可以互订攀谈的人工智能来了_措辞_模子
仅凭口头或书面指令,人类就能实行新任务,还可以通过描述,使他人能够重复实行该任务。这项能力是人类沟通的基石,但对人工智能仍是一个寻衅。
日内瓦大学(UNIGE)的一个团队成功地仿照了一个能够进行这种认知能力的人工神经网络。在学习和实行一系列基本任务之后,这个AI能够向一个“姐妹”AI供应它们的措辞描述,让后者实行这些任务。这项成果尤其对机器人学领域具有主要意义,现已揭橥在《自然-神经科学》杂志上。
▷Riveland, Reidar, and Alexandre Pouget. \"大众Natural language instructions induce compositional generalization in networks of neurons.\"大众 Nature Neuroscience (2024): 1-12.
01 遵照指令与下达指令
无需事先演习,仅基于口头或书面指令实行新任务,这是人类独占的能力。更主要的是,一旦我们学会了任务,我们也能够描述它,以便另一个人复制。这种双重能力区分了我们和其他物种:其他物种为了学习新任务,须要无数次的考试测验,需伴随着正面或负面的强化旗子暗记,且无法将知识其传达给同类。
人工智能(AI)的一个子领域——自然措辞处理——旨在复制这种人类的能力,让机器能够理解和相应语音或文本数据。这种技能基于人工神经网络,灵感来自于我们的生物神经元以及它们在大脑中相互通报电旗子暗记的办法。然而,现在还没有神经打算能实现上述认知壮举。目前,利用AI的对话代理能够整合措辞信息来天生文本或图像。但据我们所知,它们还不能将口头或书面指令转化为觉得运动行为,更不用说将其阐明给另一个人工智能以便它能够复制。
02 仿照措辞互换的人工智能
该研究成功开拓了一个具有这种双重能力的人工神经网络模型。研究职员从一个现有的人工神经元模型S-Bert开始,它有3亿个神经元,并且已经预演习以理解措辞。研究职员将其‘连接’到另一个更大略的几千个神经元的网络上”。
在实验的第一阶段,神经科学家们演习这个网络来仿照韦尼克区——大脑中使我们能够感知和解释措辞的区域。在第二阶段,网络被演习来复制布洛卡区,该区域在韦尼克区的影响下,卖力单词产生和发音。全体过程都可在条记本电脑上完成。接着,研究职员向AI通报英文指令,例如:指向感知到的刺激的位置——左边或右边;在刺激的相反方向做出反应;或者更繁芜的,从两个视觉刺激中选择比拟度略有差异的一个,指出更亮的一个。
然后,科学家们评估了模型的结果。该模型仿照了特定条件下的指向或移动,一旦学会这些任务,网络就能够将它们描述给第二个网络——第一个网络的副本——以便它能够复制它们。这是第一次两个AI能够以纯粹的措辞办法相互互换,只管该模型仍旧须要事先演习。
▷图1.实验任务和模型输入输出示例图。图源:论文。
该研究演习递归神经网络(RNNs)模型实行一系列生理物理任务,利用预演习措辞模型处理每个任务嵌入的自然措辞指令。研究中表现最好的模型可以利用这些嵌入来进行全新的模型,均匀精确率达到83%。通过利用指令嵌入和任务表示的共享组合构造,模型能对练习过任务和新颖指令之间关系进行推断,从而可以很好地推断出未见任务所需的觉得运动转换。该研究还构建了一个人工神经网络,可以仅基于其不雅观察到的觉得运动来为任务供应措辞描述。
03 实验意义
该模型对大脑区域中整合措辞信息以掌握觉得运动区域的神经表征做出了几个预测。首先,模型的层次构造表明,当人类必须根据指令泛化一组干系任务时,指令的语义表征有层次构造,生物大脑也有觉得运动区域。
该模型指出,措辞区域中等效任务干系构造的涌现对付人类按指令行动至关主要。该研究还预测,参与履行觉得运动映射的个体单元该当根据输入指令的语义在逐次试验的根本上进行调度,并且未能以预期办法调度会导致泛化性能差。这一预测在阐明人类的如何实行多步骤任务时可能特殊有用。
末了,当模型措辞描述包含基于任务集的觉得运动需求时,模型的性能有所提升,该研究的作者预测在学习过程中,模型措辞处理层次的最高级别也受到伴随措辞输入的具身过程的影响,例如运动方案或可供性评估。
措辞利用者能够以更灵巧的办法组织任务中的多个子组件,在更广泛的情境中重新组合,并传播个中蕴含的知识,这是人类得以成为万物之灵的关键。开拓可阐明的人工神经网络既能理解指令以辅导特定觉得运动反应,也能将觉得运动学习的成果作为可理解的措辞指令进行互换。该模型的借此帮助我们阐明措辞是如何在编码和在神经元网络中通报知识的,这为理解措辞和行为之间的互动开辟了新的视野。该研究还可以辅导未来的实验事情,即考验人类中措辞和觉得运动技能的相互浸染。
该研究对机器人学领域尤其故意义,开拓使机器能够相互互换的技能是该领域的一个关键问题。虽然该研究开拓的网络非常小。但未来的研究者完备可以在此根本上开拓更繁芜的网络。这些网络将被集成到既能理解人类措辞和意图,也能理解彼此的仿人机器人中。未来研究可整合自回归措辞模型和表现最好的觉得运动模型中的表征,以描述参与指令遵照的每个阶段的大脑区域的完全过程,从低级别的下一个词预测到更高层次的构造化句子表征,再到措辞掌握的觉得运动。
本文系作者个人观点,不代表本站立场,转载请注明出处!