DeepMind新论文:人工智能学会像哺乳动物那样抄近路_网格_人工智能
北京韶光5月10日凌晨1时,该英国团队在世界顶级学术杂志《自然》上揭橥论文称,其最新研发出的一个人工智能程序具有类似哺乳动物一样的寻路能力,非常类似大脑中网格细胞的事情事理。
神秘的网格细胞:大脑内置GPS
从家出发到新的地点,再原路返回,从中选择尽可能的捷径,这是绝大多数动物都能胜任的大略任务。然而,大脑这种本能的导航机制尚未被完备理解。
科学家们在动物和人类大脑中找到了三种跟认路干系的细胞,分别是位置细胞、方向细胞和网格细胞。
位置细胞能在主体到达特定地点时放电,从而授予对过往地点的影象;方向细胞能感应提高的方向;网格细胞则是最神秘的一种:它们能将全体空间环境划分成蜂窝状的六边形网格,仿佛舆图上的坐标系。
创造网格细胞的的莫索尔夫妇因此得到了2014年的诺贝尔生理学或医学奖。不过,网格细胞仅仅是在空间环境中供应GPS定位做事吗?一些科学家预测,它们也会参与矢量打算,赞助动物方案路径。
人工神经网络中自动涌现类似构造
DeepMind团队决定用人工神经网络考验上述猜想。人工神经网络是一种利用多层处理仿照大脑神经网络的运算构造。团队首先用深度学习算法演习神经网络学习哺乳动物的觅食运动路径,利用线速率、角速率等旗子暗记在视觉环境中进行定位。
研究职员随后创造,一种类似于网格细胞活动特色的构造自动出身了!
在此前的演习中,研究职员并未刻意勾引神经网络产生此种构造。
人工神经网络中自动涌现了与大鼠网格细胞(下)类似的网格构造(上) 图片来源:DeepMind官方博客
这再次显示了深度学习的可喜又可畏之处:这是一种通过大量匹配的输入和输出值演习机器自我摸索的算法,末了得到的机器逻辑是不为人知的黑匣子。正如AlphaGo自动领悟了人类千年棋史上从所未见的“天外飞仙”棋招,这次的神经网络也自动涌现了令人惊喜的构造。
迷宫寻路
DeepMind团队随后利用强化学习考验这种网格构造是否能够进行矢量导航。强化学习被普遍用于演习游戏AI,人类见告AI一种游戏的得分赏罚机制,但却不教授游戏方法,由AI在反复进行游戏、努力争取更高分的过程中自我进化。后期的AlphaGo就完备摈弃了人类棋谱履历,在纯粹的自我对弈中从零进化到更强版本。
研究职员将之前自动涌现的网格构造与一个更大型的神经网络架构结合成了人工智能体,置于虚拟现实的游戏环境中。经历强化学习后,该人工智能在游戏迷宫中向目的地提高的导航能力超越了一样平常人,达到了职业游戏玩家水平。它能像哺乳动物一样探求新路线和抄近路。
人工智能学习在迷宫中抄近路
最关键的是,当研究职员“静默”原来的网格构造后,人工智能体的导航能力就会变弱,判断目标的间隔和方向都更不准确了。
论文作者之一Dharshan Kumaran说道:“我们证明了网格细胞远不但是给我们供应GPS定位旗子暗记,也是一种大脑赖以打算两个地点间的最短间隔的核心导航机制。”
用人工智能代替小白鼠做实验
与一贯强调“人工智能不是仿生学”的Facebook人工智能首席科学家杨立昆(Yann Lecun)不同,天才创始人戴密斯·哈萨比斯(Demis Hassabis)执掌的DeepMind热衷探索人工智能与脑科学的相辅相成。这项研究再一次表示了他们的科学理念:脑科学启示下的人工智能算法能反过来帮助人类探索大脑运行机制,从而也更好地理解人工智能的内在逻辑。
哈萨比斯评价道:“我们相信人工智能和神经科学是相互启示的。这项事情便是很好的证明:通过研发出一个能在繁芜环境中导航的人工智能体,我们对网格细胞在哺乳动物导航中的主要性有了更深的理解。”
DeepMind团队相信,类似的研究方法还可以用来探索大脑听觉和掌握四肢的机制。在更远的将来,神经科学家们乃至可以用人工智能代替小白鼠来做实验。
本文系作者个人观点,不代表本站立场,转载请注明出处!