这是个很大略的捉迷藏游戏,个中蓝色小人儿卖力躲藏,而赤色小人儿则卖力捉捕。
所有小人儿都由AI操控,不过他们一开始并没有任何既定的行为程序,而是要靠反复嬉戏来学习如何捉迷藏。

AI自己跟自己捉迷藏?“人工智障”玩完游戏变聪明了_小人儿_斜坡 智能写作

起初,所有小人儿除了四处随机走动什么都不会,因此蓝队很快就会全部被捉;之后他们逐渐学会了逃跑、利用工具阻挡通道;而红队在被方块堵在门外后,逐渐学会了挪用斜坡翻墙;之后蓝队又学会了先把斜坡搬到屋内再堵门,乃至还能相互合营。
这些行为都是AI通过实践自主学会的,完备没有人为干涉。

蓝色小人儿学会了利用方块堵门

赤色小人儿学会了利用斜坡翻墙

蓝色小人儿将斜坡提前拉到屋内

除了上述封闭式场景外,OpenAI也考试测验了更大的更开放空间下的捉迷藏,结果发生了令人意想不到的事:虽然蓝队提前将斜坡方块锁去世了无法移动,但红队却能将其它方块推到斜坡旁、爬到方块上去,再通过摩擦直接移动脚下的方块,这样就能捉到蓝队了。

红方通过摩擦移动脚下方块

虽然演示中的这些行为都比较大略,不过确实很故意思。
而OpenAI官方表示:所有这些小人儿都是独立的,只能通过自己的不雅观察来认识天下,视野外的物体对他们来说都是不可见的,这很好地仿照了现实场景。
所有繁芜的策略都须要小人儿自行学习。

小人儿学会了搭建小屋躲避追踪

除了捉迷藏游戏,OpenAI官方还进行了另一种模式的演习,该模式没有目的可自由探索,不过系统会鼓励小人儿与物体交互。
这种模式下小人儿的行为则无迹可寻,根本看不出小人儿要做什么。
因此OpenAI认为像捉迷藏那样的多角色竞争模式更利于演习人工智能形成类人行为。

小人儿需进行成千上万次演习,不断进化、学习

末了OpenAI表示,这种多角色互动、不断适应型演习模式可能在未来打造出更加繁芜、更加聪明的人工智能。