经由7万小时演习后AI学会了玩《我的世界》_操作_世界

2025-01-07 05:09:06 智能助手

AI击败末影龙指日可待。

经由7万小时演习后AI学会了玩《我的世界》_操作_世界智能助手

2019年，为了研究剖析AI与儿童的智力差距，一群天下顶级科研职员在卡内基梅隆大学和微软的共同帮助下举办了一场名为“MineRL”的比赛，以有名游戏《我的天下》为舞台，让接管演习的AI在限定的韶光内探求游戏中的罕有物品——钻石。

考虑到一位普通儿童在不雅观看10分钟的传授教化视频后便能自主嬉戏《我的天下》，这项寻衅在生手来看彷佛并不是很困难，但事实是，参赛的AI们在长达4天的限时寻衅里实行了超过800万次操作之后，仍未能顺利达成目标。

在这之后，MineRL竞赛成了一年一度的科研项目，每年都会有不少探索AI前沿技能的学者带着他们精心调教的AI来《我的天下》里挖钻石。
而去年的MineRL大赛更是吸引了海内外近60支军队参赛，超过400名研究职员同台竞技，其关注度可见一斑。

而到了最近，有名AI科技公司OpenAI终于实现了技能打破，提前杀去世了比赛。
根据他们于6月23日发布的论文来看，由他们演习的AI已经做到了闇练嬉戏《我的天下》，挖钻石对他们家的AI来说早已不在话下，毕竟它目前已经节制了只有人类才能领悟的高阶玩法：

为了让AI真正做到像人类一样“玩游戏”，OpenAI的研究职员引入了一种新颖且便捷的AI演习法：视频预演习（Video PreTraining）。
他们通过从干系互助方处获取《我的天下》演示视频以及与视频配套的键盘鼠标操作记录，并根据这些操作习气建立逆动力学模型（inverse dynamics model）以推测仿照视频内的键鼠操作逻辑，此后再反复推演全天下的《我的天下》视频以仿照人类的嬉戏习气。

在“被迫”不雅观看了7万小时的视频后，OpenAI旗下的AI的操作已经相称真切：氧气稀少时会主动浮出水面、饿肚子了会啃腐肉充饥，而在研究职员的数据微调后，AI节制了更加进阶的操作，包括搜刮随机村落落里的宝箱，以及搭建一个简陋的“火柴盒”。

至于同行们费尽心血研讨的挖钻石的方法，OpenAI也通过强化学习构建了一套科学合理的打算机模型。
从获取木头开始，到在事情台上做出一把钻石镐，总计须要24000次操作，对付较为闇练的老玩家来说，完成这套流程的时终年夜概在20分钟旁边，而如今的AI在经历了大规模演习过后，网络钻石的效率足以比肩人类。

目前，OpenAI已经向MineRL大赛提交了他们研究的预演习模型，而今年参赛的科研军队也能在此模型的根本上根据自己的主攻方向进行微调。
考虑到OpenAI精良的演习成果，想必今年的MineRL大赛会是一场堪比神仙斗殴的高端对局，说不定不久之后，AI已经开始研究如何速通了。

转载内容仅代表作者不雅观点

不代表中科院物理所态度

如需转载请联系原"大众年夜众号

本文转载自"大众年夜众号“游戏研究社”（ID：yysaag），已得到转载授权。

来源：游戏研究社

编辑：Paarthurnax