仿生机动手迁徙改变骰子示意图。
受访者供图

当人工智能的“师长教师”很难也很酷_人工智能_骰子 计算机

凌晨4点,耿逸然和安博施的闹钟同时响起。
一个小时后,第36届神经信息处理系统大会(NeurIPS2022)即将开始,作为大会中MyoChallenge寻衅赛骰子重定向(DieReorientation)赛道冠军,这两位来自北京大学信息科学技能学院2020级图灵班的大三学生,即将迎来各自人生中首次在国际顶级会议上的亮相。

“还是很激动和紧张的。
”2022年12月,该会议在美国举办。
北京韶光清晨5点,耿逸然和安博施线上参会,在15分钟的全英文报告中,他们对参赛方案的完全阐释,将来自天下各地的听众带回2022年的夏天。

去年8月,两人在导师的推举下理解到,NeurIPS推出了一项比赛,哀求参赛者设计一套人工智能算法,掌握仿生机动手完成随机的抓取、迁徙改变骰子等任务,终极成功率最高、须要肌肉施加力最小的团队得胜。

赛事关照让他们立即愉快起来。
两人的导师、北京大学人工智能研究院助理教授、北京通用人工智能研究院研究员杨耀东和打算机学院前沿打算研究中央助理教授董豪长期从事机器臂和机动手的人工智能与环境交互研究,在这几位老师的辅导下,耿逸然和安博施也一贯在学习,如何在这一领域成为演习人工智能的“精良西席”。
此外,他们在搜集顶级人工智能专家的北京通用人工智能研究院长期与许多精良研究员共同事情,积累了很多宝贵履历。
用国际顶级人工智能会议的大赛考验自己,既是绝佳的练兵机会,也是展示学习所得的机会。

比赛发令枪响,耿逸然和安博施的“全速奔跑”开始了。
和他们一起互助的,还有同样来自北京通用人工智能研究院的大学生钟伊凡、吉嘉铭、陈源培等。
只管他们对机器臂的人工智能掌握已经相对熟习,但这次比赛中要面对的,是一只截然不同的“虚拟仿生手”。
在电脑屏幕上的仿照器中,这只手“有血有肉”,银灰色的手部骨骼外,覆盖着由赤色线条表示的一束束肌肉,犹如真正的手一样,各个枢纽关头和每条肌肉密切联动,“牵一发而动全身”,和常见的只能掌握每个独立枢纽关头的实体机器手比较,繁芜程度多了不是一点半点。

花了大约一周韶光熟习仿生机动手的枢纽关头与肌肉之间的关系后,他们开始订定培训这位人工智能“学生”的方案。
抓取、迁徙改变骰子,对仿生手来说相称繁芜,他们就将动作拆解,犹如体操教练传授教化员完成一套繁芜的转体、曲体组合动作时,先教各个分解动作,再进一步完成动作组合。
犹如水族馆演出的海豚,通过褒奖塑造,人工智能在完成目标动作时,一个相称于小鱼的褒奖函数会对它进行“勉励”,以促进其更好地“学习”。

这些听起来大略的操作,背后是无数争分夺秒的努力。
电脑随身携带,耿逸然有时就趁着上课前的10分钟,打开电脑修正代码。
每天面对玄色屏幕上一行行白色字母组成的代码难免呆板,但早上醒来打开头天晚上演习的模型,一个好的实验结果足以让人雀跃。
“这个过程就像开盲盒。
”安博施先容,研发的过程没有精确答案,统统都是摸着石头过河,“前一天演习了10个模型,第二天跑完数据可能有8个结果一样平常、1个不好、还有1个非常好。
每天都很期待,会有更多好的结果。

凭着长期打下的根本和比赛期间的存心,第一次上传参赛代码,他们就高居首位,随着之后不断调度方案,也一贯处于领先。
但就在靠近比赛截止日期的一个凌晨4点,从睡梦中醒来的耿逸然溘然创造,有其他参赛者的成绩超过了他们。
他一下就复苏了,套上衣服就冲进隔壁宿舍,摇醒了安博施。
两个眼睛还没睁开的人大脑已经无比复苏,迅速冲出宿舍,冲进实验室,紧锣密鼓地开始调度方案。

10月末,比赛截止。
在之后公布的结果中,在环球10多个国家的40个参赛军队提交的340余份有效方案中,他们的方案位居榜首。

在2022年末的学术会议召开前,耿逸然和安博施分工互助,为了他们共同的第一次英文学术报告反复考虑,拟定表述办法、写下逐字稿、相互给对方试讲,一贯磨到凌晨3点。
两个小时后,他们的报告结束,一位来自瑞士的教授向安博施发出邀约:“你们的讲述非常好,希望你可以考虑申请我的博士项目。

2023年年初,两位差错了一年多的伙伴再次互助,以共同第一作者的身份,在2023年国际机器人与自动化大会(ICRA2023)中,揭橥研究论文《基于端到端可操作性学习的机器人操纵框架》。
“论文里先容了我们探索出的机器臂抓取物件的方法。
”比起参加比赛,日常的学术研究须要更加深入的方法探索,通过他们开拓的这套方法,机器臂可以通过浸染域物体的关键点,如柜子的拉手、锅盖的抓手等,实现拉开柜门、提起锅盖等操作。

但比赛的过程也对他们启示颇多。
“之前以为让机动手迁徙改变一个骰子很大略,但这次比赛中利用的仿生机动手仿照了真实的骨骼和肌肉关系,我们创造动物的日常动作远比机器风雅的多,且不说大脑,动物小脑中就不知有多少我们还没创造的秘密。
”他们知道,想让人工智能实现更风雅的功能,一代代打算机人还有很长的路要走。

中青报·中青网 毕若旭 来源:中国青年报