这一研究结果标志着移动机器人学和机器智能发展的一个里程碑,或可启示在其他物理系统中支配基于稠浊学习的办理方案,如自动驾驶的地面车辆、翱翔器和个人机器人。

《自然》论文:人工智能系统驾驶无人机可一对一战胜人类对手_无人机_人类 AI简讯

本项研究成果的干系演示(图片来自Leonard Bauersfeld)。
施普林格·自然 供图

该论文先容,深度强化学习系统已在各种博弈中降服过人类,包括雅达利游戏、国际象棋、《星际争霸》和GT赛车。
不过,这些大部分都是仿照和棋盘游戏环境,而不是物理天下的竞赛。
在第一人称视角的无人机竞速中,职业选手需驾驶高速翱翔器穿过三维赛道。
每位翱翔员通过机载摄像机的视频直播从无人机的视角不雅观察周围环境。
自动驾驶无人机要达到职业翱翔员的水准很难,由于机器人须要在其物理限定下翱翔,同时只能根据机载传感器估算其速率和方位。

本项研究成果的干系演示(图片来自Leonard Bauersfeld)。
施普林格·自然 供图

论文第一作者和通讯作者、瑞士苏黎世大学Elia Kaufmann和同事及互助者一起设计了一种自动驾驶系统Swift,其能以人类天下冠军的水准进行物理天下的竞赛,该系统将仿照的深度强化学习与物理天下采集的数据相结合。
在由一位职业无人机竞速翱翔员设计的现实天下赛道上进行的一系列比赛中,Swift与3名人类冠军对战,包括两项国际联赛的天下冠军。
人类翱翔员有一周韶光在真实赛道上演习,之后每位翱翔员在多场一对一比赛中对战Swift。
该系统在多个回合中击败了每一位人类冠军(25场比赛中共得胜15场),而且冲破了比赛的最短用时记录,比人类翱翔员的最快速率还领先半秒。

本项研究成果的干系演示(图片来自Leonard Bauersfeld)。
施普林格·自然 供图

在《自然》同期揭橥的“新闻与不雅观点”文章中,荷兰代尔夫特理工大学Guido de Croon指出,Swift系统该当在一个更真实多变的环境中进一步开拓,从而充分开释这项技能的潜力。
为了在任何竞赛环境中都能打败人类翱翔员,该系统必须能应对外部滋扰,如风、光照条件变革、定义不太清晰的各种门、其他竞速无人机和许多其他成分,所有这些都对现有的人工智能技能构成很大寻衅。
(完)