人类和机械人打了一场辩论赛结果IBM的AI完胜人类_人类_论点

2024-11-15 19:29:14 科技快讯

导语：6月18日，IBM的AI系统Project Debater首次与人类进行现场公开辩论。
Project Debater能够理解对方不雅观点，并有针对性地做出清晰的回嘴，终极成功降服人类辩手。

人类和机械人打了一场辩论赛结果IBM的AI完胜人类_人类_论点科技快讯

智东西6月19日，美国韶光6月18日，IBM Research推出了人工智能系统Project Debater，一个具有诙谐感、小巧机警和偶尔有强有力的论点的实验性会话AI系统。
当日，Project Debater首次与人类进行现场公开辩论，这次辩论比赛在旧金山的IBM沃森西部厂区（ Watson West Site）举行。

Project Debater是IBM Research（即超级电脑沃森背后的团队）最新研制的AI系统，也是第一个可以对繁芜话题进行辩论的AI系统，旨在通过公道的辩论来拓展人们的思维。
Project Debater拥有数以亿计的论文、报告和***文章的弘大数据库。
通过消化这些数据，Project Debater可以就特定主题做出逻辑构造良好的演讲，提出清晰明确的论点，并对对手不雅观点进行回嘴。
只管在一些阐述上不是很自然，并不能完备和人类相提并论，但Project Debater的思考和答辩仍旧令人印象深刻。

IBM Research首席调查员兼Project Debater的创造者Noam Slonim称，该AI系统的演习始于六年前，直到两年前才有能力参与与人们的辩论。

IBM研究职员正在通过教授打算机来探索人工智能的界线，以创造引人入胜且信息更加丰富的不雅观点。
他们的目标是建立一个智能系统，帮助人们在答案模糊时作出基于证据的决定。
自2012年起，Project Debater是IBM对AI的下一个主要里程碑，是继深蓝（Deep Blue）和沃森（Watson）后的又一打破。
根据IBM的操持，Project Debater未来将能够通过供应引人瞩目的、以证据为根本的论点并限定情绪、偏见或模棱两可的影响来帮助人们做出理智的判断。

首战告捷，降服顶尖人类辩手

Project Debater和2016年的以色列国家辩论冠军Noa Ovadia、以色列国际辩论协会主席Dan Zafrir分别进行了辩论比赛。

▲图左为Noa Ovadia，图右为Dan Zafrir

在比赛中，Project Debater参与了两个辩论主题，即“政府是否该当帮助太空探索”和“远程医疗是否该当在医疗保健中发挥更大浸染”。
IBM公司希望确保人工智能系统能在不知道将研究什么的情形下进行辩论，因此Project Debater在辩论前并不知道论题。

就“政府是否应帮助太空探索”的论题，Project Debater持正方，Noa Ovadia持反方。
双方随后发布了四分钟开幕词、四分钟回嘴和两分钟论证总结。
在每个部分之间，Project Debater听取了人类对手的四分钟开场白，解析了这些数据，并创建了一个突出显示并试图驳斥人类对手所提出的信息的论据。
这令人难以置信，由于它不仅要理解单词，还要理解这些单词的背景。
鹦鹉学舌般复述维基百科条款很随意马虎做到，但获取数据并创建一个不仅基于原始数据而且还考虑到刚才听到的阐述的内容，却十分困难。

Project Debater提出一个开放性不雅观点，即空间探索有益于人类，由于空间探索不仅有助于推动科学创造，还能勉励年轻人打破思考的壁垒。
Noa Ovadia则认为诸如地球科学研究之类的项目有更值得得到政府补贴。
在听取了Noa的论点后，Project Debater揭橥了回嘴辞吐，认为太空探索带来的潜在技能和经济利益超过其他政府支出。

在双方总结陈词后，一项快速调查显示，大多数不雅观众认为Project Debater比人类的论述更能丰富他们的知识。

在这次辩论过程中，AI系统确实也出了些差错，并做出了一些猖獗的断言，比如它认为太空探索“比更好的道路、更好的学校或更好的医疗保健更主要”，或者在辩论过程中随机地说出“Scott Pelley画外音”，这彷佛是参考了哥伦比亚广播公司（CBS）***和60分钟（60 Minutes）的辞吐。

Chris Reed是论证技能中央（Center for Argument Technology）的主任，卖力的是一个探索会话式人工智能的学术团队，并没有参与Project Debater项目。
应IBM的约请，Reed在周一的第一次演出中不雅观看了Project Debater的表现，并表示就像在看“如此多的难题聚拢在一起”，包括坚持自己论点的能力、语法缺点的欠缺以及在做出决定之前能够预测和回嘴其反对者的论点等问题。

“辩论和辩论，实质上是驱动科学进程的引擎，描述了大多数政治论坛发生的事情，乃至描述了当代宗教的大多数观点。
”Reed说，“论证是人类的一个决定性特色，如果我们的机器能够传达个中的一部分，那么我认为这意味着一件非常主要的事情正在发生改变。
”从文化上来看，辩论的起源不在于冲突和竞争，而在于民主和谈论。
辩论丰富了决策制订过程，帮助人们权衡新思想和新理念的利弊。
它处于文明社会的核心。
我们辩论的不仅是为了让别人相信我们自己的不雅观点，而且也是为了理解和学习彼此的不雅观点。

试想一下，一个与专业人类辩论家互换的AI系统听取了他的不雅观点，并以令人信服的办法提出了自己的无脚本推论，说服听众思考其在有争议的话题上的态度，这解释AI系统可以像人类一样去理解见地并有针对性地给予自己的不雅观点。
未来，相信机器能够通过帮助人类做出许多主要决定。

之后，Project Debater与另一名以色列辩论专家Dan Zafrir之间进行了第二次辩论，对“该当增加对远程医疗的利用”的论题持反对见地。

这次辩论有四十名成员参与投票，Project Debater比Dan Zafrir多得9票，成功赢得比赛。

在辩论中，Project Debater能够引用阿拉伯联合酋长国的一系列资料以及德国经济事务部长的报告，得到太空探索所能供应的就业数量等有效数据。
但是，为了避免犯引用和措辞逻辑方面的缺点，Project Debater没有直接引用其对手的论述。

“无偏见”的辩论机器

根据IBM研究职员Noam Slonim和Ranit Aharonov的说法，只管人类辩论机器是对该技能的有趣展示，但Project Debater的真正力量将是其展现无偏见论述的能力。

▲图左为Ranit Aharonov，图右为Noam Slonim

我们生活在一个被感情和偏见染上色彩的天下中，难免看问题的角度不足真实与客不雅观。
IBM表示，天下充满了缺点的信息和肤浅的想法，片面的、被修改的叙事的兴起正在寻衅社会和互联网平台。
AI在措辞和推理的新发展可以帮助供应多样的、灵通的不雅观点，而Project Debater推动AI的前沿发展，促进聪慧辩论，帮助人们建立充分知情的论点并做出更好的决策。

Project Debater可以帮助公司和政府透过我们生活经历中的鼓噪提取出一些实质的东西，并产生大多数公道的结论。
当然，它所供应的数据集是基于人类的写作作品，而这些数据仍旧会存在作者的情绪与偏见。

虽然Project Debater的目标是一个没有偏见的机器，但在辩论期间，它还是涌现疑似带有偏见的表现。
在回嘴人类辩手Dan Zafrir关于远程医疗扩展的论题时，该系统声称，Zafrir在开幕声明中并没有说出有关远程医疗利用增加的事实。
换句话说，它认为Zafrir是个骗子。

当被问及Project Debater这一表现时，IBM研究职员Noam Slonim表示，在回嘴期间，该系统有一个置信度阈值。
如果觉得非常自傲，它会创建一个更繁芜的陈述；如果觉得不那么自傲，那么陈述就不那么令人印象深刻。
因此，Project Debater对回嘴见地不是很有信心，以是它基本上把Zafrir当成一个骗子。
有趣的是，这大概是这个别系全体晚上做的最人性化的事情。

构建新AI系统困难重重

在此之前，人工智能可以对关键词搜索回答大略的问题或哀求，比如“一升多少盎司？”或者“致电妈妈”，这为人们日常生活供应极大便利。
Project Debater则开始探索新的领域：接管了大量不同的信息和不雅观点，帮助人们建立有说服力的论点并做出明智的决定。

构建系统是一项非常困难和繁芜的寻衅。
Slonim说，为了使Project Debater成为可能，研究职员开拓了数十篇研究论文中记载的许多创新技能。
虽然准备辩论和回嘴或理解对手的论点可能须要大量的技能，但辩论者的大部分对话仍旧可以直接从文章中提取出来。

▲图为研究职员Noam Slonim和Project Debater机器的合影

过去六年来，IBM以色列海法实验室领导的环球IBM研究团队授予了Project Debater三种功能，每种功能都在AI方面开辟了新的天地：首先是数据驱动的语音编写和交付功能；其次，听力理解能够识别隐蔽在人类连续冗长的自然语音中的关键主见，并构建故意义的回嘴；第三，系统的仿照人类困境，基于一个独特的知识图谱，提炼出原则性的论点。

辩论的形式为这些核心能力供应了空想的测试根本。
辩论规则源于人类的谈论文化，论证的内核每每是内在的主不雅观的。
Project Debater必须适应人的理性和思考逻辑，并提出人们可以理解和接管的论点。
在辩论中，人工智能必须学会在缭乱的非构造化人类天下中进行导航和检索，而不是像在棋盘游戏中那样利用预先定义的规则。

与Big Blue在国际象棋中打败国际象棋大师Gary Kasparov、DeepMind的AlphaGo击败天下顶级围棋选手不同，辩论比其他比赛更加细致，与会者通过投票来决定本场比赛的最佳辩手，而人工智能常日拥有赛过人类丰富不雅观众知识的能力，Ranit Aharanov如是说。

结语：Project Debater有助于人类做出明智的决定

Project Debater让我们更靠近人工智能的一个巨大界线：节制措辞。
它是IBM一系列紧张AI创新产品中的最新产品，其它产品还包括1997年得到国际象棋天下冠军Garry Kasparov的IBM深海“Deep Blue”，以及2011年在Jeopardy上击败人类冠军的超级智能系统沃森（Watson）。

只管Project Debater的事情还远远没有完成，它有时会像人一样犯错。
但在不远的将来，它很有可能帮助办理数千个繁芜的人类决策。
例如，帮助网络和整理某个金融事实的干系材料，或提出与公共政策有关的附和和反对的论点。
由于不常常受到人类主不雅观意识和偏见的影响，Project Debater提出的不雅观点可能会贴近事实。

Project Debater将扩展沃森的功能，目前数十家公司正在利用沃森的功能挖掘大量内部数据集以得到新的业务洞察力。
该系统已经利用了Watson Speech to Text API，并将有助于增强沃森的高等措辞和对话功能。
未来，它的根本技能也将在IBM云平台和IBM沃森中商业化。

这对AI来说是一个非常积极的发展。
我们可以使这种变革性技能更加透明和可阐明，这样我们就越能信赖它；而我们越能信赖它，它就越能帮助我们在日益繁芜的天下中做出最好、最明智的决定。

Slonim在接管采访时见告VentureBeat，在这次辩论赛之后，Project Debrater将在今年晚些时候参加一场旷日持久的辩论，随后可能会举行一次研讨会，学者可以提出他们对Project Debater的见地和评论。