理解人工智能的运用办法:用体育来比拟_人工智能_对象
编者按:随着人工智能(AI)技能的快速发展,社会对天生式人工智能潜在影响的关注进步神速。一方面,人们担忧这项技能可能取代人类事情,导致大规模去技能化和广泛失落业。另一方面,人们寄希望于天生式人工智能能够提升人类的能力,带来前所未有的创新和生产力提升。在这一背景下,微软研究院开展了有关如何将人工智能与人类认知和决策相结合的研究。其三位研究员 Hofman、Goldstein、和Rothschild 前不久在 Harvard Business Review(《哈佛商业评论》)上揭橥了《A Sports Analogy for Understanding Different Ways to Use AI》“用体育的比拟来理解利用人工智能的不同办法”文中通过对激素、运动鞋和教练的阐明,清晰地传达了利用AI的三种不同模式,从而勾引读者更深入地思考人工智能在社会中的角色。同时,文中强调了设计选择、对AI运用的规范化、以及优先级的演化对人工智能工具可能产生的长期效果的主要性;人工智能工具可以成为有益的互助伙伴,而不是大略的替代品。总体而言,这篇文章不仅供应了对天生式人工智能不同运用办法的深入思考,而且通过体育类比、实际案例和设计理念,为读者供应了一种理解和评估AI技能的框架。
就像许多新技能一样,天生式人工智能对社会的潜在影响存在两极分解的不雅观点。有一种担忧,认为这项技能将取代人类事情者,导致大规模的去技能化和广泛的失落业。同时,也有一种希望,即天生式人工智能将增强人类能力,实现个体和集体创新与生产力前所未有的提升。在微软研究院关于用人工智能增强人类认知和决策的事情中,我们把这些情景看作是一个范围内的点,并创造了一个体育类最近帮助理解:人工智能工具可以从激素、运动鞋到教练,每一种都代表着人类用户与技能之间不同的关系。
让我们从激素这个范围中最不理想的点开始。激素可以提升短期表现,但在长期内可能导致更差的结果。例如,想象一个学生被支配作业,来阅读和评论一段笔墨。学生可以利用大型措辞模型(LLM)作为激素,只需将段落文本放入 ChatGPT 或任何类似工具中,提示它产生这样的批评,并将输出通报回老师。虽然这使学生能够立即完胜利课,但从长远来看,它违背了练习的目的。学生不仅可能无法从作业中学到东西,而且可能永久不会得到(或缓慢失落去)评论一篇文章并清晰表达思想的能力。就像在体育中,为了实现短期目标而采纳捷径,可能对长期内的其他目标产生负面影响。
在这个范围的中间,人工智能驱动的工具可以用来增强人们的技能并提高他们的生产力。这便是我们认为类似于良好跑鞋的情形。就像耐克的碳底鞋让跑步者均匀快4-5%,一些人工智能工具可以在瞬间提升性能,而不会像去技能化工人那样在长期内产生负面影响。例如,LLMs特殊适用于翻译、重新格式化和注释非构造化文本,可以为知识事情者节省大量韶光和精力。想象一下,一位剖析师正在进行一项国际调查,并以 20 种不同措辞供应自由格式的文本回答。LLM可以大大减少将这些回答翻译成一种共同措辞、为其评分积极或悲观情绪以及提取关键主题所需的韶光。与增强性能的运动鞋类似,在这种情形下,人工智能可以提高剖析师当前的能力,同时仍旧许可运用他们的人类判断力、好奇心和创造力。
在最空想的一端,人工智能驱动的工具可以像教练一样利用,提高人们自身的能力。假设一位 IT 专业职员正在学习通过一个新的繁芜系统的认证测试。经由系统文档培训的LLM可以在专业人士得到能力时交互式地天生练习问题,并在教授高等观点时供应个性化反馈。终极,这将帮助专业人士扩展对主题的理解,并开拓新技能,这些技能的持续韶光超出了利用人工智能导师所花费的韶光。
我们自己的研究显示,在学习新数学观点方面也有类似的好处。在我们进行的一项在线随机实验中,我们创造让人们在练习标准化测试问题时访问基于LLM的阐明,可以显著提高他们往后独立办理类似测试问题的能力。就像体育教练一样,人工智能传授教化工具有可能在短期和长期内都供应好处。
虽然我们认为在运动能力和认知能力之间的这些类比是得当的,但两者之间存在主要的差异。在体育中,激素、运动鞋和教练的三种关系都是相称明确的,但在涉及许多小幅变革的AI驱动工具时,情形就不那么明显了。因此,我们在设计和利用这些工具方面所做的选择可以将它们从范围的一端转移到另一端。同样,我们制订的规范以及随着韶光的推移我们的重点如何演化将在确定我们何时、如何以及为何利用AI驱动的工具方面发挥关键浸染。
设计选择至关主要首先,从设计的角度来看,我们对如何构建AI驱动工具的看似无害的选择可能对它们的影响产生重大影响。以拼写检讨为例,这是一个相对平凡的例子。大多数拼写检讨器在您输入时不会自动修复单词而没有反馈。相反,它们供应提示,指示可能的拼写缺点,并供应机会不仅纠正书写缺点,而且可视化精确的拼写。这个小小的选择将拼写检讨从一种激素变成了更像是教练的工具。它不仅提高了终极产品的质量,还帮助您从缺点(或打字缺点)中学到东西。
通过故意识地思考我们如何设计AI工具,我们可以最小化或避免有害的长期效果。例如,我们最近的实验表明,类似于拼写和语法检讨中所做的大略的基于信心的高亮显示,可以帮助人们创造并纠正LLM搜索工具产生的虚构或“幻觉”。这个想法是,如果我们能够向人们展示LLM天生的相应中哪些信息可能不太可靠,我们就可以帮助他们创造和修复潜在的缺点。这仍旧供应了提高生产力的机会,同时保持了对LLM天生的相应可能出错的认知警示。通过精心设计,我们可以开拓有益的副驾驶,这些副驾驶能够增强人们的事情能力,而不是取代他们。
规范将会涌现其次,我们须要制订一些思考何时以及如何利用AI工具的准则。打算器是另一个历史类比。虽然我们很难反对银里手利用打算器打算复利,但同样难以主见给正在学习根本加法的小学生一个打算器。就像我们已经制订了如何以及何时利用过去的技能创新的规范一样,我们想象同样的规范将会在AI工具方面涌现:同一工具在某些环境中可能被认为是有益的,而在其他环境中可能是有害的。我们还估量这些规范会随着韶光的推移而发生变革。
例如,过去图书馆是查找信息和引用的黄金标准,但随着搜索引擎质量和覆盖范围的提高以及我们能够提出有效的查询并找到精确的结果,互联网已经变得越来越可靠和被接管的信息来源。我们相信类似的转变将会在AI工具方面发生,由于根本技能和我们利用它的能力共同演进。与此同时,企业须要考虑让工人过分依赖最新工具的后果:只有一种方法办理问题是一个薄弱点。在事情场所,制订规范和期望AI工具何时(和何时不)适用,以及确保它们得到负任务和道德利用,将落在业务领导者的任务范围内。
优先级将变革这些分类都不是大略的,可能会在人与人之间、行业与行业之间有奇妙的差异。考虑一下随韶光推移对拼写和算术代价的变革。如上所述,过去能够进行长除法或拼写生僻单词而不依赖赞助工具曾经是备受推崇和尊敬的才能,但现在它们在很大程度上被视为过期和深奥的技能。据推测,这是由于大多数人在须要时都可以利用可靠的打算器或拼写检讨工具,从而使曾经被害怕为激素的东西变得不再成为问题。因此,这开释出韶光让人们投资于发展其他技能。简而言之,我们决定让一些技能萎缩,以便我们可以专注于发展其他技能。
随着AI工具的发展,我们估量会看到社会上对哪些技能有代价和优先考虑的转变。人们将以不同的办法利用他们的韶光,并将学习投资于新的领域。例如,对特定编程措辞的详细语法知识可能会由于天生式AI工具能够以越来越高的准确性自动天生代码而变得不那么主要,这将使工程师能够专注于更高等别的系统设计和架构。随着某些技能变得不那么突出,新技能作为重点涌现,公司该当主动供应培训,以确保员工保持具有最干系和有代价的技能。
我们希望我们在这里供应的激素、运动鞋、教练的框架能够帮助思考这些问题,并对嵌入到事情和生活中的AI工具提出关键问题。随着我们整合AI,我们的寻衅是打造增强而不是削弱人类能力的工具。通过谨慎的设计和寻思熟虑地考虑这些工具何时以及如何运用,以及许可这些重点随着我们共同演进而发生变革,我们有机会塑造一个未来,个中AI增强了我们的人类能力。
本文系作者个人观点,不代表本站立场,转载请注明出处!