我们做得怎么样?以下是我们对 2023 年的四大预测:

2024 AI走向水深之处:派拉蒙和迪士尼正考试测验用生成式AI制作动画_人工智能_模子 计算机

预测一:谈天机器人的下一个大进展将是多模态。

结果:预测准确。
目前最强大的大型措辞模型,OpenAI 的 GPT-4 和谷歌 DeepMind 的 Gemini,都可以处理文本、图像和音频。

预测二:政策制订者将出台严格的新规定。

结果:预测准确。
拜登政府的行政令于 10 月出台,欧盟的《人工智能法案》终极于 12 月达成同等。

预测三:大型科技公司将感想熏染到来自开源初创公司的压力。

结果:半对半错。
大模型开源热潮仍在持续,但像 OpenAI 和谷歌 DeepMind 这样的人工智能公司仍旧独占鳌头。

预测四:人工智能将永久改变大型制药公司。

结果:现在还为时过早。
药物创造领域的人工智能革命仍在展开的过程中,但利用人工智能开拓的第一批药物间隔问世还有几年的韶光。

现在,我们又来了。

这次,我们决定忽略那些显而易见的事情,比如我们知道大型措辞模型将连续霸占主导地位,监管机构也将变得更加大胆。

人工智能领域存在的偏见、版权和末日论等问题将影响研究职员、监管机构和公众年夜众的议程,这种征象将在未来几年持续下去,而不仅仅是 2024 年。

因此,我们选择(预测)了一些更详细的趋势。
以下是 2024 年值得关注的事变,等到 2025 年这个时候,记得再来看看我们的结果如何。

(来源:AI 天生)

定制谈天机器人

一个又一个的谈天机器人不断涌现。
2024 年,在天生式人工智能方面投入巨资的科技公司将面临压力,它们须要证明自己可以从干系产品中赢利。

为了做到这一点,人工智能巨子谷歌和 OpenAI 正在“小事情”高下重注。
它们都在开拓面向普通人的用户友好平台,许可儿们定制强大的措辞模型,并制作自己的迷你谈天机器人,以知足他们的特定需求且不须要编程技能。

两家公司都推出了网页版工具,让任何人都能成为天生式人工智能运用程序的开拓者。

到 2024 年,天生式人工智能可能会对普通的非技能职员很有用,我们将看到更多的人在打磨无数个小的人工智能模型。
目前最前辈的人工智能模型,比如 GPT-4 和 Gemini 是多模式的,这意味着它们不仅可以处理文本,还可以处理图像乃至***。

这个新能力可以解锁一大堆新的运用程序。
例如,房地产经纪人可以上传以前房源广告的文本,只需点击一个按钮就可以微调一个强大的模型以天生类似的文本,还可以上传新居源的***和照片,让经由定制的人工智能工具天生房屋描述。

当然,这个想法能否成功取决于这些模型是否可靠。
措辞模型随意马虎虚构事实,而天生式模型本身充满了偏见。

它们也很随意马虎被黑,尤其是当它们被许可访问网络时。
科技公司还没有办理这些问题。
当新鲜感消逝时,它们将不得不为客户供应处理这些问题的方法。

***天生,天生式人工智能的第二波浪潮

人们熟习神奇事物的速率超乎想象地快。
2022 年,第一批制作图像的天生式模型成为了主流,人们很快习气了它们的存在。

互联网上,OpenAI 的 DALL-E、Stability AI 的 Stable Diffusion 和 Adobe 的萤火虫等工具创造出了很多图像,比如身着巴黎世家的教皇,着火的五角大楼等等,令人瞠目结舌。

但除了有趣,这种征象还带来了别的东西。
有好玩的图片,就有带有性别歧视和刻板印象的图片。

这个领域的最新前沿是文本到***。
我们估量,它会将文本到图像中所有好的、坏的或丑陋的东西都转化为***并放大它们。

一年前,当天生式模型被演习将多个图像拼接成几秒钟长的***片段时,我们第一次看到了它们能做什么。
当时天生的结果不真实,而且不稳定。
但技能进步很快。

Runway 是一家制作天生式***模型的初创公司(它还共同创造了 Stable Diffusion 模型),每隔几个月就会给自己的工具推出新版本。

其最新模型 Gen-2 仍旧只能天生几秒钟长的***,但质量惊人。
最好的片段比起皮克斯动画也差不了多少。

Runway 设立了一个年度人工智能电影节,展示用一系列人工智能工具制作的实验电影。
2024 年的电影节有 6 万美元的奖金,10 部最佳影片将在纽约和洛杉矶上映。

显然,顶级事情室也把稳到了这一点,包括派拉蒙和迪士尼在内的电影巨子目前正探索在动画制作过程中利用天生式人工智能。
这项技能正被用于在外语配音中实现口型同步。

它正在重塑殊效的可能性。
2023 年,《夺宝奇兵:命运转盘》利用了深度假造技能,展示了年轻时的哈里森·福特(Harrison Ford)。
这只是一个开始。

在大屏幕之外,用于营销或培训目的的深度假造技能也在兴起。
例如,英国 Synthesia 公司开拓的工具可以将演员的一次性演出化成源源不断的深度假造化身,只需按下按钮就能读出你给他们的任何剧本。
据该公司称,其技能目前被 44% 的财富 100 强公司利用。

用很少的资源就能实现很多事情,这种能力给演员们带来了严厉的寻衅。
对事情室利用和滥用人工智能的担忧,成为了是 2023 年好莱坞 SAG-AFTRA 罢工的核心。

影响才刚刚显现出来。
“电影制作办法正在发生根本性的变革。
”独立电影制作人苏基·梅哈达维(Souki Mehdaoui)说,她也是创意技能咨询公司 Bell&Whistle 的联合创始人。

人工智能天生的虚假选举信息将无处不在

看看最近的选举,人工智能产生的与选举有关的虚假信息和深度假造将是一个巨大的问题。
2024 年,我们将看到创记录的人参与投票,我们也已经看到政客们将这些工具武器化。

在阿根廷,两位总统候选人给对手创建了人工智能天生的图像和***来攻击他们。

在斯洛伐克选举期间,一位候选人威胁要提高啤酒价格并开***玩笑的深度假造内容广泛传播。
在美国,唐纳德·特朗普(Donald Trump)被假造了他支持带有种族主义和性别歧视色彩的团体。

虽然很难说这些例子对选举结果有多大影响,但它们的迅速传播是一个令人担忧的趋势。
在网上识别什么是真实的东西将比以往任何时候都更加困难。
在已经激化和两极分解的政治环境中,这可能会产生严重后果。

就在几年前,创建深度假造内容还须要前辈的技能,但天生式人工智能让它变得非常大略,而且成果看起来越来越逼真。
纵然是可靠的信源也可能被人工智能天生的内容愚弄。

对付那些想阻挡此类内容扩散的人来说,2024 年将是至关主要的一年。
识别和戒备此类内容的技能仍处于早期发展阶段。
水印技能,如谷歌 DeepMind 的 SynthID,大多不是逼迫的,而且并非完备万无一失。

众所周知,社交媒体平台在删除缺点信息方面行动缓慢。
以是我们准备好欢迎大量人工智能天生的假***吧,我们将亲自经历一场大规模的实验。

多任务机器人

受天生式人工智能繁荣背后的一些核心技能的启示,机器人学家开始建造更多通用机器人,旨在完成更广泛的任务。

在过去的几年里,人工智能已经从利用多个小模型(每个模型都被演习来完身分歧的特界说务,比如识别图像、绘制图像、为图像加字幕等等)转变为利用单一的模型。
这些模型被演习来做所有这些事情。

通过向 OpenAI 的 GPT-3 运送一些额外样本(称为微调),研究职员可以演习它办理编程问题、编写电影脚本、通过高中生物考试等等。
多模态模型,如 GPT-4 和谷歌 DeepMind 的 Gemini,可以办理视觉任务和措辞任务。

同样的方法也适用于机器人,我们不须要演习两个机器人,一个专门翻煎饼,另一个专门开门。
一个拥有多种能力的模型可以让机器人具备多任务处理的能力。
2023 年,我们看到了这一领域的几个实例。

2023 年 6 月,DeepMind 发布了 Robocat,它可以学习如何掌握许多不同的机器臂,而不是一个特定的机器臂。

2023 年 10 月,该公司与 33 所大学实验室互助,推出了另一款名为 RT-X 的通用机器人模型,以及一个新的大型通用演习数据集。

其他顶级研究团队,如加州大学伯克利分校的机器大家工智能和学习(RAIL,Robotic Artificial Intelligence and Learning)团队,也在研究类似的技能。

机器人领域的问题在于缺少数据。
天生式人工智能可以利用互联网上的文本和图像数据。
比较之下,机器人很少有好的数据源,来帮助它们学习如何完成我们希望它们完成的许多事情或家务。

美国纽约大学的勒雷尔·平托(Lerrel Pinto)领导了一个团队来办理这个问题。
他和他的同事们正在开拓技能,让机器人通过试错来学习,并在学习过程中得到自己的演习数据。

在一个更为低调的项目中,平托招募了志愿者,利用安装在垃圾分拣机器臂上的 iPhone 网络***数据。
在过去几年里,大公司也开始发布用于演习机器人的大型数据集,例如 Meta 的 Ego4D。

这种方法已经用在了无人驾驶汽车领域。
Wayve、Waabo 和 Ghost 等初创公司正在首创一股新的自动驾驶人工智能浪潮,它们利用单个大型模型来掌握车辆,而不是多个卖力特定驾驶任务的小模型。

这让小公司追上了 Cruise 和 Waymo 这样的巨子。
Wayve 目前正在伦敦狭窄而繁忙的街道上测试其无人驾驶汽车。
接下来,天下各地的机器人都将得到类似的能力提升。

作者简介①:梅丽莎·海基莱(Melissa Heikkilä)是《麻省理工科技评论》的资深,她着重宣布人工智能及其如何改变人类社会。
此前,她曾在 POLITICO 撰写有关人工智能政策和政治的文章。
她还曾在《经济学人》事情,并曾担当***主播。

作者简介②:威尔·道格拉斯·海文(Will Douglas Heaven)是《麻省理工科技评论》人工智能栏目的高等编辑,他在这里宣布新的研究、新兴趋势及其背后的人。
此前,他是英国广播公司(BBC)科技与地缘政治网站 Future Now 的创始编辑,也是 New Scientist 杂志的首席技能编辑。
他拥有英国伦敦帝国理工学院打算机科学博士学位。

支持:Ren

运营/排版:何晨龙