谷歌版ChatGPT首秀回答掉足聊天机械人几回再三翻车袒露软肋？_缺陷_模子

2025-01-07 23:58:10 智能助手

Bard首秀翻车

谷歌版ChatGPT首秀回答掉足聊天机械人几回再三翻车袒露软肋？_缺陷_模子智能助手

在谷歌发布的一则***中，Bard被问道：“我如何见告我9岁的孩子韦布空间望远镜有哪些新创造？”

对此问题，Bard的回答不仅内容丰富，还更普通易懂。
有人创造，和ChatGPT的回答比较，Bard的答复也更切题，能够引发一个9岁孩子对宇宙的兴趣。

但可惜的是，Bard的回答中有一项事实缺点。
Bard称，韦布空间望远镜拍摄到了太阳系生手星的第一张照片。
但事实上，第一张系生手星照片是由位于智利的欧洲南方天文台甚大望远镜在2004年拍摄的。

尴尬的是，就在Bard被外界创造答题缺点前，谷歌还曾表示，Bard仍处于测试阶段、尚未对外发布，是由于他们更谨慎地对待AI工具，确保Bard的回应符合谷歌“对现实天下信息的质量、安全和可靠度的高标准”。

除了在回答问题上翻车，谷歌8日举行的一场AI发布会也被外界认为“平平无奇”。

据美国有线电视***网（CNN）宣布，在巴黎办公室举办的一场活动上，谷歌详细先容了AI技能将如何从根本上改变人们搜索信息的办法。
谷歌还透露Bard干系技能将被运用于搜索引擎中，但并未透露Bard的对外发布韶光。

另一边，谷歌的竞争对手微软则在7日宣告，将推出搜索引擎必应（Bing）升级版，并搭载ChatGPT中利用的AI技能。

对此，投资者已开始担忧，利用了AI技能的微软将成为恐怖的竞争对手，谷歌在搜索市场上的主导地位或将被削弱。

截至8日美股收盘，谷歌母公司字母表股价大跌7.68%，市值蒸发超1000亿美元。
Bard的失落误也被外界评为“AI犯下的最昂贵缺点”。

“不苟言笑地胡说八道”

Bard首秀时的答题缺点虽然令工资难，但实在ChatGPT的类似缺点也并不少见。
随着用户激增，人们创造这些谈天机器人的回答乍一看令人信服，但细节却常常出错。

比如，美联社8日在搭载了AI技能的必应上搜索“24小时内体育界发生的最主要事宜”，得到了一长串有关美国职业橄榄球大赛“超级碗”的细节丰富的描述，包括参赛军队、比赛比分乃至献唱的歌手是谁。
但唯一的问题是：今年的“超级碗”尚未开赛。

诸如此类“不苟言笑地胡说八道”还有很多。
比如，ChatGPT就常被创造会“发明”虚构的历史名称或不存在的书本，在解答数学问题时也频频翻车。

有剖析认为，这些缺点的缘故原由是由于ChatGPT、Bard等措辞模型常常会产生“幻觉”，由于这些模型只是接管了大量文本语料库的演习，并不是查询已经由验证的事实数据库来回答问题。

英国AI初创企业Speechmatics分管机器学习的副总裁威尔·威廉姆斯(Will Williams)认为，这些模型的开放性将是一把“双刃剑”，“一方面，这带来了高度的灵巧性和流畅性，险些能就任何话题进行引人入胜的对话。
但另一方面，你永久不会知道模型打仗的是否是事实，会不会产生过度自傲的‘幻觉’”。

还有专家担心谈天机器人的巨大风险。

经济和人工智能领域专家加里·N·史密斯(Gary N. Smith)认为，大型措辞模型的根本问题在于，它们并不具备理解能力，也无法区分事实与虚构，“在学会思考之前就学会了写作”。

目前，大部分专家仍认为，ChatGPT、Bard等AI尚未达到一样平常人类聪慧水平，即还不是“强人工智能”AGI。
因此，媒体、风险投资家和科技企业的大肆宣扬可能会起到反效果。

在史密斯看来，目前，这些谈天机器人的最大危险并不是它们比人类更聪明，而在于人类认为它们比人类更聪明，“这些模型该当只运用于缺点本钱较低的领域，比如推举电影等。
但它的神奇力量会让很多人相信，它们能够用于一些缺点本钱很高的情境中，比如贷款批准、监禁讯断、医疗诊断或军事计策”。

（编辑邮箱：ylq@jfdaily.com）

栏目主编：杨立群笔墨编辑：杨立群题图来源：东方IC 图片编辑：雍凯

来源：作者：裘雯涵