谷歌版ChatGPT首秀回答掉足聊天机械人几回再三翻车袒露软肋?_缺陷_模子
Bard首秀翻车
在谷歌发布的一则***中,Bard被问道:“我如何见告我9岁的孩子韦布空间望远镜有哪些新创造?”
对此问题,Bard的回答不仅内容丰富,还更普通易懂。有人创造,和ChatGPT的回答比较,Bard的答复也更切题,能够引发一个9岁孩子对宇宙的兴趣。
但可惜的是,Bard的回答中有一项事实缺点。Bard称,韦布空间望远镜拍摄到了太阳系生手星的第一张照片。但事实上,第一张系生手星照片是由位于智利的欧洲南方天文台甚大望远镜在2004年拍摄的。
尴尬的是,就在Bard被外界创造答题缺点前,谷歌还曾表示,Bard仍处于测试阶段、尚未对外发布,是由于他们更谨慎地对待AI工具,确保Bard的回应符合谷歌“对现实天下信息的质量、安全和可靠度的高标准”。
除了在回答问题上翻车,谷歌8日举行的一场AI发布会也被外界认为“平平无奇”。
据美国有线电视***网(CNN)宣布,在巴黎办公室举办的一场活动上,谷歌详细先容了AI技能将如何从根本上改变人们搜索信息的办法。谷歌还透露Bard干系技能将被运用于搜索引擎中,但并未透露Bard的对外发布韶光。
另一边,谷歌的竞争对手微软则在7日宣告,将推出搜索引擎必应(Bing)升级版,并搭载ChatGPT中利用的AI技能。
对此,投资者已开始担忧,利用了AI技能的微软将成为恐怖的竞争对手,谷歌在搜索市场上的主导地位或将被削弱。
截至8日美股收盘,谷歌母公司字母表股价大跌7.68%,市值蒸发超1000亿美元。Bard的失落误也被外界评为“AI犯下的最昂贵缺点”。
“不苟言笑地胡说八道”
Bard首秀时的答题缺点虽然令工资难,但实在ChatGPT的类似缺点也并不少见。随着用户激增,人们创造这些谈天机器人的回答乍一看令人信服,但细节却常常出错。
比如,美联社8日在搭载了AI技能的必应上搜索“24小时内体育界发生的最主要事宜”,得到了一长串有关美国职业橄榄球大赛“超级碗”的细节丰富的描述,包括参赛军队、比赛比分乃至献唱的歌手是谁。但唯一的问题是:今年的“超级碗”尚未开赛。
诸如此类“不苟言笑地胡说八道”还有很多。比如,ChatGPT就常被创造会“发明”虚构的历史名称或不存在的书本,在解答数学问题时也频频翻车。
有剖析认为,这些缺点的缘故原由是由于ChatGPT、Bard等措辞模型常常会产生“幻觉”,由于这些模型只是接管了大量文本语料库的演习,并不是查询已经由验证的事实数据库来回答问题。
英国AI初创企业Speechmatics分管机器学习的副总裁威尔·威廉姆斯(Will Williams)认为,这些模型的开放性将是一把“双刃剑”,“一方面,这带来了高度的灵巧性和流畅性,险些能就任何话题进行引人入胜的对话。但另一方面,你永久不会知道模型打仗的是否是事实,会不会产生过度自傲的‘幻觉’”。
还有专家担心谈天机器人的巨大风险。
经济和人工智能领域专家加里·N·史密斯(Gary N. Smith)认为,大型措辞模型的根本问题在于,它们并不具备理解能力,也无法区分事实与虚构,“在学会思考之前就学会了写作”。
目前,大部分专家仍认为,ChatGPT、Bard等AI尚未达到一样平常人类聪慧水平,即还不是“强人工智能”AGI。因此,媒体、风险投资家和科技企业的大肆宣扬可能会起到反效果。
在史密斯看来,目前,这些谈天机器人的最大危险并不是它们比人类更聪明,而在于人类认为它们比人类更聪明,“这些模型该当只运用于缺点本钱较低的领域,比如推举电影等。但它的神奇力量会让很多人相信,它们能够用于一些缺点本钱很高的情境中,比如贷款批准、监禁讯断、医疗诊断或军事计策”。
(编辑邮箱:ylq@jfdaily.com)
栏目主编:杨立群 笔墨编辑:杨立群 题图来源:东方IC 图片编辑:雍凯
来源:作者:裘雯涵
本文系作者个人观点,不代表本站立场,转载请注明出处!