李彦宏:没有应用AI模型一文不值_模子_开源
下午13:30开始的家当发展主论坛上,百度创始人、董事长兼CEO李彦宏出席揭橥主题演讲。本文整理出核心不雅观点如下:
1、同样参数规模之下,闭源模型的能力比开源模型要更好。当你处在一个激烈竞争的市场环境当中的时候,你须要使让自己的业务的效率比你的同行更高、本钱比你的同行更低,这个时候,商业化的闭源模型是最能打的。
2、没有运用,光有一个根本模型,不管是开源还是闭源,一文不值。以是我从去年下半年开始讲,大家不要卷模型了,要去卷运用。
3、文心大模型的日调用量最近超过了5亿,代表了真实的需求,解释有人在用、是有人真的从大模型当中获益了,并得到了代价。
4、超级能干的运用比只看DAU的超级运用恐怕要更主要,只要对家当、对运用处景能产生大的增益,整体的代价就比移动互联网要大多了。
5、随着根本模型的日益强大,开拓运用也越来越大略了,最大略的便是智能体,这也是我们最看好的AI运用的发展方向。
6、AI不是人类的竞争对手,更多的是在扮演副驾的角色,还要人来把关。目前,AI已经创造了一些全新的事情机会。
以下是李彦宏演讲的紧张内容:
各位下午好,非常高兴再次来到上海参加天下人工智能大会。我是这个会议的常客,但是去年由于出国没有来,以是我上一次来参加WAIC是2022年,我记得当时大会的主题是元宇宙,我当时讲的主题是AIGC, 便是AI Generated Content(天生式人工智能),我认为AI的技能发展路线发生了方向性的改变,便是从过去的辨别式人工智能转向了未来的天生式人工智能。
这番话当时揭橥于2022年的夏天,五个月之后,大家都知道,ChatGPT发布了。
后来的事情大家就更清楚,以是两年的韶光实在恍若隔世,便是觉得全体天下都变了,人工智能可以说颠覆了绝大多数人的认知。
商业化的闭源模型“最能打”
2023年海内涌现了百魔大战,造成了社会资源的巨大摧残浪费蹂躏,尤其是算力的摧残浪费蹂躏,但是也使得我们追赶天下上最前辈的根本模型的能力得到了建立。去年10月我宣告文心4.0发布的时候,我说文心4.0的能力跟GPT-4比较绝不逊色,好多的同行还不以为然。
本日大家可以看到,海内已经有多款闭源模型声称他们已经追平或者是超越了GPT-4的水平。把稳,我这里说的是闭源大模型,不是开源大模型。
这也是今年以来便是争议比较多的一个话题,有些个生手乃至稠浊了模型开源和代码开源这两个观点。模型开源你拿到的是一大堆的参数,你还是要去做SFT,还是要去做安全对齐,你不知道这些参数是怎么来的,你是无法做到“众人拾柴火焰高”的,纵然你拿到对应的源代码,你也不知道他用了多少数据,用了什么比例的数据去演习这些个参数,以是拿到这些东西并不能够让你站在巨人的肩膀上去迭代和开拓。
以是同样参数规模之下,闭源模型的能力就比开源模型要更好。而如果开源想要能力追平闭源,那么它就须要有更大的参数,这就意味着推理本钱会更高,反应速率会更慢。
很多人拿开源模型来改款,以为这样可以更好地做事自己的个性化的运用,殊不知这样你就创造了一个孤本的模型,既无法从根本模型的持续升级当中获益,也没办法跟别人去共享算力。
当然我也承认开源模型在某些场景下是有它的代价的,比如说一些学术研究,或者说在传授教化领域,大家想要研究大模型的事情机制形成理论,这个时候可能是有代价的。
由于大家可能也常常听到,便是我们以为大模型能力很强,但是不知道为什么能力强,由于背后没有理论来支持他,以是研究领域用开源的我以为没问题,但是大多数的运用处景开源模型并不得当。
当你处在一个激烈竞争的市场环境当中的时候,你须要使让自己的业务的效率比你的同行更高、本钱比你的同行更低,这个时候,商业化的闭源模型那是最能打的。
没有运用,AI模型一文不值
当然这些都不是最主要的,没有运用,光有一个根本模型,不管是开源还是闭源,一文不值。以是我从去年下半年开始讲,大家不要卷模型了,要去卷运用。
但是我看到我们的媒体仍旧是把紧张的关注点放在了根本模型身上,一天到晚到处去关注跑分、刷榜,谁又超越GPT-4了?OpenAI又出来GPT-4o了等等,本日这个震荡发布,来日诰日那个史诗级更新,但是我要问:运用在哪里?谁从中获益了?
运用实在离我们并不迢遥,基于根本模型的运用在各行各业各个领域都已经开始了逐步的渗透。
两个多月前,我们宣告文心大模型的日调用量超过了2亿,最近又超过了5亿。实在仅仅是两个多月的韶光,调用量发生了这么大的变革,它背后是代表了真实的需求,是有人在用、是有人真的从大模型当中获益了,得到了代价。
比如在快递领域,让大模型帮助处理订单,做到了一张图、一句话,寄快递不再须要其他的繁琐流程,韶光从3分多钟缩短到19秒,而且90%以上的售后问题也都是由大模型来办理,效率提升非常的明显。
再比如在小说的创作领域,一开始我们用开源模型做出过一些效果,后来改用文心的轻量级模型,经由10轮上万组数据的SFT和Post-pretraining(后期预演习),结果有了明显的提升。
最近,我们又转到文心4.0的版本,那么仅用了数百条的数据,天生的内容无论是可用率还是优质率,都大大超过了文心的轻量级模型。网文作者们为虎傅翼。
超级能干的运用比只看DAU的超级运用更主要
实在更通用的领域,比如说代码生成功能,文心、快马这样的软件在各个领域也在逐步地渗透。
百度内部的话,我们有30%旁边的代码已经是用AI天生的,代码的采取率超过了44%。
不过我们要避免掉入超级运用陷阱,以为一定要出一个日活用户10亿的APP才叫成功。我认为这是移动时期的思维,AI时期的规律很可能不是这样。超级能干的运用比只看DAU的超级运用恐怕要更主要,只要对家当、对运用处景能产生大的增益,整体的代价就比移动互联网要大多了。
看好智能体的运用发展方向
随着根本模型的日益强大,开拓运用也越来越大略了,最大略的便是智能体,这也是我们最看好的AI运用的发展方向。
制作一个好的智能体常日并不须要编码,只要用人话,把这个智能体的事情流说清楚,再配上专有的知识库,一样平常便是一个很有代价的智能体了,这比互联网时期制作一个网页还要大略。
未来,在医疗、金融、教诲、制造、交通、农业等等领域,都会依据自己的场景,自己特有的履历、规则、数据等等做出各种各样的智能体,将来会有数以百万量级的智能体涌现,形成弘大的智能体生态。
而搜索是智能体分发的最大的入口。刚刚过去的高考季,很多大模型公司热衷于去写高考作文:我用AI写一个作文能得多少分儿?实在这个实用代价是不大的,人家不会许可你带一个大模型进去参加高考。
真正的需求是大量的考生在考完之后要报志愿,要选择学校、选择专业。他们对一所大学一个专业会有各种各样的问题,而每一个考生的情形又是不一样的。这个时候便是须要有一个智能体来回答每一个考生专有的问题。
在高峰期间,百度的高考智能体每天要回答超过200万个考生的问题,而我们统共只有1000万的考生。在一天当中,有这么大比例的人在利用这个智能体,解释AI正在以前所未有的速率向各行各业渗透。
AI只是赞助,干系事情机会正大量出身
很多人担心,如果我们日常的事情都让AI去做了,人是不是就没有事情机会了?
这种担心不是没有道理,但是过去这段韶光,我听到的担心、听到的抱怨很多,听到的培植性的见地比较少,很少有人去致力于发掘天生式AI带来的新的事情机会,我在这儿算是抛砖引玉吧。
我以为,一方面AI更多的是在扮演副驾的角色,还要人来把关,AI只是赞助人事情,而不是替代人事情,它让人的事情效率更高,质量更好。其余一方面,我们也看到有一些全新的事情机会开始冒出来了。
比如数据标注师,过去几年我们帮助全国20多个城市落地了数据标注中央,供应了大量的新的就业岗位;再比如提示词工程师,往后不用编程了,但是做好一个智能体还须要把事情流说清楚,这里头要有很强的逻辑性,要用提示词对模型进行调校。
随着智能体的大量呈现,这种事情需求也会飙升。这些个事情机会常日门槛并不高,你做的一样平常也能够养家活口,做得好的话,那上限可以年薪百万。
自人类文明出身以来,永一直止的创新,便是刻在我们DNA当中的,从石器时期的手斧,到移动时期的手机,再到AI时期的大模型,人类不断创造各种工具来改进生活、提高生产力,但是它们永久只是工具,只有在被人类所利用的时候才有代价。
我们武断地相信,AI不是人类的竞争对手,构建和运用人工智能技能是为了知足人的需求,增强人的能力,让人类的生活更美好。感激。
本文来自华尔街见闻,欢迎***APP查看更多
本文系作者个人观点,不代表本站立场,转载请注明出处!