中国AI长卷(二):框架立基_框架_家当
2021年正值科技摩擦之际,我采访到一位工业机器公司的技能卖力人,向他问到:“制造领域有没有一些“卡脖子”的情形?”
他提到,“工业智能制造的核心要素,可以归纳为“三软三硬”。三软紧张是指大数据、人工智能和工业软件,三硬紧张是指核心装备、制造工具和材料。卡脖子这个问题,在各行各业各个领域都普遍存在”。
“反倒是深度学习框架,现在的情形还好,没有卡脖子。TensorFlow是开源框架,虽然也是国外的,但目前还没有封闭,不过也不用除它后期还会封闭。这也是为什么我们公司选择国产深度学习框架,一是利用门槛更低,二是防患于未然。客不雅观地说,国产框架离TensorFlow还有一定的差距,但这个差距在肉眼可见地缩小。”
从传统的深度学习模型时期,到朝阳东升的大模型时期,都离不开AI框架的平台化支撑,其主要性不亚于芯片。但和芯片不同的是,与大模型发展相适配的国产AI框架,基本实现了自保。
这是根本技能领域一个非常大的进步,也是中国为什么没有错过这一轮大模型AI热潮的缘故原由之一。
2021-2024的短短数年,从机器学习到大模型,新旧技能“沧海桑田”,科技行业风云变幻,但AI框架之于家当的主要性,却从未改变。
如果说,从信息化、数字化到智能化的漫长进程,就像鱼类走向陆地的进化变迁,那么AI框架,就处于算力层与运用层的中间地带,犹如海洋与陆地之间的那道“海岸”,支撑着各行各业与智能浪潮的交融。
那么,究竟什么是大模型所须要的AI框架?AI框架是如何知足家当链需求的?国产AI框架与外洋框架的差距或差异又在哪里?
本文就让我们深入AI家当链的中枢地带,沿着AI框架的“海岸”一探究竟。
AI框架家当与智能之间的那道“海岸”
鱼要经由海岸,进化成两栖动物,适应陆地,才能具备在新环境的生存能力,拓宽种群的边界。同理,AI模型从演习到推理的全流程落地,开拓者也须要一种根本举动步伐作为助力,这便是AI框架。
一个底层AI框架,至少具备几个特质:
1.通用性。AI框架作为根本举动步伐,广泛覆盖各种模型,同时简化了AI开拓过程,对多种算法进行模块化封装,让开发者不须要“重复造轮子”,可以快速搭建AI模型。比如对多元异构打算硬件的适配兼容,支持大分发多类型任务调度的分布式能力,核心算子库等,是开拓各种算法模型都须要的,都要在框架层去办理。
2.全流程。AI框架集成了模型开拓所须要的工具,为开拓职员供应全流程的开拓环境。详细来说,演习、调优、测试和支配的一全体标准化流程中,所须要的相应组件,都能够在一个平台得到,进行全流程的项目提升,高效知足各种场景的定制化建构需求。
3.生态化。从家当链全局来看,AI框架下接芯片,上承运用,是芯片厂商、运用开拓者、软件做事商等多个行业主体都汇聚的中枢地带,形成了非常关键的AI生态系统。拥有一个集聚家当链的自研AI框架,就犹如拥有了一条生态丰富、自主可靠的海岸线,是一企乃至一国守住AI边陲的关键。
因此,当ChatGPT代表的大模型爆火之后,焦虑无处不在,“我们没有大措辞模型怎么办?”“高端算力卡被禁了怎么办?”“根本软件卡脖子怎么办?”但同样至关主要的底层AI框架,却没有涌现“什么时候才能有自己的框架”的焦虑。
试想一下,如果国计民生重点行业的大模型,建立在外洋企业的框架上,开源容许证的断供风险、数据安全风险可想而知。幸好,国产AI框架,早就做好了准备。
目前,国际有两大主流AI框架TensorFlow(谷歌)、PyTorch(Meta),而中国自研的AI框架,按照其厂商可以分为三类:
一因此百度为代表的AI头部科技企业推出的,如飞桨paddlepaddle,基于前辈模型和家当生态积累,布局AI框架,建立智能业务的体系化上风。
中国软件家当40年功绩人物、“国家卓越工程师”称号、百度CTO的王海峰,曾回顾文心一言的开拓过程:2023年要在算力需求爆发、供应紧缺的条件下,快速跟上ChatGPT的趋势,正是基于百度的深度学习框架飞桨paddlepaddle,下贱跟主流的芯片厂商做了适配,任何好的算力,我们都能用得起来,很快完成了大模型演习。
二因此华为云为代表的AI云做事厂商推出的,如昇思mindspore,通过AI框架,在云根本举动步伐和行业云用户之间搭建起桥梁,供应完全的云端大模型做事。
去年大模型的百花齐放,便是很多ToB企业和软件公司,利用华为云上的AI框架昇思mindspore,以及盘古大模型、昇腾AI云做事等,支持海内各种开拓者、做事商等结合行业运用处景,做出原创模型,支撑了海内多个领域演习并首发大模型,加速了大模型走向家当化的进程。
三是垂类AI做事商、研究者推出的深度学习框架,具备某些独特的技能特性或运用处景,比如旷视科技(Megvii)在打算机视觉领域的专长,使其MegEngine框架在图像处理任务上表现突出;清华大学打算机系推出的Jittor,特殊适宜于研究和教诲领域,便于快速实验和算法原型开拓;腾讯优图的NCNN框架专为移动端和嵌入式设备优化,适宜资源受限的环境或边缘打算;一流科技的Oneflow,也是业内完全的深度学习框架类产品。
不同于英伟达基于芯片构建的软件生态体系,国产AI芯片厂商受限于产品规模,自研软件配套的运用范围比较有限,有待发育,就不详述了。
综上,面对大模型掀起的这一轮AI浪潮,外洋框架平台生态发达,起到了一个“海阔凭鱼跃”的浸染。国产AI框架也没有缺席,为各行各业探索大模型,奠定了根本,汇聚了力量。
回溯框架演化,“双漏斗式”的AI筑基进程
AI框架之以是没有缺席,是中国产学界人士“板凳甘坐十年冷”,一点一滴地构筑而成的。这个过程,遵照了技能领域的“双漏斗”规律,是一个从扩散到收敛,从收敛到扩散的过程,其间经由开拓者不断选择和淘汰,终极蜕变成了今日格局。
第一阶段:早期期间的扩散漏斗(Diversity Phase)。
新技能涌现的初期,由于技能尚未成熟,新的想法和产品层出不穷,市场和用户对付哪种技能会终极胜出存在很大的不愿定性,因此会涌现多样化的技能流派。
PC操作系统、移动互联网OS都经历过百花齐放、多家争鸣的阶段,AI框架也不例外。深度学习大行其道的时候,数据、算法和算力激增,工程繁芜度提高,开拓者非常须要减少“重复造轮子”,直接调用某些模型或工具,这时候各大厂商都开始将自研算法和工具封装为软件框架,供开拓者利用,呈现出了Theano、Caffe(伯克利大学)、Torch、DistBelief(谷歌,TensorFlow前身)等多款框架。
同一期间,海内还没有互联网企业或科技公司做框架,部分高校在学术科研角度做了一些零散的事情。构建完全的深度学习框架,是2013年百度开始。由于很早就关注到深度学习技能,百度更早碰着了深度学习运用上的一些寻衅,比如所有的算法从头写,开拓效率低,常常出错;每个深度学习开拓团队写的程序差异很大,模块无法复用,兼容性也不高,急需一个统一框架。于是2013年,百度开始在框架上投入。据理解,当时百度内部也是框架百花齐放,开拓了多个深度学习框架,办理不同业务的不同问题。
值得把稳的是,早在此时起,国内外的框架就已经显露出差异化的特质。以Caffe、Torch为代表的外洋框架,更倾向于学术、工程师利用;以百度为代表的国內框架,从家当土壤上成长出来,一开始就很看重实用性、功能性、分布式演习、硬件优化等家当特性。
第二阶段:竞争期间的收敛漏斗(Consolidation Phase)。
随着韶光的推移,更紧张是AI巨子如谷歌、Facebook、百度的上风框架相继开源,其他框架逐渐被淘汰、合并,多样化的框架格局开始向几家主导“收敛”。
2015年开始,谷歌大脑宣告TensorFlow开源,2016年百度飞桨宣告开源,2017年Meta人工智能研究院(FAIR)宣告PyTorch开源。开拓者逐渐集中到几个主导者生态中。
曾经的热点框架如Theano、CNTK(微软)、Keras、Caffe2都相继停滞掩护,或被主流框架收编,百度内部也开始将多款框架收敛为paddlepaddle,并正式对外开源。
这一阶段,海内外并不“同此凉热”。
一方面,PyTorch凭借极强的学术灵巧性、易用性,迅速崛起,已经发布很快成为爆款,成为围剿谷歌“框架霸权”(TensorFlow不兼容其他开拓框架)的新力量。
另一方面,当时海内很多企业的AI意识还没有觉醒,以打算机视觉为代表的深度学习技能,很难知足家当落地的精度需求。因此,当外洋AI巨子环绕框架“火星四溅”的时候,中国的深度学习框架依然是“冷板凳”,企业中只有百度一家在坚持做。
如果说,当时外洋框架是因竞争而主动收敛,那海内框架便是由于遇冷而被动孤守。
第三阶段:摩擦期间的再生漏斗(Renewal Phase)。
当主导框架不再适应时期需求,就会涌现新的创新浪潮,导致技能的多样性再次增加。“TensorFlow、PyTorch两分天下”的局势被改变,国产AI框架的创新再生大爆发,是在2019-2020旁边,中美科技摩擦逐渐增多,需求侧和供给侧都发生了诸多变革。
从供给侧来看,外洋框架爆出安全漏洞,而AI又涉及国计民生核心领域,供应链风险不得不重点考虑,自主可靠的国产框架成为必需,供给增多。这一阶段,国产AI框架进入加速发展期,除了飞桨PaddlePaddle,华为、阿里巴巴、腾讯、旷视科技等家当界,以及清华萨血等学术界,也都相继推出了自研框架,丰富了国产框架的活力。
从需求侧来看,随着AI渗透率提升,中国各行各业的开拓者须要中文框架,更贴合中国市场的工具与数据集,更符合中国开拓者需求的社区生态,更能知足中国度当需求的AI平台。
有开拓者曾提到过,偏底层的TensorFlow,没有为开拓者考虑到大量细碎问题;习气了邮件沟通的外洋平台社区,无法知足中文开拓者实时互换、社群互动的本土化开拓需求;需求分散、场景多样的海内里小企业,很少有技能职员,TensorFlow、PyTorch纯开源框架不能供应成熟低门槛的办理方案,这种模式无法支撑AI广泛落地。
当前阶段:大模型期间的再收敛漏斗。
AI框架从深度学习到大模型阶段,从扩散到收敛再到扩散,技能改造与格局嬗变的背后,一条主线从未改变,那便是从学术抵家当化,变得越来越易用、实用。对开拓者和家当更友好,更具运用上风的框架,生态的吸引力更强,框架的生命力也就更长,终极从群雄逐鹿的赛场中厮杀出来,成为主导。
目前,源于中国度当实践的国产AI框架,也逐步收敛到更懂家当运用处景、更具技能前辈性和生态规模上风的飞桨与昇思。
详细表现在,飞桨和文心一言,昇思与盘古大模型,与家当结合的广度和深度,已经超越了其他国产框架的生态规模。
同时,形成了全链路、低门槛的大模型做事能力,供应从算力、模型到运用、商业层的多元多层支持,凝聚更加广泛的开拓者。
家当链角色的多样性与开放性也格外显著,与模厂、硬件厂商、运用开拓者、软件企业、ISV做事商等行业伙伴,都建立起了较好的相互赋能关系,构建起智能做事的产品构造体系。
进入大模型时期的新阶段,AI根本举动步伐的主要性,也被拔高到了前所未有的高度。
正如根本通用模型不可能人人都做,如果企业和科研机构无差别入场做根本模型,会造成算力人力的极大摧残浪费蹂躏,也会让利用者的精力分散在各种模型的试错上,无法快速凝聚到技能更强的模型上,框架也是类似的逻辑。
一个底层框架的技能上风、工具完全度、生态规模,须要长期积累、积少成多,而根本软件又格外须要生态的发展和搜集。逐步收敛到飞桨、昇思等更具潜力和繁荣的家当化框架上,构筑AI计策底座,将是大势所趋。
如前所说,AI框架是技能浪潮与家昔时夜陆的连接地带,只有在一次次潮起潮掉队,仍旧坚守下来的平台,才能成为中国AI家当链的武断守护者。
光阴洗练后中国AI的差异化亮点
经由韶光和市场的洗练,国产框架与外洋框架的特性差异,也变得越来越清晰。而这,可以作为一个侧影,让我们看到中国AI的差异化亮点。
还记得ChatGPT横空出世之后,大家总能听到这样的辞吐,“中美AI差距有十年”“OpenAI齐心专心底层创新,中国AI还没终年夜就得出去赢利”“百模大战是同质化的摧残浪费蹂躏资源”……
从AI框架可以看到,更强的家当化能力,本便是中国AI的底色,也是亮色。
根本能力上,以飞桨、昇思为代表的AI框架,在家当AI方面的实践更多、积累最早,理解也最为深刻,因此可以很好地支持AI模型开拓与支配,让家当迅速、更大规模运用这些新技能。
举个例子,面向科研、强调学术研究灵巧性的PyTorch,对家当运用的推理支配需求,做得是比较薄弱的,而国产框架为大模型抵家寺库设了一条高效通道。
飞桨很快上线了对大模型开拓的功能支持,供应了一系列模型封装能力,加速大模型的家当化落地。昇思MindSpore供应了一整套高效、易用的大模型使能套件,形成了端到真个使能大模型开拓能力。
通过AI框架,开拓者与行业少走弯路,不重复造轮子,快速高效地把大模型用起来,这是中国的基座通用大模型快速跟进、行业大模型爆发的条件。
产品体系上,源于家当需求的国产AI框架,能力布局更加全面、细致,可以更好地知足家当落地AI大模型的实际需求。
纯开源的外洋模型,常常会强调自己的技能有多厉害,有多强,对开拓者就主打一个“野蛮成长”,这与其数字化水平、数字人才等都有直接关系。
然而中国企业的小、分散、需求长尾,决定了AI框架作为家当根本举动步伐,是不能轻易“放养”的。
比如硬件适配,外洋以英伟达为主导的硬件市场,也不像中国面临多元异构算力问题的巨大寻衅。作为国产AI框架,必须进行软硬件结合的深度领悟优化,做特殊多的工程开拓事情,来降落开拓者的硬件适配本钱。
再比如模型库。模型库不是深度学习框架核心的组成部分,底层框架厂商投入精力去打造更细分的模型,看起来彷佛是把精力分散到了外围一些无关紧要的东西上,而不是底层核心技能。但从家当运用的角度来看,中国存在大量企业,没有专门的研发职员能够利用核心框架,从头完成一个模型的自研事情,AI也没有办法落在家当需求中。
利用框架平台的AI办理方案、模型和开拓套件,进行微调改写,就能得到一个贴合场景的定制化模型,这更符合中国的家当实际。
源于家当、面向家当、托举家当,以国产AI框架为基,犹如隐蔽在漫永劫间深处的“海岸”,在技能潮水涌动之际,才能看出计策代价,支撑住中国产学政各界对大模型技能的期待。
处于家当链中枢地带的AI框架,以稳定的底座、百口当链的贯通、较低的门槛,吸引了大量行业和从业者在这里居住,适应并探索AI新技能;
在这里“进化”,从非数字原生组织,成长出数字化、智能化的能力;
在这里“领悟”,多种家当角色在这里互换、领悟、创新,汇聚起丰富的AI生态。
终极,经由AI框架的“海岸”,开拓者和行业一步步向AI时期迁徙,开启家当智能进化的新篇章。
本文系作者个人观点,不代表本站立场,转载请注明出处!