【环球时报宣布 马俊】美国依赖软硬件上风,在用规模“堆”出环球最强人工智能(AI)的这条道路上狂奔不已。
美国富豪马斯克近日在社交媒体上宣告,旗下AI初创公司xAI已开始用10万块H100 GPU组成的“孟菲斯超级集群”进行AI演习,号称是“环球最强大的AI演习集群”。
中国是否该当跟随美国引领的这条技能路线?近日在由中国智能打算家当同盟与全国信标委算力标准事情组共同主理的2024中国算力发展专家研讨会上,多名院士专家给出了各自的不雅观点。

多名院士专家谈人工智能:中国成长AI不能靠“堆芯片”_模子_美国 计算机

未来超智领悟将分为三个阶段

中国科学院院士陈润生在研讨会上表示,“人工智能大模型是新质生产力的代表,大模型和超级打算的领悟发展十分主要,我国须要负责地去布局、去考虑。
”中国科学院打算技能研究所研究员张云泉提到,大模型的迅猛发展彰显出新质生产力的特质,但目前也碰着了算力瓶颈。
鉴于中国在超算领域拥有深厚技能积累,希望超智领悟(超级打算与以大模型为代表的智能打算进行领悟)能有效化解这一寻衅。
国家信息中央信息化和家当发展部主任单志广阐明说,“超智领悟是随着当前根本算力、智算算力、超算算力等的运用多元化发展而出身的,即能否用稠浊型算力资源或者领悟型算力体系,来办理同时知足多种不同算力的运用需求。

在预测未来超智领悟的进程时,中国科学院院士钱德沛认为,将沿着for AI、by AI和being AI三个阶段清晰演进,从硬件到软件全方位地进化,以适应和推动人工智能技能的发展。
在第一阶段for AI,将着重于对现有打算机系统的改造与升级,发展专用硬件,确保可高效地支持和实行AI任务,为人工智能研究供应坚实的根本举动步伐。
在第二阶段by AI,将要用AI改造传统的打算,一方面用AI的方法来求解传统超算问题,另一方面AI也在影响传统打算机的构造,这个趋势也会逐渐明显。
在终极的being AI阶段,打算机系统将呈现内在的智能特性,人工智能不再是一种外加的能力,而成为打算机的核心属性和基本组成,可能打算的能力或者智能化的水平,会远远超过我们本日的超算或智算。

陈润生把稳到,目前科学界和家当界一贯在企图办理超算和智算领悟的问题。
例如英伟达最新推出的GB200架构,实在是两块GPU加上一块CPU,某种意义上就可以算是把智算和超算的上风都用上了,在两块GPU实行机器学习的布局中,加上CPU供应的数据高速传输。
但他认为,这种架构并没有从根本上办理效率问题。
“超算与智算的结合是一定的,将会有机领悟,而不是大略地把它们凑在一起”。

中国工程院院士郑纬民也表示,大模型的开拓、演习、微调及推理各个环节均离不开算力,且算力本钱霸占着整体开销的大头,特殊是在演习阶段,其占比高达70%,而在推理阶段更是高达95%。
鉴于此,算力成为支撑大模型发展的关键成分。

智能打算该当参考“人类智能”

对付中国当前的大模型热潮以及跟随美国“堆规模”的技能路径,中国院士专家们提出了各自不雅观点。
钱德沛表示,中国现在搞出的大模型数量和种类比美国还多,也都在搞通用人工智能,但我们不但在硬件上受到美国的严格限定,而且用于大模型演习的数据的质量和数量也都偏少,“这样做出来的大模型能比美国好吗?我想我们还是要符合中国国情,不能够完备随着美国人走”。

陈润生也认为,中国现在涌现的大模型基本上是在美国提出的大模型和算法上进行改进,但是对付全体大模型的根本理论考虑甚少。
他在研讨会上提出,比拟传统超算采取的局域式影象模式,智能打算展现出了根本性的差异——信息的分布式存储。
这种存储办法模拟了人脑神经网络的繁芜构造,通过大规模、密集互联的芯片网络来承载日益弘大的模型。
但是如何有效地将人类知识嵌入这些繁芜系统,以及信息详细如何在系统等分布存储,其背后的算法与技能理论仍未充分探索。
“随着模型规模的无节制扩展,导致一个不可战胜的问题是能源耗竭,因此一味地增加芯片,依赖增加系统的繁芜度来办理大模型的存储问题是不完备可取的”。

由此陈润生认为,未来智能打算还是该当参考“人类智能”,也便是仿照人脑的运行机制。
人脑的体积非常小,能耗只有几十瓦,但它所产生的智能,超过了现在最前辈的、能耗相称于一整座城市的AI。
“大模型与智算的发展,不但是运用层面的模型和算法上改进,还须要从根本理论角度去有所打破。
现在大模型只是发展了前10%,还有90%的事情没做,我也相信大模型绝对不是靠着越堆芯片越多实现的,一定像人类的大脑一样学习,把空间繁芜度、韶光繁芜度压缩得更小,能耗降得更低。
以是我以为最基本的问题,是要研究目前空间繁芜度来完成智算的根本理论。
如果我们能在根本理论上有所发展,我们就能完成根本和原始创新。

北京运用物理与打算数学研究所研究员袁国兴认为,不可能指望一种通用大模型在各行各业都能够办理问题。
从实际情形看,不同的运用有不同的技能,哀求用不同的算法,对打算能力也有不同的哀求。
例如在科学打算方面,对打算精度的哀求越来越高,而随着打算机的规模扩大,数据越来越多,可信度在不断地低落。
美国国家航空航天局(NASA)也提出类似的不雅观点,他们对打算精度提出很高的哀求。
因此未来不同的运用会有不同的大模型、不同的打算,办理不同的问题。
现在的大模型对打算精度和算法的哀求完备不一样。

中国信通院云打算与大数据研究所所长何宝宏补充说:“打算和演习对底层根本举动步伐哀求并不一样,也须要判断在什么场景下要屏蔽差异性,在什么场景要表示差异性。

须要发展主权级大模型

张云泉表示,美国最近通过一系列举动试图在发展人工智能方面对我国“卡脖子”,包括禁售高端GPU、终止共享大模型的源代码以及中断生态方面的互助等。
同时现在大模型的运算规模达到1万块GPU,乃至10万块时,就须要通过发展大模型专用超算来打破能耗墙、可靠性墙、并行墙等技能瓶颈。
在此背景下,想要在短期内打破大模型算力瓶颈,中国有一条路可走:利用过去二十多年积累的前辈超算技能,研发大模型专用超算,战胜大模型算力瓶颈问题,使我国可以牢牢咬住环球大模型最前辈水平,不至于掉队。

张云泉在先容超智领悟体系下的“主权大模型”操持时表示,我国在超算领域拥有深厚技能积累,近年又投入巨量资金发展智能算力,聚焦建立以超智领悟算力体系为中央的体系工程相应大模型的算力需求,希望能最大化利用超算技能上风破解算力寻衅。
按照“主权级大模型”操持的支配,“主权级大模型”创新联合体将依托国家超算、中科院和全国重点院校的有名教授团队、智能芯片企业、大模型办理方案企业等共同打造类似OpenAI的开放组织,由非营利性部门组织“主权级大模型”研发,由营利性部门组织“主权级大模型”落地。
他建议说,超算是“国之重器”,须要用来占领最大、最难的寻衅。
主权级大模型是一个能支撑国家发展的根模型,不是一样平常的大模型。
类似的国家级超级大模型也受到其他国家的高度重视,例如美国微软公司携手 OpenAI发布了操持投入1000亿美元全新人工智能超级打算机的操持,日本最近也宣告要投入巨资发展国家级大模型。

陈润生认为,根据中国目前的根本条件以及大模型一定要发展的趋势,我们完备跟随西方的做法是不现实的,也是很难在短期内遇上的。
以是找到一条发展主权级大模型的路,更为主要。