瞭望|公共云提速“人工智能+”_模子_芯片
公共云和AI相结合还将推动云打算走向云智算
文 |《瞭望》新闻周刊 扈永顺
新一代人工智能技能正步入超过式发展新阶段,成为引领当代家当变革的核心力量。“人工智能+”今年首次被写入政府事情报告,多地积极探索推动AI深度赋能实体经济,开启了AI在各行各业广泛运用的新篇章。
随着AI技能和运用创新不断加速,模型繁芜度和数据量急剧增加,对包括算力在内的新型根本举动步伐培植提出了新需求和新哀求,建立适应AI+时期的高质量算力做事体系迫不及待。
日前国家信息中央信息化和家当发展部发布了《“人工智能+”时期公共云发展模式与路径研究》报告,提出公共云是破解我国AI+时期算力“供不上、用不起”瓶颈问题的主要抓手。
公共云是指面向"大众供应的云打算资源,通过聚合各种算力并通过在线的模式为各种用户供应大略易用,且近乎无限扩展的打算做事,实在质是将云打算资源规模化、大范围进行共享。“公共云能以资源利用效率最大化的办法,帮助提升我国算力供给能力,并通过规模经济效应推动算力门槛降落,让更多的用户享受普适普惠的算力做事。”国家信息中央信息化和家当发展部主任单志广先容。
智能算力紧缺制约大模型规模化运用
智能算力资源紧缺已成为制约大模型规模化运用的紧张瓶颈。
按照运用和功能特性,算力可分为根本算力、智能算力、超算算力三类,根本算力紧张基于CPU芯片,用于知足根本通用打算需求,如网购、打游戏等;智能算力基于GPU、FPGA(现场可编程门阵列)、ASIC(专用集成电路芯片)等AI芯片的加速打算平台,紧张用于人工智能的演习和推理打算,如语音、图像和视频的处理;超算算力由超级打算机等高性能打算集群供应,紧张用于尖端科学领域的打算。
智能算力方面,以AIGC(天生式人工智能)为代表的AI运用、大模型演习等所利用的数据量和参数规模呈指数级增长,带来了智能算力需求爆炸式增加。例如GPT-3模型参数约为1746亿个,演习一次须要以每秒一千万亿次打算,运行3640天。GPT-4参数数量扩大到1.8万亿个,是GPT-3的10倍,演习算力需求上升到GPT-3的68倍,在2.5万个A100芯片上须要演习90~100天。
在中文大措辞模型方面,2023年3月百度发布文心一言,4月华为发布盘古大模型,阿里发布通义千问大模型,商汤科技公布日日新大模型体系,5月科大讯飞发布星火大模型等,到目前我国大措辞模型已有上百个。根据中国信息通信研究院测算,从设备供给侧看,2022年我国打算设备总算力规模中,根本算力占比40%,智能算力占比则高达59%,成为算力快速增长的驱动力。根据预测,到2026年智能算力规模将进入每秒十万亿亿次浮点打算(ZFlops)级别。
“大措辞模型发展带来了AI算力需求的快速上升,所花费的打算资源每几个月翻一倍,算力需求的增长速率已经远超芯片性能提升和产能扩展速率上限。”单志广先容。
公共云具备缓解算力紧缺潜力
公共云因此需求为导向以运用为目的的一种公共做事模式。AI+时期,公共云将成为破解算力资源紧张、降落算力本钱的关键抓手。
首先,公共云具备演习大模型所需的强算力。演习环球领先的根本大模型须要调度至少万张GPU芯片高效协同事情,只有极少数公共云具备相应能力。从亚马逊、微软和谷歌等科技巨子运营公共云的履历来看,其上风是规模大、效率高,天然能向环球市场扩展。
其次,公共云的规模效应能够带来算力普惠。随着AI大模型规模化运用,支撑海量用户频繁利用所须要的推理算力本钱也将急剧上升,尤其是多模态大模型对付算力的花费将远高于文本类大措辞模型。算力本钱是限定大模型发展的关键成分之一,中小型AI企业每每难以通过自建算力举动步伐办理演习和推理算力需求,因此算力租赁需求兴旺。公共云可以多路复用,通过多租户利用同一套打算资源大池,削峰填谷,显著提升硬件资源利用率,降落利用本钱。例如亚马逊、阿里云等公共云厂商随着用户规模增加、技能优化和运营效率提升,持续降落云打算做事价格,亚马逊AWS曾连续三年每年贬价12次;过去十年阿里云将打算本钱降落了80%,存储本钱降落了近90%。
再者,公共云能够实现我国算力供给能力的边界打破。公共云通过集群的打算、网络、存储平衡设计和软硬一体化加速技能,调度“盘活”已有芯片,可以形成超大规模算力资源池,实现芯片复用、弹性可扩展;发挥公共云大规模机器调度、异构芯片兼容能力,不仅能将已有前辈芯片集约化利用,还能充分利用已有的通用CPU资源,为AI大模型演习和推理运用供应必要的算力支持;随着公共云技能体系加速升级,AI演习、AI推理以及HPC超算等打算资源将并池管理,实现算力普惠和模型遍及。
推动云打算走向云智算
公共云和AI相结合将推动云打算走向云智算。未来云打算将不再局限于IT打算本身,而是供应包括算力、模型、数据、生态等与智能化发展干系的全方位创新做事,从而促进AI+切实落地,引领新质生产力发展。
推动云打算走向云智算,亟待办理技能层面的短板。国家信息中央信息化和家当发展部提出了公共云技能做事架构办理方案。
第一,以领悟算力举动步伐为支点搭建云打算基石。利用虚拟化技能把各种硬件资源,如打算、存储、网络等整合起来,并输出领悟异构算力做事。无论是X86、GPU还是ARM(微处理器芯片),都能在这个平台上运行,不仅办理AI算力不敷的问题,还能使大规模商业化成为可能。
第二,以AI工程化工具为重点搭建平台,为开拓者供应统一的研发、测试、运维工具,包括了智算做事和机器学习框架,让AI开拓变得更加高效。开拓者无需在本地掩护繁芜的平台就能享受到工程化的便利,降落开拓本钱。
第三,为开拓者供应一站式模型做事。大模型是AI竞争的关键,通过模型聚合、开拓和做事的整合,冲破传统AI运用的壁垒,让AI技能更易于运用到各行各业。
第四,以智能化运用处景为特色,供应适用于各种智能化场景的软件做事。
“此外,公共云须要进一步提升大规模集群管理能力,以优化资源利用效率,从而更好地知足AI对算力的需求。”单志广先容。
来源: 新华网
本文系作者个人观点,不代表本站立场,转载请注明出处!