魏少军:人工智能到底需要什么样的芯片?_芯片_人工智能
人工智能正在经历第三轮浪潮。
上世纪的40-50年代,通用打算机的涌现,带来了人类对人工智能的第一次探索;进入上世纪90年代,以日本第五代打算机成为主要标志的第二次人工智能浪潮,通过“通用推理”办法实现了部分人工智能。目前,我们正在处于机器学习带来的第三次人工智能浪潮。
在本轮AI浪潮中,一个打破性的变革是,人工智能已经在多方面超越人类。
随着人工智能的加速发展,使得算力规模不断扩大、算力需求持续攀升。在这样的背景下,如何更加高效地配置、共享、调度并开释更多算力,成为人工智能发展的一个新的寻衅。
9月14日,在2023环球AI芯片峰会(GACS 2023)上,清华大学教授、中国半导体行业协会副理事长魏少军表示,未来人工智能技能须要从终端运用出发,以运用定义软件,再用软件来定义芯片,以知足各种人工智能终端设备的定制化需求,并提升算力的供给。
魏少军教授认为,工业革命延伸了人类体力极限,信息革命延伸了人类感知极限,而正在发生的智能化革命即延伸了人类的认知极限。
如今,智能化发展已经取得了巨大进步。以谷歌为例,谷歌的智能玩家比人类专业玩家能力强10倍,智能唇语识别的精准度达93.4%,语音识别的错词率只有5.9%。由机器学习推动的第三次AI浪潮,涌现了打破性变革,即机器在多方面超越人类。
AI须要“软硬”协同的芯片架构
人工智能的发展在给人们带来惊喜的同时,也在不断推动人工智能芯片向前演进。从早期功能芯片到性能专用芯片,再到追求灵巧性的可重构AI芯片。而随着大模型的涌现,人工智能芯片的发展目标又转向高算力。
在魏少军教授看来,只管智能化发展已经取得了阶段性的进展,但人工智能依旧存在两个现实问题。第一,算法在不断演进,新算法层出不穷。第二,没有统一的算法,只能一种算法对应一种运用。
现有的条件是,芯片制造完成后其物理构造基本特性随即固定,难以兼具高能效和高灵巧性,来知足人工智能算法演进变革的需求。因此,亟需变革芯片架构和设计范式。
如何设计兼具高能效和高灵性的芯片,这就须要找到一种新的架构。魏少军教授认为,新架构要同时考虑硬件和软件两个部分。在打算机事情的过程中,芯片是承载智能运算的底层硬件,而软件则承载智能功能的实现。
“如何在软件和硬件之间形成有效结合?基于软件可编程性和硬件可编程性,我们将这两者构成AI芯片的坐标体系。比如,处理器放在第二象限,专用集成电路放在第三象限,FPGA放在第四象限。而第一象限,即是具备软件和硬件的双可编程性,通过软件和硬件之间的有机领悟,来用软件定义芯片。”
在硬件构造方面,我们须要考虑如何利用软件来实现,将软件转换为一个可以与硬件构造匹配的大小分块。之后我们将推出一个分块软件系统。当硬件架构运行时,软件与硬件将实现映射。硬件功能不断根据软件编程结果的变革而发生变革。由此得到一个具备软件和硬件的双可编程性的智能架构芯片。
魏少军认为,“通用”仍旧是人工智能芯片的主流架构,然而此通用非彼通用,未来的通用人工智能芯片,须要在通用的根本上,变得更加“智能”,以知足各种各样终端运用的定制化需求。
目前,我国在“软件定义芯片”的方向上做的比较好,实现了芯片架构和功能的纳秒级重构,使硬件电路可随软件算法的变革而快速变革,在确保灵巧性的同时,大幅提升能量效率。
值得一提的是,如今,高性能打算机的打算能力已经进入E级时期,即每秒可进行百亿亿次数学运算的超级打算机。未来还将进入Z级时期,比E级还快1000倍。但在追求高算力的同时,在功耗和资金投入上花费都是巨大的。
2022年,天下第一的超算 E 级(1018Flops)美国Frontier超算的GPU芯片利用了前辈的6nm工艺,可以达到1.1亿个Flops,若算力再提高到1000倍(z级时期),纵然技能能达到3纳米,想要实现Z级打算,功耗为8000兆瓦,相称于2021年北京市总电力负荷的三分之一。
那么,8000兆瓦是8000万度电,一度电要花费5毛钱,用一个小时的400万公民币。前沿打算机花费了6.6亿美元实现了E级打算,相称于40亿公民币。
此外, CPU、FPGA、GPU等现有的打算芯片也难以知足下一代打算的哀求,一是打算芯片打算资源占比低,仅不到0.1%;二是技能资源利用率低,仅不到5%;同时,数据传输能耗高达90%。
“在人工智能完备智能化的发展中,我们一个主要的任务便是提高芯片自学能力和接管教诲的能力。犹如人类接管教诲和学习发展一样。但芯片并非如此,芯片出厂即顶峰,后面逐渐衰减。因此芯片在物理上无法实现不断学习发展。但智能软件是实现智能的载体,应具备自我学习能力,通过软件授予硬件持续迭代的能力。”因此,在强大算力需求的推动下,若想让芯片变得更通用、更智能,可以以运用定义软件,再用软件定义芯片,担保芯片在具备灵巧性的同时兼顾效率提升。
末了,魏少军教授总结了智能AI芯片应具备的基本要素:
1、学习能力、接管教诲并发展的能力;
2、算法和软件的自主演进能力;
3、自主认知、自主判断、自主选择和自主决策;
4、可编程性:适应算法的演进和运用的多样性;
5、架构的动态可变性:适应不同的算法,实现高效打算;
6、高效的架构变换能力:<10 Clock cycle,低开销、低延迟;
7、高打算效率:避免利用指令这类低效率的架构;
8、高能量效率:~10 TOPS/W;某些运用: 功耗<1mW;某些运用: 识别速率>25F/s
9、低本钱:能够进入家电和消费类电子
10、体积小:能够装载在移动设备上;
11、运用开拓简便:不须要芯片设计方面的知识
恭喜中科芯、思瑞浦、复旦微电、芯驰科技、芯擎科技等企业上榜(芯榜)
\"大众 data-from=\"大众2\公众 data-origin_num=\公众1\公众 data-is_biz_ban=\"大众0\"大众 data-isban=\公众0\"大众 data-biz_account_status=\"大众0\公众 data-index=\公众1\"大众>
本文系作者个人观点,不代表本站立场,转载请注明出处!