Arm 宣告 Neoverse 新品：数据分析机能提升 196%奠定未来计算及 AI 的基石_机能_负载

2024-12-24 19:26:16 智能助手

作者 | 王启隆

Arm 宣告 Neoverse 新品：数据分析机能提升 196%奠定未来计算及 AI 的基石_机能_负载智能助手

责编 | 唐小引

出品 | CSDN（ID：CSDNnews）

北京韶光 2 月 22 日，半导体巨子 Arm 更新了 Arm® Neoverse™ 产品路线图，宣告推出两款基于全新第三代 Neoverse IP 构建的全新打算子系统（CSS）：Arm Neoverse CSS V3 和 Arm Neoverse CSS N3。

Arm Neoverse CSS V3 是首款高性能 V 系列 CSS 产品，与前代产品 CSS N2 比较，单芯片性能提升可达 50%。

Arm Neoverse CSS N3 是 N 系列 CSS 产品的最新拓展，相较于 CSS N2，其每瓦性能提升了 20%。

Arm 高等副总裁兼根本举动步伐奇迹部总经理 Mohamed Awad 指出：“Arm 构建了环球运用最为遍及的 CPU 架构，在多个领域的技能改造中发挥主导浸染，尤其在智好手机家傍边霸占核心地位。
随着 AI 渗透到教诲、就业、制造、医疗和交通等领域，AI 正在改变经济发展和我们的日常生活，而 Arm 是这统统变革的基石。
”

Arm® Neoverse™ 这条产品线是 Arm 专为根本举动步伐运用市场设计，进入 AI 时期之后，其运用范围从最初的运用做事器和数据中央拓展到了网络、安全和存储等诸多领域，在全体根本举动步伐领域发挥着关键浸染。

在如今 OpenAI 强势领衔，NVIDIA 气吞山河的这段 AI 加速增长期，我们可以通过解读这次产品路线图的更新，一览 Arm 这位“老大哥”对打算技能界的未来布局。

从根本改变根本举动步伐

在过去，软件和硬件分别由不同的公司卖力开拓，但如今这种传统模式已无法知足客户对性能的高哀求以及应对日趋繁芜的软硬件环境。
很多企业期望其支配的硬件，包括微架构层面，能针对软件负载进行深度优化。
然而，实现这样的深度领悟与联合优化须要多方协作，在软硬件研发上耗费大量的韶光。

这不仅很花精力，而且能自研硬件的软件厂商在环球范围屈指可数，于是他们不会绕弯子，而是选择直接去找最可靠的互助伙伴：Arm。

所谓可靠，是指 Arm 会通过在 IP 开拓阶段便展开深入且全面的支持来确保架构与微架构设计符合实际事情负载需求，并供应从 CPU 到全体平台层面的定制化优化做事：那么，为了深入优化 TCO，就必须着眼于全体平台，而天下上只有 Arm 能够在平台级别上调优内存和 I/O，并添加自定义事情负载加速器。

这是一种非常紧密的互助关系。
尤其是在 Arm 推出了 Neoverse CSS 之后，定制芯片变得更迅速，且更易实现。
微软的 Cobalt 100 CPU 便是一个经典的互助案例。
从头部云做事供应商到初创公司，Neoverse CSS 被广泛运用来推动更高的创新发展。

不难想象，这构成了一个极其强大的生态系统。

去年十月，Arm 在Neoverse CSS 的根本上，进一步推出了 Arm 全面设计 (Arm Total Design) 生态项目，集结了半导体家傍边的芯片设计伙伴、IP 供应商、EDA 工具供应商、代工厂和固件开拓商等各方力量，环绕 Arm 打算子系统（CSS）开展协同创新和系统开拓事情。

通过路线图的协同和技能整合，Arm 还设立了专业技能中央来缩短上市韶光并降落本钱，助力互助伙伴更高效地开拓基于 Neoverse CSS 的定制芯片。

在打算机发展的早期，IBM 垄断了大型机市场，拥有自己独特的硬件和软件体系构造。
然而，一些公司（Amdahl、Fujitsu 和 Hitachi）决定寻衅 IBM，试图制造与其大型机兼容的打算机。
终极 IBM 通过保持技能领先和市场份额，还是成功抵御了这些竞争者的寻衅。
这便是所谓的“大型机克隆战役”。

在这个 AI 时期，比起掀起新一轮的硬件战役，Arm 选择带头联络这些力量，立志使人工智能变得无处不在，并在网络安全领域为从芯片到云真个数字天下奠定信赖的根基。

个中也包括我们熟知的头部企业，如台积电、Intel 和三星。
还有开拓者们耳熟能详的云原生打算基金会（CNCF）毕业项目，也原生支持 Arm 架构。

目前，在短短四个月内已有超过 20 家企业加入 Arm 全面设计项目，涵盖新的 EDA 和配套 IP 供应商，以及来自韩国、中国台湾、中国大陆和印度等具有巨大发展潜力的计策市场的芯片设计公司。
他们均致力于确保高性能、高效率办理方案的广泛可触及性，助力知足 AI 加速未来的打算需求。

此外，基于 Arm 全面设计生态伙伴的反馈见地，Arm 近期还发布了芯粒系统架构 (Chiplet System Architecture, CSA)。
其旨在定义一个功能强大、支持通用的芯粒生态系统。

高负载才能看出性能差异

在过去的一年里，Arm 创造了不少市场空缺，于是为了供应知足根本举动步伐性能哀求的高效打算，他们推出了 N 系列的最新 CSS 产品——Neoverse CSS N3。
CSS N3 的首个实例可供应 32 核心，拥有卓越的能效表现，其热设计功耗（TDP）低至 40 瓦特。

基于最新的 Neoverse N3 IP 平台构建的 CSS N3，不仅引入了 Armv9.2 架构特性，还在每个核心上配备了高达 2 MB的专用二级缓存（L2），同时兼容并支持当前最前沿的 PCIe 和 CXL I/O 接口标准，以及统一芯片互连（UCIe）的芯粒互联规范。

也有些厂商希望在保有 CSS 所有上风的同时，实现更高的性能。
因此，Arm 便将 CSS 引入到了高性能的 V 系列，推出了 Neoverse CSS V3。

CSS V3 在单芯片上最多可扩展至 128 核，并支持最新的高速内存和 I/O 标准。
CSS V3 基于最新的 Neoverse V3 核心打造，是 Arm 目前单线程性能最高的 Neoverse 核心。
V3 为 Arm 机密打算架构 (CCA) 供应硬件支持。
V3 和 N3 核心均可供应业界领先的专用 L2 缓存大小，显著改进性能表现。

既然 CSS V3 主打性能，那它在关键事情负载下又能达到什么水平？Arm 供应了如下两张数据图，并强调了一个故意思的点：代际产品之间的性能提升。
Arm 的一大上风便是使互助伙伴可以不受制于技能供应商，而是自己节制创新的步伐，以是更新迭代的速率特殊快。

此外，常有人忽略一枚芯片有多少打算周期终极被用于压缩和协议转换等后台任务。
N 系列在压缩方面取得了性能上风，可降落云做事运营商的本钱，并终极降落云做事客户的本钱。
同样地，V 系列显著提高了协议缓冲区的性能，这是在数据中央内传输数据的一项关键功能。

光说数据会没什么实感，以是 Arm 也供应了实例。

如今，XGBoost 机器学习算法基本上渗透到所有依赖预测和个性化做事的领域，如内容推举、出行用度预估及旅行优惠推送等日常运用处景。
可以说，我们现在随便打开一个网页所看到的个性化内容，均利用 XGBoost 作为紧张数据库来驱动干系核心算法。

以是，这种以事情负载为重点的协作就能最好地表示生活中的实际运用处景。
Arm 针对特定关键事情负载的优化，让 N3 平台的 XGBoost 性能飙升至原来的 196%，而且这还是在已经超越同类厂商的事情负载上进行的结果。

未来打算及 AI 的基石

去年，有关 AI 的谈论焦点紧张集中在天生式 AI 和大措辞模型 (LLM) 上，行业重点都是如何演习更厉害的大模型。
但根据 Arm 的剖析，随着天生式 AI 广泛运用于实际业务场景，其事情重点将转向推理。

剖析师估计，已支配的 AI 做事器中有高达 80% 专用于推理，且这一数字还将持续攀升。
这一转变意味着要找到得当的模型和模型配置，并加以演习，然后将其支配到更具本钱效益的打算根本举动步伐上。

CPU 广泛可用，并可灵巧用于机器学习或其他事情负载，此外， CPU 还易于支配，并可支持各种软件框架，具备低本钱和高能效等上风。
因此，CPU 推理将是天生式 AI 打算运用的关键组成。

但是，并非所有 AI 处理都将在 CPU 上进行，现在风头正盛的 AI 硬件商不是 NVIDIA 吗？事实上，NVIDIA 不仅利用其领先的 Hopper GPU，同时也利用了基于 Neoverse V2 平台的紧耦合打算芯粒 Grace。
这种紧耦合的 CPU 加上加速器配置，对大参数 LLM 非常有益，对检索-增强-天生 (RAG) 等新兴方法也很有帮助。

可以见得，Arm 已经通过这次发布阐明了自己为什么是未来打算及 AI 的基石。

培植 AI 时期也离不开广大开拓者的努力，Arm 在天生式 AI 时期又该如何赋能开拓者？Arm 根本举动步伐奇迹部营销副总裁 Eddie Ramirez 向 CSDN 回答了这点：

我们致力于实现让 AI 运用开拓者可以轻松支配的 AI 软件栈。
针对中国开拓者，我们与龙蜥社区紧密互助。
通过供应 Arm Compute Library (ACL, Arm 打算库)，为 AI 运用中所利用的许多算法的实现供应出色的支持。
Arm 对 TensorFlow、PyTorch 等 AI 框架的支持，加之我们的加速打算库，两者将紧密集成，并纳入未来的龙蜥社区版。

本文系作者个人观点，不代表本站立场，转载请注明出处！

Arm Neoverse