NVIDIA 公布 Arm 架构超算处理器 NVIDIA Grace ,基于 Arm Neoverse 架构、频宽达 900GBps 的第四代 NVLink ,预计 2023 登场

NVIDIA 当前在超级电脑领域仍得仰赖与 Intel 或 AMD 合作,不过未来 NVIDIA 也将针对超级电脑与 AI 运算推出自研 CPU 了; NVIDIA 在此次 GTC 大会由执行长黄仁勋宣布将推出名为 NVIDIA Grace

NVIDIA 当前在超级电脑领域仍得仰赖与 Intel 或 AMD 合作,不过未来 NVIDIA 也将针对超级电脑与 AI 运算推出自研 CPU 了; NVIDIA 在此次 GTC 大会由执行长黄仁勋宣布将推出名为 NVIDIA Grace 的自研 CPU ,基于新一代 Arm Nerverse 超算微架构,并且藉由新一代频宽高达 900GBps 的 NVLink , NVIDIA Grace 得以在多个 CPU 与 GPU 之间共享资料与记忆体,突破现行 GPU 受制 PCIe 频宽难以高速存取系统记忆体的限制,有助于透过大容量系统记忆体执行大规模科学运算与 AI 训练。

▲ NVIDIA 的超算晶片蓝图

NVIDIA Grace 预计于 2023 年推出,不过黄仁勋仍强调, NVIDIA 每世代的 GPU 加速产品仍将同时支援 x86 与 Arm 架构,因应客户不同架构与应用的需求。黄仁勋也在此次公布针对超算与 AI 的晶片蓝图,将以两年为周期交错公布 CPU 、 GPU 与 DPU ,而不少人期待的下一代 GPU 架构预计于 2022 年公布,至于 Grace 的后继产品预计在 2025 年亮相。

照片中提到了cpock、Grace Murray Hopper, in her office in Washington, D.C. 1978、O Lynn Gilbert, CC BY-SA 4.0, WIKIMEDIA COMMONS,包含了宽限料斗、宽限料斗、Grace Hopper庆祝计算机领域的女性、电脑、瓦萨学院

▲ Grace 取自程式语言先驱 Grace Hopper

Grace 象徵的是历史上有名的程式语言先驱 Grace Hopper /霍普,也是 NVIDIA 首度将科学家的名字用于 GPU 以外的产品线; NVIDIA Grace 的出现,也宣示 NVIDIA 在运算处理器有更完整的蓝图,继做为 NVIDIA 进军运算领域的 GPU 以外,加上与 VMWare 合作的 BlueField DPU ,现在再正式进军高效能 CPU 领域,使 NVIDIA 能够扩大对资料中心、 AI 与运算的核心布局。 

照片中提到了cscs、Hewlett Packard、O NVIDIA,跟英伟达、惠普企业有关,包含了展示广告、在线广告、平面设计、数码展示广告、商标

▲ SCSC 与洛斯阿拉漠国家实验室将率先导入 Grace 架构的超算系统

目前包括瑞士超级电脑中心 CSCS 、美国的洛斯阿拉莫斯国家实验室皆以预计导入基于 NVIDIA Grace 与 NVIDIA 下一代 GPU 构成的超级电脑系统,并于 HPE 取得合约建构这两套系统。

照片中提到了DDR4、HBM20、GPU,包含了系统、产品设计、产品、牌、字形

▲当前的 x86 超算系统所採用的 PCIe 频宽使得 CPU 与 GPU 难以超高速相互存取彼此的记忆体

Grace 是专为大规模 AI 与 HPC 运算所规划的超高效能 Arm 架构处理器,能满足包括自然语言处理、推荐系统与 AI 运算等应用,并具备超高运算性能与超大记忆体支援,同时能藉由次世代 NVLink  提供比起 PCIe 介面更高的频宽,使 CPU 与 GPU 能突破上限进行更直接的资料沟通,号称是 NVIDIA 与 Arm 团队历经一万工作年的成功,其结果即是搭载 Grace CPU 的新一代系统能够发挥比现行 x86 处理器之 DGX 系统高出 10 倍性能。

照片中提到了LPDDR5X、HBM20、GRACE,包含了角度、产品设计、产品、牌、长方形

▲ Grace 将採用第 4 代 NVLink 提供 CPU 、 GPU 与记忆体的相互存取,频宽达 900GBps

除了 Arm Neoverse CPU 微架构的性能外, Grace 还有两项重要且息息相关的关键技术,其一即是搭载 LPDDR5x 记忆体,这项记忆体技术不仅提供比 DDR4 更高的频宽与 10 倍能源效率,还提供统一快取一致性与单一记忆体定址,能结合採用 HBM 记忆体的 GPU 提供单一记忆体定址,将 CPU 的系统记忆体与 GPU 的 vRAM 构成超大规模记忆体;另一项关键是 Grace 将具备第四代 NVLink 通道技术,能够提供高达 900GBps ,相较当前 PCIe 4.0 的频宽高出 30 倍,以利于 GPU 快速存取 Grace 掌控的大容量系统记忆体,使进行大规模运算时不再受限 GPU 记忆体大小。

NVIDIA 也一併宣布将提供 NVIDIA HPC 软体开发套件与完整 CUDA 、 CUDA-X 库对 NVIDIA Grace CPU 的支援,能够使用高达 2,000 种以上的 GPU 加速运算程式。

照片中提到了Cscs、Hewlett Packard、NVIDIA.,跟英伟达、最大服务有关,包含了英伟达、平面设计、数码展示广告、在线广告、商标

▲ CSCS 将採用 Grace 架构的 Alps 取代现行的 Piz Daint

NVIDIA 在宣布 NVIDIA Grace 之际也宣布两套即将採用 Grace CPU 与下一代 GPU 的系统,宣布将与瑞士国家超算中心/ CSCS 、 HPE 共同打造基于 Grace CPU 的下一代超算系统 Alps ,新一代 Alps 将採用 HPE 新一代 HPE Cray EX 构成,并延续 CSCS 历代超算系统在天气模拟与预测领域的应用,此外还将广泛应用于材料科学、天体物理、流体力学、生命科学、分子动力学、量子化学、粒子物理学、经济学与社会学等研究,并将开放给瑞士与其他国家的研究人员使用资源。

ALPS 将做为取代现行 Piz Daint 系统的下一代系统,在结合新世代 NVIDIA CPU 与 GPU 的加持下, Alps 执行自然语言模型 GPT-3 训练仅需 3 天,比起 NVIDIA 目前自建系统、性能达 2.8 AI exflops 的 Selene 缩减 7 倍时间。

照片中跟Oyo房间有关,包含了新墨西哥洛斯阿拉莫斯国家实验室、洛斯阿拉莫斯国家实验室图书馆、新墨西哥大学洛斯阿拉莫斯分校、劳伦斯·利弗莫尔国家实验室、洛斯阿拉莫斯国家实验室

▲洛斯阿拉莫斯国家实验室将成 Grace 的第一个美国客户

洛斯阿拉莫斯国家实验室的下一代系统也同样採用基于 HPE 新一代 HPE Cray EX 的系统,同时也是第一家宣布导入 Grace 的美国客户,这也是洛斯阿拉莫斯国家实验室与 NVIDIA 长期合作的新进展,在新系统于 2023 年正式架设完成前,洛斯阿拉莫斯国家实验室将率先添购 NVIDIA A100 并安装于现行的系统提升运算效能。洛斯阿拉莫斯国家实验室预计将採用新系统做为高品质 3D 仿真加速科学与全新新运算方式。

原创文章,作者:普拉斯,如若转载,请注明出处:https://www.53moban.com/8535.html

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息