NVIDIA GPU 技术再度席捲 TOP 500 榜单,达 342 套系统使用 NVIDIA 加速技术、其中包括微软 Azure 、剑桥大学与特斯拉

作为全球超级电脑指标的 TOP500 稍早公布全新的榜单排名,此次在前 500 大系统当中,有高达 342 套系统使用 NVIDIA 的加速运算,其中 58 套入围的新系统有 41 套採用 NVIDIA 的加速运算,前 10 大超级电脑系统

作为全球超级电脑指标的 TOP500 稍早公布全新的榜单排名,此次在前 500 大系统当中,有高达 342 套系统使用 NVIDIA 的加速运算,其中 58 套入围的新系统有 41 套採用 NVIDIA 的加速运算,前 10 大超级电脑系统当中有 8 套採用 NVIDIA 加速技术;此外,採用 NVIDIA 的超算系统也在节能榜单表现亮眼,在 GREEN 500 的前 40 名有 35 套採用 NVIDIA 加速技术、前 10 名仅有一套非 NVIDIA 加速技术。

值得注意的是採用 InfiniBand 连接的系统也比去年提升 20% ,意味着新一代系统由于处理 AI 、 HPC 与类比资料的增加,对于降低网络延迟较过往更为重视;这些新系统也包括微软新一代 Azure 云端系统、剑桥大学的 Wilkes 以及特斯拉的 AUTOMOTIVE 。

微软新一代的 Azure 是提供公有云服务的超算系统,此次一口气以四套系统佔据 TOP500 自 26 位到 29 位,这四套 Azure 系统皆可提供高达 16.59 petaflops 的 Linpack 性能。微软新一代 Azure 在每个虚拟实例提供达 8 个 A100 Tensor Core GPU ,多个实例之间以 HDR 200G InfiniBand 连接,共可在云服务与高达数千个 GPU 进行高速连接。

而剑桥大学此次以 Wilkes-3 成为当前学术单位性能最高的超算系统,同时也是当前 GREEN 500 的第三名, Wilkes-3 更是一套云原生超算系统,使研究人员可共享高度安全与隐私的虚拟资源。 Wilkes-3 在架构导入 BlueField DPU 提供安全、虚拟化与数据管理应用,并透过 320 个以 HDR 200G InfiniBand 连接的 A100 GPU 。

▲今年 NVIDIA 在超算领域表现依旧亮眼, TOP 500 前 10 有 8 套入围、 GREEN 500 前十则仅有一套非 NVIDIA 系统

同时,从许多新落成的超算系统架构,亦可感受到除了加速运算外, AI 在超算领域日益受到重视,如美国国家能源研究科学计算中心的 Perlmutter ,就已达 6,144 个 A100 GPU 、 64.59 Linpack petaflops 表现取得 TOP500 的第 5 位,更重要的是 Perlmutter 在 AI 的表现, Perlmutter 贡献当前最新版本的 HPL-AI 达一半的性能,并在提供目前深度学习、科学计算与商业计算所需的混合精度计算的同时,仍可提供双精度运算。

佛罗里达大学的 HiPerGator AI  以 17.20 夺下 Top 500 的 22 位,同时与第一位仅 0.18 Gflops / Watt 之差为当前超算节能指标 Green 500 的第二名。而 Perlmutter 也是藉由模组化的 NVIDIA SuperPOD 构成。

位于卢森堡 MeluXina 超算系统是此次位于欧洲的新进榜系统,并首次入围即以 10.5 Linpack petaflops 取得第 37 名的排名;而英国的剑桥一号则以 9.68 TFLOPS 取得 TOP 500 的第 42 名,也是当前英国最强大的超算系统。另外瑞典的 BerzeLiUs 则以 5.25TFLOPS 取得第 83 位,专注于 HPC 、 AI 、资料分析,藉由 200G InfiniBand 连接达 60 套 NVIDIA DGX 系统。

在纯 AI 运算领域,作为当前 HPC 之 AI 算力基準的 HPL-AI 也在此次有显着的变化,相较去年 6 月公布的榜单,前 10 名系统的 HPL-AI 得分成长近 5 倍,其一关键就是 2020 年 3 月所公布全新的代码;这项新代码能够消除系统之 GPU 与 GPU 沟通等待 CPU 决策的时间,并採用于 AI 效率更高的 16bit 代码而非 Linpack 预设的 32bit 代码,一举使 AI 运算效率提高。例如橡树岭国家实验室的系统,也因为导入全新针对 AI 运算的代码自 2019 年的 445 TFLOPS 提升到 1.15 exaflops 的 HPL-AI 得分。

而 Tesla 特斯拉虽然已经不再车辆的自动驾驶平台使用 NVIDIA 的 DRIVE 技术,不过 Tesla 为了自动驾驶的 AI 模型训练与开发,仍建构一套达 720 个节点、每个节点有 8 张 NVIDIA A100 Tensor Core GPU 的 AUTOMOTIVE 超级电脑,达到 1.8 exaflops 性能,并为 TOP500 的第 5 名。

原创文章,作者:甜可芯,如若转载,请注明出处:https://www.53moban.com/6733.html

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息