Arm 宣布基于 Armv9 指令级三款 CPU 微架构,包括 Cortex-X2 性能核心、 Cortex-A710 大核与 Cortex-A510 小核

Arm 在今年 3 月的 Vision Day 宣布全新的 Armv9 指令集后,已经公布资料中心级的 Neorvese N2 将採用此全新指令集,而在 Computex 前夕, Arm 也公布全新系列的 IP 组合,其中包括三款採用 Ar

Arm 在今年 3 月的 Vision Day 宣布全新的 Armv9 指令集后,已经公布资料中心级的 Neorvese N2 将採用此全新指令集,而在 Computex 前夕, Arm 也公布全新系列的 IP 组合,其中包括三款採用 Armv9 指令集的 CPU 微架构,包括性能核心 Cortex-X2 ,”大核” Cortex-A710 与四年来首度改版的”小核” Cortex-A510 ,而这三项核心亦可透过 DynamIQ 建构大小核,但除此之外针对运算级应用, Arm 还公布 DynamIQ 共享单元 DSU-110 ,可构成单一 Cluster 达 8 个 Cortex-X2 ,自穿戴设备、手机、数位电视到 PC 级应用提供最大化效能。

另外, Arm 也藉此宣布自 2023 年后,所有的行动运算的大核心与小核心将全面 64 位元化,届时 Arm 将不再提供 32 位元 Cortex-A 核心的 CPU 微架构。

Arm CPU 微架构重新定位三大产品线

▲ Armv9 的微架构将分为 Cortex-X 、 Cortex-A700 与 Cortex-A500 三大系列

在 Cortex 系列迈入 Armv9 架构, Arm 也将旗下的 CPU 微架构产品定位进行再调整,未来 Cortex-X 除了半客製化架构的身分,也兼具追求最高效能的超高效能核心;至于大核心 Cortex-A700 则重新定位于适合多核工作负载与能耗效率平衡,具备最佳持续性能的性能核心;小核 Cortex-A500 则继续最佳能源效率应用,作为辅助大核 Cortex-A700 系列、性能核 Cortex-X 构成大小核设计,为处理琐碎的背景与轻度负载作业而生。

追求最高效能与 PC 级运算性能的 Cortex-X2

▲ Cortex-X2 较现行 Cortex-X1 提升 30% 性能

Cortex-X2 是 Arm 第二世代的 Cortex-X 半客製化 CPU 微架构,在定位上是作为高阶手机架构中处理高度複杂运算的瞬间高负载,或是做为 PC 型态产品的高效能运算核心; Cortex-X2 强调相较上一世代大幅改善 IPC ,比起当前 Cortex-X1 的单核心效能提升 30% ,并相较 2020 年基于 Arm 架构之 Windows 10 笔电与 Chromebook 高出 40% 单执行绪性能。

Arm 视 Cortex-X2 能够为追求效能的笔记型电脑带来更大幅度的效能提升,并藉由 DSU-110 的特质,可为追求效能的 Arm 架构 PC 处理器带来单一 Cluster 达 8 核心的 Cortex-X2 设计,并具备最大 16MB 的 L3 快取,使笔记型电脑用的 SoC 能够具备更弹性的设计。

追求持续效能与效率最大化的新世代大核 Cortex-A710

▲ Cortex-A710 着重在能源效率与持续性能

既然当前高效能核心的定位已经被 Cortex-X2 取代, Cortex-A710 就不再象徵追求最高性能的定位,但仍旧是 Arm CPU 微架构中的要角,在全新的产品定位做为负责主要主流级运算的性能核心,并强调针对持续高度工作负载具备最佳化的效率,同样可涵盖自高阶智慧手机、笔电、智慧家居与智慧电视等类型的需求。

Cortex-A710 相较最高性能的 Cortex-X2 更着重性能平衡、能耗与晶圆面积,相对 Cortex-A78 在相同的功耗约提升 10% 的性能,然而在能源效率却大举提升 30% ,意味着在相同的日常使用情境可望延长设备的续航力,同时因应主流的机器学习也提升 2 倍的性能。

四年来首度改版的小核 Cortex-A510

▲ Cortex-A510 相较 Cortex-A55 进步幅度相当显着

相较于上一世代”大核” Cortex-A7x 系列微架构几乎每年一度的改版,”小核” Cortex-A55 已经是 2017 年在 Computex 所公布的微架构,而此次大改版到 Cortex-A510 也有显着的整体提升,在性能方面对比 Cortex-A55 提高 35% ,而在能源效率也提升 20% ,同时增加达 3 倍的机器学习性能。

同时 Cortex-A510 还具备一全新的创新技术,称为合併核心微架构( merged core microarchitecture ),合併核心微架构能够将 2 个 Cortex-A510 构成一个群组,单一个 CPU 可由多个群组构成,利用此弹性化的的结构设计能进一步提升单位面积效率与扩充弹性,简单来说就是类似当前 AMD 的 CPU 是透过多个 CPU CCX 模组构成一颗大型 CPU 一样。

虽然 Cortex-A510 定位在处理背景与轻度负载内容,但性能大幅提升之下,也等同具备 Cortex-A510 的处理器能够在更多的应用仅需使用省电的 Cortex-A510 ,减少动用到 Cortex-A710 与 Cortex-X2 的时间,进一步提升整体效能;同时对于主要以 Cortex-A510 构成的中低阶处理器也能具备更出色的性能但兼顾能源效率。

开创 DynamIQ 更多可能性的 DSU-110

照片中提到了The DSU-110 is the Backbone of the Armv9 CPU Cluster、Uncompromised performance and efficiency、LAPTOP,包含了三角形、产品设计、牌、三角形、产品

▲ DSU-110 能在单一 Cluster 容纳最多 8 个 Cortex-X2

在当前 Armv8 指令集时代所宣布的 DynamIQ 中,单一个 Cluster 可容纳最多 8 核心、包括 4 个大核与 4 个小核;而 Armv9 所搭配的 DSU-110 虽在单一 Cluster 仍为 8 核心,不过却可容纳最多 8 个 Cortex-X2 高性能核心,这也意味着除了原本的行动运算级与入门笔电外, Armv9 为 Arm 架构进一步带来跨足高效能 PC 领域的可能性。

从能源效率的角度,基于 DSU-110 的 DynamIQ 设计可自 4 个 Cortex-A510 、 2+6 大小核、 4+4 大小核到目前高阶手机处理器的 1 + 3 + 4 组合外,针对更进阶的主流效能笔电能提供 4 个 Cortex-X2 搭配 Cortex-A710 的组合,若将情境转换到桌上型 PC 设备,甚至可藉由 8 核 Cortex-X2 搭配主动散热带来更惊人的性能。

DSU-110 使核心之间的频宽提升达 5 倍,同时也进一步改善能耗与降低多核协作的延迟,并提供高效能运算配置最高 16MB 的 L3 ;另外在能源管理部分, DSU-110 减少 CPU Cluster 的能源耗损,同时在部分核心停止供电时仍可进行低强度的工作负载,此外搭配全新的 PPC 整合电源策略单元与多种省电模式提供更好的能源管理。

藉 Armv9 指令集大幅提升的机器学习性能

照片中提到了CPU ML Performance: Growing Leaps & Bounds、CPUS are the default ML Processor in many systems – simplest and easiest porting target、ML Performance (relative to Cortex-A55),包含了介绍、介绍、图、产品、牌

▲ Armv9 指令集进一步提高机器学习的性能

机器学习已是目前自行动装置到 PC 都相当主流的技术,藉由导入 Armv9 指令集,此次宣布的 Cortex-X2 、Cortex-A710 与 Cortex-A510 可支援 BFloat 16 格式,矩阵运算能够支援 Int8 、 BF16 与 SVE2 ,使得新世代的架构皆较前一代在机器学习有明显的提升,尤以 Cortex-A510 更比起 Cortex-A55 在机器学习提高 3 倍性能。

安全性始终是重要的

照片中提到了Security Evolution、with Armv9 CPUS、Detection and prevention,包含了图、产品设计、牌、产品、仪表

▲强调新世代架构具备更升级的安全保护

当然安全性也持续是 Arm 所重视的,除了承袭既有的安全技术外, Armv9 指令集也针对需求导入一系列全新的安全功能,例如 Secure-EL2 可针对受信任的服务提供标準化的安全隔离机制,记忆体标记扩展 MTE 则可避免记忆体遭受窜改,同时 Arm 亦与 Google 合作,针对 Android 导入 MTE 技术,进一步强化 Android 的安全性。另外 Armv9 也在 NEON 与 SVE2 添加加密指令,以及透过整合的硬体架构防护避免侧通道攻击。

AVE2 将为消费级应用带来更好的机器学习与机器视觉强化

照片中提到了SVE2: Write Once, Optimize Once, Deploy Forever、Easier for developers、Higher performance apps,跟AccuWeather有关,包含了介绍、多媒体、介绍、产品、牌

▲ Arm 强调 SVE2 将相当容易导入

虽然 SVE2 原为超算系统的 SVE 指令级延伸而来,不过由于对机器学习与机器视觉可带来相当大的帮助, Arm 也在消费级的 Armv9 指令级的 CPU 架构中导入 SVE2 ,同时强调 Arm 着手简化对消费设备导入 SVE2 支援的流程,开发者可透过简单的代码使应用支援 SVE2 。

Armv9 指令集 CPU 进一步拓展 Arm 架构在行动运算的可能性

照片中提到了Armv9 CPU Cluster: A Step Change in Premium Mobile、Armv9 CPU cluster、o Performance,包含了多媒体、屏幕截图、显示装置、计算机程序、多媒体

▲性能的提升、架构配置的弹性皆使基于新一代 Arm CPU 的消费级产品有更出色的表现与设计弹性

藉由导入新一代 Armv9 指令集,除了基础性能的提升以外,也使 Arm 在消费级产品的架构设计具备更多元的变化,并进一步自轻薄型 PC 产品迈入高效能 PC 产品领域,但同时也兼具能源效率与更进化的机器学习性能。

原创文章,作者:科技庭,如若转载,请注明出处:https://www.53moban.com/7602.html

联系我们

400-800-8888

在线咨询:点击这里给我发消息

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息