Ampere 本周推出了 用于云数据中心的AmpereOne 处理器 ,这恰好是业界首款具有多达 132 个可用于 AI 推理的通用 CPU。
新芯片比他们的前辈——Ampere Altra (它至少会在 Ampere 的稳定版中保持一段时间)消耗更多的功率——但该公司声称,尽管功耗更高,但其多达 192 个内核的处理器提供比 CPU 更高的计算密度来自 AMD 和英特尔。其中一些性能声明可能会引起争议。
192 个自定义云原生内核
Ampere 的 AmpereOne 处理器具有 136-192 个内核(与 Ampere Altra 的 32-128 个内核相反),运行频率高达 3.0 GHz,基于该公司专有的 Armv8.6+ 指令集架构实施(具有两个 128 位向量支持 FP16、BF16、INT16 和 INT8 格式的单元)每个内核配备 2MB 的 8 路组关联二级缓存(从 1MB 增加),并使用具有 个主节点和基于目录的侦听的机械网络互连筛选。除了 L1 和 L2 缓存外,SoC 还具有 MB 系统级缓存。新 CPU 的额定功率为 200W - 350W,具体取决于具体的 SKU,高于 Ampere Altra 的 40W - 180W。
该公司声称其新内核针对云和 AI 工作负载进行了进一步优化,并具有“强大且高效”的每时钟指令 (IPC) 增益,这可能意味着更高的 IPC(与用于 Altra 的 Arm 的 Neoverse N1 相比)而没有明显的增加在功耗和模具面积。说到管芯面积,Ampere 没有透露,但表示 AmpereOne 是采用台积电 5nm 级工艺技术之一制造的。