AMD Instinct MI300 细节浮出水面 在 2 Exaflop El Capitan 超级计算机中首次亮相

动态 编辑:
导读 AMD 的 Instinct MI300正在塑造成为一个令人难以置信的芯片,将 CPU 和 GPU 内核以及大量高速内存集成在同一处理器上,但细节仍然很

AMD 的 Instinct MI300正在塑造成为一个令人难以置信的芯片,将 CPU 和 GPU 内核以及大量高速内存集成在同一处理器上,但细节仍然很少。现在,我们从国际超级计算 (ISC) 2023 演示文稿中收集了一些新细节,该演示文稿概述了即将推出的由 Instinct MI300 提供支持的双 exaflop El Capitan 超级计算机。我们还在研究巨头 imec 主办的 ITF World 2023 会议上的 AMD 首席技术官 Mark Papermaster 的主题演讲中找到了其他详细信息(您可以在此处阅读我们对 Papermaster 的采访)。

El Capitan 超级计算机有望在 2023 年底启动时成为世界上最快的超级计算机,取代由 AMD 提供支持的 Frontier 的领导地位。AMD 强大的 Instinct MI300 将为机器提供动力,新的细节包括 MI300 安装的拓扑图、AMD 奥斯汀 MI300 实验室的图片,以及将在 El Capitan 超级计算机中使用的新刀片的图片。我们还将介绍围绕 El Capitan 部署的一些其他新开发。

提醒一下,Instinct MI300 是一个数据中心 APU,它混合了总共 13 个小芯片,其中许多是 3D 堆叠的,以创建一个具有 24 个 Zen 4 CPU 内核的单芯片封装,融合了一个 CDNA 3 图形引擎和 8 个总计 128GB 的​​ HBM3 内存堆栈。总体而言,该芯片拥有 1460 亿个晶体管,是 AMD 投入生产的最大芯片。九个计算裸片混合了 5nm CPU 和 GPU,它们以 3D 方式堆叠在四个 6nm 基础裸片之上,这些裸片是处理内存和 I/O 流量以及其他功能的有源中介层。

Papermaster 的 ITF World 主题演讲重点关注 AMD 的“30x25”目标,即到 2025 年将能效提高 30 倍,以及随着摩尔定律放缓,计算现在如何受到功率效率的限制。该计划的关键是 Instinct MI300,它的大部分收益来自您在上面看到的简化系统拓扑。

正如您在第一张幻灯片中看到的,Instinct MI250驱动的节点具有独立的 CPU 和 GPU,中间有一个 EPYC CPU 来协调工作负载。

相比之下,Instinct MI300 包含一个内置的 24 核第四代 EPYC Genoa 处理器在包内,从而从等式中删除了一个独立的 CPU。然而,相同的整体拓扑仍然存在,没有独立的 CPU,从而实现了具有四个元素的完全连接的 all-to-all 拓扑。这种类型的连接允许所有处理器直接相互对话,而无需另一个 CPU 或 GPU 作为中介将数据中继到其他元素,从而减少延迟和可。这是 MI250 拓扑的一个潜在痛点。MI300 拓扑图还表明每个芯片具有三个连接,就像我们在 MI250 上看到的那样。Papermaster 的幻灯片还将形成基模的有源中介层称为“第四代无限织物基模”。

标签:
免责声明:本文由用户上传,如有侵权请联系删除!