微信关注,了解更多

200 TFLOPs!AMD MI430X FP64 性能曝光,HPC 领域迎来新王者

在 AI 算力竞争白热化的当下,高性能计算(HPC)领域传来重磅消息。2026 年 5 月 6 日,AMD 在高性能计算用户论坛(HPCUF)上,正式披露了 Instinct MI400 系列新品 ——MI430X的核心性能参数,其原生 FP64 双精度浮点算力预计突破200 TFLOPs,官方数据显示,这一性能将达到下一代 NVIDIA Rubin 架构的6 倍以上,有望成为全球最强的 FP64 GPU。

一、性能狂飙:从 80 到 200,HPC 算力的历史性跨越

MI430X 的发布,标志着 AMD 在双精度计算领域实现了质的飞跃。回顾 AMD 上一代旗舰产品,MI355X、MI325X 与 MI300X 的 FP64 性能分别仅为 78.6 TFLOPs、81.6 TFLOPs 和 81.7 TFLOPs,长期在 80 TFLOPs 区间徘徊。而 MI430X 直接将这一数字拉升至 200 TFLOPs 以上,性能增幅超过 150%,彻底打破了此前的性能瓶颈。

这一突破的核心,在于 MI430X 基于下一代CDNA 5 架构,专为 HPC 与 AI 融合场景深度优化。它并非单纯追求 AI 低精度算力,而是将原生 FP64 向量计算作为核心竞争力,为气候模拟、材料科学、核物理、流体力学等对计算精度有极致要求的科研领域,提供了 “高保真” 的计算底座。

二、对比澄清:6 倍优势的背后,是赛道与定位的差异

“6 倍于 NVIDIA Rubin” 的对比数据,引发了行业热议,但需理性看待两者的定位差异。

NVIDIA Rubin:作为纯 AI 加速器,其设计重心完全倾斜于 FP4、FP8 等低精度计算格式,以适配大模型训练与推理,FP64 仅为兼容功能,并非核心优化方向。

AMD MI430X:定位为HPC+AI 融合加速器,原生支持 FP64、FP8、FP4 全精度计算,既兼顾科学计算的高精度需求,也能适配 AI 场景,是 “全能型” 算力芯片。

简言之,两者的竞争并非同一赛道的直接对抗,而是AI 专用与HPC 全能两种路线的差异化较量。在 AI 低精度算力上,Rubin 仍具优势;但在FP64 双精度这一 HPC 核心指标上,MI430X 实现了 “降维打击”。

三、硬核配置:超大内存 + 超高带宽,破解算力瓶颈

除了 FP64 性能,MI430X 的硬件配置同样堪称顶级,为大规模计算提供坚实支撑:

432GB HBM4 高带宽内存:相较上一代 MI350 系列,容量实现翻倍,可轻松承载超大规模仿真数据与万亿参数 AI 模型,彻底解决内存容量瓶颈。

19.6TB/s 内存带宽:带宽较前代提升超 100%,数据传输速度大幅加快,让 GPU 核心始终处于高效运转状态,避免 “算力等数据” 的问题。

全栈软件兼容:搭配 AMD ROCm 软件生态,完美适配 PyTorch、TensorFlow 等主流框架,支持数千块 GPU 集群扩展,兼顾易用性与扩展性。

四、行业影响:重塑超算格局,加速科研与 AI 融合

目前,MI430X 已被全球多个顶级超算项目采用,包括美国橡树岭国家实验室的Discovery 超算、欧洲的Alice Recoque 超算等,足见其行业认可度。

对于科研领域而言,MI430X 的出现意味着:气候模型模拟可实现更高分辨率,材料研发能缩短实验周期,核物理仿真精度进一步提升;而对于 AI 领域,基于高保真科学计算生成的训练数据,将让下一代 AI 模型更贴近真实世界规律,推动AI 与科学计算深度融合。

在 AI 算力成为焦点的今天,AMD MI430X 以 200 TFLOPs 的 FP64 性能,重新定义了 HPC 领域的算力标准。它的发布,不仅是 AMD 技术实力的彰显,更标志着全球算力格局正从 “AI 单一主导” 向HPC 与 AI 协同发展转变。随着 MI430X 的逐步落地,一场由双精度算力驱动的科研与 AI 革命,已然拉开序幕。

图源网络侵删

未经允许不得转载:物联网的那些事 - Totiot » 200 TFLOPs!AMD MI430X FP64 性能曝光,HPC 领域迎来新王者