200 TFLOPs！AMD MI430X FP64 性能曝光，HPC 领域迎来新王者-物联网的那些事

在 AI 算力竞争白热化的当下，高性能计算（HPC）领域传来重磅消息。2026 年 5 月 6 日，AMD 在高性能计算用户论坛（HPCUF）上，正式披露了 Instinct MI400 系列新品 ——MI430X的核心性能参数，其原生 FP64 双精度浮点算力预计突破200 TFLOPs，官方数据显示，这一性能将达到下一代 NVIDIA Rubin 架构的6 倍以上，有望成为全球最强的 FP64 GPU。

一、性能狂飙：从 80 到 200，HPC 算力的历史性跨越

MI430X 的发布，标志着 AMD 在双精度计算领域实现了质的飞跃。回顾 AMD 上一代旗舰产品，MI355X、MI325X 与 MI300X 的 FP64 性能分别仅为 78.6 TFLOPs、81.6 TFLOPs 和 81.7 TFLOPs，长期在 80 TFLOPs 区间徘徊。而 MI430X 直接将这一数字拉升至 200 TFLOPs 以上，性能增幅超过 150%，彻底打破了此前的性能瓶颈。

这一突破的核心，在于 MI430X 基于下一代CDNA 5 架构，专为 HPC 与 AI 融合场景深度优化。它并非单纯追求 AI 低精度算力，而是将原生 FP64 向量计算作为核心竞争力，为气候模拟、材料科学、核物理、流体力学等对计算精度有极致要求的科研领域，提供了 “高保真” 的计算底座。

二、对比澄清：6 倍优势的背后，是赛道与定位的差异

“6 倍于 NVIDIA Rubin” 的对比数据，引发了行业热议，但需理性看待两者的定位差异。

NVIDIA Rubin：作为纯 AI 加速器，其设计重心完全倾斜于 FP4、FP8 等低精度计算格式，以适配大模型训练与推理，FP64 仅为兼容功能，并非核心优化方向。

AMD MI430X：定位为HPC+AI 融合加速器，原生支持 FP64、FP8、FP4 全精度计算，既兼顾科学计算的高精度需求，也能适配 AI 场景，是 “全能型” 算力芯片。

简言之，两者的竞争并非同一赛道的直接对抗，而是AI 专用与HPC 全能两种路线的差异化较量。在 AI 低精度算力上，Rubin 仍具优势；但在FP64 双精度这一 HPC 核心指标上，MI430X 实现了 “降维打击”。

三、硬核配置：超大内存 + 超高带宽，破解算力瓶颈

除了 FP64 性能，MI430X 的硬件配置同样堪称顶级，为大规模计算提供坚实支撑：

432GB HBM4 高带宽内存：相较上一代 MI350 系列，容量实现翻倍，可轻松承载超大规模仿真数据与万亿参数 AI 模型，彻底解决内存容量瓶颈。

19.6TB/s 内存带宽：带宽较前代提升超 100%，数据传输速度大幅加快，让 GPU 核心始终处于高效运转状态，避免 “算力等数据” 的问题。

全栈软件兼容：搭配 AMD ROCm 软件生态，完美适配 PyTorch、TensorFlow 等主流框架，支持数千块 GPU 集群扩展，兼顾易用性与扩展性。

四、行业影响：重塑超算格局，加速科研与 AI 融合

目前，MI430X 已被全球多个顶级超算项目采用，包括美国橡树岭国家实验室的Discovery 超算、欧洲的Alice Recoque 超算等，足见其行业认可度。

对于科研领域而言，MI430X 的出现意味着：气候模型模拟可实现更高分辨率，材料研发能缩短实验周期，核物理仿真精度进一步提升；而对于 AI 领域，基于高保真科学计算生成的训练数据，将让下一代 AI 模型更贴近真实世界规律，推动AI 与科学计算深度融合。

在 AI 算力成为焦点的今天，AMD MI430X 以 200 TFLOPs 的 FP64 性能，重新定义了 HPC 领域的算力标准。它的发布，不仅是 AMD 技术实力的彰显，更标志着全球算力格局正从 “AI 单一主导” 向HPC 与 AI 协同发展转变。随着 MI430X 的逐步落地，一场由双精度算力驱动的科研与 AI 革命，已然拉开序幕。

图源网络侵删

未经允许不得转载：物联网的那些事 - Totiot » 200 TFLOPs！AMD MI430X FP64 性能曝光，HPC 领域迎来新王者

200 TFLOPs！AMD MI430X FP64 性能曝光，HPC 领域迎来新王者

作者：Vv

相关推荐

热门推荐

文章推荐

热门标签