5 月 20 日,2026 阿里云峰会上,平头哥正式发布新一代训推一体 AI 芯片真武 M890,并同步推出基于该芯片的磐久 AL128 128 卡超节点服务器,以全栈自研技术,直击 Agentic 时代海量并发推理的算力痛点,标志着阿里云 “芯 – 云 – 模型 – 推理” 一体化布局再升级。
一、真武 M890:性能跃升 3 倍,全场景训推一体
作为平头哥真武系列的最新力作,M890 实现了全方位性能突破。其内置144GB HBM 高带宽显存,较上一代 810E 的 96GB 提升 50%;片间互联带宽达 800GB/s,较前代提升约 14%,整体算力直接跃升至前代的 3 倍。
该芯片采用自研并行计算架构,原生支持 FP32 到 FP4 全精度覆盖,既能满足高精度大模型训练的质量要求,又能在低精度推理场景下显著降低算力开销,实现 “一颗芯片通吃训练与推理全场景”。配合自研ICN Switch 1.0 互联芯片,可实现 64 卡全带宽无阻塞互联,为大规模智算集群提供高效、稳定的算力底座。
二、128 卡超节点:百纳秒级时延,解锁海量 Agent 并发
磐久 AL128 超节点服务器是本次发布的另一大亮点。它将 128 颗真武 M890 芯片通过 ICN Switch 1.0 紧密耦合,打造出单机柜级超级计算机。其核心优势在于:
极致低时延:芯片间 P2P 通信时延低于 150ns,彻底打通传统算力集群的 “通信墙”。
超高带宽:单机柜带宽达Pb/s 级,可承载海量 Agent 的高频、并发推理请求。
在 Agentic 时代,单个智能体单次任务可能连续发起数十次模型调用,成千上万个 Agent 同时运行,对算力系统的实时性与并发能力提出严苛要求。该超节点正是为解决这一痛点而生,目前已上线阿里云百炼平台,全面支持 Qwen、DeepSeek、Kimi 等主流大模型。
三、全栈自研,加速 AI 从 “对话” 迈向 “自主执行”
此次发布,是阿里云面向 Agentic 时代的关键布局。从底层的真武 AI 芯片、ICN 互联芯片,到上层的超节点服务器、模型服务平台,阿里云已构建起完整的全栈技术体系。
截至目前,真武系列芯片累计出货已超 56 万片,服务于中国电信、中国一汽、浦发银行等 20 多个行业的 400 多家客户。未来,平头哥还将按 “一年一代” 节奏迭代,2027 年推出性能再升 3 倍的真武 V900,持续夯实中国 AI 算力的自主可控能力。
随着 AI 从 “聊天问答” 向 “自主执行任务” 跃迁,算力已成为智能体生态的核心引擎。阿里云真武 M890 与 128 卡超节点的发布,不仅是技术层面的突破,更为千行百业的 Agent 应用落地提供了坚实的算力支撑,推动中国 AI 产业加速迈入智能体新纪元。
未经允许不得转载:物联网的那些事 - Totiot » 阿里云发布真武 M890 与 128 卡超节点,为 Agent 时代筑牢算力底座

微信关注,了解更多 