微信关注,了解更多

阿里云发布真武 M890 与 128 卡超节点,打造 Agent 时代算力新底座

5 月 20 日,2026 阿里云峰会正式开幕,平头哥半导体重磅发布新一代训推一体 AI 芯片真武 M890,同步推出基于该芯片的磐久 AL128 128 卡超节点服务器,以全栈自研算力方案,直击 Agentic 时代海量并发推理与大模型训练的核心痛点,标志着阿里云 “芯 – 云 – 模型 – 推理” 一体化技术体系全面落地。

一、真武 M890:性能跃升 3 倍,训推一体全场景覆盖

作为平头哥真武系列的最新力作,M890 采用自研并行计算架构,核心参数实现跨越式升级:

超大显存:内置 144GB HBM 高带宽内存,较上一代真武 810E 的 96GB 提升 50%,可承载更长上下文、更大参数模型的高效运行。

性能爆发:整体算力达前代产品的 3 倍,片间互联带宽提升至 800GB/s,数据交互效率大幅增强。

全精度支持:原生兼容 FP32 到 FP4 全系列数据精度,既能满足高精度模型训练需求,又能适配低 / 超低精度推理场景,在保障输出质量的同时,显著降低算力开销。

高效互联:搭配自研 ICN Switch 1.0 互联芯片,实现 64 卡全带宽无阻塞互联,为大规模智算集群筑牢通信基石。

截至 2026 年 Q1,真武系列 PPU 芯片累计出货超 60 万片,国内 AI 芯片市场排名第二,已服务国家电网、小鹏汽车等 400 余家头部客户,在智驾、金融等领域落地多个万卡级集群,技术成熟度与落地能力获市场充分验证。

二、磐久 AL128:128 卡紧密耦合,百纳秒级时延支撑海量 Agent

基于真武 M890 打造的磐久 AL128 超节点服务器,是阿里云面向 Agentic 时代的算力 “王炸” 产品:

极致集群架构:单机柜集成 128 张真武 M890 芯片,通过 ICN Switch 1.0 实现跨芯片、跨节点全互联,将 128 颗 AI 芯片 “拧成一台超级计算机”。

超低通信时延:P2P 通信时延低至 150ns 以内,单柜带宽达 Pb/s 级,彻底解决海量 Agent 并发时的通信拥堵问题。

场景精准适配:针对 Agent 高频短推理、状态常驻的负载特征优化,单卡并发数较同级别 GPU 提升 2.8 倍,集群调度延迟降低 70%,单位算力成本可降 45%,私有化部署更具性价比与可控性。

生态全面兼容:已上线阿里云百炼平台,支持通义千问、DeepSeek、Kimi 等主流大模型,为企业快速部署多 Agent 应用提供开箱即用的算力服务。

三、全栈就绪,阿里云领跑 Agentic 时代

阿里云智能集团资深副总裁刘伟光表示:“进入 Agentic 时代,阿里云已全栈就绪。从芯片、服务器到云平台、大模型,我们构建了完整的技术闭环,为海量 Agent 并发、万亿参数模型训练提供从底层到应用的一体化支撑。”

当前,AI 正从单一模型推理迈向多 Agent 协同的新阶段,成千上万个智能体同时运行、高频交互,对算力的密度、时延、带宽提出前所未有的要求。真武 M890 与磐久 AL128 的发布,不仅是平头哥芯片技术的又一次突破,更以全栈自研的硬核实力,为千行百业的 Agent 规模化落地提供了稳定、高效、低成本的算力底座,推动 AI 从 “能用” 走向 “好用、大规模用”。

未来,平头哥还将按一年一代的节奏,陆续推出真武 V900、J900 等新品,持续迭代 AI 芯片技术,与阿里云生态协同,加速构建更强大的智能计算基础设施。

图源网络侵删

未经允许不得转载:物联网的那些事 - Totiot » 阿里云发布真武 M890 与 128 卡超节点,打造 Agent 时代算力新底座