当地时间 4 月 22 日,在 Google Cloud Next 2026 大会上,谷歌云正式发布第八代张量处理器(TPU)——TPU 8t 与 TPU 8i,这是谷歌首次将 AI 芯片按训练与推理两大核心场景彻底拆分,标志着其 AI 硬件战略从 “全能通用” 走向 “专精定制”,为智能体(Agent)时代的算力需求提供全新底层支撑。
一、战略转向:为何一分为二?
过去,AI 芯片多采用 “训练推理一体化” 设计,试图兼顾两种任务。但随着大模型规模指数级增长、AI 智能体全面兴起,训练与推理的硬件需求差异已无法调和:
- 训练:追求极致算力吞吐量、大规模集群扩展、高浮点精度,核心是 “快” 与 “大”,要在数月内跑完千亿 / 万亿参数模型。
- 推理:尤其是智能体推理,追求低延迟、高并发、大内存带宽、高性价比,核心是 “稳” 与 “省”,要同时支撑数百万智能体实时响应。
谷歌高级副总裁 Amin Vahdat 直言:“随着 AI 智能体兴起,行业将从训练与推理专用芯片中受益。” 第八代 TPU 的双芯设计,正是对这一趋势的精准回应。
二、TPU 8t:训练猛兽,把数月开发周期缩至数周
定位:超大规模模型预训练、高嵌入密度算力专用 “训练引擎”。
核心升级:
- 极致扩展与算力单 Pod 集群规模达9600 颗芯片(上代 9216 颗),总 FP4 算力接近翻倍;单芯片互联带宽从 100Gbps 跃升至400Gbps,彻底破解大规模集群通信瓶颈。
- 专属加速核心内置SparseCore 稀疏计算核心,专门处理大模型嵌入查询的不规则内存访问,规避无效运算阻塞;向量单元与矩阵单元深度并行,量化、Softmax 等运算与矩阵乘法同步执行,芯片持续满载。
- 原生低精度支持搭载原生 FP4(4 位浮点) 算力,峰值达12.6 PFLOPS,在保障模型精度的同时,算力吞吐翻倍、内存占用减半、功耗大幅下降。
- 性能与能效飞跃同等价格下,性能是第七代 Ironwood 的2.8 倍,每瓦性能提升124%,可将前沿大模型开发周期从数月压缩至数周。
三、TPU 8i:推理利器,为百万智能体而生
定位:智能体推理、采样生成、低延迟高并发服务专用 “推理引擎”。
核心升级:
- 内存至上,延迟为王配备384MB 片上 SRAM(是 8t 的 3 倍)+288GB HBM,内存带宽达8.6 TB/s(8t 的 1.3 倍),运行数据无需频繁存取外部内存,响应速度骤升。
- 专用推理加速引擎内置CAE 集合通信加速引擎,搭配全新 Boardfly 网络拓扑,单 Pod 集群规模达1152 颗芯片(上代 256 颗),全对全通信跳转次数减少 50%,完美适配混合专家(MoE)模型推理。
- 规模与性价比双爆发每 Pod FP8 算力提升8.67 倍、HBM 容量提升5.74 倍;推理性价比较上代提升80%,每瓦性能提升117%,可低成本支撑数百万 AI 智能体同时运行。
- 全域适配智能体场景专为 AI 智能体的复杂协作、迭代推理、长上下文窗口优化,让智能体从 “被动响应” 转向 “主动思考、实时决策”。
四、双芯协同:覆盖 AI 全生命周期
TPU 8t 与 8i 虽分工明确,但共享同一套软件生态与系统架构,形成训练 – 推理无缝闭环:
- 兼容 JAX、PyTorch、Keras、vLLM 等主流框架,原生 PyTorch 支持已进入预览,代码无需修改即可迁移。
- 首次搭载谷歌自研 Axion ARM CPU,全栈系统深度优化,算力、能效、延迟全面拉满。
- 纳入谷歌 AI Hypercomputer 超算架构,从模型训练到智能体部署,提供一站式算力支撑。
五、行业影响:AI 芯片赛道迎来 “分工革命”
此次发布不仅是谷歌 TPU 的迭代,更重塑全球 AI 芯片竞争格局:
- 对英伟达:双芯专业化路线直接对标 GPU,在训练性价比、推理能效上形成差异化优势,加剧云侧算力竞争。
- 对行业:验证 “训练 / 推理拆分” 成为必然趋势,未来 AI 芯片将告别 “全能”,走向场景专精,推动算力成本持续下降。
- 对产业:为大模型规模化落地、AI 智能体商业化扫清算力障碍,加速智能体在企业服务、工业、自动驾驶等领域渗透。
六、上市时间与展望
两款芯片计划2026 年晚些时候正式登陆谷歌云,作为 AI 超级计算机的核心组件对外提供服务。
从初代 TPU 支撑 AlphaGo,到第八代双芯领航智能体时代,谷歌 TPU 始终与 AI 演进同频。TPU 8t 与 8i 的登场,不仅是硬件的升级,更是AI 算力从 “通用计算” 迈向 “智能专用计算” 的里程碑—— 当训练更快、推理更稳、成本更低,AI 的边界将被再次拓宽,属于智能体的全新时代,正从算力底层加速到来。
未经允许不得转载:物联网的那些事 - Totiot » 谷歌第八代 TPU 重磅登场:TPU 8t/8i 双芯分进,训练与推理迈入专业化时代

微信关注,了解更多 






