微信关注,了解更多

中国移动 MoMA 平台重磅发布:300+AI 模型一站调用,Token 成本直降 30%

5 月 8 日,在苏州举办的 2026 移动云大会上,中国移动正式推出移动模型服务平台 MoMA(Mixture of Models and Agents),以 “一次接入、智能优选、普惠可用、安全可信” 为核心,打造 AI 模型服务 “超级入口”,不仅接入超 300 款业界主流 AI 模型,更实现单位 Token 成本压降约 30%、资源占用率降低 50% 以上,为千行百业的 AI 应用落地按下 “加速键”。

一、300 + 模型聚合,一站式解锁全场景 AI 能力

MoMA 平台构建了开放普惠的模型服务生态,目前已接入中国移动自研 “九天” 基座大模型,以及 DeepSeek、通义千问、豆包、Kimi、GLM 等业界优质模型,覆盖文本生成、语音处理、多模态理解、代码开发等全品类 AI 能力。

无论是政务领域的政策解读、公文生成,金融行业的风险评估、智能客服,工业场景的设备故障诊断、生产优化,还是医疗、教育领域的智能辅助,企业与开发者只需通过统一 API 网关接入 MoMA,即可一键调用全部模型资源,无需再逐一对接不同厂商、不同类型的模型,大幅降低 AI 应用的接入门槛与开发成本。

二、Token 成本直降 30%,破解 AI 规模化落地 “成本难题”

AI 应用规模化落地的核心痛点之一,便是高昂的 Token 使用成本。MoMA 平台首创 Token 集约化运营模式,基于国产算力部署自研推理引擎,结合智能路由对长尾模型资源调度、智能缓存、上下文复用、Token 压缩等多项技术,实现单位 Token 成本压降约 30%,资源占用率降低 50% 以上。

同时,平台采用流式实时计费模式,Token 计费端到端时延不超过 1 分钟,彻底解决传统按包计费模式下透明度不足、资源浪费的问题,让每一笔 Token 消耗都清晰可追溯,帮助企业精准控制 AI 使用成本,让 AI 从 “尝鲜” 走向 “普惠”。

三、智能路由 + 安全防护,让 AI 服务更高效、更可靠

MoMA 平台的核心优势,在于其首创的智能路由引擎。该引擎可自动分析用户需求,灵活切换 “成本优先”“效果优先”“均衡优先” 三种策略,为用户动态匹配最适合的模型。例如,简单的文本问答可自动切换至轻量高效模型,复杂的代码开发、多模态理解则自动调用高性能大模型,在保障效果的同时最大化节约成本。

当接入的模型出现超时、限流或故障时,平台可实现秒级自动切换,确保业务连续不中断。此外,MoMA 还推出 “机密模型” 服务,将模型部署在机密容器中,通过硬件隔离实现 “可用不可见”,为政务、金融等高安全需求场景提供全链路数据安全保障。

四、生态共建,推动 AI 成为千行百业 “数字新动能”

发布会上,中国移动还联合阿里云、火山引擎、华为云等 8 家合作伙伴共同组建 “Token 应用生态联盟”,并与多家机构完成合作签约,依托 MoMA 平台构建国产 AI 模型统一服务入口。

未来,MoMA 平台将持续丰富模型资源、优化技术能力,推动 AI 像水和电一样 “随时可得、随处可用”,助力企业与开发者快速构建 AI 应用,加速千行百业的数智化转型,让人工智能真正走进千家万户、服务千行百业。

未经允许不得转载:物联网的那些事 - Totiot » 中国移动 MoMA 平台重磅发布:300+AI 模型一站调用,Token 成本直降 30%