中国移动 MoMA 平台重磅发布：300+AI 模型一站调用，Token 成本直降 30%-物联网的那些事

5 月 8 日，在苏州举办的 2026 移动云大会上，中国移动正式推出移动模型服务平台 MoMA（Mixture of Models and Agents），以 “一次接入、智能优选、普惠可用、安全可信” 为核心，打造 AI 模型服务 “超级入口”，不仅接入超 300 款业界主流 AI 模型，更实现单位 Token 成本压降约 30%、资源占用率降低 50% 以上，为千行百业的 AI 应用落地按下 “加速键”。

一、300 + 模型聚合，一站式解锁全场景 AI 能力

MoMA 平台构建了开放普惠的模型服务生态，目前已接入中国移动自研 “九天” 基座大模型，以及 DeepSeek、通义千问、豆包、Kimi、GLM 等业界优质模型，覆盖文本生成、语音处理、多模态理解、代码开发等全品类 AI 能力。

无论是政务领域的政策解读、公文生成，金融行业的风险评估、智能客服，工业场景的设备故障诊断、生产优化，还是医疗、教育领域的智能辅助，企业与开发者只需通过统一 API 网关接入 MoMA，即可一键调用全部模型资源，无需再逐一对接不同厂商、不同类型的模型，大幅降低 AI 应用的接入门槛与开发成本。

二、Token 成本直降 30%，破解 AI 规模化落地 “成本难题”

AI 应用规模化落地的核心痛点之一，便是高昂的 Token 使用成本。MoMA 平台首创 Token 集约化运营模式，基于国产算力部署自研推理引擎，结合智能路由对长尾模型资源调度、智能缓存、上下文复用、Token 压缩等多项技术，实现单位 Token 成本压降约 30%，资源占用率降低 50% 以上。

同时，平台采用流式实时计费模式，Token 计费端到端时延不超过 1 分钟，彻底解决传统按包计费模式下透明度不足、资源浪费的问题，让每一笔 Token 消耗都清晰可追溯，帮助企业精准控制 AI 使用成本，让 AI 从 “尝鲜” 走向 “普惠”。

三、智能路由 + 安全防护，让 AI 服务更高效、更可靠

MoMA 平台的核心优势，在于其首创的智能路由引擎。该引擎可自动分析用户需求，灵活切换 “成本优先”“效果优先”“均衡优先” 三种策略，为用户动态匹配最适合的模型。例如，简单的文本问答可自动切换至轻量高效模型，复杂的代码开发、多模态理解则自动调用高性能大模型，在保障效果的同时最大化节约成本。

当接入的模型出现超时、限流或故障时，平台可实现秒级自动切换，确保业务连续不中断。此外，MoMA 还推出 “机密模型” 服务，将模型部署在机密容器中，通过硬件隔离实现 “可用不可见”，为政务、金融等高安全需求场景提供全链路数据安全保障。

四、生态共建，推动 AI 成为千行百业 “数字新动能”

发布会上，中国移动还联合阿里云、火山引擎、华为云等 8 家合作伙伴共同组建 “Token 应用生态联盟”，并与多家机构完成合作签约，依托 MoMA 平台构建国产 AI 模型统一服务入口。

未来，MoMA 平台将持续丰富模型资源、优化技术能力，推动 AI 像水和电一样 “随时可得、随处可用”，助力企业与开发者快速构建 AI 应用，加速千行百业的数智化转型，让人工智能真正走进千家万户、服务千行百业。

未经允许不得转载：物联网的那些事 - Totiot » 中国移动 MoMA 平台重磅发布：300+AI 模型一站调用，Token 成本直降 30%

中国移动 MoMA 平台重磅发布：300+AI 模型一站调用，Token 成本直降 30%

作者：liuhuan

相关推荐

热门推荐

文章推荐

热门标签