微信关注,了解更多

重建内核,剑指实用!腾讯混元 Hy3 preview 开源,姚顺雨首秀交出硬核答卷

4 月 23 日,腾讯正式发布并开源新一代大模型混元 Hy3 preview。这是混元体系历经底层推倒重建后的首个旗舰版本,也是腾讯首席 AI 科学家姚顺雨掌舵后,首次对外亮相的模型成果。从底层架构到训练逻辑,从能力重构到场景落地,Hy3 preview 以 “快慢思考融合 + 极致实用” 为核心,用三个月时间完成从重建到上线的突破,不仅刷新了混元系列的智能上限,更吹响了腾讯大模型在实用化赛道全力冲刺的号角。

一、推倒重来:三个月重构,混元开启 “实用新征程”

三个多月前,混元团队做出关键决策:预训练重建、强化学习重建、基础设施重建,彻底告别旧有体系,从零搭建适配未来的大模型研发底座。2026 年 2 月,团队完成预训练与强化学习基础设施的全面升级,同步确立 “能力体系化、评测真实性、性价比追求” 三大核心原则,为 Hy3 preview 的诞生奠定底层逻辑。

  • 能力体系化:拒绝 “偏科”,即便单一的代码智能体场景,也需推理、长文、指令、工具等多能力深度协同,打造全面均衡的 “全能型模型”;
  • 评测真实性:跳出易被 “刷榜” 的公开榜单,以自建题目、真实考试、人工评测、产品众测等方式,直面真实场景的 “战斗力” 考验;
  • 性价比追求:不盲目堆砌参数,深度协同架构与推理框架设计,大幅降低部署与使用成本,让 AI“用得起、用得好”。

在这三大原则指引下,Hy3 preview 于 1 月底正式启动训练,仅用不到三个月便完成从研发到上线的全流程,创下腾讯大模型研发的效率新纪录。作为姚顺雨加盟腾讯后的首份 “成绩单”,Hy3 preview 不仅是技术重构的成果,更承载着腾讯补齐 AI 短板、在大模型下半场实现弯道超车的核心期待。

二、硬核实力:MoE 架构 + 快慢思考,打造 “实用最强模型”

Hy3 preview 并非追求参数规模的 “虚胖型” 模型,而是精准平衡能力与效率的 “务实派”。它采用快慢思考融合的混合专家(MoE)架构,核心参数为295B 总参数、21B 激活参数,最大支持256K 上下文长度—— 这是混元迄今最智能的模型,整体性能达到同尺寸模型最佳水平。

1. MoE 架构:高效激活,成本减半

不同于千亿级参数的超大模型,Hy3 preview 选择 “295B 总参 + 21B 激活” 的黄金配比,精准锁定300B 参数区间—— 这是复杂推理、长上下文理解、指令遵循等能力充分释放的最优平衡带,继续扩大参数的边际收益显著递减。

  • 低激活成本:仅 21B 激活参数,大幅降低高频调用、长链路任务的运行成本,推理效率较上一代提升 40%,任务成本大幅下降;
  • 高能力上限:295B 总参数保障模型具备充足的知识储备与泛化能力,兼顾 “轻量部署” 与 “强大性能” 双重优势。

2. 快慢思考融合:推理 + 行动,破解复杂难题

Hy3 preview 的核心突破,在于融合了姚顺雨提出的ReAct(推理 – 行动)循环机制,实现 “慢思考” 深度推理与 “快思考” 快速响应的无缝切换。

  • 慢思考(深度推理):专攻高难度数理推理、逻辑推导、长文本理解等复杂任务,在硬核考场中表现亮眼 —— 拿下清华大学求真书院数学博士资格考(26 春)国内模型最高分,在全国中学生生物学联赛 CHSBO 2025 中取得优异成绩;
  • 快思考(快速响应):擅长日常对话、代码生成、工具调用、信息检索等高频场景,响应速度大幅提升,适配实时交互、多步骤工具调用等实用场景。

3. 三大能力跃升:推理、代码、Agent 全面突破

Hy3 preview 主打 “全面实用性”,在复杂推理、代码生成、智能体(Agent)三大核心能力上实现跨越式提升,彻底告别 “偏科” 短板。

  • 复杂推理:硬核考场 “双优”推理是 AI 的核心底座。Hy3 preview 在 FrontierScience-Olympiad、IMOAnswerBench 等高难度理工科榜单中表现突出,更通过 “真实考场 + 权威榜单” 双线验证 —— 既能推导学术论文中的复杂公式,也能精准讲解高难度理科题目,推理能力实现结构性变强。
  • 代码生成:高效实用,全链路覆盖代码能力是实用大模型的核心刚需。Hy3 preview 在代码生成、调试、优化上全面升级,支持网页开发、游戏编写、数据可视化、SVG 动画生成等全链路任务,生成速度快、准确率高,可直接辅助开发者完成复杂项目开发。
  • Agent 能力:从 “对话” 到 “做事”,质变突破Agent 是本次迭代提升最显著的方向,也是 Hy3 preview 区别于前代模型的核心标签。模型具备自主规划、工具调用、多步骤执行、结果复盘的全链路能力,可独立完成复杂任务 —— 比如抓取金融数据、计算相关性系数、生成动态热力图的全流程,真正实现 “用工具解决真实问题”。

三、开源落地:全矩阵接入 + 社区共建,普惠 AI 生态

技术的价值在于落地。Hy3 preview 不仅开源核心权重与代码,更已全面接入腾讯产品矩阵,同时开放生态合作,推动实用大模型从 “实验室” 走向 “千家万户”。

1. 全产品覆盖:腾讯生态全面赋能

目前,Hy3 preview 已在腾讯云、元宝、ima、CodeBuddy、WorkBuddy、QQ、QQ 浏览器、腾讯文档、腾讯乐享等十余款产品中首发上线;微信公众号、和平精英、腾讯新闻、腾讯自选股、微信读书等产品也在陆续接入,全面覆盖社交、办公、娱乐、云服务等核心场景。用户可直接在腾讯元宝中体验 Hy3 preview 的强大能力 —— 无论是日常闲聊、文案创作,还是代码开发、数据分析,均能获得更精准、更智能、更稳定的交互体验。

2. 开源普惠:全平台开放,社区共建

4 月 23 日,腾讯同步将 Hy3 preview 的模型权重与代码在GitHub、Hugging Face、ModelScope、GitCode等主流平台开源,免费向社区开放,鼓励开发者基于模型进行二次开发与创新。同时,腾讯云大模型服务平台 TokenHub 上线 Hy3 preview API 服务,定价极具竞争力:输入最低 1.2 元 / 百万 tokens、缓存命中 0.4 元 / 百万 tokens,输出最低 4 元 / 百万 tokens,个人版套餐最低月费仅 28 元,大幅降低中小企业与个人开发者的使用门槛。

3. 生态开放:兼容主流 Agent 框架

Hy3 preview 支持接入OpenClaw、OpenCode、KiloCode等主流开源智能体产品,可快速适配各类 Agent 开发场景,助力开发者构建更强大的智能应用,推动 AI 生态的繁荣发展。

四、行业意义:腾讯 AI 的 “节奏校准”,实用化时代全面到来

Hy3 preview 的发布,不仅是腾讯混元的里程碑事件,更折射出中国大模型行业的发展新趋势 ——从 “参数竞赛” 转向 “实用为王”,从 “单点突破” 转向 “全面均衡”

过去,大模型行业陷入 “唯参数论” 的内卷,千亿级、万亿级参数模型层出不穷,但大多 “强在跑分、弱在落地”,难以解决真实场景的复杂问题。而 Hy3 preview 的出现,打破了这一内卷逻辑:不盲目追求参数规模,而是聚焦 “能力均衡、落地高效、成本可控”,用真实场景的 “战斗力” 说话,为行业提供了 “实用化” 的全新范式。

对于腾讯而言,Hy3 preview 是其 AI 战略的 “节奏校准”—— 不再盲目跟风参数竞赛,而是依托自身庞大的产品生态,走 “技术 + 场景” 深度融合的差异化路线。姚顺雨主导的混元团队,正以 “重建内核、聚焦实用” 为核心,推动腾讯 AI 从 “追赶者” 向 “引领者” 转变,补齐大模型短板,在 AI 下半场竞争中占据主动。

五、未来展望:持续进化,探索 AI 无限可能

Hy3 preview 是混元重建的第一步,而非终点。腾讯表示,未来将持续扩大预训练与强化学习规模,不断提升模型智能上限;深化与腾讯全产品的 Co-Design(协同设计),让模型在真实场景中持续迭代优化;探索非同质化模型能力,打造差异化竞争优势。

从底层重构到开源落地,从能力突破到生态共建,混元 Hy3 preview 的到来,标志着腾讯 AI 正式进入 “实用化新时代”。未来,随着技术的持续进化与场景的不断拓展,Hy3 系列模型将深度融入生产生活的方方面面,为个人、企业、社会带来更智能、更高效、更普惠的 AI 服务,助力中国 AI 产业高质量发展。

未经允许不得转载:物联网的那些事 - Totiot » 重建内核,剑指实用!腾讯混元 Hy3 preview 开源,姚顺雨首秀交出硬核答卷