4 月 20 日,国内 AI 算力芯片领域传来重磅消息 —— 全栈自研推理 GPU 企业曦望(Sunrise) 宣布完成新一轮超10 亿元人民币融资,分拆独立仅一年多便累计完成 7 轮融资、总金额达 40 亿元,更成为国内首家估值超百亿元的纯推理 GPU 独角兽,为 2026 年 “AI 智能体元年” 的国产算力崛起,再添关键注脚。
一、一年七轮融资,资本为何狂押 “纯推理”?
此次融资由杭州资本领投,多家产业方战投、地方国资及头部财务机构共同参与,资金将重点投向三大方向:新一代启望 S3 推理 GPU 规模化量产、全栈软件生态建设,以及 S4/S5 后续芯片研发迭代。
从商汤科技大芯片部门分拆独立(2024 年底)至今,曦望用短短一年多时间,跑出了国产芯片领域罕见的 “融资加速度”—— 从累计融资到百亿估值,背后是 AI 产业从 “训练为王” 到 “推理落地” 的彻底转向。
正如曦望董事长徐冰所言:“AI 算力基建的重心已彻底切换。2026 年 AI 推理计算需求将达到训练需求的 4-5 倍,推理算力租赁价格半年涨幅近 40%。”
当大模型从 “会聊天” 进化为 “会思考、会执行” 的 AI 智能体,当文生视频、行业大模型、数字员工全面落地,推理不再是训练的 “附属”,而是 AI 商业化的核心刚需—— 这也是资本密集加注曦望的底层逻辑:瞄准万亿推理算力市场,抢占国产替代核心阵地。
二、All-in 推理!不走 “训推一体”,曦望的差异化破局路
与行业主流 “训推一体” 的芯片设计路线不同,曦望从成立之初就坚定All-in 纯推理赛道,放弃训练冗余模块,以 “Token 成本、单位能耗、服务稳定性” 为核心,做真正适配推理场景的 “专用算力芯片”。
这一战略,让曦望快速形成三大核心壁垒:
- 全栈自研,三代芯片迭代落地累计 8 年技术沉淀、20 亿研发投入,曦望已完成 S1、S2、S3 三代推理 GPU 迭代,实现数万颗芯片量产交付,且所有芯片均 “一次性流片成功”,覆盖从视觉推理到万亿参数大模型推理的全场景需求。
- 启望 S3:成本降 90%,专为大模型推理定制2026 年 1 月发布的旗舰产品启望 S3,是国内首款搭载 LPDDR6 且兼容 LPDDR5X 内存的推理 GPU,摒弃高端训练 GPU 的 HBM 高成本路线,从 AI Core 架构到内存 IO 全链路重构。通过裁剪训练冗余模块,S3 将晶体管与功耗全部投向推理,单位面积有效算力效率提升 5 倍以上,目标实现 “百万 Token 一分钱”,让大模型推理成本直降 90%。
- 顶尖团队 + 完整闭环,硬核实力支撑商业化曦望团队约 400 人,研发人员占比超 80%,核心成员来自英伟达、AMD、华为海思等顶尖企业,覆盖芯片设计、高性能计算、AI 算法全链路。目前已实现 “芯片研发 — 量产 — 解决方案交付” 完整闭环,深度兼容主流大模型与 CUDA 生态,快速落地云服务商、智算中心、工业互联网等场景。
三、百亿估值背后:国产推理 GPU 的时代机遇
曦望的崛起,正是国产推理 GPU 爆发的缩影。当前,AI 推理需求占比已超七成,国内日均 Token 调用量较 2024 年初增长超千倍,而高端 GPU 进口受限、算力成本居高不下,推理 GPU 成为国产替代的核心突破口。
相比训练芯片,推理市场更看重性价比、能效比、规模化交付能力—— 这正是曦望的优势所在:专注推理赛道深耕,用更低成本、更高能效的芯片,解决 AI 规模化落地的 “算力痛点”。
此次 10 亿融资落地后,曦望将加速 S3 量产交付,完成与主流大模型、Agent 框架的全面适配,同时推进 S4 高性能芯片、S5 安全可控芯片研发,持续加码近存计算、光电共封等前沿技术。
结语
从 “训练狂热” 到 “推理为王”,AI 产业的下半场,算力竞争的核心已变。曦望以 “纯推理 GPU” 的差异化定位,拿下百亿估值、斩获重磅融资,不仅是一家企业的突破,更标志着国产推理算力正式进入规模化落地、商业化兑现的黄金期。
当 “百万 Token 一分钱” 成为现实,当国产推理 GPU 全面替代进口,AI 普惠化的大门,正被这群专注 “算力硬核创新” 的中国企业,一步步推开。
未经允许不得转载:物联网的那些事 - Totiot » 估值破百亿!曦望获 10 亿融资,纯推理 GPU 独角兽引爆国产算力新赛道

微信关注,了解更多 






