微信关注,了解更多

十亿加持!商汤系黑马,专啃 AI 推理这块硬骨头

AI 算力赛道风云剧变。当行业扎堆挤破头争抢训练芯片高地,国产算力厮杀内卷愈演愈烈之时,一家出身商汤、扎根推理赛道的芯片独角兽,再度斩获重磅资本加持。4 月 20 日,曦望(Sunrise) 官宣完成新一轮超 10 亿元融资,由 27 家地方国资、产业资本、头部财务机构联合注资,创下 2026 年国内 GPU 赛道单轮投资方数量新高。独立仅一年多,这家脱胎于商汤科技大芯片部门的企业,累计融资达40 亿元,估值突破百亿,正式坐稳国内首家纯推理 GPU 独角兽席位。在训练芯片红海厮杀、海外巨头垄断、算力自主可控迫在眉睫的当下,曦望为何能持续获得资本重金押注?放弃热门训练赛道、All-in 推理细分市场,这家商汤系新贵,究竟藏着怎样的国产算力突围逻辑?

一、商汤基因孵化,顶级团队铸就硬核底色

曦望的出身,自带浓厚的商汤系血脉。公司前身是商汤科技内部大芯片研发部门,最早可追溯至 2020 年商汤布局自研算力、推进 “去海外算力依赖” 的战略布局。随着商汤 2024 年底启动 “1+X” 业务战略拆分,内部芯片板块正式独立,曦望应运而生,从集团内部技术部门,蜕变为面向全行业、全产业链的独立芯片企业。背靠商汤多年 AI 算法、大模型技术积累,曦望并非空有资本加持的初创公司,更是集齐了国内顶尖的芯片研发天团。公司董事长为商汤科技联合创始人徐冰,主导过商汤多轮巨额融资与上市全程,深谙 AI 产业生态与资本运作;联席 CEO 王勇是前 AMD 全球 GPU 首席架构师、昆仑芯核心架构师,拥有二十余年全球顶级 GPU 架构研发经验,手握海量底层芯片设计核心技术;另一位联席 CEO 王湛出身百度创始团队,操盘过百度核心商业化系统,擅长产品落地与市场商业化。目前曦望团队规模超 300 人,硕博人才占比超 80%,累计研发投入已达 20 亿元,手握 200 余项芯片底层核心专利,从架构设计、芯片流片、硬件量产到软件适配、行业方案,完成全栈自研闭环,更是实现了芯片一次性流片成功、性能完全达标的行业顶尖水准。从商汤内部孵化到独立独角兽,从技术储备到人才底盘,曦望凭借原生技术底蕴,一出场便站在了国产推理芯片的高起点。

二、反其道而行,死磕推理赛道的差异化突围

纵观当下全球 AI 芯片行业,几乎所有玩家都扎堆冲向大模型训练芯片赛道。英伟达凭借 H100、A100 垄断高端训练市场,国内厂商纷纷对标训练 GPU,内卷制程、浮点算力、集群性能,赛道拥挤、竞争白热化,同时还深陷海外生态壁垒、高端芯片受限、商业化盈利困难的困境。与行业主流 “训推一体” 的通用路线截然不同,曦望从独立之初,就做出了极其坚定的战略选择:全面 All-in AI 推理赛道,专注纯推理 GPU 研发,绝不跟风内卷训练市场。这一选择,精准踩中了 AI 产业发展的时代拐点。2026 年已是行业公认的推理时代元年。大模型训练热潮逐渐降温,模型训练完成后,海量日常调用、智能体运行、多模态交互、云端服务、边缘落地,全部依赖推理算力。行业数据显示,如今全球推理算力需求占总算力比重已超 70%,是训练算力的 4.5 倍,推理芯片市场规模正式超越训练芯片,成为 AI 算力增长的核心引擎。推理算力是 AI 商业化落地的真正刚需,直接决定大模型应用成本、服务延迟、并发能力与企业盈利空间。但长期以来,推理市场被海外通用芯片溢出产能覆盖,国内缺少专门优化、高性价比、低功耗、适配本土场景的专用推理 GPU,行业普遍存在算力成本高、能效比低、生态适配差、供应链不安全的痛点。曦望的核心定位,就是精准解决行业痛点:不盲目追求极致训练算力,全部架构围绕推理场景优化,以 Token 成本、运行能效、并发稳定性、落地适配为核心设计标准,做真正适配大模型时代的专用推理算力底座。资本重金押注,本质也是看好这条被多数人忽略、却潜力无限的黄金赛道,以及曦望专一深耕的长期主义。本轮超 10 亿融资,资金将全部用于S3 新一代芯片量产、全栈软件生态搭建、后续 S4/S5 芯片预研迭代,持续夯实推理芯片技术壁垒。

三、三代芯片矩阵成型,剑指百万 token 一分钱

技术落地,终究要靠产品说话。依托全栈自研能力,曦望已经搭建起完整的S1、S2、S3 三代推理 GPU 产品矩阵,从视觉推理到大模型推理,完成全场景覆盖,并且全部实现量产商用,走完从研发到落地的完整闭环。初代S1 芯片聚焦视觉推理场景,目前量产出货量突破2 万片,凭借优异的视觉计算能效,获得索尼、小米等头部企业 IP 授权,广泛应用于机器视觉、智能硬件、边缘终端场景,完成了商业化初步验证。二代S2 大模型推理芯片,性能对标英伟达 A100,完美兼容主流 CUDA 生态,降低企业迁移成本,兼顾云端大模型推理、高并发服务需求,适配政务智算、云计算、企业大模型部署等核心场景,实现国产算力高性价比替代。2026 年重磅发布的旗舰启望 S3,更是曦望技术集大成之作。作为国内首款搭载 LPDDR6 显存、同时兼容 LPDDR5X 的推理 GPU,曦望放弃行业扎堆的 HBM 高端显存路线,基于 AI 智能体、大模型多轮推理的真实需求,重构底层计算架构与内存 IO 系统,推理性价比相较前代直接提升10 倍。而曦望给出了极具冲击力的终极目标:百万 token 推理成本仅需一分钱。当下国内大模型推理成本居高不下,高昂算力直接压制应用普及。一旦该目标落地,将大幅降低大模型、AI 智能体、多模态应用的运行成本,推动 AI 从高端云端全面走向千行百业,覆盖医疗、能源、智慧城市、工业 AI、通用大模型服务等海量场景,撬动整个 AI 应用生态的爆发。截至目前,曦望算力方案已经落地政务智算、工业、医疗、能源等多个领域,凭借专用化优势,在细分场景实现对海外通用芯片的差异化替代,完成万卡级规模化交付能力验证。

四、国产算力破局,推理赛道迎来全新格局

从资本热度、技术突破到商业化落地,曦望的崛起,不仅仅是一家独角兽的成长故事,更是国产 AI 芯片赛道格局重构的缩影。长久以来,全球 GPU 市场被海外巨头牢牢掌控,训练领域壁垒森严,推理市场同样话语权薄弱。随着 AI 全面落地,国内算力自主可控已经不是选择题,而是产业生存的必修课。行业不再只迷信通用高端芯片,专芯专用、场景定制、成本优先、生态自主,成为国产芯片突围的最优解。曦望坚守推理细分、拒绝赛道内卷、深耕底层自研、绑定商汤 AI 生态、打通全产业链商业化,走出了一条独有的国产 GPU 成长路径。商汤的 AI 算法场景为曦望提供原生落地试验田,曦望的自研推理算力反哺商汤大模型、多模态业务,形成双向技术协同。同时凭借兼容 CUDA、高性价比、大规模量产能力,向外开放通用算力服务,打破海外芯片在推理市场的长期垄断。独立一年融资 40 亿、估值破百亿、三代芯片量产、成本革命目标明确,资本、技术、市场、生态多方加持,曦望已然站在了推理算力爆发的风口。当 AI 产业全面迈入落地应用时代,训练的故事逐渐落幕,推理的浪潮刚刚升起。在国产算力自主可控的漫长征途上,无数企业奔赴红海,而曦望扎根蓝海,以专一、深耕、自研、落地,在推理 GPU 赛道筑牢护城河。未来,随着 S3 芯片全面量产、算力成本大幅下探,这家商汤系独角兽,或将彻底改写国内 AI 推理算力的市场格局,为千行百业的 AI 应用,装上属于中国自己的低成本算力心脏。

图源网络,侵删

未经允许不得转载:物联网的那些事 - Totiot » 十亿加持!商汤系黑马,专啃 AI 推理这块硬骨头