十亿加持！商汤系黑马，专啃 AI 推理这块硬骨头-物联网的那些事

AI 算力赛道风云剧变。当行业扎堆挤破头争抢训练芯片高地，国产算力厮杀内卷愈演愈烈之时，一家出身商汤、扎根推理赛道的芯片独角兽，再度斩获重磅资本加持。4 月 20 日，曦望（Sunrise） 官宣完成新一轮超 10 亿元融资，由 27 家地方国资、产业资本、头部财务机构联合注资，创下 2026 年国内 GPU 赛道单轮投资方数量新高。独立仅一年多，这家脱胎于商汤科技大芯片部门的企业，累计融资达40 亿元，估值突破百亿，正式坐稳国内首家纯推理 GPU 独角兽席位。在训练芯片红海厮杀、海外巨头垄断、算力自主可控迫在眉睫的当下，曦望为何能持续获得资本重金押注？放弃热门训练赛道、All-in 推理细分市场，这家商汤系新贵，究竟藏着怎样的国产算力突围逻辑？

一、商汤基因孵化，顶级团队铸就硬核底色

曦望的出身，自带浓厚的商汤系血脉。公司前身是商汤科技内部大芯片研发部门，最早可追溯至 2020 年商汤布局自研算力、推进 “去海外算力依赖” 的战略布局。随着商汤 2024 年底启动 “1+X” 业务战略拆分，内部芯片板块正式独立，曦望应运而生，从集团内部技术部门，蜕变为面向全行业、全产业链的独立芯片企业。背靠商汤多年 AI 算法、大模型技术积累，曦望并非空有资本加持的初创公司，更是集齐了国内顶尖的芯片研发天团。公司董事长为商汤科技联合创始人徐冰，主导过商汤多轮巨额融资与上市全程，深谙 AI 产业生态与资本运作；联席 CEO 王勇是前 AMD 全球 GPU 首席架构师、昆仑芯核心架构师，拥有二十余年全球顶级 GPU 架构研发经验，手握海量底层芯片设计核心技术；另一位联席 CEO 王湛出身百度创始团队，操盘过百度核心商业化系统，擅长产品落地与市场商业化。目前曦望团队规模超 300 人，硕博人才占比超 80%，累计研发投入已达 20 亿元，手握 200 余项芯片底层核心专利，从架构设计、芯片流片、硬件量产到软件适配、行业方案，完成全栈自研闭环，更是实现了芯片一次性流片成功、性能完全达标的行业顶尖水准。从商汤内部孵化到独立独角兽，从技术储备到人才底盘，曦望凭借原生技术底蕴，一出场便站在了国产推理芯片的高起点。

二、反其道而行，死磕推理赛道的差异化突围

纵观当下全球 AI 芯片行业，几乎所有玩家都扎堆冲向大模型训练芯片赛道。英伟达凭借 H100、A100 垄断高端训练市场，国内厂商纷纷对标训练 GPU，内卷制程、浮点算力、集群性能，赛道拥挤、竞争白热化，同时还深陷海外生态壁垒、高端芯片受限、商业化盈利困难的困境。与行业主流 “训推一体” 的通用路线截然不同，曦望从独立之初，就做出了极其坚定的战略选择：全面 All-in AI 推理赛道，专注纯推理 GPU 研发，绝不跟风内卷训练市场。这一选择，精准踩中了 AI 产业发展的时代拐点。2026 年已是行业公认的推理时代元年。大模型训练热潮逐渐降温，模型训练完成后，海量日常调用、智能体运行、多模态交互、云端服务、边缘落地，全部依赖推理算力。行业数据显示，如今全球推理算力需求占总算力比重已超 70%，是训练算力的 4.5 倍，推理芯片市场规模正式超越训练芯片，成为 AI 算力增长的核心引擎。推理算力是 AI 商业化落地的真正刚需，直接决定大模型应用成本、服务延迟、并发能力与企业盈利空间。但长期以来，推理市场被海外通用芯片溢出产能覆盖，国内缺少专门优化、高性价比、低功耗、适配本土场景的专用推理 GPU，行业普遍存在算力成本高、能效比低、生态适配差、供应链不安全的痛点。曦望的核心定位，就是精准解决行业痛点：不盲目追求极致训练算力，全部架构围绕推理场景优化，以 Token 成本、运行能效、并发稳定性、落地适配为核心设计标准，做真正适配大模型时代的专用推理算力底座。资本重金押注，本质也是看好这条被多数人忽略、却潜力无限的黄金赛道，以及曦望专一深耕的长期主义。本轮超 10 亿融资，资金将全部用于S3 新一代芯片量产、全栈软件生态搭建、后续 S4/S5 芯片预研迭代，持续夯实推理芯片技术壁垒。

三、三代芯片矩阵成型，剑指百万 token 一分钱

技术落地，终究要靠产品说话。依托全栈自研能力，曦望已经搭建起完整的S1、S2、S3 三代推理 GPU 产品矩阵，从视觉推理到大模型推理，完成全场景覆盖，并且全部实现量产商用，走完从研发到落地的完整闭环。初代S1 芯片聚焦视觉推理场景，目前量产出货量突破2 万片，凭借优异的视觉计算能效，获得索尼、小米等头部企业 IP 授权，广泛应用于机器视觉、智能硬件、边缘终端场景，完成了商业化初步验证。二代S2 大模型推理芯片，性能对标英伟达 A100，完美兼容主流 CUDA 生态，降低企业迁移成本，兼顾云端大模型推理、高并发服务需求，适配政务智算、云计算、企业大模型部署等核心场景，实现国产算力高性价比替代。2026 年重磅发布的旗舰启望 S3，更是曦望技术集大成之作。作为国内首款搭载 LPDDR6 显存、同时兼容 LPDDR5X 的推理 GPU，曦望放弃行业扎堆的 HBM 高端显存路线，基于 AI 智能体、大模型多轮推理的真实需求，重构底层计算架构与内存 IO 系统，推理性价比相较前代直接提升10 倍。而曦望给出了极具冲击力的终极目标：百万 token 推理成本仅需一分钱。当下国内大模型推理成本居高不下，高昂算力直接压制应用普及。一旦该目标落地，将大幅降低大模型、AI 智能体、多模态应用的运行成本，推动 AI 从高端云端全面走向千行百业，覆盖医疗、能源、智慧城市、工业 AI、通用大模型服务等海量场景，撬动整个 AI 应用生态的爆发。截至目前，曦望算力方案已经落地政务智算、工业、医疗、能源等多个领域，凭借专用化优势，在细分场景实现对海外通用芯片的差异化替代，完成万卡级规模化交付能力验证。

四、国产算力破局，推理赛道迎来全新格局

从资本热度、技术突破到商业化落地，曦望的崛起，不仅仅是一家独角兽的成长故事，更是国产 AI 芯片赛道格局重构的缩影。长久以来，全球 GPU 市场被海外巨头牢牢掌控，训练领域壁垒森严，推理市场同样话语权薄弱。随着 AI 全面落地，国内算力自主可控已经不是选择题，而是产业生存的必修课。行业不再只迷信通用高端芯片，专芯专用、场景定制、成本优先、生态自主，成为国产芯片突围的最优解。曦望坚守推理细分、拒绝赛道内卷、深耕底层自研、绑定商汤 AI 生态、打通全产业链商业化，走出了一条独有的国产 GPU 成长路径。商汤的 AI 算法场景为曦望提供原生落地试验田，曦望的自研推理算力反哺商汤大模型、多模态业务，形成双向技术协同。同时凭借兼容 CUDA、高性价比、大规模量产能力，向外开放通用算力服务，打破海外芯片在推理市场的长期垄断。独立一年融资 40 亿、估值破百亿、三代芯片量产、成本革命目标明确，资本、技术、市场、生态多方加持，曦望已然站在了推理算力爆发的风口。当 AI 产业全面迈入落地应用时代，训练的故事逐渐落幕，推理的浪潮刚刚升起。在国产算力自主可控的漫长征途上，无数企业奔赴红海，而曦望扎根蓝海，以专一、深耕、自研、落地，在推理 GPU 赛道筑牢护城河。未来，随着 S3 芯片全面量产、算力成本大幅下探，这家商汤系独角兽，或将彻底改写国内 AI 推理算力的市场格局，为千行百业的 AI 应用，装上属于中国自己的低成本算力心脏。

图源网络，侵删

未经允许不得转载：物联网的那些事 - Totiot » 十亿加持！商汤系黑马，专啃 AI 推理这块硬骨头

十亿加持！商汤系黑马，专啃 AI 推理这块硬骨头

一、商汤基因孵化，顶级团队铸就硬核底色

二、反其道而行，死磕推理赛道的差异化突围

三、三代芯片矩阵成型，剑指百万 token 一分钱

四、国产算力破局，推理赛道迎来全新格局

作者：liuhuan

相关推荐

热门推荐

文章推荐

热门标签