首页 > 股市 > 正文

瞄准“百万Token一分钱”，推理GPU独角兽曦望再获超10亿元融资

新华财经|2026年04月20日

阅读量：

国内全栈自研AI推理GPU企业曦望（Sunrise）20日宣布完成新一轮超10亿元人民币融资。这是2026年AI产业全面迈入“推理落地、智能体普及”时代后，国内GPU赛道诞生的最大单笔融资之一。

新华财经上海4月20日电（记者高少华）国内全栈自研AI推理GPU企业曦望（Sunrise）20日宣布完成新一轮超10亿元人民币融资。这是2026年人工智能产业全面迈入“推理落地、智能体普及”时代后，国内GPU赛道诞生的最大单笔融资之一。至此，分拆独立仅一年多的曦望已累计完成七轮融资，总融资额约40亿元，成为国内首家估值超百亿元的纯推理GPU独角兽。

曦望方面表示，本轮融资资金将主要用于新一代S3推理GPU的规模化量产交付、全栈软件生态建设，以及S4/S5后续芯片的研发迭代。

曦望本轮融资由多家产业方战投、地方国资及头部财务机构共同参与。杭州资本表示：“本次投资是杭州资本紧扣杭州‘296X’先进制造业集群建设战略、深耕人工智能万亿级产业赛道的重要布局。曦望‘All-in推理’的战略选择具备行业前瞻性，其在技术创新和产品商业化方面的能力，是我们决定投资的重要原因。作为长期资本，我们更看重企业在关键技术方向上的持续投入与落地能力。”

2026年被行业公认为“智能体元年”。随着大模型从“会聊天”进化为“会思考、会执行”的数字员工，推理需求迎来爆发式增长。不同于行业主流的“训推一体”路线，曦望从成立起就投入推理赛道，目前已推进三代推理GPU迭代、数万颗GPU量产落地，实现从芯片研发、产品量产到解决方案交付的完整闭环。

2026年1月，曦望发布了新一代旗舰产品启望S3推理GPU，它解决了通用GPU“算力用不满”的核心痛点，推理性能较上一代GPU提升5倍，目标实现Token成本下降90%。

曦望董事长徐冰表示，2026年人工智能推理计算需求将达到训练需求的4至5倍，推理算力租赁价格半年涨幅近40%。启望S3推理GPU不是简单的性能升级，而是一次对人工智能推理成本曲线的重构。“我们的目标是将推理成本降至‘百万Token一分钱’，让人工智能像水电一样成为普惠基础设施。”

目前，曦望团队规模已增长至400人，研发人员占比超80%，汇聚了来自英伟达、超威半导体（AMD）、华为海思等国内外顶尖芯片企业的核心人才。

曦望方面表示，2026年将全力推进S3芯片量产交付，完成与国内外主流大模型、多模态模型和智能体框架的全面适配。同时，公司已完成S4高性能推理GPU和S5安全可控推理GPU的技术路线规划，持续加码近存计算、光电共封装（CPO）等前沿技术探索。

编辑：葛佳明

声明：新华财经（中国金融信息网）为新华社承建的国家金融信息平台。任何情况下，本平台所发布的信息均不构成投资建议。如有问题，请联系客服：400-6123115

作家

文章：556 人气：558

作家介绍

手机扫码访问

传播矩阵

主题

热点

首页

股票

债券

外汇

基金

期货

指数

研报金榜

合规评测

丝路数据库

新华财经

新华丝路

新华信用

新华指数

产品下载

瞄准“百万Token一分钱”，推理GPU独角兽曦望再获超10亿元融资

传媒矩阵

友情链接