首页 > 股市 > 正文

瞄准“百万Token一分钱”,推理GPU独角兽曦望再获超10亿元融资

新华财经|2026年04月20日
阅读量:

国内全栈自研AI推理GPU企业曦望(Sunrise)20日宣布完成新一轮超10亿元人民币融资。这是2026年AI产业全面迈入“推理落地、智能体普及”时代后,国内GPU赛道诞生的最大单笔融资之一。

新华财经上海4月20日电(记者高少华)国内全栈自研AI推理GPU企业曦望(Sunrise)20日宣布完成新一轮超10亿元人民币融资。这是2026年人工智能产业全面迈入“推理落地、智能体普及”时代后,国内GPU赛道诞生的最大单笔融资之一。至此,分拆独立仅一年多的曦望已累计完成七轮融资,总融资额约40亿元,成为国内首家估值超百亿元的纯推理GPU独角兽。

曦望方面表示,本轮融资资金将主要用于新一代S3推理GPU的规模化量产交付、全栈软件生态建设,以及S4/S5后续芯片的研发迭代。

曦望本轮融资由多家产业方战投、地方国资及头部财务机构共同参与。杭州资本表示:“本次投资是杭州资本紧扣杭州‘296X’先进制造业集群建设战略、深耕人工智能万亿级产业赛道的重要布局。曦望‘All-in推理’的战略选择具备行业前瞻性,其在技术创新和产品商业化方面的能力,是我们决定投资的重要原因。作为长期资本,我们更看重企业在关键技术方向上的持续投入与落地能力。”

2026年被行业公认为“智能体元年”。随着大模型从“会聊天”进化为“会思考、会执行”的数字员工,推理需求迎来爆发式增长。不同于行业主流的“训推一体”路线,曦望从成立起就投入推理赛道,目前已推进三代推理GPU迭代、数万颗GPU量产落地,实现从芯片研发、产品量产到解决方案交付的完整闭环。

2026年1月,曦望发布了新一代旗舰产品启望S3推理GPU,它解决了通用GPU“算力用不满”的核心痛点,推理性能较上一代GPU提升5倍,目标实现Token成本下降90%。

曦望董事长徐冰表示,2026年人工智能推理计算需求将达到训练需求的4至5倍,推理算力租赁价格半年涨幅近40%。启望S3推理GPU不是简单的性能升级,而是一次对人工智能推理成本曲线的重构。“我们的目标是将推理成本降至‘百万Token一分钱’,让人工智能像水电一样成为普惠基础设施。”

目前,曦望团队规模已增长至400人,研发人员占比超80%,汇聚了来自英伟达、超威半导体(AMD)、华为海思等国内外顶尖芯片企业的核心人才。

曦望方面表示,2026年将全力推进S3芯片量产交付,完成与国内外主流大模型、多模态模型和智能体框架的全面适配。同时,公司已完成S4高性能推理GPU和S5安全可控推理GPU的技术路线规划,持续加码近存计算、光电共封装(CPO)等前沿技术探索。

 

编辑:葛佳明

 

声明:新华财经(中国金融信息网)为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

作家
文章:556 人气:558
作家介绍
手机扫码访问
传播矩阵