曦望完成近30亿战略融资:王湛称不拼参数,做AI产业损益表优化师

雷递
01-22 18:22

雷递网 乐天 1月22日

AI推理算力赛道再迎资本注入。

1月22日,专注于极致推理GPU芯片的科技公司曦望(Sunrise)宣布一年内完成近30亿元战略融资。

投资方包括三一集团旗下华胥基金、范式智能、杭州数据集团、正大机器人、协鑫科技等产业投资方,以及IDG资本、高榕创投、无极资本、中金资本、普华资本、松禾资本、易方达资本、工银投资、心资本等VC/PE 机构,同时也获得诚通混改基金等国资背景资本加持。

曦望称,本轮资金主要用于下一代推理GPU研发、规模化量产及生态共建。

刚完成近10亿元融资

曦望成立于2020年,前身为商汤科技大芯片部门。在长期服务于实际AI业务的过程中,团队积累了对模型演进、算子优化及客户需求形成深刻理解,这让其从诞生之初就贴上了“更懂AI的GPU芯片公司”标签。

曦望的核心团队在芯片工程与产品化、商业化能力之间形成互补。联席CEO王勇为前AMD、昆仑芯核心架构师,拥有20年芯片研发经验,并于2020年加入商汤,主导了曦望两代芯片的研发和量产;另一位联席CEO王湛则为百度创始团队成员、原集团副总裁,曾带领8000人团队负责百度搜索业务,并于2025年初加入曦望再创业,负责公司产品化和商业化。

目前,曦望团队规模约300人,成员主要来自NVIDIA、AMD、昆仑芯、商汤等企业,核心技术骨干平均拥有15年行业经验。

2025年7月,曦望刚刚宣布完成近10亿元人民币的最新一轮融资。

三代芯片落地,剑指 “百万 Token 一分钱”

与多数国产芯片厂商仍试图在通用GPU参数上追赶主流产品不同,曦望选择差异化的路径——围绕推理场景的成本与效率,对芯片架构进行“重写”。

曦望并未沿用传统训推一体GPU为训练优化的设计思路,其在调度、缓存、片上SRAM、互联及编译器路径上进行推理场景原生优化,并结合LPDDR内存技术,显著降低单位Token推理成本。同时,曦望采取全栈自研方式,覆盖指令集、GPGPU IP及编译工具链等关键环节。公司已累计并持有200余项核心专利,并在此前的产品中实现“一次流片成功”。

信息显示,曦望在过去数年研发投入累计20亿元,已形成三代芯片产品矩阵,覆盖从视觉推理到大模型全场景推理的需求。

其中,2020 年量产的 S1 芯片,作为国内首款视觉推理芯片,适配千余种 CV 模型,已实现 IP 授权索尼、小米等头部客户;2024 年量产的 S2 芯片,对标主流 A/H 系列 GPU,兼容 CUDA 生态,已成功适配 DeepSeek、Qwen等主流模型;2026 年即将推出的 S3 芯片定位为“推理性价比之王”,在单位 Token 成本、能耗上实现数量级降低,原生支持 FP8/FP4 低精度推理,目标直指 “百万 Token 一分钱” 的行业新基准。

不拼参数拼成本,做 AI 产业的 “损益表优化师”

曦望联席CEO王湛说,“如果能让推理成本下降 90%,并提供更稳定的服务,我们的竞争就不是‘又一个芯片’,而是‘重写中国 AI 产业的损益表’。”

对算力厂商、AI 原生应用开发者而言,推理能效、SLA 稳定性与 Token 成本,才是决定业务毛利率与用户体验的核心指标。因此,曦望选择不与训推一体 GPU 拼参数,而是聚焦真实场景的单位经济性,成为现有算力系统的 “推理分流与成本优化层”—— 与本土芯片厂商合作为客户构建推理加速专区,形成独特的竞争生态。

王湛表示,“我们的目标是极致降低大模型推理成本与门槛,让算力变得普惠且可广泛获取,从而释放 AGI 的全部潜力。”

——————————————

雷递由媒体人雷建平创办,若转载请写明来源。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法