硅基流动称融资超20亿 携程壁仞商汤等联合投资 主打Token工厂模式

雷递网 乐天 6月16日

硅基流动日前宣布已完成超20亿元B轮融资,本轮融资由携程战投、晶科能源控股、金蝶股份、联通新沃、联通资本旗下联创创新基金、盛奕资本(润泽集团产业资本)、壁仞战投、蔚来资本、商汤战投、巨人网络、国泰君安创新投、纪源资本、华熙睿登、华控基金、国开金融、北工投资、中关村科学城等产业资本、顶级财务机构和国资联合投资。

据介绍,硅基流动成立之初就提出Token工厂模式,致力于提升Token生产效率并通过规模化生产实现技术普惠,2023年8月启动研发大模型推理引擎,2024年5月,公有云MaaS上线。上架数十款主流开源模型,打通从“裸金属”到标准化Token的链路,并推进支持多元化算力的战略。

2025年2月,基于****的DeepSeek推理服务上线,硅基流动实现基于国产芯片的超大规模Token生产服务。

2025年9月,私有化MaaS推出。针对拥有自有算力、对数据合规有极高要求的国央企、金融机构,硅基流动支持在其私有环境中快速搭建专属Token工厂。

2026年4月,硅基流动新一代算力调度引擎“弹性GPU”上线,实现多元异构算力的弹性扩缩容,支持客户自助式高效部署模型。

硅基流动称,过去一年,公司通过Token工厂模式提供高效 MaaS(模型即服务),日均Token(词元)调用量达数万亿,服务超1,000万用户和1万家企业客户,营收同比增长超10倍,海外市场单月营收达数百万美元。

有观点认为,大模型掀起的是一场生产力革命,其深远程度堪比蒸汽机与电力,将重塑所有产业。这场工业革命造就两类商业机遇:一类是贴近场景的各类应用,百花齐放但面临高度不确定性;另一类则是所有应用都赖以生存且确定性极高的底座——无论上层应用如何变迁,都离不开底层能力的持续供给。Token工厂正是这个确定性极高的底座。

AI底座的核心技术要素是芯片、模型与系统软件。它们并非孤立存在,而是深度耦合,最终凝练成一种全新的产品形态——Token工厂。它将算力、算法与系统能力封装起来,大规模、低成本、高可靠地输出“智能”的原子单位Token。

作为智能的生产与分发枢纽,Token工厂将成为未来智能社会的底层基础设施,扮演新时代“水电煤”的角色。

大模型能力每迈上一个台阶,就解锁一大类应用,应用反过来又提升了底层Token消耗量。IDC预测,2026年中国市场的Token消耗量将达到40,000万亿,较2025年再增约20倍。

面对海量的市场需求爆发,大规模、高性价比Token的稳定供应,正成为影响AI技术规模化落地的关键能力。然而,算力的结构性紧缺、碎片化以及利用率低下,导致优质Token供给严重不足;同时,随着大模型解锁更多应用场景,高企的Token成本成为制约企业规模化落地的核心痛点。

硅基流动称,团队深耕AI系统软件方向十余年,潜心技术攻关和产品打磨,构建了全自研Token生产线。“原子级”工程优化,极致释放算力效能:自研推理引擎融合PD分离、KV缓存管理、专家并行、流水并行等领先技术,支持DeepSeek、Qwen、GLM、Kimi等主流模型,可在英伟达、**、沐曦、摩尔线程等多元芯片上稳定提供高吞吐、低延迟商业级服务。

异构算力纳管与调度,破解供需匹配难题:对异构集群实现统一智能调度与弹性伸缩,支持跨地域资源调度,提升算力利用率并实现极致成本管控,满足企业级客户的业务多元化与Token量产需求。硅基流动已与国内外众多算力供应商建立战略合作关系。

——————————————

雷递由媒体人雷建平创办,若转载请写明来源。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论