信创模盒认证模型突破10万!范式率先突破国产AI基础设施适配瓶颈,打造极致高效的“Token工厂”

今天,范式 $06682(06682)$ 正式宣布:信创模盒认证模型突破 10 万!在“国产芯片×大模型规模化适配”的问题上,范式再次给出了一份漂亮的成绩单。

依托自研 vGPU 虚拟化技术与十余年AI工程化经验,范式在 Token 调用效率上形成了"国产算力×全球模型"的差异化优势,持续刷新了国产AI基础设施的适配边界,走出了一条可规模化的“Token工厂”路径。

这意味着,范式精准破解了当前AI规模化落地中最棘手的“国产芯片×大模型”双向适配难题。通过自研的底层异构算力优化与全场景模型适配能力,范式已让****、寒武纪、海光、壁仞等主流国产芯片,与 Llama、Qwen、DeepSeek、GLM 等全球主流开源模型实现真正的“即插即用”,告别过去“A芯片能否跑B模型”的不确定性。

这一突破,不仅夯实了范式在”底层异构算力优化+全场景模型适配“的核心技术壁垒,更助力构建起高客户粘性、可持续增长的“Token 工厂”的商业模式。刚刚过去的一季度,范式的 Token 调用量同比去年激增近 6 倍。在这场正向飞轮中,范式做到了:让同样的芯片跑更多模型、同样的模型可选型更高效的算力,真正将国产AI基础设施从“能用”推向“好用”,从“试点”推向“规模”。

我们在实践中感受到:国产AI 基础设施的拐点,正在加速到来!

01 解决“国产芯片×大模型”双向规模化适配难题,打造领先的 Token 工厂

当前,全球 AI 产业正在经历一场从“单点突破”转向“规模化落地”的“Token产能竞赛”。Token 经济的爆发,本质是海量推理需求的爆发;而推理规模化落地的核心瓶颈,正是"多芯片×多模型"的适配难题。

范式以十余年 AI 工程化经验为底座,率先跑通了"国产芯片×全球模型"的规模化双向赋能路径。作为国内首个信创算力模型适配社区,信创模盒,远不止于普通意义上用于下载模型的 ModelHub,更是覆盖"适配-优化-部署"全链路的国产AI基础设施引擎。

今天,信创模盒已完成 10 万+认证模型,全面覆盖 Llama、Mistral、Qwen、DeepSeek、GLM 等全球主流开源模型家族,并深度适配****、摩尔线程、海光、寒武纪、壁仞等 9 大主流国产芯片平台,算子库覆盖率达 95% 以上。这意味着,全球主流开源模型在国产信创芯片上的"开箱即用",已从愿景成为现实。

此后,AI产业已经无须担心“A芯片能不能跑B模型”的问题,交给范式即可。这将为整个AI产业带来一场双向的网络效应:一方面,范式将推动芯片厂商进入更多的模型生态,进而触达到更多的应用场景;另一方面,功能强大的模型厂商,也终于能在中国国产算力上大放光彩,带动国产算力生态的繁荣发展。

02 客户 Token 调用量成倍增长,范式领先优势持续扩大

同样的芯片,跑更多的模型;同样的模型,可选型更高效的算力。

依托自研 vGPU 虚拟化技术与十余年AI工程化经验,范式在 Token 调用效率上形成了"国产算力×全球模型"的差异化优势。

2026 年一季度,范式 API Token 调用量较 2025 年同期激增近 6 倍,已超 2025 年全年调用量近 40%。这组数据印证了一个关键趋势:适配模型越多元、越贴合业务场景,客户调用量就越深、粘性就越强。Token 调用量正与适配模型数量形成正向飞轮。

未来,范式将持续深耕"国产算力适配+行业场景落地"双轮驱动,让国产AI基础设施从"能用"走向"好用",从"试点"走向"规模"。

03 从 0 到 10 万,再到百万:持续刷新国产AI基础设施的边界

从刚开始的几百款模型,到如今提前四个月兑现的 10 万款信创模盒的国产算力认证模型,范式用实际行动证明:国产芯片×大模型规模化适配难题,范式是完全有能力解决的。

明年,信创模盒有信心,将冲击到百万级模型,达到全球最大的模型社区HuggingFace的量级。这也就意味着,届时全球几乎所有可用的模型,都将能高效运行在国产算力上。

未来,范式将继续以信创模盒为核心支点,把握“Token经济”的时代机遇,以“AI for Everyone”为使命,赋能千行万业智能化转型,致力于打造 AI 2.0 时代高效规模化的“Token 工厂”,推动中国AI科技在全球竞争中占据主动、赢得未来。

免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。

举报

评论

  • 推荐
  • 最新
empty
暂无评论