信创模盒ModelHub XC｜适配认证突破30000个深度攻克大模型部署工程瓶颈_老虎社区_美港股上老虎

信创模盒ModelHub XC｜适配认证突破30000个深度攻克大模型部署工程瓶颈

近日，范式 $范式智能(06682)$ 宣布旗下信创模盒ModelHub XC累计完成的信创算力适配认证模型数量突破30000个。自2025年9月上线至今，6个月内实现从100到30000的规模化跨越，近14天新增适配5,000个，信创模盒在异构算力环境下的标准化适配与工程化能力不断提高，紧密联系起国产芯片与主流算法框架，为开发者提供开箱即用的国产算力部署方案。

算力覆盖：9家主流芯片厂商完成系统级适配

信创模盒已完成对国内9家核心加速芯片厂商的系统级优化，包括：

****（Ascend 910-B3/B4）、摩尔线程（MTT S4000）、海光（Hygon K100-AI）、沐曦（MetaX C-500）、天数智芯（Iluvatar BI/BI-150/MRV-100）、寒武纪（MLU370-X4/X8）、曦望（Sunrise PT-200）、昆仑芯（Kunlunxin R200-8F/P-800）、壁仞（Biren 166M）等。

上述芯片已支持从基础NLP任务到多模态大模型的稳定运行，算子库覆盖率达95%以上。

生态协作：3家新增厂商启动批量适配

近期，曦望（Sunrise）与壁仞（Biren）已启动批量适配流程，通过信创模盒标准化测试套件加速产品商业化部署。瀚博半导体（VastaiTech）已启动前期对接，双方围绕底层软硬件接口对齐与推理引擎优化展开合作。

"先导合作+批量加速"模式有助于持续引入前沿硬件算力，丰富用户选择。

技术攻坚：智谱GLM-5完成异构算力部署验证

在30000余项适配任务中，智谱大模型GLM-5在国产异构算力上的部署具有代表性。国产芯片驱动、固件版本与大模型软件栈（如PyTorch、vLLM）之间存在版本依赖，团队在环境解耦与内核调优上进行了系统性投入。

模型量化是另一技术难点。为在有限显存带宽下保持精度，团队针对GLM-5的权重分布开展了定制化量化校准。目前，信创模盒技术团队已在天数智芯Iluvatar BI-150平台上完成GLM-5的复现与部署验证，支持INT4 QAT及特定位宽对齐。

下一步：深化推理优化，跑出信创“加速度”

适配数量是基础，推理效率决定商用价值。信创模盒正集中推进推理环节的优化工作，围绕不同算力架构的显存管理特性与通信原语调优，将推理速率提升至工业级商用标准。

依托XC-LLM等自研推理引擎，信创模盒将持续推进"适配+调优"双轮驱动，将国产算力硬件潜能转化为实际业务生产力，助力国产大模型生态在万亿级参数时代实现真正的自主可控。

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

推荐
最新

暂无评论

信创模盒ModelHub XC｜适配认证突破30000个 深度攻克大模型部署工程瓶颈

评论

热议股票

信创模盒ModelHub XC｜适配认证突破30000个深度攻克大模型部署工程瓶颈