信创模盒ModelHub XC|适配认证突破30000个 深度攻克大模型部署工程瓶颈
近日,范式 $范式智能(06682)$ 宣布旗下信创模盒ModelHub XC累计完成的信创算力适配认证模型数量突破30000个。自2025年9月上线至今,6个月内实现从100到30000的规模化跨越,近14天新增适配5,000个,信创模盒在异构算力环境下的标准化适配与工程化能力不断提高,紧密联系起国产芯片与主流算法框架,为开发者提供开箱即用的国产算力部署方案。
算力覆盖:9家主流芯片厂商完成系统级适配
信创模盒已完成对国内9家核心加速芯片厂商的系统级优化,包括:
****(Ascend 910-B3/B4)、摩尔线程(MTT S4000)、海光(Hygon K100-AI)、沐曦(MetaX C-500)、天数智芯(Iluvatar BI/BI-150/MRV-100)、寒武纪(MLU370-X4/X8)、曦望(Sunrise PT-200)、昆仑芯(Kunlunxin R200-8F/P-800)、壁仞(Biren 166M)等。
上述芯片已支持从基础NLP任务到多模态大模型的稳定运行,算子库覆盖率达95%以上。
生态协作:3家新增厂商启动批量适配
近期,曦望(Sunrise)与壁仞(Biren)已启动批量适配流程,通过信创模盒标准化测试套件加速产品商业化部署。瀚博半导体(VastaiTech)已启动前期对接,双方围绕底层软硬件接口对齐与推理引擎优化展开合作。
"先导合作+批量加速"模式有助于持续引入前沿硬件算力,丰富用户选择。
技术攻坚:智谱GLM-5完成异构算力部署验证
在30000余项适配任务中,智谱大模型GLM-5在国产异构算力上的部署具有代表性。国产芯片驱动、固件版本与大模型软件栈(如PyTorch、vLLM)之间存在版本依赖,团队在环境解耦与内核调优上进行了系统性投入。
模型量化是另一技术难点。为在有限显存带宽下保持精度,团队针对GLM-5的权重分布开展了定制化量化校准。目前,信创模盒技术团队已在天数智芯Iluvatar BI-150平台上完成GLM-5的复现与部署验证,支持INT4 QAT及特定位宽对齐。
下一步:深化推理优化,跑出信创“加速度”
适配数量是基础,推理效率决定商用价值。信创模盒正集中推进推理环节的优化工作,围绕不同算力架构的显存管理特性与通信原语调优,将推理速率提升至工业级商用标准。
依托XC-LLM等自研推理引擎,信创模盒将持续推进"适配+调优"双轮驱动,将国产算力硬件潜能转化为实际业务生产力,助力国产大模型生态在万亿级参数时代实现真正的自主可控。
免责声明:上述内容仅代表发帖人个人观点,不构成本平台的任何投资建议。


