信创模盒ModelHub XC适配模型25000+ 完成智谱GLM-5模型部署_老虎社区_美港股上老虎 - 老虎社区

点赞
评论
收藏

信创模盒ModelHub XC适配模型25000+ 完成智谱GLM-5模型部署

范式智能
03-06

今天，范式旗下信创模盒ModelHub XC完成智谱GLM-5模型在天数智芯天垓150上的部署与验证，并将于近日上线。同时，平台上模型的适配认证数量已超过25000个。

GLM-5在国产硬件上的部署实践

本次部署以GLM-5-INT4-Pack8量化模型为核心，依托Docker容器化技术，采用vLLM推理框架，并启用pipeline-parallel与tensor-parallel分布式并行策略，最终对外提供标准OpenAI Chat Completions API服务。

部署过程中，通过INT4量化技术对模型权重压缩，降低显存占用，并用Pack8技术提升访存效率与计算吞吐。推理层面采用vLLM框架的显存管理技术与迭代级动态调度机制，减少显存碎片，实现请求级的持续批处理。同时结合张量并行与流水线并行，在多卡环境下进行计算与通信重叠。

此次部署验证了国产天数智芯硬件与大模型主流推理框架的深度适配性，实现从模型量化、容器化封装到高性能推理的全链路自主可控，为后续基于信创环境的AI应用开发提供可靠的技术范式。

平台生态协同突破：适配模型数量突破25000个

截至目前，信创模盒ModelHub XC已完成超过25000个大模型的适配认证，覆盖**、摩尔线程、天数智芯、海光等主流国产芯片。其中，**系列累计适配模型超过13000个，摩尔线程MTT S4000等芯片适配模型超过6000个，天数智芯系列适配模型突破3000个，海光AI加速卡适配模型超过1500个。

模型架构层面，平台已完成对Qwen2、GLM-4、DeepSeek-V2、Llama3、InternLM2等最新一代模型体系的适配，支持多模态、长文本、强化推理等能力。

未来，范式将持续进行模型推理性能的优化，推进信创硬件与AI框架的适配工作。

$范式智能(06682)$

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

点赞

举报

评论

推荐
最新

empty

暂无评论

热议股票

{"i18n":{"language":"zh_CN"},"data":{"magic":2,"id":539737964594032,"tweetId":"539737964594032","gmtCreate":1772760918179,"gmtModify":1772760935889,"author":{"id":4173517089458360,"idStr":"4173517089458360","authorId":4173517089458360,"authorIdStr":"4173517089458360","name":"范式智能","avatar":"https://static.tigerbbs.com/996fd20a98e9ee9ec2cf636e8f289bfd","vip":5,"userType":5,"introduction":"人工智能时代的领军软件企业","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":204,"starInvestorFlag":false},"themes":[],"images":[{"img":"https://static.tigerbbs.com/4e64e8a7f8a117d36359508c35d2829c","width":"2286","height":"1268"}],"coverImages":[{"img":"https://static.tigerbbs.com/4e64e8a7f8a117d36359508c35d2829c","width":"2286","height":"1268"}],"title":"信创模盒ModelHub XC适配模型25000+ 完成智谱GLM-5模型部署","html":"<html><head></head><body><p>今天，范式旗下信创模盒ModelHub XC完成智谱GLM-5模型在天数智芯天垓150上的部署与验证，并将于近日上线。同时，平台上模型的适配认证数量已超过25000个。</p>\n<p><strong>GLM-5在国产硬件上的部署实践</strong></p>\n<p>本次部署以GLM-5-INT4-Pack8量化模型为核心，依托Docker容器化技术，采用vLLM推理框架，并启用pipeline-parallel与tensor-parallel分布式并行策略，最终对外提供标准OpenAI Chat Completions API服务。</p>\n<p>部署过程中，通过INT4量化技术对模型权重压缩，降低显存占用，并用Pack8技术提升访存效率与计算吞吐。推理层面采用vLLM框架的显存管理技术与迭代级动态调度机制，减少显存碎片，实现请求级的持续批处理。同时结合张量并行与流水线并行，在多卡环境下进行计算与通信重叠。</p>\n<p>此次部署验证了国产天数智芯硬件与大模型主流推理框架的深度适配性，实现从模型量化、容器化封装到高性能推理的全链路自主可控，为后续基于信创环境的AI应用开发提供可靠的技术范式。</p>\n<p><strong>平台生态协同突破：适配模型数量突破25000个</strong></p>\n<p>截至目前，信创模盒ModelHub XC已完成超过25000个大模型的适配认证，覆盖**、摩尔线程、天数智芯、海光等主流国产芯片。其中，**系列累计适配模型超过13000个，摩尔线程MTT S4000等芯片适配模型超过6000个，天数智芯系列适配模型突破3000个，海光AI加速卡适配模型超过1500个。</p>\n<p>模型架构层面，平台已完成对Qwen2、GLM-4、DeepSeek-V2、Llama3、InternLM2等最新一代模型体系的适配，支持多模态、长文本、强化推理等能力。</p>\n<p>未来，范式将持续进行模型推理性能的优化，推进信创硬件与AI框架的适配工作。</p>\n<p><a href=\"https://laohu8.com/S/06682\">$范式智能(06682)$</a></p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/4e64e8a7f8a117d36359508c35d2829c\" tg-width=\"2286\" tg-height=\"1268\"></p>\n<p></p></body></html>","htmlText":"<html><head></head><body><p>今天，范式旗下信创模盒ModelHub XC完成智谱GLM-5模型在天数智芯天垓150上的部署与验证，并将于近日上线。同时，平台上模型的适配认证数量已超过25000个。</p>\n<p><strong>GLM-5在国产硬件上的部署实践</strong></p>\n<p>本次部署以GLM-5-INT4-Pack8量化模型为核心，依托Docker容器化技术，采用vLLM推理框架，并启用pipeline-parallel与tensor-parallel分布式并行策略，最终对外提供标准OpenAI Chat Completions API服务。</p>\n<p>部署过程中，通过INT4量化技术对模型权重压缩，降低显存占用，并用Pack8技术提升访存效率与计算吞吐。推理层面采用vLLM框架的显存管理技术与迭代级动态调度机制，减少显存碎片，实现请求级的持续批处理。同时结合张量并行与流水线并行，在多卡环境下进行计算与通信重叠。</p>\n<p>此次部署验证了国产天数智芯硬件与大模型主流推理框架的深度适配性，实现从模型量化、容器化封装到高性能推理的全链路自主可控，为后续基于信创环境的AI应用开发提供可靠的技术范式。</p>\n<p><strong>平台生态协同突破：适配模型数量突破25000个</strong></p>\n<p>截至目前，信创模盒ModelHub XC已完成超过25000个大模型的适配认证，覆盖**、摩尔线程、天数智芯、海光等主流国产芯片。其中，**系列累计适配模型超过13000个，摩尔线程MTT S4000等芯片适配模型超过6000个，天数智芯系列适配模型突破3000个，海光AI加速卡适配模型超过1500个。</p>\n<p>模型架构层面，平台已完成对Qwen2、GLM-4、DeepSeek-V2、Llama3、InternLM2等最新一代模型体系的适配，支持多模态、长文本、强化推理等能力。</p>\n<p>未来，范式将持续进行模型推理性能的优化，推进信创硬件与AI框架的适配工作。</p>\n<p><a href=\"https://laohu8.com/S/06682\">$范式智能(06682)$</a></p>\n<p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/4e64e8a7f8a117d36359508c35d2829c\" tg-width=\"2286\" tg-height=\"1268\"></p>\n<p></p></body></html>","text":"今天，范式旗下信创模盒ModelHub XC完成智谱GLM-5模型在天数智芯天垓150上的部署与验证，并将于近日上线。同时，平台上模型的适配认证数量已超过25000个。 GLM-5在国产硬件上的部署实践 本次部署以GLM-5-INT4-Pack8量化模型为核心，依托Docker容器化技术，采用vLLM推理框架，并启用pipeline-parallel与tensor-parallel分布式并行策略，最终对外提供标准OpenAI Chat Completions API服务。 部署过程中，通过INT4量化技术对模型权重压缩，降低显存占用，并用Pack8技术提升访存效率与计算吞吐。推理层面采用vLLM框架的显存管理技术与迭代级动态调度机制，减少显存碎片，实现请求级的持续批处理。同时结合张量并行与流水线并行，在多卡环境下进行计算与通信重叠。 此次部署验证了国产天数智芯硬件与大模型主流推理框架的深度适配性，实现从模型量化、容器化封装到高性能推理的全链路自主可控，为后续基于信创环境的AI应用开发提供可靠的技术范式。 平台生态协同突破：适配模型数量突破25000个 截至目前，信创模盒ModelHub XC已完成超过25000个大模型的适配认证，覆盖**、摩尔线程、天数智芯、海光等主流国产芯片。其中，**系列累计适配模型超过13000个，摩尔线程MTT S4000等芯片适配模型超过6000个，天数智芯系列适配模型突破3000个，海光AI加速卡适配模型超过1500个。 模型架构层面，平台已完成对Qwen2、GLM-4、DeepSeek-V2、Llama3、InternLM2等最新一代模型体系的适配，支持多模态、长文本、强化推理等能力。 未来，范式将持续进行模型推理性能的优化，推进信创硬件与AI框架的适配工作。 $范式智能(06682)$","highlighted":1,"essential":1,"paper":2,"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/539737964594032","repostId":0,"isVote":1,"tweetType":1,"viewCount":26766,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":["06682"],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":1244,"optionInvolvedFlag":false,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"hasMoreComment":false,"orderType":2}