记忆张量科技有限公司与商汤科技大装置团队联合宣布,成功在国产GPGPU集群上实现了业界首个以“记忆—计算—调度”一体化为核心的PD分离商用推理集群,并在真实生产环境中稳定运行。测试数据显示,该方案综合推理性价比达到同代英伟达A100的150%,标志着国产算力体系在大模型商业化落地方面首次具备了体系级竞争力。此次突破为国产算力生态找到了差异化突破路径。PD分离从硬件优化升级为记忆中心的设计范式。在...
网页链接记忆张量科技有限公司与商汤科技大装置团队联合宣布,成功在国产GPGPU集群上实现了业界首个以“记忆—计算—调度”一体化为核心的PD分离商用推理集群,并在真实生产环境中稳定运行。测试数据显示,该方案综合推理性价比达到同代英伟达A100的150%,标志着国产算力体系在大模型商业化落地方面首次具备了体系级竞争力。此次突破为国产算力生态找到了差异化突破路径。PD分离从硬件优化升级为记忆中心的设计范式。在...
网页链接
精彩评论