英伟达即将推出的推理芯片系统整合了Groq的“语言处理单元”(LPU)技术,采用与传统GPU截然不同的架构,通过更广泛的SRAM集成和3D堆叠技术,专门针对大模型推理中的延迟和内存带宽瓶颈进行优化。该新品可能基于下一代Feynman架构设计,从而大幅降低AI智能体运行的能耗与成本。OpenAI承诺采购并投资300亿美元。英伟达计划在下个月的GTC开发者大会上发布一款整合了Groq“语言处理单元”(...
网页链接华尔街见闻02-28
英伟达即将推出的推理芯片系统整合了Groq的“语言处理单元”(LPU)技术,采用与传统GPU截然不同的架构,通过更广泛的SRAM集成和3D堆叠技术,专门针对大模型推理中的延迟和内存带宽瓶颈进行优化。该新品可能基于下一代Feynman架构设计,从而大幅降低AI智能体运行的能耗与成本。OpenAI承诺采购并投资300亿美元。英伟达计划在下个月的GTC开发者大会上发布一款整合了Groq“语言处理单元”(...
网页链接免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。