谷歌宣称TurboQuant可在不损失准确性的前提下,将大型语言模型运行时的缓存内存占用至少减少6倍。在高度依赖硬件规模扩张的AI军备竞赛逻辑下,任何可能削减物理内存采购量的技术进步,都足以让本已处于高估值的芯片板块面临抛压。
精彩评论