一波未平一波又起,英伟达Vera Rubin可能加剧NAND存储短缺

ITheat热点科技01-13

在此前的CES 2026展会中,英伟达发布了下一代的AI超级计算平台,Vera Rubin系统。在目前的环境体系中,此类LLM智能体需要依赖大量的长期记忆,并存储下跨越多轮的对话,以及会话内容的上下文,以便AI能够基于此前已经生成的推理内容进行继承构建,而非从头再来。这些内容也被称之为KV缓存,按照传统的做法这些缓存会被存储在GPU的HBM缓存中,但很显然以Vera Rubin那恐怖的算力来说,...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法