腾讯科技论文解读专栏,在代码与商业的交汇处,寻找AI的确定性。文|博阳编辑|徐青阳近期,谷歌的 Nested Learning 引发了一场模型界的记忆地震。很多人重新意识到,大模型不必永远是“训练完就封存”的只读权重,它也可以在推理过程中继续变化。在 Nested Learning 里,当模型读到新的上下文时,它不只是把文本塞进注意力的缓存里临时翻找,而是允许自己在推理过程中更改参数,让新信息变成...
网页链接腾讯科技论文解读专栏,在代码与商业的交汇处,寻找AI的确定性。文|博阳编辑|徐青阳近期,谷歌的 Nested Learning 引发了一场模型界的记忆地震。很多人重新意识到,大模型不必永远是“训练完就封存”的只读权重,它也可以在推理过程中继续变化。在 Nested Learning 里,当模型读到新的上下文时,它不只是把文本塞进注意力的缓存里临时翻找,而是允许自己在推理过程中更改参数,让新信息变成...
网页链接
精彩评论