2026年2月26日,麻省理工学院联合英伟达、苏黎世联邦理工学院等机构发布‘驯服长尾’(TLT)技术。该技术针对推理大语言模型在强化学习训练中因‘推演’阶段不均衡导致的算力浪费问题,创新引入自适应草稿模型与实时训练机制。通过投机解码与动态策略调整,TLT在不损失准确率前提下,将训练速度提升70%至210%,并产出可直接部署的轻量级副模型。
网页链接2026年2月26日,麻省理工学院联合英伟达、苏黎世联邦理工学院等机构发布‘驯服长尾’(TLT)技术。该技术针对推理大语言模型在强化学习训练中因‘推演’阶段不均衡导致的算力浪费问题,创新引入自适应草稿模型与实时训练机制。通过投机解码与动态策略调整,TLT在不损失准确率前提下,将训练速度提升70%至210%,并产出可直接部署的轻量级副模型。
网页链接
精彩评论