登顶 SWE-Bench,快手 KAT-Dev-72B-Exp 刷新开源 SOTA

IT之家10-14

大规模强化学习作为关键路径,能够有效激发大模型的复杂推理能力并显著提升其任务泛化性。近期,快手 Kwaipilot 团队重磅发布的 KAT-Dev-72B-Exp,在软件开发能力评测基准 SWE-Bench Verified 上取得了 74.6% 的卓越表现,创下开源模型领域新纪录。KAT-Dev-72B-Exp 是 KAT-Coder 模型强化学习的实验版本,我们借助这一开源模型揭秘 KAT-...

网页链接
免责声明:本文观点仅代表作者个人观点,不构成本平台的投资建议,本平台不对文章信息准确性、完整性和及时性做出任何保证,亦不对因使用或信赖文章信息引发的任何损失承担责任。

精彩评论

我们需要你的真知灼见来填补这片空白
发表看法