2026年1月16日,美团LongCat团队正式发布并开源新一代模型LongCat-Flash-Thinking-2601。作为LongCat-Flash-Thinking的升级版,该模型在智能体搜索、工具调用及工具交互推理等核心评测中均达到开源模型SOTA水平。尤其在工具调用泛化能力上,在随机复杂任务中性能超越Claude,可大幅降低真实场景下新工具的适配训练成本。该模型支持“重思考”模式,可...
网页链接2026年1月16日,美团LongCat团队正式发布并开源新一代模型LongCat-Flash-Thinking-2601。作为LongCat-Flash-Thinking的升级版,该模型在智能体搜索、工具调用及工具交互推理等核心评测中均达到开源模型SOTA水平。尤其在工具调用泛化能力上,在随机复杂任务中性能超越Claude,可大幅降低真实场景下新工具的适配训练成本。该模型支持“重思考”模式,可...
网页链接
精彩评论