业界
美团上线首个开源并可体验的“重思考”模型
时间:2026-01-16 21:01 阅读:
作为LongCat-Flash-Thinking模型的升级版,LongCat-Flash-Thinking-2601现已开源。新模型在Agentic Search、Agentic Tool Use、TIR等核心评测基准上,均达到开源模型SOTA水平。
值得一提的是,该模型在工具调用的泛化能力上更具优势,在依赖工具调用的随机复杂任务中,性能表现超越了Claude-Opus-4.5-Thinking,可大幅度降低真实场景下新工具的适配训练成本;同时,新模型支持“重思考”模式,可同时启动8个“大脑”执行任务,确保思考周全、决策可靠。