首页 > 股市 > 正文

美团上线首个开源并可体验的“重思考”模型

新华财经|2026年01月16日
阅读量:

记者16日从美团获悉,其新一代推理模型——LongCat-Flash-Thinking-2601已开源。该模型在智能体搜索、智能体工具调用、工具交互推理等多个核心评测中,均达到开源模型SOTA水平。

新华财经北京1月16日电(记者丁雅雯)记者16日从美团获悉,其新一代推理模型——LongCat-Flash-Thinking-2601已开源。该模型在智能体搜索、智能体工具调用、工具交互推理等多个核心评测中,均达到开源模型SOTA水平。

值得一提的是,该模型在工具调用的泛化能力上优势尤其明显,在依赖工具调用的随机复杂任务中,性能表现超越了Claude-Opus-4.5-Thinking,可大幅度降低真实场景下新工具的适配训练成本。同时,新模型支持“重思考”模式,可同时启动8个“大脑”执行任务,确保思考周全、决策可靠。

“具体来看,当遇到高难度问题时,新模型会把思考过程拆分成‘并行思考’和‘总结归纳’两步进行。并行思考阶段,与人类面对难题会同时尝试多种解法相似,‘重思考’模式下的模型,会在保证思路多样性的同时,独立梳理出多条推理路径寻找最优解;总结归纳阶段,则会对多条路径进行梳理、优化与合成,并将优化结果重新输入,形成闭环迭代推理,推动思考持续深化。”美团LongCat团队相关负责人介绍。

除此之外,LongCat团队在新模型中加入了额外的强化学习环节,针对性打磨模型的总结归纳能力,从而让LongCat-Flash-Thinking-2601实现了“想清楚再行动”的结果。

此前,美团已开源了面向对话优化的LongCat-Flash-Chat,以及初代思考模型LongCat-Flash-Thinking,及其全模态模型LongCat-Flash-Omni。此次发布的模型进一步强化了智能体在自主使用工具、与环境交互并进行持续推理方面的能力,为AI智能体的实际落地提供了更强支撑。

 

编辑:王媛媛

 

声明:新华财经(中国金融信息网)为新华社承建的国家金融信息平台。任何情况下,本平台所发布的信息均不构成投资建议。如有问题,请联系客服:400-6123115

作家
文章:556 人气:558
作家介绍
手机扫码访问
传播矩阵