港股研究社迅,近日,美团(03690.HK)在人工智能领域迈出了重要一步,于9月22日正式发布了其高效推理模型LongCat-Flash-Thinking。
据美团官方介绍,基于AIME25实测数据,LongCat-Flash-Thinking在该框架下展现出了卓越的智能体工具调用能力。在确保高达90%准确率的前提下,该模型相较于不使用工具调用的方式,能够节省64.5%的Tokens,这一数据充分显示了其高效性。目前,该模型已在HuggingFace、Github等知名平台上全面开源,供全球开发者共同研究与使用。
LongCat-Flash-Thinking不仅增强了智能体自主调用工具的能力,还扩展了形式化定理证明能力,成为国内首个同时具备“深度思考+工具调用”与“非形式化+形式化”推理能力的大语言模型。其在逻辑、数学、代码、智能体等多个领域的推理任务中,均达到了全球开源模型的最先进水平。