【太平洋科技快讯】12 月 2 日消息,深度求索公司昨日发布 DeepSeek V3.2 正式版。此次发布包含两个版本:适用于日常场景的 DeepSeek-V3.2,以及目标将开源模型推理能力推向极致的长思考增强版 DeepSeek-V3.2-Speciale。官方网页端、 App 及 API 均已更新为 V3.2 正式版,而 Speciale 版本目前仅通过临时 API 开放,供社区评测与研究。
DeepSeek V3.2 旨在平衡推理能力与输出长度,适合日常使用,如问答及通用 Agent 任务场景。在公开推理基准测试中,其性能达到 GPT-5 水平,略低于 Gemini-3.0-Pro。相比同类长思考模型,V3.2 大幅降低了输出长度与计算开销。
表1:DeepSeek-V3.2 与其他模型在各类数学、代码与通用领域评测集上的得分(括号内为消耗 Tokens 总量约数)
DeepSeek V3.2 是该公司推出的首个将思考融入工具使用的模型,并同时支持思考模式与非思考模式的工具调用,通过大规模 Agent 训练数据合成分发,显著提升模型的泛化能力,在相关评测中达到开源模型最高水准。
表2:DeepSeek-V3.2 与其他模型在各类智能体工具调用评测集上的得分
DeepSeek-V3.2-Speciale 集成了长思考与 DeepSeek-Math-V2 的定理证明能力,专注于探索模型推理边界。它在 IMO 2025、CMO 2025、ICPC World Finals 2025 及 IOI 2025 等顶级国际竞赛中均斩获金牌,其中 ICPC 成绩相当于人类选手第二名。该版本在高度复杂任务上表现大幅优于标准版,但计算成本更高。目前仅用于研究,不支持工具调用,也未针对日常对话优化。
V3.2 的思考模式新增对 Claude Code 的支持,用户可通过更改模型名或快捷键开启。但该模式尚未充分适配 Cline、RooCode 等非标准工具调用组件,官方建议在此类场景下使用非思考模式。