深度思考

最近更新时间:2026-04-30 10:59:02

我的收藏

功能说明

深度思考模型支持在生成最终答案前先进行推理,提升复杂任务的准确性和可解释性。

适用场景

复杂代码生成、代码修复、代码重构。
数学推导、逻辑分析、多步骤决策。
复杂信息抽取后再综合归纳。
需要更强稳定性和更少推理失误的任务。

开启/关闭深度思考

通过 thinking 参数控制是否开启思考模式。
开启深度思考:"thinking":{"type":"enabled"}
关闭深度思考:"thinking":{"type":"disabled"}

支持模型

模型名称
model 参数值
默认值及说明
Hy3 preview
hy3-preview
disabled
HY 2.0 Think
hunyuan-2.0-thinking-20251109
enabled 不支持关闭
DeepSeek-V4-Flash
deepseek-v4-flash
enabled
DeepSeek-V4-Pro
deepseek-v4-pro
enabled
Deepseek-v3.2
deepseek-v3.2
disabled
GLM-5.1
glm-5.1
enabled
GLM-5V-Turbo
glm-5v-turbo
enabled
GLM-5-Turbo
glm-5-turbo
enabled
GLM-5
glm-5
enabled
Kimi-K2.6
kimi-k2.6
enabled
Kimi-K2.5
kimi-k2.5
enabled
MiniMax-M2.7
minimax-m2.7
enabled 不支持关闭
MiniMax-M2.5
minimax-m2.5
enabled 不支持关闭

调用示例

开启深度思考:
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' \\
-H 'Content-Type: application/json' \\
-H 'Authorization: Bearer $API_KEY' \\
-d '{
"model": "hunyuan-2.0-thinking-20251109",
"messages": [
{
"role": "user",
"content": "小明有5个苹果,给了小红2个,又买了3个,最后还剩几个?"
}
],
"thinking": {
"type": "enabled"
},
"stream": false
}'
关闭深度思考:
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' \\
-H 'Content-Type: application/json' \\
-H 'Authorization: Bearer $API_KEY' \\
-d '{
"model": "deepseek-v4-flash",
"messages": [
{
"role": "user",
"content": "小明有5个苹果,给了小红2个,又买了3个,最后还剩几个?"
}
],
"thinking": {
"type": "disabled"
},
"stream": false
}'

推理深度配置

通过 reasoning_effort 参数控制推理深度。该参数用于约束模型投入多少推理强度;推理强度越高,通常回答会更充分,但延迟和 token 消耗也会更高。
reasoning_effort 的值
说明
low
轻量推理,推理步数少,速度快,适合简单任务。
medium
平衡模式,适合大多数日常、逻辑适中的复杂任务。
high
深度推理,推理时间最长,思考最深入,适合高难度数学、编程或复杂逻辑推理任务,但延迟和成本最高。

支持模型

模型名称
model 参数值
说明
Hy3 preview
hy3-preview
默认 low
DeepSeek-V4-Flash
deepseek-v4-flash
默认 high
DeepSeek-V4-Pro
deepseek-v4-pro
默认 high
Deepseek-v3.2
deepseek-v3.2
默认 high

调用示例

推理深度配置:
curl -X POST 'https://tokenhub.tencentmaas.com/v1/chat/completions' \\
-H 'Content-Type: application/json' \\
-H 'Authorization: Bearer $API_KEY' \\
-d '{
"model": "hy3-preview",
"messages": [
{
"role": "user",
"content": "小明有5个苹果,给了小红2个,又买了3个,最后还剩几个?"
}
],
"stream": false,
"temperature": 0.9,
"reasoning_effort": "high"
}'
响应,会附带思考过程 reasoning_content
{
"id": "c95dc87ecce440678c3bb08f5868fee6",
"object": "chat.completion",
"created": 1775146546,
"model": "hy3-preview",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "",
"reasoning_content": "用户现在需要解决的是小明苹果数量变化的问题,首先得理清楚每一步的变化。首先小明一开始有5个苹果,给了小红2个,那这时候应该减去2,对吧?然后又买了3个,这时候要加上3。所以计算的话就是5减2再加3。先算5-2=3,然后3+3=6?等一下,等我再检查一遍:初始5个,给小红2个后剩下5-2=3个,再买3个就是3+3=6个。对的,没错。或者用另一种方式,总的变化是-2+3=+1,所以5+1=6。结果应该是6个。"
},
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 22,
"completion_tokens": 264,
"total_tokens": 286
}
}
思考模式下的工具调用,需在每一轮请求都回填历史 reasoning_content,以获取最佳效果,详情请参见 交错式思考模式(Interleaved Thinking)