白话科普 | AI如何理解你的问题？万字长文结合案例解析Prompt核心技术！让DeepSeek等大模型更好用

AI研思录

发布于 2025-02-20 20:03:20

11500

代码可运行

文章被收录于专栏：AI研思录AI研思录

运行总次数：0

代码可运行

Prompt（提示词）是大模型的输入，也是调用大模型能力的接口，用以激发或引导大模型生成特定类型的回答。

前言

你是否曾经在使用AI时感到困惑，为什么同样的问题会有截然不同的回答？其实，这背后的关键就在于“Prompt”（提示词）。本文将深入探讨Prompt的定义、作用以及如何构建优质Prompt，并结合技术原理剖析AI是如何理解你的输入。从ICIO框架到自注意力机制，再到多头注意力模型，我们将用通俗易懂的语言揭开大模型运行的秘密。更重要的是，本文将围绕医学领域的实际案例，展示如何通过精心设计的Prompt，让AI在诊断、治疗方案推荐和患者教育等场景中发挥巨大价值。无论你是AI小白还是资深玩家，这篇文章都能帮你掌握与AI高效沟通的核心技巧！

正文：

一、什么是Prompt？它为什么重要？

如果你把AI比作一个超级聪明的朋友，那么Prompt就是你和这个朋友交流的方式。简单来说，Prompt是用户输入给AI的一段文字或指令，用来引导AI生成特定的回答。

举个例子，当你问AI“帮我写一首关于春天的诗”，这就是一个Prompt。而AI根据你的要求生成的诗句，则是对这个Prompt的回应。

但问题来了——为什么我们需要精心设计Prompt呢？答案很简单：因为AI并不是人类，它无法像我们一样自然地理解语境和意图。如果Prompt不够清晰或者缺乏上下文信息，AI可能会误解你的意思，甚至给出完全不符合预期的答案。

为了更系统地优化Prompt，业内提出了一个叫做ICIO框架的方法论。ICIO代表四个要素：

Instruction（指令）：告诉AI具体要做什么。
Context（上下文/背景）：提供任务相关的背景信息。
Input Data（输入数据）：明确需要处理的具体内容。
Output Indicator（输出指示器）：说明希望得到的结果类型或格式。

其中除了指令以外，其他要素都是可选的，说明指令对于大模型来说是最重要的，其他要素都是对指令的补充。这意味着：

提示词最基本的作用是沟通和引导，其核心是要清晰地传达用户的意图，而上下文和输入输出等内容，是对意图的补充，帮助大模型更快、更准确地理解意图。

二、优质Prompt的标准是什么？

既然我们知道Prompt很重要，那什么样的Prompt才算优质呢？答案是：能够清晰传达用户意图的Prompt。

这里有一个经典案例可以说明问题。假设有人问你：“我配XXXX吗？”你会怎么回答？

大多数人可能会直接解读为对方想确认某种能力或资格，比如“我配得上这份工作吗？”、“我配拥有幸福的生活吗？”等等。但实际上，这种提问方式往往隐藏着更深层次的情感需求。对方可能并不是真的想知道“配不配”，而是希望通过你的回答获得支持和鼓励。

如果此时你只是机械地回答“你当然配啊”，很可能会让对方失望，因为他们真正期待的是情感上的共鸣和支持。这就说明了，即使是简单的Prompt，也需要充分考虑上下文和潜在意图。

因此，优质的Prompt必须做到以下几点：

明确性：避免模糊表达，尽量使用具体、直接的语言。
完整性：包含足够的上下文信息，帮助AI更好地理解你的意图。
逻辑性：确保问题结构合理，便于AI推理和生成答案。

三、GPT如何理解Prompt？技术细节揭秘

接下来，让我们进入稍微复杂但又非常有趣的技术层面，看看AI究竟是如何“读懂”你的Prompt的。

unsetunset1. GPT的基本结构unsetunset

GPT是一种基于Transformer架构的大语言模型。它的主要特点是采用了解码器部分，并且舍弃了原始Transformer中的交叉注意力层，只保留了掩码多头自注意力层（Masked Multi-Head Attention）和前置反馈网络层（Feed Forward Network, FFN）。

GPT结构

这两个模块分工明确：

自注意力层：负责捕捉输入序列中各个单词之间的依赖关系，从而理解上下文信息。
FFN层：对自注意力层的输出进行进一步加工，提取更高层次的特征。

由于FFN层的操作较为抽象且难以直观解释，所以我们重点分析自注意力层的工作原理。

unsetunset2. 自注意力机制：AI的“聚焦”能力unsetunset

想象一下，当你阅读一本书时，大脑会自动忽略无关紧要的信息，专注于当前句子的关键部分。AI的自注意力机制正是模仿了这种行为。

具体而言，当Prompt被输入到GPT中时，首先会经过Tokenization（分词），将文本拆分成一个个独立的词元（tokens）。然后，这些tokens会被转换成高维空间中的向量表示，这一过程称为Embedding（词嵌入）。

在向量空间中，每个点都代表一个实体（如单词、短语等），它们的位置反映了彼此之间的相似性和关系。例如，“苹果”这个词在不同语境下可能有不同的含义——在“苹果公司的财报”中指代一家企业，而在“苹果的口感”中则是水果。为了让AI正确区分这些差异，模型会对原始向量进行调整，以丰富其语义。

调整后的向量随后进入自注意力层，在这里发生了一系列复杂的计算。以下是自注意力机制的主要步骤：

unsetunset（1）QKV计算unsetunset

对于每个token，模型都会生成三个向量：Query（查询）、Key（键）和Value（值）。这三个向量分别对应于：

Query：当前token的需求或目标。
Key：其他token的特性或标签。
Value：其他token的实际内容。

举个例子，假如我们的输入是“我是小明，今天我心情不太好，在学校里被人欺负和嘲笑了，你安慰安慰我”。对于token“我是小明”，它的Query可能是“你安慰安慰我”，而其他的Key和Value则提供了相关信息。例如，“心情不好”的Key可能包括“被欺负”、“被嘲笑”等标签，Value则是完整的描述，整句话。

用数学公式来表示这个过程，假设我们有一个输入序列，其中是第个token的嵌入向量。通过线性变换，我们可以得到Query、Key和Value矩阵：

其中，、和是可训练的权重矩阵。

unsetunset（2）注意力权重分配unsetunset

接下来，模型会计算Query和Key之间的相似度，这一步通常通过点积运算完成。结果越大，说明两个token之间的关联越强。

为了防止数值过大影响稳定性，点积结果还会除以Key维度的平方根进行缩放。最后，通过归一化操作（softmax函数），将所有权重转化为总和为1的概率分布。

具体来说，给定Query矩阵和Key矩阵，注意力权重的计算公式为：

其中：

是Key向量的维度；
是归一化函数，确保所有权重的总和为1。

unsetunset（3）加权求和unsetunset

归一化后的权重会与对应的Value相乘，再加权求和，最终得到一个新向量，即上下文向量。这个向量融合了当前token及其周围token的所有相关信息，相当于AI对该token的理解。

用公式表示，上下文向量的计算过程如下：

其中：

是上一步计算得到的注意力权重矩阵；
是Value矩阵。

最终，上下文向量就是模型对当前token的综合理解，包含了来自整个输入序列的相关信息。

unsetunset3. 多头注意力：多角度捕获信息unsetunset

虽然单头注意力已经足够强大，但它仍然存在局限性——只能从单一视角分析数据。为此，Transformer引入了多头注意力机制。

Multi-head attention allows the model to jointly attend to information from different representation subspaces at different positions. With a single attention head, averaging inhibits this

原始论文中这段表述的意思是，多头注意力允许模型同时关注不同表示子空间中的信息，使用单个注意力头时，平均会抑制这一点。

因此Transformer引入了多头注意力，这里的多头，指的是注意力函数实例。可以理解为，不同的头，他们的Wq、Wk、Wv都不同，也就是词元会从不同角度去发问，同时表达出不同角度的特征。这对于充分捕获上下文信息，是有帮助的。

所谓“多头”，是指同时运行多个注意力函数实例，每个实例都有自己的Query、Key和Value矩阵。这样做的好处是可以从不同角度捕获上下文信息，避免因单一视角导致的信息丢失。

每个头都按照缩放点积注意力的方式进行运算后，会将他们的上下文向量，基于输出投影矩阵Wo进行变换。论文中提到，由于每个头的维度降低，总的计算成本与具有完整我是维度的单头注意力相似。所以性能上相对于单头注意力并没有太大影响。

再之后，就是基于理解进行作答，这部分并不是本文关注的重点，简单概括下：就是将上下文向量传入前置反馈层（FNN），经过两次线性变化加一次激活函数来提取更深层次的特征，再通过残差连接和归一化来加速收敛。

最后在输出层通过对线性变换后计算生成的logits进行归一化，来得到下一个词的概率分布，通过解码策略来选择具体的token，然后将输出的token作为Prompt的一部分再来一轮，由此往复，直至完成作答。其中输出层涉及到了大模型的解码策略，其中GPT提供了常见的temperature、top-p等参数，这些参数的设定同样会影响模型输出的结果。

例如，在处理“你安慰安慰我”这个query时，第一个注意力头可能关注“心情不好”带来的直接坏情绪，第二个头则可能注意到原因“被人欺负和嘲笑”所暗示的事件背景。综合多个头的输出后，模型就能形成更加全面的理解。

四、以医学为例：Prompt应用案例

unsetunset1. 病例诊断辅助unsetunset

在医学领域，AI可以通过精心设计的Prompt帮助医生快速识别疾病。例如，假设一名患者出现发热、咳嗽和呼吸困难的症状，医生可以输入以下Prompt：

患者症状：发热、咳嗽、呼吸困难  
背景信息：近期曾接触过流感患者  
任务：请列出可能的诊断并排序优先级

通过这样的Prompt，AI可以迅速生成一份可能的诊断列表，例如：

流感
肺炎
新冠病毒感染

这种功能不仅节省了医生的时间，还能减少误诊的可能性。

unsetunset2. 治疗方案推荐unsetunset

除了诊断，AI还可以协助制定个性化的治疗方案。例如，针对糖尿病患者，医生可以输入以下Prompt：

患者情况：50岁男性，II型糖尿病，BMI 28，血糖控制不佳  
背景信息：无严重并发症，但有轻度高血压  
任务：请推荐一种适合的药物治疗方案，并说明理由

AI可能会生成如下建议：

推荐药物：二甲双胍联合SGLT2抑制剂
理由：二甲双胍是II型糖尿病的一线用药，可有效降低血糖；SGLT2抑制剂有助于减轻体重和改善血压。

unsetunset3. 患者教育unsetunset

AI还可以用于患者教育，帮助普通人群更好地理解复杂的医学知识。例如，患者可能问：

问题：什么是胰岛素抵抗？  
背景信息：我是糖尿病患者，刚被医生告知可能存在胰岛素抵抗  
任务：请用通俗易懂的语言解释胰岛素抵抗的概念，并告诉我如何应对

AI的回答可能是：

胰岛素抵抗是指身体细胞对胰岛素的反应减弱，导致血糖水平升高。这就像钥匙插进锁里却打不开门一样。为了应对胰岛素抵抗，你可以尝试以下方法：

坚持规律运动，特别是力量训练；
控制饮食，减少精制碳水化合物的摄入；
定期监测血糖，按医嘱服药。……

五、后记

通过以上分析，我们可以得出几个关键结论：

Prompt的质量直接影响AI的表现。只有清晰、完整、逻辑严密的Prompt，才能激发AI的最佳潜力。
AI并非天生具备人类般的理解力，它依赖复杂的数学模型来解析输入信息。因此，了解一些基础技术原理，有助于我们更好地与AI协作。
在医学领域，精心设计的Prompt可以帮助医生提高诊断效率、优化治疗方案，并为患者提供更好的教育服务。

总之，Prompt不仅是人机交互的桥梁，更是解锁AI潜能的钥匙。希望大家在阅读本文后，能够掌握更多实用技巧，成为与AI高效对话的高手！

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2025-02-01，如有侵权请联系 cloudcommunity@tencent.com 删除

prompt

本文分享自 AI研思录微信公众号，前往查看

如有侵权，请联系 cloudcommunity@tencent.com 删除。

本文参与腾讯云自媒体同步曝光计划，欢迎热爱写作的你一起参与！

登录后参与评论

0 条评论

热度