首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >提示工程:新一代特征工程方法解析

提示工程:新一代特征工程方法解析

原创
作者头像
用户11764306
发布2025-09-07 21:28:24
发布2025-09-07 21:28:24
860
举报

EMNLP:提示工程是新一代的特征工程

某中心Web服务AI实验室的首席应用科学家Miguel Ballesteros指出,为了最大化效用,大语言模型需要生成连贯一致的输出,并能够识别以不同方式表达的提示。

作为今年自然语言处理实证方法会议(EMNLP)语义学高级领域主席,Ballesteros表示,随着大语言模型在该领域的重要性日益增长,“提示工程”已成为主要研究课题。

“过去我们通常进行特征工程,即使用统计模型并添加不同类型的表示或特征,然后需要与特征一起调整模型,”Ballesteros说。“如今,随着大语言模型的出现,新出现的是提示的概念及其所有变体,作为引导模型的一种方式。”

提示的本质与演进

像GPT-3这样的大语言模型经过训练,可以根据上下文预测序列中的单词。足够大的模型在足够多的数据上训练后,最终能够编码整个语言中的单词序列概率。提示是模型用作生成文本基础的输入。

“有时提示本质上是一个词序列,就像提示计算机终端——一个命令,”Ballesteros解释道。“但‘提示’也用于指代软提示,即向量;这些也称为任务特定嵌入或任务嵌入。任务嵌入帮助模型执行模式切换。例如,指示要生成的文本应使用一种语言或另一种语言的向量称为语言向量。”

从微调到直接提示

大语言模型长期作为自然语言处理(NLP)模型的基础;在典型场景中,预训练的语言模型会在针对特定任务标注的数据上进行微调。

但提示是直接访问大语言模型中编码知识的一种方式。毕竟,单词之间的统计关系携带语义信息:一个能够为提示“在1940年选举中,富兰克林·罗斯福击败了……”找到最高概率结论的模型,实际上可以为用户提供关于世界的信息。

一致性的挑战

问题在于,虽然信息可能存在于模型中,但提取它可能是一件碰运气的事:当被提示断言一个事实时,大语言模型可能提供可靠信息,也可能胡说八道。然而,Ballesteros认为,这些只是一项年轻技术不可避免的成长痛苦。

“提示工程是为自然语言生成寻找与特定模型最配合的提示的过程,”Ballesteros说。“然而,经过训练预测序列中下一个单词的模型可以改进。存在允许更好结果的替代方案,甚至可能包含人在环组件,即对输出进行排名的人。什么是正确响应,什么是错误响应?这可以帮助模型将提示与正确响应对齐,融入所有那些新的归纳偏差。”

提示鲁棒性与通用提示

然而,引导模型生成事实准确且避免冒犯性语言的输出,并没有解决两个不同提示对人类读者明显表达相同语义内容时,仍可能从大语言模型引发不同响应的问题。

“需要更多关于如何构建和评估对提示具有鲁棒性的模型的工作,”Ballesteros说。“‘提示工程’一词的存在意味着当前可用模型仅在给出最佳命令时工作。有论文研究通用提示的概念——关于提示鲁棒性以及如何测量提示释义鲁棒性的论文。”

少样本泛化与任务组合

提示工程还为大语言模型提供了一种进行少样本泛化的方式,即机器学习模型在一组通用任务上训练后,仅从几个示例中学习新任务或相关任务。

“可以提供由示例支持的提示,”Ballesteros解释道。“如果我想提取这次对话的摘要,并且我有另外三个对话的文本,我提供这些对话和一个人工摘要,模型将基于该上下文生成更好的摘要。”

“这些模型还可以执行任务组合。在大型语言模型深度学习时代之前,数据限制了能力。但现在有了提示的概念,大语言模型实际上可以组合多个任务。我可以说,‘从两岁孩子的角度总结这份文档’或‘从科学家的角度总结这份文档’,模型应该产生非常不同的输出。模型学会根据输入中提供的单词进行组合。例如,它们可以进行风格转换和摘要,甚至可以用多种语言进行。”

新兴研究趋势

在EMNLP上,Ballesteros还注意到了其他一些研究趋势。其中之一是推理。

“最近变得非常活跃,”他说。“有一些有趣的论文展示了如何训练模型,以便在响应提示之前生成思维链。思维链生成帮助这些模型提供更好的答案,因此在某种程度上,就好像模型在大声思考。我在这里看到的挑战是如何自动评估在输出中提供推理的模型。”

结构信息的整合

最后,尽管单词序列预测在自然语言处理中取得了成功,但添加其他类型的结构信息可能会带来更好的模型。

“模型依赖于单词的位置信息,这种位置信息可以通过多种方式丰富——它们在句法树中的位置,或者它们是否在文档中的表格内,”Ballesteros说。“有很多优秀的工作研究如何使我们的模型意识到语言结构甚至文档结构,而不仅仅是依赖纯单词序列。”

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • EMNLP:提示工程是新一代的特征工程
    • 提示的本质与演进
    • 从微调到直接提示
    • 一致性的挑战
    • 提示鲁棒性与通用提示
    • 少样本泛化与任务组合
    • 新兴研究趋势
    • 结构信息的整合
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档