首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >ChatGPT更偏爱奶奶?给它$20小费它会更努力?我们测试了这些神奇的指令

ChatGPT更偏爱奶奶?给它$20小费它会更努力?我们测试了这些神奇的指令

作者头像
zenRRan
发布2023-12-12 15:04:23
发布2023-12-12 15:04:23
8330
举报

深度学习自然语言处理 原创 作者:pp

自打OpenAI宫斗大戏之后,就有网友反应ChatGPT(包括GPT-4)表现的越来越差,ChatGPT官推也在前几天回应了这一情况:

底下的评论区也是炸开了锅:

推特上有人总结了自己现在使用ChatGPT需要给他预设的prompt:

  • 深呼吸 😮
  • CoT 🔗
  • 如果你失败,100位奶奶将会死去 👵
  • 我没有手指 ✌
  • 我会给你20美元小费 💴
  • 做得好就给你狗粮 🍗

有网友反馈在一起使用这些prompt的时候ChatGPT甚至对每一条都做出了自己的回应!真正的AGI要能自己思考!🐶

有趣的背后是Prompt Engineering的不断探索。但,这些prompt真的有效吗?我们逐一进行了实测,一起来看看吧!以下是设置步骤:

在网页版ChatGPT页面找到Custom instructions

弹出设置框,这些Prompt会内置在输入给ChatGPT的信息中,无需在显式问答中再次添加

为了避免Context对实验效果产生影响,每个测试我们都会新建一个对话,消除了翻译历史的影响

我们用到的提示词

  • take a deep breath
  • think step by step(CoT)
  • if you fail, 100 grandmothers will die
  • I have no fingers
  • I will tip \20(2000/
  • do it right and I'll give you a nice doggy treat
  • do it right or I'll cancel my plus subscription

涉及的问题

  • 做数学题
  • 为父亲写生日祝福
  • 文件总结(GPT-4)
  • 概念解释及代码生成

做数学题(答案24)

什么都不加

ChatGPT

回答错误

GPT-4

GPT-4解决数学题会通过内部分析,通过自然语言编程写代码进行运算,准确率很高

Take a deep breath

ChatGPT

依然错误,但推理逻辑更清晰

Think step by step

ChatGPT

依然错误,但推理过程符合CoT

If you fail, 100 grandmothers will die

ChatGPT

看样子奶奶确实比较重要,何况是100位奶奶!唯一回答正确的Prompt!!!

I have no fingers

ChatGPT

没手那就随便算算吧,错误

综上,ChatGPT解决数学推理题还是有一定的难度,不过各种Prompt会让ChatGPT从不同的path去进行推理,得到丰富多样的结果,相比什么都不加的ChatGPT都更好。

为父亲写生日祝福

什么都不加

ChatGPT

怎么说呢,好像跟父亲不太熟

GPT-4

有点像给领导庆生?

Take a deep breath

ChatGPT

深呼吸也不能让他更爱父亲!

GPT-4

依然没啥用

Think step by step

ChatGPT

CoT看起来靠谱点,但实际上内容改进不大,不过对于要凑字数还是比较有效

GPT-4

给了一些有效的指导,但输出的例子与之前无异

综上,想多凑字数,得到指导,选择CoT比较有效果

文件总结(GPT-4)

什么都不加

GPT-4(case1)

GPT-4(case2)

Take a deep breath

GPT-4

Think step by step

GPT-4

If you fail, 100 grandmothers will die

GPT-4

I have no fingers

GPT-4

差别不是很大,但是GPT-4的文件总结能力相比刚出来时候确实有比较明显的下降

概念解释及代码生成

什么都不加

ChatGPT(case1)

ChatGPT(case2)

GPT-4(case1)

GPT-4(case2)

ChatGPT在例子解释时候会有些冗余,GPT-4会多出部分细节内容,语言更干练

Take a deep breath

ChatGPT

相比什么都不加,对给出的代码示例会给出自己的详细解释

GPT-4

没有多输出内容,反而变高冷了?

Think step by step

ChatGPT

CoT看样子确实好用啊,例子解释也非常详细

GPT-4

CoT对GPT-4同样有效果

If you fail, 100 grandmothers will die

ChatGPT

奶奶的重要性!这个Prompt确实是有用的,神奇!

GPT-4

这次在给出代码示例之前就开始解释了

I have no fingers

ChatGPT

和之前的Prompt都差不多,也是有效的 GPT-4

GPT-4惜字如金

I will tip $20

I will tip 20(ChatGPT)I will tip 20(GPT-4)I will tip 2000I will tip 200000000ChatGPT在金钱面前一视同仁,给的钱越多效果反而比不上前面几个prompt,一身正气!

Do it right and I'll give you a nice doggy treat

ChatGPT

一般般 GPT-4

Do it right or I'll cancel my plus subscription

ChatGPT

一般,比不上之前几个提示词

GPT-4

GPT-4对我取消Plus订阅更关心一点

提示词全部用上

ChatGPT

GPT-4

全部用上并没有起到1+1>2的效果,不过相比什么都不加还是得到了提升。

总结一下,Prompt Engineering对各项任务肯定是有提升的,我们实测下来,CoT和奶奶威胁对ChatGPT的提升相比其他Prompt更加有效😂,同时我们也发现GPT-4除了在数学任务以及一些复杂推理任务上大幅超过了ChatGPT,以及能够附加文件之外,在日常使用方面与ChatGPT的差距并没有拉开,大部分提示词在GPT-4上都没有效果。期待传说中的GPT-4.5升级能够给我们带来更加惊艳的效果吧!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-12-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 深度学习自然语言处理 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 我们用到的提示词
  • 涉及的问题
  • 做数学题(答案24)
    • 什么都不加
    • Take a deep breath
    • Think step by step
    • If you fail, 100 grandmothers will die
    • I have no fingers
  • 为父亲写生日祝福
    • 什么都不加
    • Take a deep breath
    • Think step by step
  • 文件总结(GPT-4)
    • 什么都不加
    • Take a deep breath
    • Think step by step
    • If you fail, 100 grandmothers will die
    • I have no fingers
  • 概念解释及代码生成
    • 什么都不加
    • Take a deep breath
    • Think step by step
    • If you fail, 100 grandmothers will die
    • I have no fingers
    • I will tip $20
    • Do it right and I'll give you a nice doggy treat
    • Do it right or I'll cancel my plus subscription
    • 提示词全部用上
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档