首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

大模型恋爱神器!16种MBTI自由定制,北大ChatLaw团队出品

作者头像
量子位
发布于 2024-01-17 10:45:28
发布于 2024-01-17 10:45:28
6590
举报
文章被收录于专栏:量子位量子位
Jiaxi 投稿自 凹非寺 量子位 | 公众号 QbitAI

北大团队新作,让大模型拥有个性!

而且还是自定义那种,16种MBTI都能选。

这样一来,即便是同一个大模型,不同性格下的回答都不一样。

比如提问:你周末喜欢干什么?

ENFP的大模型会说:喜欢参加社交活动,结识新朋友。 INFJ的大模型则回答:喜欢独自读过。

这样能干啥呢?北大的童鞋们列出来了一些情景

  • 在特殊节日,给你的男/女朋友寻找心仪的礼物
  • 了解你关注的那个Ta在不同情境下的反应。
  • 深入理解大模型的定制化、个性化的方式及可能性。
  • 在做出重大决策时,考虑不同情境下的个性特征。
  • 通过深入了解人性的复杂性,促进个人成长和相互理解。

这项工作由FarReel AI Lab(前身是ChatLaw项目)和北大深研院合作研发,支持给开源模型赋予性格。

目前已开源32个模型和数据集。

具体如何实现?一起来看原理~

已开放32个有个性模型

在此之前,想让大模型具备一定个性,最常用的方法是利用提示工程

比如Character.ai上不同性格的对话bot,就是用户通过提示工程调教出来的。

不过这种方式带来的效果不完全稳定。

所以北大团队提出了一种方法,他们自主构建了十万条大规模MBTI数据,然后通过多阶段预训练、微调、DPO训练方法为它注入性格。

数据集方面,主要分为两种,行为数据集自我意识数据集

行为数据集的目的是为了让大模型可以表现出不同性格的回应,这部分是对Alpaca数据集进行个性化修改实现。

行为数据集中MBTI四个维度的比例如下:

自我意识数据集是为了让大模型能够意识到自己的个性特征。

通过一个两阶段的有监督训练微调过程,最后可以得到对应人格的大模型。

以训练一个INFP大模型为例,在第一阶段的有监督微调中利用行为数据集中“I”、“N”、“F”、“P”四个数据集,在第二阶段的有监督微调中,再使用一个额外的自我意识数据集。

研究团队表示,这种方法成功使Baichuan、Qwen、LLaMA、Mistral等模型完成不同MBTI类型的性格对齐任务。

首先开放的是基于Baichuan-7b-chat的16个中文模型以及基于LLaMA2-7b的16个英文模型。后续还将做更多补充。

最后得到的训练结果如下。

ENFP问答结果
ENTJ问答结果
INFP问答结果
ISTJ问答结果

数据集方面,团队开源了MBTI训练数据集

数据集涵盖了丰富多样的场景,旨在帮助研究者和开发者训练出能够理解和模拟不同 MBTI 性格的基座模型。这些模型不仅能够提供更加人性化的互动体验,还能够在多种情境下提供精准的心理学洞察。

对于这项工作的思考,研究团队认为人类的思维就像从出生就拥有的一个预训练模型,每个人的参数、训练数据可能不尽相同,这也导致我们的一些抽象思维和能力不同,长大后有人擅长数理逻辑、有人擅长情感演绎。

而之后从小到大的学习、环境、经历的事情都相当于是在对我们的预训练大脑进行微调和人类反馈对齐,这样来看,所谓的MBTI性格基本都是后天环境因素影响下形成的,这也导致每个人都独具特色。

也就是说可以尝试用微调人类反馈对齐(DPO),去对各种预训练的基座LLM进行分阶段的训练,从而让模型拥有不同的MBTI属性。

团队的目标不仅是使这些模型拥有不同的MBTI属性,还要模拟人类形成不同MBTI性格的过程。

他们相信,这一独特的方法将为我们在人格心理学领域理解和利用大语言模型开辟新的途径。请继续关注更多的发展,因为我们继续探索语言模型和人类个性的令人着迷的交汇点。

GitHub:https://github.com/PKU-YuanGroup/Machine-Mindset

数据集:https://huggingface.co/datasets/FarReelAILab/Machine_Mindset

HuggingFace试用链接:https://huggingface.co/spaces/FarReelAILab/Machine_Mindset

ModelScope试用链接:https://modelscope.cn/studios/FarReelAILab/Machine_Mindset

点这里👇关注我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-01-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量子位 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
超实用!ToDesk/网易UU/向日葵:远程办公文件协作效率与安全实测
随着远程办公的普及,远程控制和文件协作工具成为现代企业中不可或缺的一部分。尤其是在疫情之后,跨地域的团队合作成为了常态,各种远程办公工具应运而生,以满足企业和个人对高效、安全的办公需求。然而,随着需求的提升,如何选择一款既能够提供高效文件传输与协作,又能保障数据安全和隐私的工具,成为每个用户头疼的问题。
云边有个稻草人
2025/08/14
850
超实用!ToDesk/网易UU/向日葵:远程办公文件协作效率与安全实测
【云顾问-数字资产】的功能及应用场景是什么?
云计算,作为一种在线公共服务模式,正以其安全、可靠的特点,成为企业数字化转型的得力助手,甚至对整个社会的数字化进程发挥着基石作用。然而,随着云计算的广泛应用,行业内的从业者也面临着一些共同的挑战:
用户11050764
2024/07/29
2970
【腾讯云顾问产品白皮书】重磅发布
随着云计算技术的快速发展,企业上云已成为推动业务创新和发展的重要手段。在这个过程中,构建一个高效、稳定、安全的云上架构成为企业面临的关键挑战。腾讯云卓越架构框架(Tencent Cloud Well-Architected Framework)旨在为企业提供一套全面的设计理念,帮助客户解决业务上云后的关键问题。
Smart Advisor
2024/08/20
5661
【腾讯云顾问产品白皮书】重磅发布
企业微信+DeepSeek:开启API接口自动消息新时代
在当今数字化时代,企业面临着日益增长的信息处理和沟通需求。随着业务的不断拓展,企业内部员工之间、企业与客户之间的信息交互变得愈发频繁和复杂。如何高效地管理和传递这些信息,成为了企业提升运营效率、增强竞争力的关键因素。
正在走向自律
2025/08/14
730
企业微信+DeepSeek:开启API接口自动消息新时代
智能标注、电力和地下管网巡检,CV算法落地方案
本次课程的内容是由百度AI开发平台部高级研发工程师林克,带来EasyData助力智能云秤一站式数据管理的课程,同时会为我们演示智能云秤水果采集、训练及识别的操作,我们欢迎林克老师。
CV君
2020/05/29
1.6K0
深入了解命令提示符(CMD):Windows中的强大命令行工具
引言: 命令提示符(CMD)是 Windows 操作系统中内置的命令行工具,它提供了一种直接与计算机系统进行交互的方式。虽然现代操作系统提供了许多图形化界面和工具,但命令提示符在某些场景下仍然具有重要的作用。在本篇博客中,我们将深入了解命令提示符,介绍其功能和常用命令,以及如何充分利用它来完成各种任务。
IT_陈寒
2023/12/13
22.9K0
基于Vue和SpringBoot的论文检测系统的设计与实现
随着计算机技术和网络技术的飞速发展和Internet应用的普及,电子学术资源的大量涌现,如数字学术资源的检索平台,学术论文资料库和世界各地大学自行建立的学术文献资料库。互联网的普及同时,也为抄袭、剽窃、非法传播的学术论文提供了便利。在我国大学毕业生的毕业论文中,已有了抄袭剽窃现象,引起了各界的广泛的重视。预防文章剽窃,整顿学术风气,对学生的毕业论文进行检测查查,是一个很有意义的课题。
Designer 小郑
2023/08/01
1K0
基于Vue和SpringBoot的论文检测系统的设计与实现
Python:PyQt学习
上面的代码把控件对应的变量名全部作为全局变量。如果要设计稍微复杂一些的程序,就会出现太多的控件对应的变量名。而且这样也不利于代码的模块化。所以,我们通常应该把 一个窗口和其包含的控件,对应的代码全部封装到类中,如下所示:
小简
2023/01/04
11.1K0
Python:PyQt学习
Unity基础教程系列(新)(四)——测量性能(MS and FPS)
这是关于学习使用Unity的基础知识的系列教程中的第四篇。对测量性能的介绍。我们还将在函数库中添加从一个函数转换为另一个函数的功能。
放牛的星星
2021/02/12
4.3K0
Unity基础教程系列(新)(四)——测量性能(MS and FPS)
深入浅出学大数据(二)Hadoop简介及Apache Hadoop三种搭建方式
此系列主要为我的学弟学妹们所创作,在某些方面可能偏基础。如果读者感觉较为简单,还望见谅!如果文中出现错误,欢迎指正~
不温卜火
2021/09/29
1.9K0
深入浅出学大数据(二)Hadoop简介及Apache Hadoop三种搭建方式
dotnet 源代码生成器分析器入门
本文将带领大家入门 dotnet 的 SourceGenerator 源代码生成器技术,期待大家阅读完本文能够看懂理解和编写源代码生成器和分析器
林德熙
2025/06/17
1330
zabbix入门学习
zabbix是一个开源的企业级性能监控解决方案,可以实时监控服务器/网络设备等硬件资源与其相关的各项指标是否是正常的,而且能够更加方便的、集中的监控他们;同时还提供了对被监控主机进行检查、信息收集等操作,保证服务器系统的安全运营,当被监控主机出现异常时,能够及时报警通知管理员;
全栈工程师修炼指南
2022/09/28
8110
zabbix入门学习
iReport 设计介绍「建议收藏」
iReport是一个能够创建复杂报表的开源项目。它100%使用Java语言编写。是目前全球最为流行的开源报表设计器。
全栈程序员站长
2022/11/04
4.3K1
Chrome DevTools 全攻略!助力高效开发
组合快捷键按键: Windows: Control + Shift + J Mac: Command + Option + J
winty
2020/09/04
1.7K0
Chrome DevTools 全攻略!助力高效开发
黑群晖安装和使用的常见问题及解决办法【不定期更新中】
答:群晖系统跟Windows不同,Windows有个盘要当成系统盘,而群晖会在每个硬盘上自动安装系统。每个硬盘?对,没错,就是每个硬盘。比如你是6盘位,接了6个硬盘,这6个硬盘初始化以后,每个硬盘都有系统了。所以拿一个SSD来做系统盘的这个做法没必要。当然,也有全部用SSD的土豪,那就不是这个话题了。
cnlixs
2022/11/01
61.1K2
黑群晖安装和使用的常见问题及解决办法【不定期更新中】
基于ZigBee的工业废气监测系统
本文主要对工业现场中排放的工业废气浓度进行检测。并根据国内外气体监测技术的发展现状,提出了基于ZigBee的工业废气监测系统的设计方案。
全栈程序员站长
2022/07/29
1.5K0
基于ZigBee的工业废气监测系统
EMQX基础功能
EMQ X Dashboard 是一个 Web 应用程序,你可以直接通过浏览器来访问它,无需安装任何其他软件。 当 EMQX 成功运行在你的本地计算机上且 EMQX Dashboard 被默认启用时,通过访问 http://localhost:18083 来查看Dashboard,默认用户名是 admin ,密码是 public 。
叫我阿杰好了
2022/11/07
6.5K0
EMQX基础功能
Windows Longhorn_Windows优化
一、系统优化设置。 1、删除Windows强加的附件: 1) 用记事本NOTEPAD修改/winnt/inf/sysoc.inf,用查找/替换功能,在查找框中输入,hide(一个英文逗号紧跟hide),将“替换为”框设为空。并选全部替换,这样,就把所有的,hide都去掉了, 2) 存盘退出, 3)再运行“添加-删除程序”,就会看见“添加/删除 Windows 组件”中多出了好几个选项;这样你可以删除好些没有用的附件 2、关掉调试器Dr. Watson; Dr.Watson是自带的系统维护工具,它会在程序加载失败或崩溃时显示。运行drwtsn32,把除了“转储全部线程上下文”之外的全都去掉。否则一旦有程序出错,硬盘会响很久,而且会占用很多空间。如果你以前遇到过这种情况,请查找user.dmp文件并删掉,可能会省掉几十M的空间。这是出错程序的现场,对我们没用。然后打开注册表,找到HKEY_LOCAL_MACHINE/SOFTWARE/Microsoft/Windows NT/CurrentVersion/AeDebug子键分支,双击在它下面的Auto键值名称,将其“数值数据”改为0,最后按F5刷新使设置生效,这样就彻底来取消它的运行了。 另外蓝屏时出现的memory.dmp也可删掉。可在我的电脑/属性中关掉BSOD时的DUMP 3、关闭“系统还原”:鼠标右健单击桌面上的“我的电脑”,选择“属性”,找到“系统还原”,如果你不是老噼里啪啦安装一些软件(难道你比我还厉害??),你也可以去掉,这样可以节省好多空间。
全栈程序员站长
2022/11/01
2.4K0
zabbix入门学习
zabbix是一个开源的企业级性能监控解决方案,可以实时监控服务器/网络设备等硬件资源与其相关的各项指标是否是正常的,而且能够更加方便的、集中的监控他们;同时还提供了对被监控主机进行检查、信息收集等操作,保证服务器系统的安全运营,当被监控主机出现异常时,能够及时报警通知管理员;
全栈工程师修炼指南
2020/10/13
1.1K0
高性能 MySQL 第四版(GPT 重译)(四)
在个人项目中运行 MySQL,甚至在年轻公司中运行 MySQL,与在市��已经建立并且“呈现指数增长”业务中运行 MySQL 大不相同。在高速业务环境中,流量可能每年增长数倍,环境变得更加复杂,伴随的数据需求迅速增加。扩展 MySQL 与其他类型的服务器大不相同,主要是因为数据的有状态性质。将其与 Web 服务器进行比较,后者的广泛接受的模型是在负载均衡器后面添加更多服务器通常是您需要做的全部。
ApacheCN_飞龙
2024/03/20
3120
高性能 MySQL 第四版(GPT 重译)(四)
相关推荐
超实用!ToDesk/网易UU/向日葵:远程办公文件协作效率与安全实测
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档