前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ChatGPT+SmartKG 3分钟生成「哈利波特」知识图谱

ChatGPT+SmartKG 3分钟生成「哈利波特」知识图谱

作者头像
叶锦鲤
发布于 2023-03-21 10:21:19
发布于 2023-03-21 10:21:19
3.5K0
举报
文章被收录于专栏:悦思悦读悦思悦读

本期微软ATP特邀微软首席算法工程师Julia老师带大家见证魔法的诞生:看看爆火的ChatGPT如何好玩又有趣,与微软开源工具SmartKG一同生成《哈利波特》的人物及其关系的可视化图谱!(文末含详解视频哟)

ChatGPT 能聊天,能用它生成知识图谱吗?当然可以了,今天就带大家来利用ChatGPT生成一款哈利波特知识图谱。

当然,ChatGPT的功能在于抽取《哈利波特》中的实体和关系,要存储、搜索、可视化图谱,我们还需要一款知识图谱引擎,此处选用开源的 SmartKG——

SmartKG是微软开源的一款产品,作为轻量级知识图谱可视化+智能对话框架,它能够根据用户输入的实体和关系数据自动生成知识图谱,并提供图谱可视化及基于图谱的智能对话机器人

SmartKG官方下载地址>>

https://github.com/microsoft/SmartKG

如下附Julia老师的介绍SmartKG&知识图谱的B站视频链接,速戳>>

https://www.bilibili.com/video/BV1wN411X7Gw/?spm_id_from=333.337.search-card.all.click&vd_source=e1101e74d0123dc5ba17bf523052c5a5

用ChatGPT抽取知识图谱的实体和关系

工具选好用SmartKG之后,首先要做的是将《哈利波特》中的人物转化成实体(图节点),这一步由ChatGPT承担。

我们设计这样一个问题来提示ChatGPT:

“我需要一个list,这个list里面都是Harry Potter里面的角色”,然后输入两个例子:

一是Harry,如下列出他的信息:

“Harry是男的,巫师,在霍格沃茨,被大众熟知为是大难不死的男孩”。

二是赫敏,也是巫师,也是在霍格沃茨上学,由于她特别的聪明,所以她被人们所知道。

按照如上描述,输入给ChatGPT,它就给出了下图的回复。

大家看输出的 “Harry Potter”,中间都已经用逗号隔开,这样的一个文本就基本上已经是格式化文本了。

有了节点介绍之后,就需要的是「关系」,很简单就是三元组。

接下来,需要继续地给ChatGPT描述上面这些角色之间的关系,同样我要给它一个格式,按照输入的格式,ChatGPT输出的结果如下图所示

通过重复要求ChatGPT输出,之后把所有的这些内容都copy至一个文本文件,存成了nodes.csv。

哈利波特里面分正邪双方,通过ChatGPT可以输出谁是善良的一方,谁是邪恶的一方。

大家可以将这些都存在一个文档里,其实并不需要它很格式化。因为只是需要得到每一个名字生成节点的时候会需要用,以及介绍他们都是什么人,之后就可以反复地生成一系列人物的关系。

▍用ChatGPT写Python脚本进行数据处理

现在我们需要把实体和关系存储为SmartKG的模板定义的格式。这里就需要一个脚本来处理刚才存储的CSV文件。

我们当然可以自己写脚本,不过有ChatGPT ,为什么不让它直接生成代码呢?

如上图所示,我们要求ChatGPT生成 python code,去读CSV文件,一行行读,然后忽略空行,每一行用逗号把它们separate出来,然后把第一个element放到一个set里面去。

之后再要求:如果当前的这一行的第一个element,它已经在这个set里了,那就不处理它。

反过来如果它还不在这个set里,就要进一步去把它整个这一行里面的所有的内容都转到一个 excel 文档里面去。

经过后期稍微的修改和调试,再按照 SmartKG 的模板,首先将它分为 vertexes 和 edges两个sheets。大家可以用名字本身来作为实体ID,属性设置有gender和profession等。

▍用SmartKG对知识图谱进行存储和运算

之后用 SmartKG新建一个数据仓库就叫 HarryPotter,然后上载数据。之后进入知识图谱页,选择数据仓库和场景,先进行图谱可视化。

根据上图大家可以看到,我们总共生成了28个人物和20对关系。分了两个颜色,蓝色代表伏地魔,这显然就是邪恶的一方;绿色的整体上是善良的,或者至少是不邪恶的。

此处图谱完全是通过 ChatGPT直接生成的,没有加任何其他的额外的人工干预的结果。

▍基于知识图谱进行智能对话

接下来,便可以测试一下基于 SmartKG的对话。如下图所示:

左右滑动查看“测试对话”

通过 ChatGPT直接生成的「节点」还有「边」,然后再通过 ChatGPT 生成 code,对案例中存下来的数据进行处理,再用 SmartKG就可以生成这样的一个知识图谱。

基于这个知识图谱还可以进行对话,真的是非常神奇的一段体验!

心动不如行动!大家也赶紧动手试一试吧!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-02-14,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 智汇AI 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
亲手制作一个《哈利·波特》人物图谱,原来罗恩和赫敏的姻缘从第一部就已注定?
文摘菌记得小时候看《哈利·波特》小说的时候,最难记住的就是那些音译的名字,又长又多,最后只能关注那几个主要人物,跟着主要剧情一路过去,当个爽文看完了。
大数据文摘
2021/08/25
1.1K0
与 AI 同行,利用 ChatGLM 构建知识图谱
大家好,我是东方财富的一名算法工程师,这里分享一些利用大模型赋能知识图谱建设的一些实践。
NebulaGraph
2023/07/14
7700
与 AI 同行,利用 ChatGLM 构建知识图谱
哈利波特AR游戏-巫师联盟 深度解析
今年AR技术的进展,及相关应用值得我们关注。给大家推荐一个AR游戏,应该会超越Pokemon Go。
mixlab
2019/06/26
1.1K0
哈利波特AR游戏-巫师联盟 深度解析
让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)
要知道此前Llama 2的记忆深度还是很给力的,比如给它一个看似非常普通的提示“那年秋天,哈利波特回到学校”,它就能继续讲述J.K.罗琳笔下的魔法世界。
量子位
2023/11/07
2470
让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)
知识图谱如何使数据对组织更有用
翻译自 How Knowledge Graphs Make Data More Useful to Organizations 。更多链接查看原文。
云云众生s
2024/03/27
1590
知识图谱如何使数据对组织更有用
《哈利·波特》出版二十周年,教大家用神经网络写咒语!
AI 研习社按:不知道你小时候是否梦想过这样的场景,在对角巷的奥利凡德家挑一把魔杖,十一英寸,冬青木、凤凰羽毛,带着它和一只雪白的猫头鹰奔入国王十字车站,从 9 号和 10 号站台之间穿墙而过,踏上一列呼呼作响、冒着滚滚白烟的蒸汽列车,从此进入一个名叫“霍格沃茨”的魔法世界。 时光飞逝,自 1997 年 6 月这个神奇的魔法世界首次出现在我们面前,已经过去了整整 20 年,这本名为《哈利·波特与魔法石》的奇幻小说也已经整整 20 周岁。 在这个特殊的日子,社长特地为大家准备了一份同样充满奇幻色彩的 AI 教
AI研习社
2018/03/19
8060
《哈利·波特》出版二十周年,教大家用神经网络写咒语!
15亿参数的NLP模型究竟有多强大?有人用它生成了一部《哈利·波特》
这个模型是 OpenAI 去年发布的无监督 NLP 模型 GPT 的直接拓展,基于Transformer,拥有 15 亿参数,使用含有 800 万网页内容的数据集训练。
新智元
2019/05/08
5710
15亿参数的NLP模型究竟有多强大?有人用它生成了一部《哈利·波特》
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等
《海贼王》(英文名ONE PIECE) 是由日本漫画家尾田荣一郎创作的热血少年漫画,因为其宏大的世界观、丰富的人物设定、精彩的故事情节、草蛇灰线的伏笔,受到世界各地的读者欢迎,截止2019年11月7日,全球销量突破4亿6000万本^1,并被吉尼斯世界纪录官方认证为“世界上发行量最高的单一作者创作的系列漫画”^2。
汀丶人工智能
2023/07/07
9680
知识图谱之《海贼王-ONEPICE》领域图谱项目实战(含码源):数据采集、知识存储、知识抽取、知识计算、知识应用、图谱可视化、问答系统(KBQA)等
大语言模型无代码构建知识图谱概述
2023年3月15日,ChatGPT4.0的横空出世,将人们对大语言模型的关注推到了风口浪尖。由于其在智能问答、翻译以及文本生成等工作任务上的卓越表现,业界一度出现了不再需要发展知识图谱相关技术的观点,知识图谱相关概念严重受挫。无可置疑的是,大语言模型的确在智能问答等功能上与知识图谱存在交集,并且表现令人惊讶。但由于大语言模型不可避免的“幻觉”问题,使其存在无法给出准确、全面回答的情况,故而无法适应用户全面的场景需求。而知识图谱存储着大量结构化的信息,可以表达复杂的知识关系,能够满足用户准确、有效的检索需求。由此看来,二者各有所长,不是简单的替代关系,更有甚者二者可以彼此促进。众所周知,知识图谱的构建过程是相当昂贵的,开发者需要从海量的文档中抽取、对齐各类知识,工作量巨大,准确度要求也高。由于大语言模型拥有很强的泛化能力,因此其能有效抽取、识别特定领域文档中的实体、属性以及关系知识,可大大降低知识图谱的构建成本。
colorknight
2024/03/22
3200
项目实战:如何构建知识图谱
作者丨徐阿衡 学校丨卡耐基梅隆大学硕士 研究方向丨QA系统 实践了下怎么建一个简单的知识图谱,两个版本,一个从 0 开始(start from scratch),一个在 CN-DBpedia 基础上补充,把 MySQL,PostgreSQL,Neo4j 数据库都尝试了下。自己跌跌撞撞摸索可能踩坑了都不知道,欢迎讨论。 1. CN-DBpedia 构建流程 知识库可以分为两种类型,一种是以 Freebase,Yago2 为代表的 Curated KBs,主要从维基百科和 WordNet 等知识库中抽取大量的实
小莹莹
2018/04/18
3.1K0
项目实战:如何构建知识图谱
《小时代3》背后:百度知识图谱前夜
这几天百度不断出新,让人目不暇接。在极简首页之后,《小时代3》的百度知识图谱也悄然在搜索页上线。《小时代3》大热之际,其错综复杂的人物关系并不是每个观众都能理清,百度通过掌握的知识图谱数据直接给出了清晰的网状关系,可视化、支持互动。笔者注意到这个产品的网址前缀是tupu.baidu.com,看来接下来百度必然会推出各种独立的“图谱”页面,知识图谱产品狂想曲已然奏响。 我们已从信息时代进入知识时代 如果要对互联网进行分层,它大概可以分为四层。 最底层是将实体世界比特化的“数据”。二进制存储技术、文件结构以及
罗超频道
2018/04/25
1.1K0
《小时代3》背后:百度知识图谱前夜
知识图谱如何改进生成式AI
大语言模型有巨大的潜力,但也存在明显的缺陷。知识图谱可以使大语言模型变得更准确、透明,并且结果易于解释。
云云众生s
2024/03/28
1790
ChatGPT的胜利,宣告知识图谱的消亡?
过去10年,知识图谱可谓是最接近“人工智能”的概念。业内普遍认为,知识图谱的概念最先是由谷歌于2012年正式提出,主要用来支撑下一代搜索和在线广告业务。
科技云报道
2023/08/03
4820
ChatGPT的胜利,宣告知识图谱的消亡?
知识图谱增强大模型应用架构
一 、引言 最近OpenAI连续12天进行12场直播,发布新品。其中第八天介绍了ChatGPT搜索功能项全体用户开放。搜索增强大模型值得OpenAI安排一天专
走向未来
2024/12/24
4670
知识图谱增强大模型应用架构
从《梦华录》谈起:知识图谱竟然还能这么用?!
👆点击“博文视点Broadview”,获取更多书讯 《梦华录》是最近一段时间讨论度颇高的一部电视剧,豆瓣评分一度高达8.8分,是近些年来评分较高的一部古装影视剧。其制作相对精良,画面精美,主要人物的性格特色明显,角色鲜明。并且,这部剧的内容本身当属“披着古装的现代都市剧”,许多情节都能引起人们的共鸣。 不过,今天我们不是来聊剧情的,而是想借这部剧来谈谈知识图谱。从有意思的事情中学习,才能高效地学为所用嘛! 众所周知,知识图谱是由实体和关系组成的网状结构的知识表示。 最新的研究表明,人脑就是通过知识与知识
博文视点Broadview
2022/06/20
4170
从《梦华录》谈起:知识图谱竟然还能这么用?!
知识图谱入门
谷歌是做搜索引擎的,它提出知识图谱的概念,就是为了优化搜索。语义搜索作为一个概念,起源于常被称为互联网之父的Tim Berners-Lee
zhangjiqun
2024/12/17
2700
知识图谱入门
全国知识图谱与语义计算大会 - 实体发现与链接比赛总结
一 背景 互联网大数据时代中,随着机器语义理解需求的日益增长,知识图谱,即各类实体、概念及其之间的语义关系,日益成为大数据时代知识表示的主要形态之一,并在学术界、产业界中掀起一股股浪潮。 2016年9月19-22日,全国知识图谱与语义计算大会(简称CCKS)在北京召开。来自全国学术界、产业界从事知识图谱相关研究的400多人参加,探讨了知识图谱领域的新发现、新技术和新应用,旨在向社会公众介绍知识图谱相关领域的发展趋势和创新成果,进一步推动知识图谱技术领域的发展。本届CCKS会议主题为:语义、知识与链接大数
TEG云端专业号
2018/03/13
2.3K0
全国知识图谱与语义计算大会 - 实体发现与链接比赛总结
基于知识图谱的智能问答方案
2012年谷歌首次提出“知识图谱”这个词,由此知识图谱在工业界也出现得越来越多,对于知识图谱以及相关概念的理解确实也是比较绕。自己在研究大数据独角兽Palantir之后开始接触知识图谱,也算对其有了一定了解,这里从三个角度总结一下怎么去理解知识图谱。
机器学习AI算法工程
2020/07/14
4.6K0
知识图谱(一)-基本概念 原
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。 知识图谱是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
Pulsar-V
2019/07/19
6.3K1
需要知识的后深度学习时代,如何高效自动构建知识图谱?
二者展示的信息量是差不多的,但右边这种看起来更加直观。而且,随着文本篇幅的增长,这种优势会体现得更加明显。
机器之心
2020/11/20
1.1K0
需要知识的后深度学习时代,如何高效自动构建知识图谱?
推荐阅读
相关推荐
亲手制作一个《哈利·波特》人物图谱,原来罗恩和赫敏的姻缘从第一部就已注定?
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档