Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >我做到了!《斗罗大陆》人物关系可视化

我做到了!《斗罗大陆》人物关系可视化

原创
作者头像
Python研究者
修改于 2021-06-10 10:14:13
修改于 2021-06-10 10:14:13
1.3K0
举报
文章被收录于专栏:Python研究者Python研究者

今天辰哥来教大家从一本小说/名著里面提取出人名,并对人名之间的关系进行统计(同一段里面人名两两出现),根据人名之间的关系进行绘制关系图--gephi

核心知识点

  1. 提取文本中人名
  2. 统计文本中人物之间的关系
  3. 绘制网络关系图

先看一下效果

01 jieba小例子

在开始分析《斗罗大陆》小说之前,先来一个小例子让大家对jieba库的使用有个印象。

说明:

可以看到文本内容结果jieba库分词之后,可以获取每一个的词性。咱们这里需要获取人名,只需要挑选出nr的词性,并统计每个词的次数。

这里就给大家演示讲解了jieba从文本提取人名的小例子,下面以小说《斗罗大陆》为例,讲解如何去提取里面人物名,并建立有向图,最后绘制人物关系图。

02 提取人物关系

1.制作姓名字典

部分结果如上图,通过提取小说中里面的所有名字,取出前100个并按频率从高到低写入txt。不过发现一些是不完整、无用、一个人物多名等情况。进行整理之后如下。

2.建立人物有向关系

通过构建的人物名在每一段中两两出现的进行统计。最后建立出来,人物节点和人物之间的联系。

3.保存到csv

结果如下:

03 人物关系网图

这里使用的是gephi进行绘制,gephi下载地址如下:

代码语言:txt
AI代码解释
复制
https://gephi.org/

下载安装之后,开始导入刚刚保存的node.csv和edge.csv数据绘制人物关系网图

1.新建工程&导入数据

新建工程->选择数据资料tab,点击输入数字表格,添加节点和边的csv数据。

2.调整相关的样式

3.修改字体,显示相应的标签

4.选择一个自动化布局的方式,预览,再调整相关参数

5. 最终点击左下角导出图片

04 小结

本文讲解了提取文本中人名并统计文本中人物之间的关系,最后绘制网络关系图,不明白的地方可以在下方留言,一起交流。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
python苦短-灵笼说啥
《灵笼》艺画开天生产,B站独播,国漫里面制作算是精良,但是剧情有太多瑕疵。评论两极分化,好的说非常好,差的说非常差。看看弹幕说的啥吧
火星娃统计
2020/09/15
5060
python苦短-灵笼说啥
看我如何用Python来分析《斗破苍穹》
近期根据小说《斗破苍穹》改编的同名电视剧正在热映,本文对《斗破苍穹》进行文本分析,分为两部分,首先爬取豆瓣影评进行简单分析,随后对于原创小说文本中的人物进行详细分析,文章代码和数据在后台回复"斗破苍穹"可得。
sergiojune
2018/12/05
9740
2017,那些出现在日记中的人:简单的文本挖掘
终于做出这张图时,我突然有点感慨,这就是2017年我的日记中提到过或记录过的一个个人名,当然为避免引起不必要的麻烦,隐去了许多亲人朋友的名字。想到一辈子说长也长,说短的话,几十张词云图也就概括了那些人与事。曾经朝夕相处、相识相知的人,或许早已渐行渐远了,二三老友谈起故人往事才发现死活想不起某某同学姓甚名谁,遗忘总是发生在不知不觉间,有时候连自己都不知道究竟忘记了什么。
古柳_DesertsX
2018/08/21
4740
2017,那些出现在日记中的人:简单的文本挖掘
办公利器!用Python批量识别发票并录入到Excel表格
辰哥今天来分享一篇办公干货文章:用Python批量识别发票并录入到Excel表格。对于财务专业等学生或者公司财务人员来说,将报账发票等汇总到excel简直就是一个折磨。
Python研究者
2021/06/24
1.6K0
图解大数据 | Spark Dataframe/SQL大数据处理分析
教程地址:http://www.showmeai.tech/tutorials/84
ShowMeAI
2022/03/08
1.8K0
图解大数据 | Spark Dataframe/SQL大数据处理分析
使用Prometheus进行Substrate节点可视化监控
本文将使用docker搭建普罗米修斯可视化监控环境,安装组件包括:Influx、Prometheus、Grafana,并基于该环境进行Substrate节点可视化监控。
jasonruan
2020/08/12
1.2K0
Python文本挖掘:基于共现提取《釜山行》人物关系
《釜山行》是一部丧尸灾难片,其人物少、关系简单,非常适合我们学习文本处理。这个项目将介绍共现在关系中的提取,使用python编写代码实现对《釜山行》文本的人物关系提取,最终利用Gephi软件对提取的人物关系绘制人物关系图。实体间的共现是一种基于统计的信息提取。关系紧密的人物往往会在文本中多段内同时出现,可以通过识别文本中已确定的实体(人名),计算不同实体共同出现的次数和比率。当比率大于某一阈值,我们认为两个实体间存在某种联系。这种联系可以具体细化,但提取过程也更加复杂。因此在此课程只介绍最基础的共现网络。
机器学习AI算法工程
2018/03/15
2.7K0
Python文本挖掘:基于共现提取《釜山行》人物关系
用Python爬取《王者荣耀》英雄皮肤数据并可视化分析,用图说话
今天辰哥带大家分析一波当前热门手游《王者荣耀》英雄皮肤,比如皮肤上线时间、皮肤类型(勇者;史诗;传说等)、价格。
Python研究者
2021/08/17
7930
纠结火锅去哪吃,用Python可视化做个数据呈现决定吧
大家好,今天给大家讲一讲Python的综合实战演练内容——以大众都非常喜爱的火锅为例,如何用我们掌握的Python语言,去获取全国不同城市火锅店数量情况,并将这些数据进行可视化展示呢?
查理不是猹
2021/12/25
5930
微博可视化网站定制:微博话题人物关系共现可视化
写了个一站式微博分析可视化网站 作为长期项目,本次开放微博话题人物关系共现可视化功能,用户可以输入 2021 新版微博话题爬虫发布 的 csv 结果文件和自己的邮箱,然后网站后台提取话题的文本内容中相互艾特的人物关系并且生成 gephi 构图所需的 edge.csv 和 node.csv 文件,处理成功并压缩后发送至你输入的邮箱地址。接口地址如下:
月小水长
2022/05/18
5890
微博可视化网站定制:微博话题人物关系共现可视化
数据可视化:认识WordCloud
wordcloud是优秀的词云展示的第三方库,我们可以借助wordcloud轻松实现词云图。使用Wordcloud之前需要先了解它的以下几个特点:
马拉松程序员
2023/09/02
7460
数据可视化:认识WordCloud
用Python进行分析
大家给差评的原因也很统一,电视剧对小说改编过多,原著党难以接受,再加上5毛钱特效和演员的尴尬演技,感觉是妥妥烂片无疑了。不妨再看看给好评的人都是些神马想法
数据森麟
2019/09/27
7450
如何用Python对某娅偷逃税进行微博舆情分析~
前几天某娅因偷逃税被罚了13.41亿元,此消息一出,可是在网上激起了千层浪,网友们直接炸锅了。都在感慨,这辈子挣的钱不知道有没有人家交的罚款的零头多。
陈晨135
2021/12/25
9060
如何用Python对某娅偷逃税进行微博舆情分析~
Python数据分析 | 基于Pandas的数据可视化
教程地址:http://www.showmeai.tech/tutorials/33
ShowMeAI
2022/02/25
9950
Python数据分析 | 基于Pandas的数据可视化
Kaggle赛题分析(二)
通过智能手机的信号日志,识别具体用户在购物中心的位置。当前的定位算法在多层建筑中精度较差,且大部分是基于GPS信息构建。
算法之名
2021/10/09
3.5K0
Kaggle赛题分析(二)
干货分享:如何学习关系网络可视化?
本文介绍了关系网络可视化中的node-link与matrix方法,以及可视化工具Gephi。文章还涉及了可视化中颜色、视觉元素、辅助视角等的应用,并给出了一个实际案例。
企鹅号小编
2018/01/04
1.7K0
干货分享:如何学习关系网络可视化?
Qt编写数据可视化大屏界面电子看板系统
目前大屏大数据可视化UI这块非常火,趁热也用Qt来实现一个,Qt这个一站式超大型GUI超市,没有什么他做不了的,大屏电子看板当然也不在话下,有了QSS和QPainter这两个无敌的工具组合,借用几个Qt高手朋友的话来说,都是分分钟。在整个系统的编写过程中,发现数学知识真的还是蛮重要的,在重要的几个算法点上,需要多次用到二元一次方程才能搞定几个算法,比如如何分组绘制柱状图。
feiyangqingyun
2019/08/20
5.5K1
Qt编写数据可视化大屏界面电子看板系统
【旧文】浅析_网友说的过火绒的远控
【HA256】 :3504ec84a6efb00010064e3abb1d0ae5e38883ce0abbd7c1ad7245eeb3a05bcd
UzJu@菜菜狗
2022/04/25
4180
【旧文】浅析_网友说的过火绒的远控
CMS指纹字典大全[通俗易懂]
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
全栈程序员站长
2022/11/10
4.8K0
Armor Piercer:针对南亚次大陆的网络攻击已经开始
思科最近发现了一个针对印度政府和军事人员的攻击活动,攻击者使用了两个商业 RAT(NetwireRAT 和 WarzoneRAT)。攻击者将诱饵文件伪装成与印度政府基础设施运营相关的指南,指南以恶意 Office 文档和压缩文件(RAR、ZIP)等形式出现。
FB客服
2021/10/11
1.7K0
推荐阅读
相关推荐
python苦短-灵笼说啥
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档