Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Python数据挖掘:WordCloud词云配置过程及词频分析

Python数据挖掘:WordCloud词云配置过程及词频分析

作者头像
小小科
发布于 2018-09-28 03:30:17
发布于 2018-09-28 03:30:17
5510
举报
文章被收录于专栏:北京马哥教育北京马哥教育

这篇文章是学习了老曹的微信直播,感觉WordCloud对我的《Python数据挖掘课程》非常有帮助,希望这篇基础文章对你有所帮助,同时自己也是词云的初学者,强烈推荐老曹的博客供大家学习。如果文章中存在不足或错误的地方,还请海涵~

一. 安装WordCloud

在使用WordCloud词云之前,需要使用pip安装相应的包。

pip install WordCloud pip install jieba

其中WordCloud是词云,jieba是结巴分词工具。 问题:在安装WordCloud过程中,你可能遇到的第一个错误如下。

error: Microsoft Visual C++ 9.0 is required. Get it from http://asa.ms/vcpython27

解决方法也很简单,下载VCForPython27安装(Microsoft Visual C++ Compiler for Python 2.7)。但是在微软下载总是没响应。 这是最大的问题,下面我自己提供一个CSDN的地址供大家下载。下载完成,可以进行安装响应的库函数。 资源地址:http://download.csdn.net/detail/eastmount/9788218

安装完成之后,可以正常运行代码啦。

二. 简单词云代码

下面这部分代码参考老曹的,希望对你有所帮助。 老曹说:什么是词云呢?词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。 代码如下:

运行结果如下所示:

这是中文编码问题,下面讲解解决方法。

三. 中文编码错误及解决

在WordCloud安装的目录下找到WordCloud.py文件,对源码进行修改。

编辑wordcloud.py,找到FONT_PATH,将DroidSansMono.ttf修改成msyh.ttf。这个msyh.ttf表示微软雅黑中文字体。

注意,此时运行代码还是报错,因为需要在同一个目录下放置msyh.ttf字体文件供程序调用,如下图所示,这是原来的字体DroidSansMono.ttf。

此时的运行结果如下所示,这是分析CSDN多篇博客的主题,"阅读"和"评论"比较多。

也可以采用下面的代码:

wordcloud = WordCloud(font_path = 'MSYH.TTF').fit_words(word)

四. 照片背景的词云代码

下面进一步深入,假设存在一个图 "sss3.png",核心代码如下:

运行结果如下图所示,显示我和宝宝我俩最近两月的聊天记录。

一弦一柱思华年,一co一ding梦严贤。 希望文章对你有所帮助,尤其是结合数据库数据分析的人。还是那句话,如果刚好需要这部分知识,你就会觉得非常有帮助,否则只是觉得好玩,这也是在线笔记的作用。如果文章中存在不足或错误的地方,还请海涵~

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-09-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 马哥Linux运维 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python | 数据挖掘,WordCloud词云配置过程及词频分析
其中WordCloud是词云,jieba是结巴分词工具。 问题:在安装WordCloud过程中,你可能遇到的第一个错误如下。
用户1634449
2018/10/18
9070
Python数据挖掘:WordCloud词云配置过程及词频分析
豌豆贴心提醒,本文阅读时间5分钟 这篇文章是学习了老曹的微信直播,感觉WordCloud对我的《Python数据挖掘课程》非常有帮助,希望这篇基础文章对你有所帮助,同时自己也是词云的初学者,强烈推荐老曹的博客供大家学习。如果文章中存在不足或错误的地方,还请海涵~ 一. 安装WordCloud 在使用WordCloud词云之前,需要使用pip安装相应的包。 pip install WordCloud pip install jieba
小小科
2018/05/02
1.6K0
Python数据挖掘:WordCloud词云配置过程及词频分析
利用jieba和wordcloud从新闻中生成词云
wordcloud 是一个python实现的高效词频可视化工具,除了可以使用各种mask和颜色提供个性化的掩膜,还可以通过api便捷的挑战获得个性化的词云输出。 安装
菲宇
2020/03/25
2K0
艺术与文本的交织:基于Python的jieba和wordcloud库实现华丽词云
jieba和wordcloud是两个在自然语言处理和数据可视化领域非常常用的Python库。
Srlua
2024/05/26
3500
艺术与文本的交织:基于Python的jieba和wordcloud库实现华丽词云
简单NLP分析套路(3)---- 可视化展现初步
构思这个系列的初衷是很明显的,之前我是从图论起家搞起了计算机视觉,后来发现深度学习下的计算机视觉没的搞了,后来正好单位的语料很丰富就尝试了NLP 的一些东西,早期非常痴迷于分词等等的技术,后来发现NLP 里面是有广阔天地的。
流川疯
2022/05/10
4580
简单NLP分析套路(3)---- 可视化展现初步
数据可视化:认识WordCloud
wordcloud是优秀的词云展示的第三方库,我们可以借助wordcloud轻松实现词云图。使用Wordcloud之前需要先了解它的以下几个特点:
马拉松程序员
2023/09/02
7080
数据可视化:认识WordCloud
Python 词云分析周杰伦新歌《说好不哭》
周杰伦难得出新歌 ,最近终于推出了单曲《说好不哭》,然后直接把QQ音乐服务器干崩了,天王的实力可见一斑,QQ音乐还把这个当作 今天过年
苏生不惑
2019/10/30
7910
Python 词云分析周杰伦新歌《说好不哭》
COVID-19数据分析实战:WordCloud 词云分析
上一篇文章(链接)我们对COVID19_line_list数据集进行了清洗以及初步分析。本文中我们将分析如何用词云来展示文本信息的概要。
统计学家
2020/05/25
1.4K0
COVID-19数据分析实战:WordCloud 词云分析
如何用Python做中文分词?
打算绘制中文词云图?那你得先学会如何做中文文本分词。跟着我们的教程,一步步用Python来动手实践吧。
王树义
2018/08/22
1.4K0
如何用Python做中文分词?
用Python绘制词云:让数据可视化变得生动有趣
导读:你是否曾想过,如何将一堆枯燥的数据转化为一幅幅引人入胜的视觉艺术品?词云,作为一种流行的数据可视化技术,能够将文本数据中的关键词以不同大小和颜色呈现,直观地展示信息的密度和重要性。在本文中,我们将探索如何使用Python——一种强大而灵活的编程语言——来绘制出既美观又富有洞察力的词云图。
三猫
2024/06/26
4520
用Python绘制词云:让数据可视化变得生动有趣
10行Python代码的词云
词云又叫文字云,是对文本数据中出现频率较高的“关键词”在视觉上的突出呈现,形成关键词的渲染形成类似云一样的彩色图片,从而一眼就可以领略文本数据的主要表达意思。
半吊子全栈工匠
2018/08/22
3.2K0
10行Python代码的词云
[Python从零到壹] 十六.文本挖掘之词云热点与LDA主题分布分析万字详解
欢迎大家来到“Python从零到壹”,在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解,真心想把自己近十年的编程经验分享给大家,希望对您有所帮助,文章中不足之处也请海涵。
Eastmount
2022/08/31
2K0
Python生成词云图,TIIDF方法文本挖掘: 词频统计,词云图
python中使用wordcloud包生成的词云图。 下面来介绍一下wordcloud包的基本用法。 class wordcloud.WordCloud(font_path=None, width=400, height=200, margin=2, ranks_only=None, prefer_horizontal=0.9,mask=None, scale=1, color_func=None, max_words=200, min_font_size=4, stopwords=None, random
学到老
2018/03/19
2.1K0
Python生成词云图,TIIDF方法文本挖掘: 词频统计,词云图
【编程课堂】词云 wordcloud
本周为大家带来炫酷好玩的 wordcloud 词云构造库。 使用 wordcloud 可以做出这样的图片: 还可以做出这样的: 接下来,我们来学习如何制作属于自己的词云图。 本来想说一句,安装过程不表
Crossin先生
2018/04/17
2.1K0
【编程课堂】词云 wordcloud
【数据挖掘 | 可视化】 WordCloud 词云(附详细代码案例)
🤵‍♂️ 个人主页: @计算机魔术师 👨‍💻 作者简介:CSDN内容合伙人,全栈领域优质创作者。 开发环境 编辑器: jupyter notebook 解释器: python 3.7 在七夕节中,博主写了一篇为女友收集QQ聊天记录做可视化词云的文章获得广泛好评,一直有小伙伴希望能出一篇教程,今天他来啦! 一文带你速通词云🙋‍♂️ 文章链接 — Python | 词云】聊天记录绘制超美词云(七夕快乐 ,曾同学) 后面生成的图片是有些显示违规或奇怪(因为我是用核心价值观作为词库的,所以会被
计算机魔术师
2022/11/03
1.3K0
【数据挖掘 | 可视化】 WordCloud 词云(附详细代码案例)
手把手教你做一个词云生成(精讲每一步,附带完整源代码)
川川最近遇到一些同学问我词云生成问题,于是我就在此统一回答一下 言归正传: 效果看看:
川川菜鸟
2021/10/18
1K0
利用词云图分析热词
1.安装第三方库(matplotlib,jieba,wordcloud,numpy)
py3study
2020/01/20
1.5K0
Python3.6+jieba+wordcloud 爬取豆瓣影评生成词云
在上一篇介绍了如何通过Python爬虫抓取豆瓣电影榜单。Python3.6+Beautiful Soup+csv 爬取豆瓣电影Top250 此篇博客主要抓取豆瓣某个电影的影评,利用jieba分词和w
geekfly
2022/04/24
6820
Python3.6+jieba+wordcloud 爬取豆瓣影评生成词云
3.python词云图的生成
3.1.python词云图 安装库 pip install jieba wordcloud matplotlib 准备 txt文本 字体(simhei.ttf) 词云背景图片 代码 import matplotlib.pyplot as plt import jieba from wordcloud import WordCloud #1.读出歌词 text = open('jack.txt','r',encoding='utf-8').read() #2.把歌词剪开 cut_text = jieba.c
zhang_derek
2018/08/10
1.2K0
3.python词云图的生成
拿来就用能的Python词云图代码|wordcloud生成词云详解
词云也叫文字云,是一种可视化的结果呈现,常用在爬虫数据分析中,原理就是统计文本中高频出现的词,过滤掉某些干扰词,将结果生成一张图片,直观的获取数据的重点信息。今天,我们就来学习一下Python生成词云的常用库「wordcloud」。
吾非同
2021/03/12
4.6K0
推荐阅读
相关推荐
Python | 数据挖掘,WordCloud词云配置过程及词频分析
更多 >
领券
社区富文本编辑器全新改版!诚邀体验~
全新交互,全新视觉,新增快捷键、悬浮工具栏、高亮块等功能并同时优化现有功能,全面提升创作效率和体验
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文