“词云”,指的是对网络文本中出现频率较高的关键词予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
今天,小编给大家分享在Python中如何绘制一张词云图。
一、WordCloud包安装
在绘制词云图之前,我们需要安装WordCloud包,安装方式如下图所示:
当然,你也可以从PyPI中下载WordCloud源码包,使用python install setup.py命令进行安装。
二、绘制词云图
WordCloud包安装完成后,我们开始绘制词云图。首先,展示一下绘制词云图的源数据,如下所示:Statistics skills, and programming skills are equally important for analytics.
它存储在名称为wordcloud.txt的文本文档中。以下是绘制词云图的一些代码及步骤:
Step 1:我们需要从wordcloud中导入WordCloud类,从matplotlib中导入pyplot模块,并将其别名为plt,如下所示:
import matplotlib.pyplot as plt
from wordcloud import WordCloud
Step 2:我们需要从wordcloud.txt文本文档中读取所有内容。同时,实例化WordCloud类,并将文本内容传递到实例的generate方法中,它会生成一张词云图,代码如下:
text = open('wordcloud.txt').read()
wordcloud = WordCloud()
pic = wordcloud.generate(text)
Step 3:最后,我们需要使用绘图包matplotlib将其显示出来,代码如下:
plt.imshow(pic.recolor(random_state=2019))
plt.title('Most Frequent Words')
plt.axis("off")
plt.show()
以上步骤完成后,一张反映词频多少的的词云图(如下图所示)就生成了,是不是非常简单!赶快试一试吧!
以上所有代码如下图:
领取专属 10元无门槛券
私享最新 技术干货