利用Python制作一个可视化的词云,是一项相对简单、适合初学者练手的一个实验。通过本实验,我们可以体会到计算思维方法在解决自然语言处理问题中的重要作用,将计算思维与实际生活紧密结合起来。
实验准备
1.安装Python解释器(版本最好在3.7.x以上,不建议使用最新版)+配置相关环境
2.导入第三方库wordcloud和jieba(或者下载一个完备的Anaconda),如果要更改词云形状的话还需要导入numpy库
3.确定要进行可视化处理的文本
4.编写代码,实现词云
代码实现
import wordcloud #以空格为标识,区分单词import jiebaimport numpy as npimport PIL.Image as image
f = open("mytext.txt","r",encoding="utf-8")txt=f.read() #生成字符串,一大段文本f.close()ls = jieba.lcut(txt)#jieba库分词,形成列表
t = " ".join(ls)#然后以空格为标识,将列表的每一个元素区分开
mask = np.array(image.open("图片1.jpg"))#注意这里的图片的背景必须是白色,否则会修改词云形状失败
w = wordcloud.WordCloud(width=1000,height=700,background_color="white",\ font_path="msyh.ttc")w.generate(t)
w.to_file("result.png")
实验效果
关注我们
2021
学生工坊
领取专属 10元无门槛券
私享最新 技术干货