在生成词云的时候,Wordcloud默认是按照空格或者标点作为分割符来对目标文本进行分词处理。若是英文文本可直接调用,若是中文文本,则需要按照前面介绍jieba分词的那边文章先对文本进行分词处理然后用空格拼接,再调用wordcloud库函数。另处理中文是还需要制定中文字体,例如微软雅黑字体(msyh.ttc)作为显示效果。
结果如下:
wordcloud库的核心是WordCloud类,所有功能都封装到WordCloud类中。主要有两个常用方法generate()来生成词云和to_file()保存云图。另外还有很多参数例如font_path/width/mask/max_words/stopwords等来配置词云:
emmm,本来想将这几个词语以爱心的形式显示出来,结果词太少了,一点儿都不像。。。
领取专属 10元无门槛券
私享最新 技术干货