最近在上一门生物文本挖掘的课,做了一下课后作业:统计一篇文献的词频并可视化,周末和大家分享一下吧。
话不多说,先上代码:
可以看到我们统计使用频率大于50的单词:
最后生成词云:
wordcolud已经升级到wordcloud2,后期还可以根据自己的需要指定词云的形状。当然,能用代码办成的事,在这个“懒人”时代,肯定也会有智能的方法,网址: https://wordart.com/ 注册之后即可导入你想分析的文本 (下面这张图好像还可以用来表白)。
分享快讯到朋友圈
领取专属 10元无门槛券
私享最新 技术干货