跟着博主的脚步,每天进步一点点
本文简绍了SnowNLP的使用方法,这是一个处理中文文本内容的python类库,其主要功能包括分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等等。
简介
SnowNLP是一个可以方便的处理中文文本内容的python类库,是受到了TextBlob的启发而写的,和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。
SnowNLP主要功能包括分词、词性标注、情感分析、汉字转拼音、繁体转简体、关键词提取以及文本摘要等等。
Github地址:https://github.com/isnowfy/snownlp
实战
1.安装
2.分词
3.词性标注
4.情感分析(positive的概率)
5.中文拼音
6.繁体转简体
7.分割成句子(Tokenization)
8.关键词抽取
9.摘要抽取
10.计算tf和idf
11.计算相似度(BM25)
12.支持训练
代码已上传:
https://github.com/yuquanle/StudyForNLP/blob/master/NLPtools/SnowNlpDemo.ipynb
The End
领取专属 10元无门槛券
私享最新 技术干货