我试图对唐纳森·特朗普( Donalds Trump )的推文进行情绪分析。我已经收集了大约100条推文,这些推文似乎是非常可能的或消极的。比如
今天墨西哥之行太棒了--出色的领导才能和高素质的人才!期待我们下一次会议。 内格:不诚实的希拉里·克林顿( Hillary )花了很多钱在针对我的广告上。我是她不想与之竞争的人。一定会很有趣的!
我使用TextBlob框架训练了NB分类器。不幸的是,我获得了大约40-50%的准确性和信息最丰富的特点是:
> contains(I) = True pos : neg = 6.1 : 1.0
> contains(been) = True pos : neg = 2.8 : 1.0
> contains(has) = True pos : neg = 2.8 : 1.0
> contains(you) = True pos : neg = 2.8 : 1.0
> contains(is) = True neg : pos = 2.6 : 1.0
> contains(I) = False neg : pos = 2.3 : 1.0
> contains(not) = True neg : pos = 2.2 : 1.0
> contains(in) = True neg : pos = 2.0 : 1.0
> contains(of) = True pos : neg = 1.7 : 1.0
> contains(in) = False pos : neg = 1.7 : 1.0我认为我做错了什么,因为它决定了什么是政治,根据简单的词语,如“我,是,在,”而不是“悲伤,好,税收,监狱,上帝保佑,比你”。
我所做的就是从文档中运行代码。
test_set, train_set = dataset[30:], dataset[:70]
cl = NaiveBayesClassifier(train_set)
print(cl.accuracy(test_set))
cl.show_informative_features(10)这样做合适吗?有人能帮忙吗?
发布于 2018-02-20 10:25:11
这个github储存库包含了来自推特流的关于唐纳德·特朗普的推文的情绪分析,我想你会发现它很有趣。
如果对来自社交网络的文本进行情感分析(无结构文本带有噪音),我建议您使用维德情感分析工具。
在解决情绪分析问题时需要考虑很多细节,这份备忘单将有助于您解决情感分析问题3.。
此外,你也可以尝试深度学习方法的情感分析,这是当今最先进的技术。检查这个Kaggle教程LSTM情绪分析
https://stackoverflow.com/questions/48794659
复制相似问题