目前我正在做一个项目,这是情绪检测(高兴,悲伤等)从聊天应用程序中使用Python和NLTK。我对NLP和Python不是很熟悉。作为一种基本方法,我希望使用基于关键字的方法。在这种情况下,我必须在每个情绪状态下制作一个情绪关键词列表,并需要查找给定句子中是否存在任何情绪关键词,并相应地识别相关的情绪状态。那么我需要知道的是,我是否需要创建一个训练数据集和特征列表来完成该任务,如果需要,我如何才能做到这一点。请帮帮我。
发布于 2017-03-04 12:03:38
您将需要一组已标记的单词。首先要从AFINN情感字典开始,它是一大组手动标记的单词。郭伟挺的slides展示了如何使用AFINN词集。
Laurent Luce的blog使用推文浏览了整个情感分析过程,尽管他从一个标记的训练集开始。
也可以看看NLTK在sentiment analysis上的“How To”
有许多情感数据集可能对https://www.w3.org/community/sentiment/wiki/Datasets#Emotions_datasets_by_Media_Core_.40_UFL有所帮助。
https://stackoverflow.com/questions/42508624
复制相似问题