我正在处理航空公司客户投诉的数据集。既然是“抱怨”,一般的共识是所有的句子都是“负面”的情绪。因此,我正在考虑一种量化负性分数的方法。例如: 负面评论较少: "the cabin did not have enough leg space but the food was decent" - Score: 0.3 高度负面评论: "附言:我不是在寻找一个确切的答案,任何关于方向或方法的建议都会很好。
我正在尝试对一个评论数据集进行情感分析。由于我更关心在评论中识别(提取)负面情绪(现在没有标记,但我尝试手动标记数百条或使用Alchemy API),如果评论总体上是中立的或正面的,但部分评论有负面情绪,我希望我的模型更倾向于将其视为负面评论有人能给我一些如何做的建议吗?我正在考虑将bag of words/word2vect与有监督的(随机森林,支持向