我正在尝试对一个评论数据集进行情感分析。由于我更关心在评论中识别(提取)负面情绪(现在没有标记,但我尝试手动标记数百条或使用Alchemy API),如果评论总体上是中立的或正面的,但部分评论有负面情绪,我希望我的模型更倾向于将其视为负面评论。有人能给我一些如何做的建议吗?我正在考虑将bag of words/word2vect与有监督的(随机森林,支持向量机) /unsupervised学习模型(Kmeans)结合使用。
我想尝试用Python学习深度学习。对于一个有用的场景,我想到的第一件事就是重复检查。
假设您有一个包含姓名、地址、电话和电子邮件的customer表,并希望插入新客户。例如:
In Table:
Max Test,Teststreet 5, 00642 / 58458,info@max.de
To Insert:
Max Test, NULL, (+49)0064258458, test@max.de
这应该被识别为重复的条目。
已经有这个用例的教程了吗?或者,深度学习有可能实现吗?
当我尝试将项目添加到新的数据集中进行情感分析时,我遇到了一个问题。
我有一个从0到10的情绪评分,从0到9,一切都很完美,但那些与10相关的内容无法读取,尽管我将最大情绪评分设置为10。
是否对我的csv文件做了特殊的修改,以便google可以识别这些行?
这是我得到的错误:
Invalid input found at row 2 of ... "Row parsing resulting in unexpected label name."
感谢您的帮助!