我想创建一个情感分析程序,它接受一个中文数据集,并确定是否有更多的积极,消极或中性的陈述。按照这个例子,我为英语创建了一个情感分析(stanford-corenlp),它完全按照我想要的方式工作,但采用了中文。' has a score of "+ (score-2) +" rating: " + ratings[score]);目前,我不知道如何更改上述代码,使其支持中文。有没有什么电子书、教程或例子可以帮助我理解斯坦
我的问题是我的表中有重复的条目。然而,事情并没有那么简单。有些是有效的副本,而另一些则不是。例如,E Pearl River, NY和East Pearl River, NY是同一个城市,而Bardonia, NY和Nanuet, NY则不是。所以,如果我删除所有的副本,它将移除像巴多尼亚这样的有效城市。