我是情绪分析方面的新手。全德达实例展示了如何输出正负数。我测试了一些文件。它的产出如下:
案例1
document negative positive
file1 28 28
file2 98 71
file3 28 22
file4 37 39
file5 7 36
或以下
案例2
document negative positive neg_positive neg_negative
file1 28 28 0 1
file2 98 71 0 0
file3 28 22 1 0
file4 37 39 0 1
file5 7 36 0 1
你能告诉我如何获得file1的分数吗。两种情况下的file5?是这样吗?
(#阳性-#阴性)/#均为1例file2,(71-98)/(71+98)=-27/169=- 0.15?
第二个案子呢?
非常感谢。
一个
发布于 2019-12-16 18:31:12
如果您认为neg_positive
为negative
,而neg_negative
为正,则可以通过组合列对来创建索引。这是可信的,因为例如"neg正“包含诸如”不好“这样的序列。
(rowSums(object[, c("negative", "neg_positive")]) -
rowSums(object[, c("positive", "neg_negative")])) / rowSums(object) * 100
另一个(更好的)衡量标准是2011年描述的logit规模。作者声明: William Lowe,Kenneth Benoit,Slava,和Michael Laver。"从编码的政治文本中缩放策略首选项。“立法研究季刊26(2月1日):123-155。这是日志(正/负)或
log( rowSums(object[, c("positive", "neg_negative")]) /
rowSums(object[, c("negative", "neg_positive")]) )
https://stackoverflow.com/questions/59360578
复制相似问题