我有如下数据集
df = pd.DataFrame({'numbers':range(9), 'group':['a', 'b', 'c']*3})
group numbers
0 a 0
1 b 1
2 c 2
3 a 3
4 b 4
5 c 5
6 a 6
7 b 7
8 c 8
我想要创建向量
a = [0, 3, 6]
b = [1, 4, 7]
c = [2, 5, 8]
Kruskal-Wallis H-test python
我有一个按多个类别(distance & phase)分组的值数据集(distance&phase)。我想通过Kruskal-Wallis test测试每个类别,其中val是因变量,distance是一个因素,phase将我的数据分成3组。
因此,我需要在测试中指定数据子集,然后将测试应用于每个组。但是,,我不能让我的子集工作!
在R中,指定subset是an optional vector specifying a subset of observations to be used.,但是如何正确地将它放到我的lapply函数中?
我的虚拟数据:
# create data
我有个问题是关于斯派西的kruskal wallis测试。最近,我对许多组执行了这个测试,并返回了几个完全相同的p值。我还注意到这个测试可以在字符串(?)上执行。下面是我所说的例子
In [40]: scipy.stats.kruskal("x","y","z")
Out [40]: KruskalResult(statistic=2.0, pvalue=0.36787944117144245)
如您所见,这只是对三个字母执行了kruskal测试,并返回了一个p值和一个测试统计数据。这怎麽可能?这个测试完全可靠吗?
考虑在此处创建的dat1:
set.seed(123)
dat1 <- data.frame(Region = rep(c("r1","r2"), each = 100),
State = rep(c("NY","MA","FL","GA"), each = 10),
Loc = rep(c("a","b","c","d","e","
我有以下数据,我称之为“测试”,我试图对每个"metab“和”诊断“运行Bartlett's测试和Kruskal测试。
> test
Index tube.label age gender diagnosis metab1 metab2 metab3 metab4 metab5 metab6
1 200 73 Male Cancer 6 1.5 2 5 8 1.5
2 201 71 Male Healthy