我想在以下数据集上执行独立性的卡方检验。数据集由四个分类变量组成。在变量V4固定的情况下,一次对两个变量执行测试。本质上,我想对3个组合执行卡方: V1-V4,V2-V4和V3-V4。现在,我想在循环中执行此操作,因为实际分析由大量组合上的操作组成。Yes ExcellentD SUV Yes PoorE car No Excellent 我尝试过
让X是一个基数很高的类别,Y是我的目标。当我查看X发行版到Y时,我发现其中一些级别非常相似。我想找到一种方法来组合它们(假设X_1和X_3在那里Y分布的频率上非常相似),其中X in (x_1,...,y_n)找到所有具有类似X分布的D11子组的最佳方法是什么?我之所以这么做,是因为我知道我的很多Xs都是一样的,但是有人给他们贴上了不同的标签。我已经开始对每个X和它的Ys分布的频率表做spea