各位:我们以前学习R×C表卡方的时候,说过要对频数项进行加权,因为那是计数资料,有权重项。可是我们进行线性回归,为啥还要进行进行加权呢?听松哥道来吧:
松哥虚构一个例子,比如我们想研究苍蝇幼虫(蛆)体内酶A、酶B对幼虫体内激素C的影响。检测了不同批次的样本,资料如下图,x1、x2代表酶A和酶B的含量,Y为激素C,n为检测的样品数量。注意这是关键点哦,如下图红色框为例,里面x1,x2和Y是指10只蛆的平均含量,非1只,而我们既往研究都是One row one case的。那怎么体现数量的区别呢?就需要加权啦!
操作步骤:
1、执行线性回归
2、如下设置,注意其他都一样,关键在WLS权重框中放入N,即可,其他同普通的线性回归设置。
3、总结:加权最小二乘回归其实就是对不同样本量的混合样本进行回归的方法。如此而已!有人肯定会问,为啥我每次检测不能选择同样样本量的混合样本,或者不能那个进行单一样本测试呢,如果你这样想非常好,不过松哥认为,有时单只样本含量较低,不适宜检测,因此可以混合增加含量;二者,如果不同文章有不同的数据,是否也可以提取进行分析呢?呵呵!
精鼎原创,欢迎转发,未经允许,谢绝转载!
统计思维与统计理论系列[1]
【点击下部广告5秒,就是对松哥的支持哦】
领取专属 10元无门槛券
私享最新 技术干货