我正在尝试将Ridge和Lasso回归应用于逻辑回归模型,并努力理解x和y输入所需的结构。我是R的新手,所以很抱歉,我希望这一点是清楚的。我相信我们使用x中列中的值来预测y中的结果。
对于x,我有七列,每一列都是分类数据(作为因子)。整个x是一个包含7个变量的9000个观测值的数据框架,每个变量都是一个因子,每个因子的水平各不相同。这将显示在环境中的数据下
对于y,它是一组结果-- "0“或"1”--在环境中以值的形式出现,这说明y是一个因子w/ 2水平"0“"1",也有9000个值
努力找出x和y结构需要是什么,才能使以下内容适用于逻辑模型
alpha0.fit <- cv.glmnet(x, y , type.measure="deviance", alpha=0, family="binomial")
感谢您所收到的任何想法或建议。
发布于 2021-01-30 21:24:53
您可以按照注释中的建议使用虚拟编码,也可以使用glmnetUtils
来处理此问题:
library(glmnetUtils)
x = data.frame(x1 = sample(c("A","B","C"),9000,replace=TRUE),
x2 = sample(c("D","E"),9000,replace=TRUE),
x2 = sample(c("F","G","H"),9000,replace=TRUE)
)
y = factor(sample(0:1,9000,replace=TRUE))
fit = cv.glmnet(y ~ .,data=data.frame(x,y),family="binomial",alpha=0)
https://stackoverflow.com/questions/63036059
复制相似问题