特征A对训练数据D的信息增益g(D, A) = 集合D的经验熵H(D) - 特征A给定情况下D的经验条件熵H(D|A)
特征A对训练数据D的信息增益比r(D, A) = g(D, A) / H(D)
而...## cp全称为complexity parameter,指某个点的复杂度,对每一步拆分,模型的拟合优度必须提高的程度
ct rpart.control(xval=10, minsplit=20,...cp=0.1)## kyphosis是rpart这个包自带的数据集
## na.action:缺失数据的处理办法,默认为删除因变量缺失的观测而保留自变量缺失的观测。 ..."green",
border.col="blue", split.col="red",
split.cex=1.2, main="Kyphosis决策树")...box.col="green",
border.col="blue", split.col="red",
split.cex=1.2, main="Kyphosis决策树