查看之前文章请点击右上角,关注并且查看历史消息
所有文章全部分类和整理,让您更方便查找阅读。请在页面菜单里查找。...以此类推, 最后一条边会指向一个叶子节点, 那就是答案。下表是14个节点的训练数据:
从数据中我们发现, 猫比狗更容易发脾气。大多数狗玩球, 而猫不爱玩。狗更喜欢狗粮和培根, 而猫喜欢猫粮和培根。...决策树比我们之前介绍的算法更容易拟合过度, 因为它们可以通过精确的描述每个训练样本的特征,构建出复杂的决策树, 从而忽略了一般性的真实关联关系。有一些技术可以修正决策树的拟合过度。...一个解释变量被选中是因为它比其他解释变量更大幅度的降低了不确定性。但是, 有可能全局最优的决策并非局部最优。
在我们的例子中, 决策树的规模并不重要, 因为我们可以获取所有节点。...但是, 在现实应用中, 决策树的规模被修剪以及其他技术限制。而决策树经过修剪后的不同形状会产生不同的效果。实际上, 由信息增益和基尼不纯度启发式方法计算出的局部最优决策通常都会生成一个可行的决策树。