我目前正在实现一个ID3算法。我已经看过了经典的网球例子,但是我似乎不明白为什么属性温度被忽略在最后一棵树中。有人能解释一下为什么会这样吗?
数据集
最终决策树
发布于 2014-12-19 10:39:37
ID3算法在以下三种场景中的一种结束:
例如,Outlook:晴天和湿度:高/正常。有三排“高”的,他们都说不网球。因此,出现了第一个场景,并且可以创建叶子。有更多的信息,但不需要它来作出决定。
发布于 2019-01-03 20:06:35
创建ID3树是如何工作的?
你必须做的第一件事就是获取每个属性的信息增益。但是有一条规则,也许你是在跳,它是:-分析积极和消极的数量。如果所有带有该属性的记录都只有正或负记录。你不用再问了。
知道了这个规则,解释了为什么在温度的情况下,我没有不断地增加分支。
但是,如果在计算行数时有正的和负的结果,您将需要问另一个问题,例如,您将检查所有可能的组合,例如晴天与阴天或雨,而信息增益最高的组合将作为该分支的子代。
该过程将这样做,直到您发现所有行都只有负或正。当它通过时,它将将结果定义为工作表。
此外,还需要注意的是,根据数据集的行数,树将增长。
我在javascript中实现了ID3,我离开了存放它的存储库。https://github.com/Danils123/Id3Algoritmo.git
https://stackoverflow.com/questions/27564067
复制相似问题