假设我在一个数据集中有3个分类属性和2个连续属性。如何使用这5个变量构建决策树?编辑:
对于分类变量,可以很容易地说,我们只将它们除以{yes/no}并计算出gini的总增益,但是我的怀疑主要是关于连续属性的。假设我有一个像{1,2,3,4,5}这样的连续属性的值。我的分裂点选择是什么?它们是在每个数据点(如{<1,>=1......& so on
我需要实现朴素贝叶斯分类器并绘制ROC曲线
1) only 2 classes(Trousers and pullovers) out of 10 classes of the [FMNIST][1]我已经成功地实现了这两种情况下的朴素贝叶斯分类器,但我无法理解如何实现ROC曲线,因为它需要设置阈值。朴素贝叶斯分类器仅使用离散分布的似然和先得到后验,特征值为RGB(0-255)值,阈值为127个(每个测试样本的特征数