# 决策树,随机森林
# 决策树结构:if-then
# 信息熵:
# 例:第一届世界杯32支球队 每个队伍冠军概率1/32
# 可得 log32(程序员认为的log一般都默认是以...不需要归一化
# 缺点(太过于详细,有些异常点)
# 创建的树不能很好的适用于测试集:过拟合
# 改进
# 减枝cart算法 (指定叶子属性:例如若到达该叶子的样本数少于5,就不要了)
# 随机森林...# ==========================================================
# 集成学习方法----随机森林
# 集成学习方法:多个分类器或模型组合...# 什么是随机森林:包含多个分类器,最后的结果取众数
# 随机森林的过程,优势(n个样本,m个特征
# 单个树的建立过程:
# 1,随机在n个中抽取一个样本,重复...",gc.score(x_test,y_test))
print("随机森林选择的参数模型",gc.best_params_)
# 极好的准确率,有效使用在大数据,不需要降维
if __name