腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
决策树
回归
器
中
网格
交叉
验证
问题
、
、
、
、
让我们假设我定义了一个这样
的
回归
器
tree.fit(X_train, y_train)ValueError: Invalid parameter ccp_alpha for estimator
浏览 24
提问于2021-02-25
得票数 0
回答已采纳
1
回答
决策树
回归
与
交叉
验证
在学习
中
的
应用
、
、
当使用sklearn
的
决策树
回归
(例如DecisionTreeRegressor和RandomForestRegressor)时,我在理解
交叉
验证
的
执行过程
中
遇到了
问题
。我
的
数据集有多个预测
器
(y =单因变量;X=多个自变量),也有单个预测
器
,包含足够
的
情况(> 10k)。以下解释适用于所有情况。基本KFold
交叉
验证
指南中给出
的<
浏览 0
提问于2017-06-21
得票数 5
回答已采纳
2
回答
sklearn
中
的
网格
搜索
交叉
验证
可以使用
网格
搜索
交叉
验证
来提取
决策树
分类
器
的
最佳参数吗?
浏览 3
提问于2015-07-01
得票数 6
1
回答
随机森林太合适了
、
、
、
我正在使用scikit学习一个分层
的
简历来比较一些分类
器
。我在计算:准确,回忆,auc。 敏感度: 0.79 (
回归
(所以他们看上去不太合适)。所以也
浏览 2
提问于2015-11-27
得票数 5
回答已采纳
2
回答
我
的
数据是高度重叠
的
,但当我应用逻辑
回归
,它是一个令人印象深刻
的
准确性79%。为什么?
、
、
、
Logistic
回归
应该只在线性可分
的
数据上才能很好地工作。正如我们在对图中看到
的
,数据点有很大
的
重叠。logistic
回归
模型比
决策树
法、KNN法、随机森林法(适用于重叠数据
的
方法)具有更好
的
精度。即使
交叉
验证
得分较高,我
的
logistic
回归
模型。 📷
浏览 0
提问于2021-09-26
得票数 4
1
回答
扫描所有机器学习分类
器
?
、
、
我正在使用Weka对一些大型数据集执行分类、聚类和一些
回归
。我目前正在尝试所有的分类
器
(
决策树
、SVM、朴素贝叶斯等)。有没有办法(在Weka或其他机器学习工具包
中
)扫描所有可用
的
分类
器
算法,以找到产生最佳
交叉
验证
精度或其他度量
的
算法? 我也想为我
的
其他聚类
问题
找到最好
的
聚类算法;也许可以找到最低
的
误差平方和?
浏览 0
提问于2013-10-12
得票数 1
1
回答
多个分类算法总是以相同
的
分数准确地预测。这正常吗?如果没有,我应该怀疑什么?
、
对于
交叉
验证
,我使用重复
的
K-
交叉
验证
.对支持向量机、Logistic
回归
、随机森林、
决策树
、K-邻域和朴素贝叶斯等方法进行了实验,并采用了二值相关、分类链和标签幂集变换等方法。我注意到,对于分类链,支持向量机,Logistic
回归
,随机森林,和K-邻居总是达到相同
的
子集准确性和hamming损失。对于标签Powerset,SVM,Logistic
回归
和随机预测都取得了相同
的
分数。然而,对于二元关联
浏览 0
提问于2018-12-03
得票数 0
1
回答
在对
回归
算法进行特征选择时,我选择了多少个特征?R2和RMSE是衡量过度适应成功
的
好方法吗?
、
、
、
、
我比较随机森林
回归
,
决策树
回归
和线性
回归
。我可以看出存在一些过度拟合
的
情况,因为我
的
初始值与
交叉
验证
值之间
的
关系如下:我已经对RF和D
浏览 0
提问于2021-01-14
得票数 0
4
回答
简历在sklearn.linear_model.LogisticRegressionCV中代表什么?
scikit学习具有两个逻辑
回归
函数: sklearn.linear_model.LogisticRegressionCV我在ML
中
唯一知道
的
与"CV“匹配
的
缩略语是
交叉
验证
,但我猜不是这样,因为这将在带有包装
器
函数
的
scikit
中
实现,而不是逻辑
回归
函数本身
的
一部分(我认为)。
浏览 19
提问于2017-09-30
得票数 25
回答已采纳
1
回答
如何处理目标偏斜且只有少数高值
的
回归
问题
?
、
、
、
我目前正在处理一个带有倾斜目标变量
的
回归
问题
(如下所示)。当然,我
的
第一个想法是用自然对数变换目标,因为它可能会帮助线性
回归
或基于
决策树
的
算法。第二种思想是准备一个类似于分层k-折叠
交叉
验证
的
验证
方案,目标被绑定为n个组。然而,我担心
的
是,我只有很少
的
最高价值:因此,我
的
测试集和所有
验证
集错误都是高度依赖
的<
浏览 0
提问于2020-08-17
得票数 2
1
回答
优化模型超参数模块:同时优化和
交叉
验证
、
假设我将以下配置与Tune Model Hyperparameters模块和增强
的
决策树
回归
一起使用:这种配置是否允许我调整超参数,从而获得最佳的确定系数,同时保证最低
的
交叉
验证
平均误差?
浏览 2
提问于2017-06-04
得票数 0
1
回答
客户行程
的
二分类
、
、
、
、
我想开发一个模型,它可以对客户旅程
的
二元性质进行分类(1表示购买完成,0表示没有购买("jrn_type“列)。行程由通道组成,如下图所示(从1到7列)。 ? 哪个模型最适合数据?
浏览 4
提问于2019-01-14
得票数 0
回答已采纳
4
回答
我应该使用
决策树
或逻辑
回归
来进行分类吗?
、
、
我正在研究一个分类
问题
。我有一个包含相同数量
的
分类变量和连续变量
的
数据集。如何在
决策树
和逻辑
回归
之间决定使用哪种技术?假设logistic
回归
更适合连续变量,
决策树
更适合连续变量和范畴变量,这是否正确?
浏览 0
提问于2015-06-09
得票数 17
回答已采纳
1
回答
如何在随机森林
回归
中提高
回归
模型
的
精度
、
、
、
、
想要提高我
的
成绩更多。不知道这些结果有什么
问题
。已完成移除异常值,转换字符串->数值,规范化。想知道我
的
输出有什么
问题
吗?如果我没有正确地问这个
问题
,请问我任何事情。这只是我对堆栈溢出
的
开始。2152.7 1542.3 962.0 311.3 20 这是我输出
的
直方图我不是专业
的
回归
需要超级帮助从你<em
浏览 2
提问于2022-05-23
得票数 3
回答已采纳
1
回答
包含范畴变量
的
LASSO子集选择
、
、
我在有多个分类变量
的
数据集上运行了LASSO算法。当我在自变量上使用model.matrix()函数时,它会自动为每个因素级别创建虚拟值。其他一些分类变量有或多或少
的
因素水平。 当我输出拉索
的
系数时,我注意到worker_typecontr和worker_typeother
的
系数都是零
的
。我该如何解释结果呢?在这种情况下,FTE
的
系数是多少?我应该把这个变量从公式
中
取出来吗?
浏览 1
提问于2018-09-07
得票数 2
回答已采纳
2
回答
K-折叠
交叉
验证
的
应用与部署
、
、
、
K折叠
交叉
验证
是一种用于将数据分割成K个Folds数
的
技术,用于测试和培训。目的是估计机器学习模型
的
可拓性。该模型被训练K次,每列折叠一次,然后在相应
的
测试褶皱上测试。假设我想对任意数据集上
的
决策树
和Logistic
回归
模型与10个Folds进行比较。假设对每个模型进行10倍
的
训练,并得到相应
的
检验精度,Logistic
回归
具有较高
的
平均精度,说明该模型是较好
的
数
浏览 6
提问于2022-05-20
得票数 3
回答已采纳
2
回答
如何使用cross_validation_scores使用
的
分类
器
、
、
我正在尝试训练一个
交叉
验证
的
支持向量机模型(用于一个学校项目)。Call 'fit' with appropriate arguments before using this method.
的
异常(我希望它返回类似于[scores, predictor]
的
东西,或者可能返回有predict方法
的
CrossValidationPredictor,但事实并非如此)。当然,我可以调用classifier = clf.fit(X, y),但这不能给我一个
交叉
浏览 0
提问于2019-09-06
得票数 3
回答已采纳
1
回答
Scikit学习
中
的
二叉
决策树
我有一个我不明白
的
简单
问题
:有人知道答案吗?请告诉我,非常感谢。
浏览 2
提问于2015-04-16
得票数 0
3
回答
如果有的话,机器学习算法被认为是可解释性和预测之间
的
一个很好
的
权衡?
、
描述梯度增强机器或神经网络等算法
的
机器学习文本经常评论说这些模型擅长预测,但这是以失去可解释性或可解释性为代价
的
。相反,单
决策树
和经典
回归
模型被标记为善于解释,但与更复杂
的
模型(如随机森林或支持向量机)相比,预测精度(相对)较差。是否有普遍接受
的
机器学习模型代表两者之间
的
良好权衡?是否有任何文献列举了算法
的
特点,使它们可以解释?(这个
问题
以前是在
交叉
验证
时提出
的
)
浏览 0
提问于2016-05-22
得票数 9
回答已采纳
1
回答
分类
问题
的
RandomForestRegressor
、
、
、
我一直在做Python课程
中
的
应用机器学习,在第四周
的
课程和作业
中
,我发现了一些有趣
的
东西。在我第一次尝试完成这个任务时,我尝试使用sklearn
的
RandomForestClassifier来预测标签,但是模型过于贴切,测试
的
准确性也很差。作为一个实验,我转向了RandomForestRegressor,并且,你猜怎么着,它不仅不过分合适,而且测试
的
准确性也要高得多。那么,为什么RandomForestRegressor在二进制分类
问题</e
浏览 2
提问于2020-01-06
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据分享|R语言决策树和随机森林分类电信公司用户流失churn数据和参数调优、ROC曲线可视化
使用Weka在几分钟内建立决策树
学习笔记之——决策树
使用网格搜索优化CatBoost参数
交叉验证和超参数调整:如何优化你的机器学习模型
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券