腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
PySpark
中
的
分层
交叉
验证
、
我正在使用python
中
的
Apache Spark API,
PySpark
(--version 3.0.0),理想情况下,我希望以
分层
的
方式执行标记数据
的
交叉
验证
,因为我
的
数据非常不平衡!from
pyspark
.ml.tuning import CrossValidator 在scikit-learn
中
,这可以通过定义一个StratifiedKFold并将其放在任何网格搜索函数
的</em
浏览 23
提问于2020-09-01
得票数 1
1
回答
CrossValidation线性回归梯度下降
、
、
、
我正试图在
pyspark
中
对SGD模型执行
交叉
验证
,我正在使用来自
pyspark
.mllib.regression、ParamGridBuilder和CrossValidator
的
pyspark
.mllib.regression、ParamGridBuilder和CrossValidator
的
交叉
验证
,它们都来自
pyspark
.ml.tuning库。在跟踪了星火网站上
的
之后,我希望
浏览 2
提问于2017-10-30
得票数 1
1
回答
树中分类错误
的
实例与混淆矩阵不匹配
、
所有规则
中
错误分类
的
总和(见树)是2097 (来自895+700+428+74)。但是混淆矩阵是2121 (来自1999+122)。有人能解释一下这种差异吗?数字怎么会不一样呢?
浏览 6
提问于2016-08-27
得票数 0
2
回答
测试与
交叉
验证
精度之间存在显著差异
、
交叉
验证
和测试f1_scores
的
显著差异
的
可能原因是什么?我正在执行3倍
分层
交叉
验证
,测试f1_score几乎比
交叉
验证
分数少0.15。我怎样才能想出一个更有效
的
交叉
验证
策略,使这两个分数更接近?
浏览 0
提问于2016-08-30
得票数 2
1
回答
天蓝色ML
中
的
K-折叠
交叉
验证
、
、
、
目前,我正在使用使用sdk构建
的
azure管道来训练模型。我正试图在我
的
ml步骤
中
添加
交叉
验证
。我注意到,您可以在配置autoML时将其添加到参数
中
。我
的
数据集由30%标签0和70%标签1组成。我
的
问题是,在执行
交叉
验证
时,azure autoML是否
分层
数据?如果不是,在将其传递给autoML之前,我必须自己进行拆分/
分层
。
浏览 3
提问于2022-09-15
得票数 0
1
回答
插入符号
中
的
rfeControl函数是否产生
分层
褶皱?
、
、
我想按照插入包
的
方法对我
的
随机forrest模型进行特性选择。由于我
的
数据集只包含大约100个标记样本,而且它是高度不平衡
的
(这反映了现实生活
的
平衡),我需要/想做
分层
交叉
验证
。但是,我没有找到任何关于
分层
交叉
验证
的
rfeControl函数
的
文档。有没有人知道如果我使用rfeControl函数,是否会创建
分层
褶皱 ctrl <-
浏览 0
提问于2017-04-04
得票数 1
回答已采纳
1
回答
如何在火花放电
中
不使用参数生成器执行
交叉
验证
?
、
我想在不使用ParamGrid Builder
的
情况下,在火花放电中进行一种简单
的
交叉
验证
。from
pyspark
.ml.tuning import CrossValidator, ParamGridBuilderlr = LinearReg
浏览 1
提问于2018-10-10
得票数 2
1
回答
使用
pyspark
调整回归树模型
的
K-折叠
交叉
验证
、
、
我正在尝试使用k-折
交叉
验证
来调整在
pyspark
中生成
的
回归树。然而,就我目前所见,将
pyspark
的
CrossValidator与
pyspark
的
DecisionTree.trainRegressor结合起来是不可能
的
。以下是相关代码。DecisionTree.trainRegressor(trainingData, categoricalFeaturesInfo={}, impurity='variance'
浏览 28
提问于2019-10-04
得票数 0
回答已采纳
1
回答
交叉
验证
是一种
分层
吗?
、
我想知道
交叉
验证
是否是一种
分层
。
浏览 0
提问于2019-01-13
得票数 0
1
回答
Pyspark
k重
交叉
验证
平均RMSE
、
我使用
Pyspark
在数据集上运行线性回归和k重
交叉
验证
。目前我只能确定最佳模型
的
均方根误差。但我想要在
交叉
验证
中
评估
的
所有模型
的
平均RMSE。如何在
交叉
验证
中
获得所有评估模型
的
平均RMSE?from
pyspark
.ml.regression import LinearRegression from
pyspark
.ml.ev
浏览 9
提问于2018-12-17
得票数 2
7
回答
如何从spark.ml中提取
PySpark
中
的
模型超参数?
、
、
、
、
我正在修改
PySpark
文档
中
的
一些
交叉
验证
代码,并试图让
PySpark
告诉我选择了什么模型:from
pyspark
.mllib.linalg import Vectorsfrom
py
浏览 9
提问于2016-04-18
得票数 36
回答已采纳
1
回答
is分区和
交叉
between
的
区别是什么?
、
% split training/testing setscrossvalind用于执行
交叉
验证
利用这些指标,我们可以分别生成X(trainIdx,:)和X(testIdx,:)
的
训练数据和测试数据。cvpartition也使用
分层
和非
分层
的
方法来分割数据,但是它不返回指数。我还没有看到crossvalind是一种
分层
或非
分
浏览 1
提问于2018-06-06
得票数 1
回答已采纳
1
回答
用于
交叉
验证
的
高级特征提取方法
、
、
给定一个包含1000个数据样本
的
样本数据集,假设我想对数据进行预处理以获得10000行数据,因此每一行原始数据将导致10个新
的
样本。此外,在培训我
的
模型时,我也希望能够执行
交叉
验证
。评分函数我使用原始数据来计算分数,所以我希望
交叉
验证
评分也能处理原始数据,而不是生成
的
数据。由于我将生成
的
数据提供给训练器(我使用
的
是RandomForestClassifier),所以我不能依靠
交叉
验证</em
浏览 2
提问于2013-06-03
得票数 0
回答已采纳
3
回答
错误: AttributeError:'DataFrame‘对象没有属性'_jdf’
我想要执行k-折叠
交叉
验证
,使用吡火花来细化参数,我使用
的
是
pyspark
.ml。我得到了属性错误。AttributeError: DataFrame对象没有属性“_jdf”from
pyspark
import SparkConf, SparkContext from
pyspark
.ml.classificati
浏览 3
提问于2019-04-10
得票数 20
2
回答
在Spark
中
创建自定义
交叉
验证
、
、
、
我是新
的
火花和
PySpark
数据帧和ML。如何为ML库创建自定义
交叉
验证
。例如,我希望改变训练褶皱形成
的
方式,例如
分层
分裂。Grid Searchpredictions.append(cvModel.transform(testingData)) 我希望有一个
交叉
验证
类像这样被调用这两个选项对我来说都是很有挑战性
的
,我试着复制GitHub代码,但是我得到了很多错误,特别是
浏览 2
提问于2015-11-04
得票数 7
1
回答
如何在sklearn
中
对不平衡数据集进行
交叉
验证
、
、
、
我有一个高度不平衡
的
数据集,我想执行二进制分类。 在阅读一些帖子时,我发现sklearn为不平衡数据集提供了class_weight="balanced"。所以,我
的
分类器代码如下。clf=RandomForestClassifier(random_state = 42, class_weight="balanced") 然后,我使用上面的分类器进行了10折
交叉
验证
,如下所示。new_scores = cross_val_score(clf, X, y, cv=k_fold, n_j
浏览 30
提问于2019-03-31
得票数 5
回答已采纳
1
回答
train_test_split对StratifiedShuffleSplit
中
的
分层
论证
、
在sklearn
的
stratify函数中使用train_test_split参数与StratifiedShuffleSplit函数有什么区别?他们不是也这么做吗?
浏览 0
提问于2020-04-19
得票数 5
回答已采纳
1
回答
如果我已经在使用打击炮,是否有必要使用
分层
抽样?
、
我已经用300 K以上
的
观测数据对我
的
不平衡数据集应用了SMOTE。使用
分层
的
K-折叠
交叉
验证
,而不仅仅是普通
的
K-折叠
交叉
验证
(似乎不太可能,每个K-折叠训练集都会不平衡),这是否仍然有意义?
浏览 0
提问于2021-10-19
得票数 0
回答已采纳
4
回答
在MATLAB中将数据分割成训练/测试数据集?
、
经过一些研究,我在MATLAB中找到了两个函数来完成这个任务: 现在,我已经使用cvpartition创建了n个
交叉
验证
子集,以及统计工具箱
中
的
浏览 8
提问于2009-09-03
得票数 9
回答已采纳
1
回答
cross_val_score和train_test_split
的
不同得分
在使用python3.6和scikitlearn 0.18时,我遇到了一个问题 我使用随机森林进行回归,回归效果很好,但当我试图计算
交叉
验证
时,我遇到了一个问题,即从cross_val_score和train_test_split得到
的
分数确实不同。或者我
的
代码中有什么错误?
浏览 15
提问于2017-01-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
交叉表分析方法大全——分层的交叉表资料
算法研习:机器学习中的K-Fold交叉验证
浅论渠道业务的交叉验证
时间序列的蒙特卡罗交叉验证
机器学习的算法测试与验证:训练集、测试集、验证集以及交叉验证
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券