当将train()函数与交叉验证列车控制一起使用时，如何查看模型对测试集的预测？

文章/答案/技术大牛

发布

2回答

、、、

我是一个初学者，试图学习一些基本的机器学习技术。我想使用leave-one-out交叉验证和train()函数来训练模型。我的函数似乎正常工作。但是，我无法看到模型的测试集预测。在给定以下模型的情况下，您将如何做到这一点？myControl <- trainControl( method = &qu

浏览 24提问于2020-02-02得票数 0

1回答

套索分析(glmnet软件包)。我能循环分析和结果提取吗？

、

size = smp_size)列车<- mydatatrain_ind，测试<- mydata-train_ind _ind， vars.train) y.train <- train3$X1 y.test <-测试$X1 之后，我对训练集进行了交叉验证的L

浏览 0提问于2018-01-17得票数 0

2回答

标记数据异常检测中的交叉验证

、、、、

我的数据是标记的，所以我有基本的真实性，但问题的性质需要无监督/半监督异常检测方法，而不是简单的分类。因此，我将只使用标签进行验证。既然我不会用标签来训练模型，而不像在有监督的学习中使用X_train、X_test、y_train和y_test，那么在这里进行模型验证的正确方法是什么？如果这是监督学习，我会把数据分成3部分:训练，简历和

浏览 0提问于2020-07-16得票数 1

2回答

在Keras中，x_train和x_test有什么区别？

、、

在本教程(以及Keras的官方文档中)中，MNIST数据集的加载方式如下：然而，没有解释为什么我们有两个元组的数据。我的问题是:什么是x_train 和 y_train ，以及它们与 x_test 和 y_test counterpart

浏览 0提问于2017-09-29得票数 13

回答已采纳

3回答

如何利用LSTM对数据进行列车/试验的正确预测？

、

如果我们使用训练/测试分割并评估我们的测试数据，我们可能会得到一个很好的分数，但是任何进一步的预测都是不可信的，因为模型没有训练测试数据并将它的序列包含在内存中。另一方面，我们可以将列车和测试序列上的数据训练为列车数据，但由于没有测试参考，因此无法评估我们的预测。

浏览 0提问于2018-05-05得票数 1

1回答

上下文:我目前正在制作和比较机器学习模型，以预测住房数据。我有大约32000个数据点，42个特征，我正在预测房价。我比较随机森林回归，决策树回归和线性回归。我可以看出存在一些过度拟合的情况，因为我的初始值与交叉验证值之间的关系如下： RF: 10倍R平方= 0.758，neg RMSE = -540.2 vs未验证的R平方为0.877，RMSE为505.6LR: 10倍R平方= 0.695，neg

浏览 0提问于2021-01-14得票数 0

2回答

测试和评分结果之间的差异以及用混淆矩阵计算的差异(准确性、敏感性和特异性)

、

我们正在使用橙色和有2个文件(培训和测试)。我们应用不同的学习者(kNN，AdaBoost.)得到评估结果。但是我们对测试和得分窗口中的一些选项有一些疑问。📷当我们应用“列车数据测试”选项时，它是否为每个学习者生成一个模型，然后将其应用于培训人群？和“测试数据测试”一样，它是否使用训练数据生成模型，并将其应用于测试群体？因为当我们得到混淆矩阵并计算准确性、敏感性和特异性时，

浏览 0提问于2017-05-17得票数 7

回答已采纳

1回答

比较交叉验证和测试集结果

、、、、

我很难理解交叉验证测试和测试集上运行的测试结果。首先，我制作了以下管道：然后，我在缩放训练集(原始数据集的75%)上使用交叉验证： >>> cross_val_score(pipe, X_train

浏览 0提问于2020-11-05得票数 0

回答已采纳

1回答

对培训、测试和val的澄清以及如何使用/实施

、、、

到目前为止，我认为我理解了培训、测试和验证集之间的区别。基本上就像在这张图片里：培训集:对模型进行培训的数据测试集:原则上与验证集相同。只是使用在最终结束后，模型已被裁剪。训练集通常

浏览 0提问于2019-10-09得票数 0

回答已采纳

2回答

时间序列试验数据

、、、

我正试图建立一个模型来预测未来几天产品的销售量正确的方法是什么？使用其中一种或另一种有什么好处

浏览 0提问于2022-03-04得票数 0

1回答

如何在kknn函数中进行预测？图书馆(Kknn)

、、

我尝试使用kknn +循环为模型创建一个离开一交叉验证，并将其与train.kknn进行比较。1)在k

浏览 1提问于2019-08-25得票数 4

回答已采纳

1回答

如何在GridSearchCV中正确选择最佳模式--学习和插入都是错误的

、、、、

考虑3个数据集-列车/val/测试。GridSearchCV默认选择交叉验证分数最高的最佳模型。在现实世界中，预测必须准确，这是选择最佳模型的可怕方法。原因是因为这就是它应该如何使用的原因：-Val集用来验证<

浏览 1提问于2019-10-31得票数 5

2回答

如何将K-折叠交叉验证的结果应用于我最初的测试集？

、、

我有一个数据集，我分裂成80%-20%的训练和测试集。在训练集上，我做k折交叉验证，得到准确性的平均值。但是，我不清楚该如何将这个结果应用于我的原始测试集？#Splitting Training & Test datasetX_<e

浏览 7提问于2022-09-29得票数 0

回答已采纳

2回答

scaler在Sklearn和交叉验证中的应用

、、、

我以前看到过一个，它的代码如下：clf = svm.LinearSVC() scores = cross_val_score(pipeline, X, y, cv = cv) 我的理解是:当我们应用标度器时，我们应该使用3中的4倍来计算的均值和标准差，然

浏览 0提问于2020-05-28得票数 1

1回答

不使用train_test_split方法的滑雪板支持向量机数据预处理

、、

我使用了“盗梦空间”，并为大约11000个视频生成了1000个特性(对象的概率)。这些视频已经按类型分类，我希望支持向量机能够预测视频属于哪一种类型。我的数据看起来如何：我有以类型为标题的文件，例如用于培训的Training/education.txt和

浏览 1提问于2019-02-05得票数 1

回答已采纳

2回答

当使用Scikit学习网格搜索时，为什么我的训练和cv分数很高，但是我的测试分数要低得多呢？

、、、、

在火车组上，我用5倍交叉验证的网格搜索来选择超参数.将重构设置为真，在选取了超参数后，将模型重构到整个训练集上，并用于预测测试集。当我查看cv_results_时，我发现我的mean_train_score (我将其解释为每个k折叠交叉验证循环的训练分数)确实很高。但是当我使用我的外部

浏览 0提问于2020-07-02得票数 3

2回答

随机森林交叉验证K折叠与插入包R最佳auc

、、、、

我有一个相当严重的问题，我已经很多天没能解决了！我不明白插入包的训练控制功能是如何在R中工作的，我需要交叉验证(10倍)的随机森林，并认为插入包一次只能自动选择一个测试集( 10 %的数据集)，并验证随机林中的随机林型( 90%的数据集)。web上的所有教程都输入了列车功能<

浏览 3提问于2020-12-14得票数 1

1回答

利用sklearn、cross_val_score和model对预测模型进行拟合和帮助

、、、

我正在尝试理解如何使用sklearn python模块中的from交叉验证。(ytest) accuracie

浏览 4提问于2017-02-16得票数 22

回答已采纳

3回答

训练-测试分离的缺点

、、、

“火车/测试分割确实有它的危险，如果我们进行的分割不是随机的怎么办?如果我们的数据的一个子集只有来自某个州的人，有特定收入水平的员工，而没有其他收入水平的员工，只有女性，或者只有某个年龄段的人，那该怎么办？(想象一下，一个文件是由这些人中的一个人排序的)。这就是交叉验证的用武之地。”上面提到的大多数博客我都不理解。我认为缺点不是太合适，

浏览 57提问于2019-02-27得票数 1

回答已采纳

2回答

在分割数据之前使用单个StandardScaler正确吗？

、

我看到了一些使用两个不同StandardScaler的实验，如下所示：train_sc = scaler_1.transform(X_train) test_sc = scaler_2.fit(X_test)# X_all represents X feat

浏览 1提问于2020-07-22得票数 3

回答已采纳

点击加载更多