腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(3322)
视频
沙龙
2
回答
当
将
train
()
函数
与
交叉
验证
列车
控制
一起
使
用时
,
如何
查看
模型
对
测试
集
的
预测
?
、
、
、
我是一个初学者,试图学习一些基本
的
机器学习技术。 我想使用leave-one-out
交叉
验证
和
train
()
函数
来训练
模型
。我
的
函数
似乎正常工作。但是,我无法看到
模型
的
测试
集
预测
。在给定以下
模型
的
情况下,您将
如何
做到这一点?myControl <- trainControl( method = &qu
浏览 24
提问于2020-02-02
得票数 0
1
回答
套索分析(glmnet软件包)。我能循环分析和结果提取吗?
、
size = smp_size)
列车
<- mydatatrain_ind,
测试
<- mydata-
train
_ind _ind, vars.
train
) y.
train
<-
train
3$X1 y.test <-
测试
$X1 之后,我
对
训练
集
进行了
交叉
验证
的
L
浏览 0
提问于2018-01-17
得票数 0
2
回答
标记数据异常检测中
的
交叉
验证
、
、
、
、
我
的
数据是标记
的
,所以我有基本
的
真实性,但问题
的
性质需要无监督/半监督异常检测方法,而不是简单
的
分类。因此,我
将
只使用标签进行
验证
。既然我不会用标签来训练
模型
,而不像在有监督
的
学习中使用X_
train
、X_test、y_
train
和y_test,那么在这里进行
模型
验证
的
正确方法是什么?如果这是监督学习,我会把数据分成3部分:训练,简历和
浏览 0
提问于2020-07-16
得票数 1
2
回答
在Keras中,x_
train
和x_test有什么区别?
、
、
在本教程(以及Keras
的
官方文档中)中,MNIST数据
集
的
加载方式如下:然而,没有解释为什么我们有两个元组
的
数据。我
的
问题是:什么是x_
train
和 y_
train
,以及它们
与
x_test 和 y_test counterpart
浏览 0
提问于2017-09-29
得票数 13
回答已采纳
3
回答
如何
利用LSTM对数据进行
列车
/试验
的
正确
预测
?
、
如果我们使用训练/
测试
分割并评估我们
的
测试
数据,我们可能会得到一个很好
的
分数,但是任何进一步
的
预测
都是不可信
的
,因为
模型
没有训练
测试
数据并将它
的
序列包含在内存中。另一方面,我们可以
将
列车
和
测试
序列上
的
数据训练为
列车
数据,但由于没有
测试
参考,因此无法评估我们
的
预测
。
浏览 0
提问于2018-05-05
得票数 1
1
回答
R2和RMSE是衡量过度适应成功
的
好方法吗?
、
、
、
、
上下文:我目前正在制作和比较机器学习
模型
,以
预测
住房数据。我有大约32000个数据点,42个特征,我正在
预测
房价。我比较随机森林回归,决策树回归和线性回归。我可以看出存在一些过度拟合
的
情况,因为我
的
初始值
与
交叉
验证
值之间
的
关系如下: RF: 10倍R平方= 0.758,neg RMSE = -540.2 vs未
验证
的
R平方为0.877,RMSE为505.6LR: 10倍R平方= 0.695,neg
浏览 0
提问于2021-01-14
得票数 0
2
回答
测试
和评分结果之间
的
差异以及用混淆矩阵计算
的
差异(准确性、敏感性和特异性)
、
我们正在使用橙色和有2个文件(培训和
测试
)。我们应用不同
的
学习者(kNN,AdaBoost.)得到评估结果。但是我们
对
测试
和得分窗口中
的
一些选项有一些疑问。📷当我们应用“
列车
数据
测试
”选项时,它是否为每个学习者生成一个
模型
,然后将其应用于培训人群? 和“
测试
数据
测试
”一样,它是否使用训练数据生成
模型
,并将其应用于
测试
群体?因为当我们得到混淆矩阵并计算准确性、敏感性和特异性时,
浏览 0
提问于2017-05-17
得票数 7
回答已采纳
1
回答
比较
交叉
验证
和
测试
集结果
、
、
、
、
我很难理解
交叉
验证
测试
和
测试
集
上运行
的
测试
结果。首先,我制作了以下管道:然后,我在缩放训练
集
(原始数据
集
的
75%)上使用
交叉
验证
: >>> cross_val_score(pipe, X_
train
浏览 0
提问于2020-11-05
得票数 0
回答已采纳
1
回答
对
培训、
测试
和val
的
澄清以及
如何
使用/实施
、
、
、
到目前为止,我认为我理解了培训、
测试
和
验证
集
之间
的
区别。基本上就像在这张图片里:培训
集
:
对
模型
进行培训
的
数据
测试
集
:原则上
与
验证
集
相同。只是使用在最终结束后,
模型
已被裁剪。 训练
集
通常
浏览 0
提问于2019-10-09
得票数 0
回答已采纳
2
回答
时间序列试验数据
、
、
、
我正试图建立一个
模型
来
预测
未来几天产品
的
销售量正确
的
方法是什么?使用其中一种或另一种有什么好处
浏览 0
提问于2022-03-04
得票数 0
1
回答
如何
在kknn
函数
中进行
预测
?图书馆(Kknn)
、
、
我尝试使用kknn +循环为
模型
创建一个离开一
交叉
验证
,并将其
与
train
.kknn进行比较。1)在k
浏览 1
提问于2019-08-25
得票数 4
回答已采纳
1
回答
如何
在GridSearchCV中正确选择最佳模式--学习和插入都是错误
的
、
、
、
、
考虑3个数据
集
-
列车
/val/
测试
。GridSearchCV默认选择
交叉
验证
分数最高
的
最佳
模型
。在现实世界中,
预测
必须准确,这是选择最佳
模型
的
可怕方法。原因是因为这就是它应该
如何
使用
的
原因:-Val
集
用来
验证<
浏览 1
提问于2019-10-31
得票数 5
2
回答
如何
将
K-折叠
交叉
验证
的
结果应用于我最初
的
测试
集
?
、
、
我有一个数据
集
,我分裂成80%-20%
的
训练和
测试
集
。在训练
集
上,我做k折
交叉
验证
,得到准确性
的
平均值。但是,我不清楚该
如何
将
这个结果应用于我
的
原始
测试
集
?#Splitting Training & Test datasetX_<e
浏览 7
提问于2022-09-29
得票数 0
回答已采纳
2
回答
scaler在Sklearn和
交叉
验证
中
的
应用
、
、
、
我以前看到过一个,它
的
代码如下:clf = svm.LinearSVC() scores = cross_val_score(pipeline, X, y, cv = cv) 我
的
理解是:当我们应用标度器时,我们应该使用3中
的
4倍来计算
的
均值和标准差,然
浏览 0
提问于2020-05-28
得票数 1
1
回答
不使用
train
_test_split方法
的
滑雪板支持向量机数据预处理
、
、
我使用了“盗梦空间”,并为大约11000个视频生成了1000个特性(对象
的
概率)。这些视频已经按类型分类,我希望支持向量机能够
预测
视频属于哪一种类型。我
的
数据看起来
如何
: 我有以类型为标题
的
文件,例如用于培训
的
Training/education.txt和
浏览 1
提问于2019-02-05
得票数 1
回答已采纳
2
回答
当
使用Scikit学习网格搜索时,为什么我
的
训练和cv分数很高,但是我
的
测试
分数要低得多呢?
、
、
、
、
在火车组上,我用5倍
交叉
验证
的
网格搜索来选择超参数.
将
重构设置为真,在选取了超参数后,
将
模型
重构到整个训练
集
上,并用于
预测
测试
集
。当我
查看
cv_results_时,我发现我
的
mean_
train
_score (我将其解释为每个k折叠
交叉
验证
循环
的
训练分数)确实很高。但是当我使用我
的
外部
浏览 0
提问于2020-07-02
得票数 3
2
回答
随机森林
交叉
验证
K折叠
与
插入包R最佳auc
、
、
、
、
我有一个相当严重
的
问题,我已经很多天没能解决了!我不明白插入包
的
训练
控制
功能是
如何
在R中工作
的
,我需要
交叉
验证
(10倍)
的
随机森林,并认为插入包一次只能自动选择一个
测试
集
( 10 %
的
数据
集
),并
验证
随机林中
的
随机林型( 90%
的
数据
集
)。web上
的
所有教程都输入了
列车
功能<
浏览 3
提问于2020-12-14
得票数 1
1
回答
利用sklearn、cross_val_score和model
对
预测
模型
进行拟合和帮助
、
、
、
我正在尝试理解
如何
使用sklearn python模块中
的
from
交叉
验证
。(ytest) accuracie
浏览 4
提问于2017-02-16
得票数 22
回答已采纳
3
回答
训练-
测试
分离
的
缺点
、
、
、
“火车/
测试
分割确实有它
的
危险,如果我们进行
的
分割不是随机
的
怎么办?如果我们
的
数据
的
一个子集只有来自某个州的人,有特定收入水平
的
员工,而没有其他收入水平
的
员工,只有女性,或者只有某个年龄段的人,那该怎么办?(想象一下,一个文件是由这些人中
的
一个人排序
的
)。这就是
交叉
验证
的
用武之地。”上面提到
的
大多数博客我都不理解。我认为缺点不是太合适,
浏览 57
提问于2019-02-27
得票数 1
回答已采纳
2
回答
在分割数据之前使用单个StandardScaler正确吗?
、
我看到了一些使用两个不同StandardScaler
的
实验,如下所示:
train
_sc = scaler_1.transform(X_
train
) test_sc = scaler_2.fit(X_test)# X_all represents X feat
浏览 1
提问于2020-07-22
得票数 3
回答已采纳
点击加载更多
相关
资讯
数据代码分享|PYTHON用NLP自然语言处理LSTM神经网络TWITTER推特灾难文本数据、词云可视化
5种常用的交叉验证技术,保证评估模型的稳定性
模型选择与评价(一)
手把手教你做交叉验证
机器学习基础Python训练集测试集分割与交叉验证
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券