腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
根据
群
id
生成
列车
测试
拆分
?
、
、
、
、
我有以下数据: pd.DataFrame({'Group_
ID
':[1,1,1,2,2,2,3,4,5,5],7 4 8 09 5 10 1 我需要
根据
"Group_
ID
“将数据集划分为训练和
测试
集,以便80%的数据进入训练
浏览 19
提问于2019-02-21
得票数 17
回答已采纳
2
回答
CNN模型的交叉验证技术
、
、
、
当它完成训练和验证时,最后我使用一个
测试
集来衡量模型的性能并
生成
混淆矩阵。现在我想用交叉验证来训练我的模型。我可以实现它,但我脑海中有一些问题: 为什么大多数CNN模型不使用交叉验证?2-如果我使用交叉验证,
如何
生成
混淆矩阵?我是否可以将数据集
拆分
为训练/
测试
,然后在
列车
/验证集上进行交叉验证(即,除了通常的
列车
/
测试
外,交叉验证作为
列车
/验证),并最终以同样的方式使用
浏览 0
提问于2019-03-22
得票数 10
回答已采纳
1
回答
当选择用于模型训练的训练
测试
拆分
时,它是否从所有类中选择偶数个样本?
、
、
、
、
我使用了一个包含20,000个样本的数据集,并进行了50:50的训练
测试
。这是正常的吗?我找不到任何证明这一点的文件。
浏览 0
提问于2020-11-24
得票数 0
1
回答
如何
对非随机数据进行采样
、
我从来没有处理过这样的数据,所以我不知道
如何
采样非随机数据,我想要采样数据的80%,训练数据和30%的
测试
数据,但是我想按照原始的顺序来采样,而不是随机的。这有可能吗?
浏览 9
提问于2022-06-11
得票数 1
1
回答
LDA作为分区之前或之后的降维
、
、
我正在进行分类,我有一个关于仅用于降维的LDA的问题: LDA是否适用于包括训练数据和
测试
数据在内的整体特征矩阵,然后(在减少数据维数后)对特征矩阵进行划分,为分类提供训练和
测试
集?是真的吗?
如何
能够使用Matlab的内部分类器(如kNN和SVM)对
测试
数据进行分类?
浏览 1
提问于2017-09-30
得票数 2
2
回答
测试
数据显示100%准确率
、
、
9304 Accuracy: 1.0 尽管train_test_split随机划分训练和
测试
数据,除此之外,我还使用了sklearn.utils shuffle,但我仍然可以100%准确地处理
测试
数据。
浏览 48
提问于2020-01-17
得票数 0
1
回答
多项式回归图不正确显示
、
根据
我的理解,我必须排序X,但是当我这样做的时候,我得到的只是一个带直线的空图。
浏览 1
提问于2020-04-14
得票数 1
回答已采纳
2
回答
作为培训集和
测试
集提供的
列车
测试
拆分
数据集
希望询问
如何
为两个单独的.csv文件中提供的数据集设置一个
列车
测试
拆分
:一个是“
列车
”数据集,另一个是“
测试
”数据集。我被教会使用sklearn的train_test_split,通常用于一个数据集,并将其
拆分
为分别的X序列/
测试
、y序列/
测试
,但如果将数据集作为两个单独的数据框架输入,我似乎找不到任何关于该方法的文档
浏览 0
提问于2023-04-07
得票数 0
回答已采纳
1
回答
蟒蛇试验
列车
分裂
test_size,random_state和stratify在python的火车
测试
分裂中意味着什么?
浏览 4
提问于2018-01-23
得票数 1
2
回答
具有缩放整个数据集,然后分裂它。
、
、
我想知道为什么我们要分别在火车和
测试
集上使用缩放。我理解
根据
列车
上的fit_transform()计算的对
测试
数据的转换(μ和σ)。但是,为什么我们可以从所有给定的数据(在
拆分
之前)计算μ和σ,然后将它们应用于未来的数据。 我们这么做是因为我们不知道未来数据的大小吗?
浏览 0
提问于2018-08-08
得票数 1
1
回答
KNN用于不平衡数据集,添加SMOTE用于提高性能,但结果最差
、
、
、
我有一个名为yeast4的不平衡数据集。记录分为两类目标“积极”和“消极”。正类只占总比例的3%。我使用了kNN算法进行分类,我没有指定k,但我在训练数据上使用了5折交叉验证。我发现: auc_knn_none = 0.7062473。我很感兴趣地添加了一个过采样算法来提高模型的质量。所以我使用了SMOTE算法,而且我没有指定k ok kNN,我在训练数据上使用了5折交叉验证。但这次,我发现: auc_knn_smote = 0.56676。通常情况下,auc_knn_smote必须高于auc_knn_none,所以有一些问题,我不知道问题出在哪里。下面是我的代码: library(imbal
浏览 9
提问于2020-08-30
得票数 0
1
回答
user_features中不正确的特性数量
、
、
我的
列车
交互稀疏矩阵具有形状:<39326x2569型稀疏矩阵,类型为<class‘numpy.Float 64’>,压缩稀疏行format>中有758931个存储元素,我的
测试
交互稀疏矩阵有“<class
浏览 2
提问于2020-12-14
得票数 0
回答已采纳
2
回答
在scikit中分割数据-学习
、
、
、
、
我知道
如何
使用train_test_split将数据集
拆分
为训练集和
测试
集,但是否可以将数据集分成三个不同的集合,即“
列车
集”、“
测试
集”和“验证集”。举个例子就够了。
浏览 0
提问于2016-08-20
得票数 0
回答已采纳
2
回答
(分层) KFold与train_test_split --使用了哪些培训数据?
、
、
经典的train_test_split只使用一部分用于培训(本例中为75%),另一部分用于
测试
(本例中为25%)。在这里,我确切地知道哪些数据点用于培训和
测试
(参见代码)。当我们与(分层的)K折叠分裂时,我们使用了4个分裂,结果是我们有4个不同的训练/
测试
部分。对我来说,不清楚这四部分中哪一部分将用于培训/检验Logistic回归。这样设置这样的分裂有意义吗?要实现这一点,我必须
如何
更改代码?
浏览 5
提问于2020-10-22
得票数 1
1
回答
更改循环中的随机种子并
生成
训练
测试
拆分
我正在使用Python3.7,我试图将我的数据分成10000次训练和
测试
set.For,我试图改变我的随机种子。) print(x) 但在
列车
测试
拆分
中你能建议我
如何
在循环和
生成
训练
测试
分裂中改变我的种子吗?我也喜欢储存种子
浏览 24
提问于2020-05-04
得票数 0
回答已采纳
1
回答
如何
在cv中使用TimeSeriesSplit,如scikit-learn文档中提到的那样
、
= cross_val_score(knn, X1, y1, cv=tss, scoring='accuracy')尝试使用10倍TimeSeries
拆分
,但在cross_val_score文档中,我们需要通过交叉验证
生成
器或可迭代。当时间序列分裂成
列车
和
测试
数据到cv后,我应该
如何
传递它?cross_validation.py in cross_val_score(estimator, X, y, scoring, cv, n_job
浏览 1
提问于2018-05-10
得票数 0
回答已采纳
1
回答
过拟合与数据分割
20000,2015-01-27,32,Mike现在我知道,我们把数据分成两部分,即训练和
测试
。然后将
列车
划分为70:30,用70%建立模型,用30%对模型进行验证。我们调整参数,使模型不过分适合。然后用
测试
数据进行预测。例如:我把2000000分成两个相等的部分。一般情况下,我们对数据进行洗牌,然后将其分解为训练、验证和
测试
。(
列车
+验证=
列车
)。(请不要在这里混淆)但是如果分裂是交替的呢?(在这里,数据
浏览 4
提问于2016-02-02
得票数 0
回答已采纳
1
回答
在CNN中使用麻省理工学院室内场景数据库
、
、
、
我宁愿使用PyTorch,因为我可以使用"train_test_split“函数,但如果有人能帮助我理解
如何
将这15620个输入输入到网络上,我将非常感激。
浏览 1
提问于2019-11-18
得票数 1
1
回答
时间序列预测
测试
集
、
、
、
没有提到
测试
集。为什么没有时间序列数据集,而对实时
生成
时间序列数据的数据集有什么要求呢? 我有3小时的数据收集在1s间隔。我想在接下来的30分钟之前预测一下。火车/验证/
测试
拆分
应该是什么样子的?
测试
集可以跳过吗?
浏览 0
提问于2019-12-23
得票数 0
回答已采纳
1
回答
PySpark :
如何
在没有随机化的情况下分割数据
、
trainingRDD, validationRDD, testRDD = RDD.randomSplit([6, 2, 2], seed=0L)是否有一种可能的方式来分割数据,类似的方式分裂,但不是随机化
浏览 2
提问于2016-02-24
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
基于Pulsar的事件驱动铁路网
selenium自动化测试的实战招式
【新增功能】集简云新增数组拆分功能
性能优化:Mysql分表与分库使用场景以及设计方式
擅用数据挖掘,全国两会“热词”轻松掌握
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券