腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何使用date、pandas
和
python将数据集作为
训练
和
测试数据
拆分成行?
、
、
、
如何使用像前90%(从2018-01-01到2019-02-01)将被
训练
,最后10%(从2019-02-02 )将是python中的
测试数据
这样的日期将数据集
分割
为
训练
和
测试数据
行?不是
随机
分割
吗?
浏览 3
提问于2020-06-02
得票数 0
1
回答
对时差
和
准确度的混淆
、
几个星期以来,我一直在学习角角
和
TensorFlow,并对时代感到困惑。说在10年代,
测试数据
的准确率是92%,在下一个时代,精度怎么会下降?我能想到的是,也许每个时代的
测试数据
浏览 0
提问于2018-07-26
得票数 0
回答已采纳
2
回答
(分层) KFold与train_test_split --使用了哪些培训数据?
、
、
在这里,我确切地知道哪些数据点用于培训
和
测试(参见代码)。 当我们与(分层的)K折叠分裂时,我们使用了4个分裂,结果是我们有4个不同的
训练
/测试部分。
浏览 5
提问于2020-10-22
得票数 1
1
回答
当列车/测试是真正的i.i.d.时,信息泄漏。
、
、
、
、
我非常清楚,为了避免信息泄漏,建议对
训练
数据集上的任何转换(例如标准化或基于中值的估算)进行拟合,并将其应用于
测试数据
集。然而。我不清楚,如果数据是iid,而
训练
/测试拆分确实是
随机
的,那么将这些转换应用于整个数据集的风险是什么?例如,如果原始数据集具有一定的统计特性(例如,均值、中值
和
std),那么我将期望
随机
数据溢出,生成具有相同统计特性的
训练
和
测试数据
集。因此,对整个数据集进行标准化,然后再进行
分割
,
浏览 0
提问于2021-02-04
得票数 2
回答已采纳
2
回答
随机
分割
训练
和
测试数据
、
、
、
我想在
训练
和
测试数据
中
随机
划分这些对象,70%的
训练
和
30%的测试
分割
。但是,我想根据与每个对象相关联的计数来划分它们,而不是基于对象的数量。Obj 2 => 30Obj 4 => 20如果我以接近70%-30%的比例拆分它们,我的
训练
集应该是Obj 3 => 40 O
浏览 25
提问于2016-07-27
得票数 1
2
回答
取多个神经网络的平均值?
、
、
、
、
我用一个非常小的数据集来拟合一个神经网络,所以试着把数据分成
训练
和
验证集。(有一个单独的测试集)如果我将
训练
/验证
随机
分成几次,为每个
训练
/验证分裂构造一个神经网络,并取测试集上神经网络预测值的平均值,它是否可以称为集成模型?或者,这种技术是否有一个特定的名称?编辑:我刚刚发现一种类似的技术叫做“重复
随机
次抽样验证”,但是RRSSV将数据分成
训练
和
测试集(根据维基百科,它被称为“验证数据”,实际上是
测试数据
)。我的
浏览 0
提问于2018-01-29
得票数 2
3
回答
模型性能因列车试验的不同而不同?
、
、
我将我的数据集与
随机
森林分类器相匹配,发现模型的性能在不同的
训练
和
测试数据
分割
集之间会有所不同。据我理解,交叉验证用于特定的列车
和
测试数据
的
分割
。
浏览 0
提问于2017-01-05
得票数 2
回答已采纳
2
回答
python-
分割
数据以获得高精度数据的最佳技术
、
、
、
、
我采用了以下4种方法: 我想知道我应该选择哪种方法?
浏览 6
提问于2019-11-17
得票数 0
2
回答
scala中火花数据的有序分裂
、
、
我有一个sql.DataFrame,我想将它与scala
分割
成
训练
和
测试数据
格式。我现在正在使用这个代码:但是我不想
随机
地
分割
我的数据。
浏览 1
提问于2020-06-05
得票数 0
回答已采纳
1
回答
测试数据
集
和
验证数据集的增强
、
、
、
我在
训练
一个
分割
模型(计算机视觉)。因此,我的数据集包含图像
和
掩码(对象的二进制分段)。 我正在增加
训练
数据集(应用
随机
作物、轮班或轮班等)以获得更大的数据集。我不对测试
和
验证数据集应用增强。我应该在验证数据集或
测试数据
集上使用增强吗?
浏览 0
提问于2020-11-12
得票数 0
回答已采纳
3
回答
什么是培训
和
测试数据
集?
、
、
、
我刚刚参加了各种数据科学
和
机器学习比赛。有人能解释一下这些数据集是什么以及我们如何在解决问题的同时使用这些数据集吗?
浏览 3
提问于2017-09-15
得票数 1
1
回答
我能用
训练
过的数据来测试我已经
训练
过的模型吗?
、
分裂时的数据被
随机
地洗牌
和
分割
,所以问题不再是游戏的一部分。 我现在可以用同样的问题,它被
训练
和
测试,以重新测试所有的问题,但为了确定赢得比赛的百分比?或者,在最初
训练
我的模型时,
训练
数据
和
测试数据
是否应该通过游戏而不是问题来
分割
?
浏览 0
提问于2019-04-24
得票数 1
1
回答
学习train_test_split中平台无关的
随机
状态
、
、
、
、
当使用scikit learn
分割
训练
/
测试数据
集时,设置一个特定的
随机
种子(random_state)是否会产生相同的
随机
数生成器初始化(即,在不同平台上产生相同的伪
随机
数)--例如,在不同的云计算实例上
浏览 3
提问于2021-04-07
得票数 0
回答已采纳
1
回答
分割
数据集在R中对
随机
森林模型进行测试
和
训练
?
、
、
我正在为一个医学预测项目设计一个
随机
森林模型。我使用的数据集包含病人的信息,包括特征、诊断
和
病人ID (每个病人都是唯一的)。现在,我不只是根据比例(即培训数据的75%,
测试数据
的25% )来
分割
数据集,而是希望根据患者(即
随机
选择的患者)
分割
数据集,同时满足"75%的
训练
,25%的测试“的比例。
浏览 2
提问于2022-03-07
得票数 0
回答已采纳
1
回答
is分区
和
交叉between的区别是什么?
、
testing setscrossvalind用于执行交叉验证,通过返回索引,将整个特性集X
随机
分成
训练
和
测试数据
利用这些指标,我们可以分别生成X(trainIdx,:)
和
X(testIdx,:)的
训练
数据
和
测试数据
。cvpartition也使用分层
和
非分层的方法来
分割
数据,但是它不返回指数
浏览 1
提问于2018-06-06
得票数 1
回答已采纳
1
回答
如何防止
测试数据
泄漏到机器学习算法的
训练
过程中?
、
、
、
我在许多不同的来源中看到,我需要将我的数据分成一个
训练
集
和
一个测试集。然后,我必须确保算法只对
训练
数据进行
训练
,并尽量避免
测试数据
泄漏到
训练
过程中。为了避免学习不重要的数据细节(这将提高算法的泛化能力),我可以将
训练
数据进一步
分割
成适当的
训练
集
和
验证集,并选择算法的参数,为所有这些
分割
提供最佳的平均性能。当然,我没有在
训练
期间使用我的
测试数据
,但是我得到的算法参数
浏览 0
提问于2020-01-23
得票数 1
回答已采纳
2
回答
重复许多
随机
训练
和
测试集分裂,直到达到高精度,是不是很糟糕的做法?
、
model.predict(x_test) test_accuracy = np.mean(p == y_test) * 100既然我已经根据测试集的准确性选择了random_state,那么这里的测试集真的是一个验证集吗?
浏览 3
提问于2020-09-02
得票数 1
回答已采纳
1
回答
在前处理
和
降维之前或之后将X
分割
成测试/
训练
?机器学习
、
、
、
、
在创建用于机器学习的SVC模型时,我们鼓励在执行preprocessing (例如scaling
和
dimension reduction,例如PCA/Isomap )之前,使用来自sci-kit learn的将dataset X拆分成test
和
train集。然而,preprocess
和
PCA/IsoMap在X上的速度要快得多,然后才将X分解成test
和
train,并且accuracy评分较高。我的问题是: 1)在
分割
出测试
和
训练
之前,我们为什么不能<
浏览 1
提问于2017-08-11
得票数 4
回答已采纳
2
回答
为什么我的模型可以处理来自train_test_split的
测试数据
,而不能处理新的数据呢?
、
、
、
、
利用train_test_split函数对列车
和
试验数据进行分离。我正在使用以下代码对模型进行培训
和
测试:X_trai
浏览 0
提问于2017-10-17
得票数 2
回答已采纳
1
回答
如何在基于用户的协同过滤中增加显着性加权
、
、
、
这些天来,我一直在学习推荐系统。更具体地讲到协作过滤。在探索的过程中,我发现在预测公式中使用“显着性加权”来给拥有更多同级项目的用户更多的权重是有用的。它们用于这一重要权重的公式如下:但我不太明白他们是怎么找到β的。他们说这可以通过交叉验证来完成,但我不太明白这意味着什么。有人能帮我吗?谢谢!
浏览 0
提问于2022-12-11
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
视频批量处理操作解析:随机分割方法,创新剪辑方式
训练和测试数据重叠!Nature效果超好的AI预测地震论文被爆严重错误
上海交大:基于近似随机Dropout的LSTM训练加速
ConvCRF:一种结合条件随机场与CNN的高效语义分割方法
大量的视频如何批量随机分割的详细操作:批量剪辑不求人
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券