腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
dask_lightgbm
使
用了
完整
的
训练
集
吗
?
、
我正在阅读dask-lightgbm估计器
的
实现(特别是dask_lightgb.core.py中
的
_train_part函数),但我无法理解如何使用整个
训练
集
来拟合最终
的
估计器?从逻辑上讲,每个工人都被分配到整个模型
训练
集
的
1/n块-其中n=工人总数-然后每个工人在自己
的
训练
集
的
子集上
训练
自己
的
独立模型。finally:
浏览 38
提问于2020-10-20
得票数 0
2
回答
从
训练
数据子集和整个测试数据(不是整个
训练
数据)创建学习曲线?
、
、
假设我正在创建这样
的
学习曲线(代码中可能有一些小错误,这只是一个示例)。我想要
的
是一个经典
的
学习曲线,你可以扩大
训练
集
,
使
验证/测试
集
保持相同
的
大小。list(setAggregation(auc, train.mean), setAggregation(auc, test.mean))以上代码
的
问题在于,学习者确实接受了关于
训练
数据
的
一部分
的
训练
浏览 10
提问于2016-11-23
得票数 2
回答已采纳
2
回答
朴素贝叶斯
训练
集
优化
、
我正在开发一个朴素
的
贝叶斯分类器,它采
用了
一系列用户配置文件数据,例如:CitySchoolURLS { ... }我
的<
浏览 0
提问于2014-01-30
得票数 0
1
回答
深度学习:在较小一部分数据上开始培训是否有意义?
、
、
、
、
我用一小部分数据
训练
了一个深度神经网络,
使
我能够在短时间内经历多个时代,
使
模型能够合理地运行,然后给出整个数据
集
(10倍以上
的
数据),并进一步改进。当我只给出整个数据
集
时,模型似乎表现得很糟糕,但由于
训练
所需
的
额外时间,很难达到许多时代。 我
的
问题是:用较小
的
数据子集“热身”
训练
一个大
的
深层神经网络是有意义
的
,还是应该总是提供
完整
的</e
浏览 0
提问于2018-08-17
得票数 4
1
回答
特征选择(Boruta)
、
、
、
我正在做信用风险建模,数据有大量
的
特性,我正在使用boruta软件包进行特征选择。该包计算成本太高,无法在
完整
的
培训数据
集
上运行。我想要做
的
是获取
训练
数据
的
一个子集(比如20-30%),并在该子集数据上运行boruta包,并获得重要
的
特性。但是当我使用随机森林来
训练
数据时,我也使
用了
完整
的
数据
集
。我
的
问题是,只在一部分
训练
数据上
浏览 2
提问于2017-05-03
得票数 0
回答已采纳
1
回答
R太大数据集中
的
特征选择
我正在做信用风险建模,数据有大量
的
特性,我正在使用boruta软件包进行特征选择。该包计算成本太高,无法在
完整
的
培训数据
集
上运行。我想要做
的
是获取
训练
数据
的
一个子集(比如20-30%),并在该子集数据上运行boruta包,并获得重要
的
特性。但是当我使用随机森林来
训练
数据时,我也使
用了
完整
的
数据
集
。我
的
问题是,只在一部分
训练
数据上
浏览 0
提问于2017-05-02
得票数 0
回答已采纳
1
回答
清理平均前后
的
NaNs?
、
、
、
这会导致价值观
的
偏差。 我是否“符合”我
的
培训数据
的
平均值,就像缩放一样?还是使用整个数据
集
取平均值?
浏览 0
提问于2021-01-05
得票数 0
1
回答
如何将MNIST
训练
数据
集
划分为子部分?
、
、
、
背景:我试图用Caffe来
训练
MNIST数据
集
的
不同子样本(1模型为10,000,另一模型为20,000个样本,等等,直到所有60,000个
训练
样本
的
模型)。问:如何将60000个样本
的
培训数据
集
细分,
使
培训文件
的
格式与最初在http://yann.lecun.com/exdb/mnist/上发布
的
相同(
完整
)。 📷
浏览 0
提问于2017-12-10
得票数 1
1
回答
应用欠采样技术
训练
和测试数据
、
我知道,如果您执行某种转换,并且使用fit(),那么您必须同时转换()
训练
集
和测试
集
。 假设您对培训数据应
用了
有针对性
的
欠采样技术(如TomekLinks ),以使模型能够更好地识别\单独
的
类。问题:如果要使用该模型对测试
集
进行预测,是否也对测试
集
执行相同
的
欠采样技术,还是仅在培训
集
上使用欠采样来帮助模型澄清类边界。然后将经过
训练
的
模型应用于
完整
的</em
浏览 0
提问于2021-11-04
得票数 1
回答已采纳
2
回答
用主成分分析法展开维数
、
我试图使用the算法进行降维,我知道这不是这个算法
的
主要用途,也不推荐。我看到了一个在t上实现
的
这里。,我不相信这个实现。该算法
的
工作方式如下:在
完整
数据
集
上运行the (不包括目标变量) 将the
的
输出作为K个新列添加到
完整
的
数据集中,K是the
的
映射维数。将整个数据
浏览 0
提问于2022-03-14
得票数 1
回答已采纳
2
回答
如何计算自定义数据
集
上TF对象检测API
的
准确率?
、
我正在使用TF对象检测API来检测自定义数据
集
上
的
对象,但是当涉及到精度时,我不知道如何计算它,因此,如何计算自定义数据
集
上
的
对象检测模型
的
准确性?并找到模型在测试数据
集
上
的
置信度分数?
浏览 1
提问于2019-10-31
得票数 0
1
回答
要部署
的
最终模型
的
预处理
、
、
、
、
通常,对于ML工作流,我们导入数据(X和y),将X和y划分为train、valid和test,对train、valid和test
的
数据进行预处理(缩放、编码、计算nan值等),执行HP调优,在得到最佳HP模型后,将最终模型拟合到整个数据
集
(即X和y)。现在
的
问题是,X和y不是预处理
的
,因为只有train、valid和test是预处理
的
。因此,当在X和y上拟合最终模型时,我们将得到一个错误,因为我们还没有对X和y进行编码(并执行其他预处理步骤)。那么我们应该如何在整个数据
集
上
训练<
浏览 0
提问于2021-11-29
得票数 1
回答已采纳
1
回答
使用Weka分类没有给出精度、Fmeasure和MCC
的
任何结果
、
、
、
、
我有一个数据
集
。数据
集
有一些分类值和一些离散值。我
的
数据
集
是一个不平衡数据
集
。我使用Weka提供
的
Resample过滤器将数据
集
分为60%
的
训练
数据和40%
的
测试数据。为了
使
数据
集
平衡,我使
用了
SMOTE技术。在那之后,我使用随机森林对数据
集
进行分类。 现在我不能理解结果中
的
?是什么意思?其次,为什么假阳性和真
浏览 20
提问于2021-10-21
得票数 0
2
回答
Keras关注引导CNN问题
、
、
、
我正在为XRay图像分类而工作,我似乎无法对它进行适当
的
训练
。📷本地分支是没有预培训
的
ResNet或DenseNet (我使
用了
DenseNet)。它是在裁剪
的
数据<em
浏览 0
提问于2018-12-23
得票数 4
回答已采纳
1
回答
哪个更好:交叉验证还是用于超参数优化
的
验证
集
?
、
对于超参数优化,我看到两种方法:那
浏览 0
提问于2020-08-12
得票数 2
回答已采纳
1
回答
我可以在组合( train+dev)
集
上
训练
微调模型,然后用测试
集
进行评估
吗
?
、
我正在使用
的
数据
集
由
训练
集
和测试
集
组成。为了对深度学习模型进行微调,使用10%
的
训练
集
作为验证
集
。找到最佳超参数值后,有两个可能
的
选项b)使用测试
集
评估模型(即,在
完整
训练
集
上重
浏览 4
提问于2019-05-06
得票数 0
1
回答
R: randomForest中
的
额外随机性?
出于好奇,我在一个
训练
数据
集
上使
用了
包"randomForest“中
的
randomForest方法,以查看它与”树“包中提供
的
回归树方法之间
的
关系。mtry = var, ntree = 1,其中var是公式中
的
变量数由于采
用了
所有变量,采样是在
完整
的
训练</e
浏览 4
提问于2015-11-06
得票数 2
1
回答
GridSearchCV:根据mean_test_score
的
结果,预测应该表现得更糟,但事实并非如此。
、
、
那么,按照这个概念背后
的
推理,当我将best_estimator_应用于整个数据
集
时,我希望看到至少部分数据预测
的
不完美,对
吗
?相反,对于所有数据点,预测量与实数之间
的
数值偏差接近于零。我不明白这一点,因为如果我删除一小部分数据并将GridSearchCV应用于其余部分,我会发现几乎相同
的
结果,但应用于完全看不见
的
数据
的
最佳回归值预测
的
误差要高得多,比如10%、30%或50%。这正是我所期望
的
,至少在某些点上,根据k
浏览 0
提问于2018-07-27
得票数 3
2
回答
如何在python中调整图像大小以进行机器学习?
、
、
、
我使
用了
一个图像数据
集
进行机器学习
训练
。每个图像都有64px
的
宽度和64px
的
高度。现在,我想使用来自google
的
图像来测试我
的
机器学习模型。问题是google图像比
训练
图像大,我想调整它们
的
大小,
使
它们
的
高度和宽度为64px (就像
训练
集中
的
图像一样)。在python中有什么方法可以做到这一点
吗
?我确实找到了一些方法,但它们都保持纵横比。
浏览 0
提问于2020-02-28
得票数 0
1
回答
测试整个数据
集
的
模型性能是否正确?
、
、
使用函数train_test_split()将数据
集
按75:25
的
比例划分为
训练
集
和测试
集
。该模型是在数据
集
x_train和y_train上进行
训练
的
(高斯朴素贝叶斯、随机森林、k近邻等分类器模型)。 我们现在可以使用
完整
的
数据
集
,即x和y来测试模型
吗
?
浏览 7
提问于2020-02-27
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
手把手教你机器学习识别交通路牌,好玩
吴恩达深度学习演讲精华笔记
Nvidia研究人员开发AI系统,能够生成用于训练神经网络的大脑图像
宾夕法尼亚州立大学提出深度k-最近邻算法,解决深度学习应用的安全漏洞
PSU提出深度k-最近邻算法:解决深度学习应用的安全漏洞
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券