腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9531)
视频
沙龙
1
回答
在
R
MXNet
的
数据
集中
仅
训练
可
预测
样本
的
最佳
方法
、
、
、
、
我有一个像这样
的
训练
集。[i] feature[i][1] feature[i][2] ... feature[i][j] 假设一些
样本
(行)具有可能产生类似输出
的
“良好”值组合,而其他
样本
(行)具有“坏”值组合,因此难以
预测
我
的
目标是,通过摆脱那些缺乏规律性
的
坏
样本
,我想提高最终
的
准确性。谁能告诉我,有什么最好
的
算法或预处理可以自动检测这些
样本
,以便只
训练
好<e
浏览 8
提问于2017-06-23
得票数 0
1
回答
我可以用不同数量
的
预测
变量对测试
数据
进行predict.glmnet吗?
、
对于一个二项式回归/分类问题,我使用glmnet
在
具有大约200个
预测
器和100个
样本
的
训练
集上构建了一个
预测
模型。 我选择了给我最大AUC
的
最佳
模型(16个
预测
值)。我有一个独立
的
测试集,其中只有那些变量(16个
预测
值),它们进入了
训练
集中
的
最终模型。有没有办法将基于
训练
集中
最优模型
的</e
浏览 1
提问于2013-08-25
得票数 4
1
回答
鸟类
的
视频分类
、
、
、
我正在做一个项目,任务是对鸟类
的
视频进行分类,并对物种进行
预测
。我尝试使用机器学习模型,最初是为深入行动识别而设计
的
,并针对我
的
数据
集进行了调整。老鼠)
R
dhake (Robin)Inget objekt (无对象)📷
方法
目前,我已经为时态段网
浏览 0
提问于2018-04-14
得票数 3
1
回答
验证
的
准确性总是有可能达到
训练
精度
的
水平吗?
、
我有一个非常小
的
数据
集(40个
训练
示例、10个验证示例、120个类),对于这些
数据
集,我
在
Keras中使用了一个非常简单
的
模型(仅限于批规范、扁平和密集层),获得了非常高
的
精度。我
的
训练
准确率为94-95%,验证准确率为76-78%.我知道这太合适了,我试过几样东西。
数据
不是图像,所以我不能增加
数据
。我也不能添加
数据
,因为它是一个特定
的
类型。我使用了两个0.5层<
浏览 0
提问于2017-06-05
得票数 3
回答已采纳
1
回答
在
KNN中,为什么
数据
是模型?
、
、
在
机器学习讲座幻灯片中,有人说没有针对KNN
的
特定模型,其中
数据
是KNN
的
模型。然而,对于KNN,它被写入
数据
就是模型。这句话我不清楚,我
的
问题是为什么
数据
是KNN
的
模型?
浏览 0
提问于2020-05-20
得票数 1
2
回答
如何控制一些病人在我
的
培训
数据
中提供多个
样本
?
、
、
我有50个病人
的
数据
集。这些病人经过多年
的
追踪,
在
某种程度上随机间隔地测量了几千个特征。我正试图
预测
一个特定
的
结果(这是一个回归问题),这个结果可以是一次,两次,或者是每名患者
在
整个跟踪期间
的
三次。到目前为止,我一直假设每个结果特征都是Y向量中
的
一个
数据
点,并且使用最近
的
时间点来测量患者
的
特征。我希望我
的
最后一个模型能够从一个特性度量中
预测
结果变
浏览 0
提问于2018-07-09
得票数 0
3
回答
向上采样不平衡
数据
集
的
次要类
、
、
我正在使用scikit-学习分类我
的
数据
,目前我正在运行一个简单
的
DecisionTree分类器。我有三节课有一个很大
的
不平衡问题。类是0,1和2,小班是1和2。为了让您了解这些类
的
样本
数量:1 = 15/20 less or more因此,次要类约占
数据
集
的
0.06%。我解决这个不平衡问题
的
方法
是辅导班<em
浏览 0
提问于2018-11-09
得票数 2
回答已采纳
2
回答
ValueError:形状(1, 10 )和( 20 ,20)不对齐:10 (dim 1) != 20 (dim 0)
、
、
我是机器学习新手,当我尝试
在
.predict()上执行X_test
方法
时,我会遇到这个错误。我也不理解reshape
的
概念:为什么我们需要这样做?
浏览 0
提问于2019-01-26
得票数 0
1
回答
攀爬
的
步骤是什么?
、
、
、
我阅读了adaboost教程,下面是我
的
简化理解:
仅
使用
数据
集中
的
一个特性创建树桩。 利用总误差和
样本
权重计算出残端重要性。改变
样本
权重,即用高重要性
的
树桩错误地
预测
样本
,使
样本
重量增加,其余
的
样本
重量按相同
的
顺序
浏览 0
提问于2020-01-09
得票数 1
回答已采纳
1
回答
在
培训、测试和生产过程中如何准备
数据
?
、
、
、
、
大多数真实世界
的
数据
集都有缺少值
的
特性。将缺失值替换为适当
的
值(如平均值)是特征工程中
的
一个很好
的
步骤。有时,我们还会在输入特性列以
训练
模型之前对其进行标准化/规范化。在建模之前,我们还将
数据
集拆分为培训和测试集。 我
的
第一个问题是如何在这个分裂
的
数据
集中
进行特性工程?我们是使用未分割特征
的
全局平均值来替换
训练
和测试
集中</em
浏览 0
提问于2020-12-16
得票数 4
1
回答
当我
的
数据
很少
的
时候,优化Sklearn分类器中
的
参数
的
最佳
方法
是什么?
、
、
如果我只有684行和177列
的
数据
集,而我要
预测
的
列有3个标签,那么优化Sklearn分类器中
的
参数
的
最佳
方法
是什么?我知道我应该将
数据
分成
训练
、验证和测试集,然后找到参数来
训练
训练
集,使验证
集中
的
度量最大化,并在测试
集中
使用这个优化
的
分类器。但是,当我使用决策树分类器执行此操作时,对验证集最有效
的</
浏览 0
提问于2019-08-07
得票数 0
回答已采纳
1
回答
如何检验神经网络
训练
中未使用变量
的
效果
、
、
我目前正在使用tensorflow创建一个神经网络来进行基本
的
二进制分类,并且我想在
训练
后检查模型
的
偏差。 我有一个大约300,000个
样本
的
数据
集,每个
样本
都有一个包含112个特征
的
列表。
在
训练
之前,我们已经选择了20个我们想用来
预测
的
特征--种族是
数据
集中
的
一个特征,但它不用于
训练
神经网络。我想要
的
浏览 0
提问于2022-06-07
得票数 0
1
回答
精度函数
、
这两种精确度之间
的
区别是什么:fcast<-forecast(fit,6)fcast<-forecast(fit,6)当我没有像第一种情况那样
在
精度函数中指定实际值时,精度函数是如何工作
的
。其次,计算精度
的
正确
方法
是什么
浏览 0
提问于2017-03-27
得票数 1
回答已采纳
4
回答
学习随机森林分类器能按树调整
样本
大小,处理类不平衡吗?
、
、
、
、
关于滑雪板随机森林
的
简单问题:
在
随机森林
的
R
实现(称为randomForest )中,有一个选项sampsize()。这允许您根据结果来平衡用于
训练
每棵树
的
样本
。例如,如果
浏览 2
提问于2013-11-27
得票数 6
回答已采纳
2
回答
gbm中
的
预测
输入
数据
., data = traindata, ...)
训练
一个模型,并使用predict(... newdata = newdata, ...)进行
预测
。我
的
问题是:培训
数据
和新
数据
是否需要相同
的
格式(顺序和变量数量)? 如果对象适合使用gbm.fit,则将不存在术语组件。因此,用户有更大
的
责任确保新
数据
的
格式(顺序和变量数)与最初用于模型
的</
浏览 5
提问于2016-02-12
得票数 0
1
回答
分类信息能改善对
样本
外类别的
预测
吗?
、
、
、
假设我们有一些与我们试图
预测
的
目标值有关
的
特征
的
记录。所有记录都遵循相同
的
通用底层模式,并由RandomForestRegressor很好地学习。现在,假设所有记录都添加了一个分类特性,可以将其编码为附加信息,以提高模型
的
预测
能力。到现在为止还好。但是现在,假设我们想要使用对
数据
进行
训练
的
回归器,包括分类特性,来
预测
记录中没有表示
在
训练
数据
中<e
浏览 1
提问于2016-11-07
得票数 0
回答已采纳
2
回答
神经网络模型无法
预测
外部世界
的
数据
、
、
、
、
当我用3倍交叉验证
训练
和测试我
的
网络时,它对所有情况都提供了100 %
的
准确性,前提是我
在
将输入
数据
划分为
训练
和测试集之前将它们标准化。当我使用先
训练
的
网络(标准化
的
一个)模型对
训练
集中
存在
的
几个随机
数据
集进行测试时,如果不进行规范化(因为外部世界
的
数据
不能标准化,因为我们处理单个实例),它将所有
样本
预
浏览 3
提问于2013-12-13
得票数 0
回答已采纳
1
回答
用于
预测
的
Bootstrap置信区间
、
、
、
、
我想计算
样本
外测试集
预测
中机器学习回归
的
RMSE
的
置信区间。 我
的
训练
集是
样本
的
前80%,“
样本
外”测试集是
样本
的
最后20%。我将测试集
预测
的
RMSE视为
样本
外性能,并希望计算此RMSE
的
CI。我
的
一个想法是对前80%
的
训练
集进行重新采样,但每次迭代都使用相同
的</e
浏览 14
提问于2018-02-19
得票数 1
1
回答
为什么knnImpute preProcess会改变其他
数据
?这是错误
的
吗?
、
、
、
以下是一些
数据
: id timestamp full_sq2 30475 1661716617 40.505 30478 16617 40.00有一些缺失
的
值没有显示在上面,所以我使用preProcess从插入符号填充它们
的
中值: p.full.medians <- predict(prePro
浏览 6
提问于2017-05-10
得票数 1
回答已采纳
2
回答
有没有办法找到整个
数据
集最具代表性
的
样本
集?
、
、
、
、
这个想法是手动标记一组短
的
推文,并
训练
分类器来
预测
其余
的
标签。监督学习。我想知道
的
是,是否有一种
方法
可以选择要包括
在
训练
集中
的
样本
,使该
训练
集能够很好地代表整个
数据
集,并且由于
训练
集中
包含
的
高度多样性,经过
训练
的
分类器具有相当大
的
可信度,可以应用于其余<em
浏览 0
提问于2019-05-12
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
9,模型的评估
动手深度学习:线性回归
处理不平衡数据的技巧总结!
处理不平衡数据的技巧总结
R语言梯度提升机 GBM、支持向量机SVM、正则判别分析RDA模型训练、参数调优化和性能比较可视化分析声纳数据
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券