腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
3
回答
如何
使用
预
训练
模型
来
填充
缺失
值
?
、
、
、
、
我已经
训练
了一个ML
模型
来
预测基于X,Y和Z的湿度
值
。现在,当我
使用
pickle加载保存的
模型
时,我想
使用
X,Y和Z
来
填充
湿度
缺失
值
。但是,它应该考虑到X,Y和Z本身不应该丢失的事实。NaN 12 NaN NaN在此示例中
浏览 16
提问于2020-05-09
得票数 2
回答已采纳
1
回答
无法在pandas数据帧中执行空
值
分析
、
、
我想在这里执行空
值
分析。dtr,mtg,Harley Davidson Portland 6022$ 4.8 除了shop_name,每一列都有一些空
值
。早些时候,我
使用
了基于均值的估算和基于频率的估算来替换空
值
。 但是,我被告知要遵循基于
模型
的
填充
技术
来
替换所有空
值
。 有没有人能建议我怎么做。
浏览 16
提问于2020-06-28
得票数 0
1
回答
如何
在Keras中加载卷积神经网络前几层的权
值
,删除
预
训练
模型
?
、
、
、
、
我在凯拉斯有个受过
训练
的模特。是否可以
使用
“.h5”文件中
预
训练
模型
的前4个conv层的权重来初始化新
模型
的前4个conv层?是否必须先加载整个预先
训练
过的
模型
??
预
训练
模型
实际上
浏览 6
提问于2020-08-19
得票数 0
1
回答
关于用于机器学习的train_test_split的思考
、
我只是注意到,许多人甚至在处理丢失的数据之前就倾向于
使用
train_test_split,而且似乎他们在一开始就拆分了数据 还有一群人,他们倾向于在做完所有的数据清理、特征工程和特征选择之后,在
模型
构建步骤之前滑动数据我现在对构建
模型
的管道感到非常困惑。为什么我们需要在一开始就滑动数据呢?当我们实际上可以进行所有的数据清理和特征工程,或者为了方便起见,将分类变量转换为虚拟变量等事情时,分别清理
训练
集和测试集?
浏览 3
提问于2020-04-16
得票数 0
2
回答
处理预测数据集中的
缺失
值
、
、
我正在
使用
lightgbm和python包进行预测。我有一个
训练
数据集和一个预测数据集。在预测数据集中,我有一些特征的NaN
值
。在结果中,当我有nan
值
时,预测是完全错误的。有没有办法处理预测数据集中的
缺失
值
? 我已经尝试
使用
参数use_missing和zero_as_missing,并尽可能
使用
((true,false),...)但没有成功。我
使用
的是主版本。gbm.predict(predictdata.iloc[:,1:], n
浏览 2
提问于2019-09-04
得票数 2
2
回答
预测
缺失
数据的方法
、
、
我有以下问题:我正在寻找方法
来
预测给定数据集中随机丢失的数据。我读过关于PCA-方法的文章,但我想了解一下方法的优缺点,以及最近的研究概况(给定数据集的良好工作算法/从哪里开始阅读,以开发算法和解决给定的问题)。
浏览 0
提问于2016-10-23
得票数 2
3
回答
用0
填充
缺失
值
或任何常数项(如-999 )之间有什么区别?
大多数教科书说,要
填充
缺失
的
值
,
使用
的是均值/中值(数字)和最频繁的(分类),但我
使用
的是一个数据集,它有太多的
缺失
值
,而且我不能删除这些列,因为它们很重要。471874(590540, 434) 您可以看到,DeviceType和DeviceInfo有太多缺少的
值
。我不知道用最频繁的价值
来
填补这些问题是否是正确的选择。所以,我在考虑用一个常量项
浏览 0
提问于2020-03-17
得票数 0
回答已采纳
3
回答
部分未知向量的最近邻
、
、
、
、
我猜因此,假设我们计算出170cm是身高的平均值,并将person C重新定义为[60kg, ~170cm, 50y]。,但是我们
如何
计算这个惩罚呢?(最好是在简单的经验算法中),我们应该以某种方式惩罚未知
值
的向量吗?用多少(可能计算出每两个人的身高之间的平均差值)?
浏览 4
提问于2017-09-23
得票数 1
2
回答
你能用特定于任务的体系结构从零开始
训练
BERT
模型
吗?
、
、
BERT对基本
模型
的
预
训练
是通过一种语言建模方法完成的,在这种方法中,我们在句子中掩蔽了一定百分比的标记,并让
模型
学习那些
缺失
的掩码。然后,我认为,为了完成下游任务,我们添加了一个新的初始化层,并对
模型
进行了微调。 然而,假设我们有一个巨大的句子分类数据集。从理论上讲,我们能否从零开始初始化BERT的基本体系结构,同时
训练
额外的下游任务特定层+基
模型
权
值
,只
使用
这个句子分类数据集形成scratch,并且仍然取得了良好
浏览 2
提问于2020-05-15
得票数 7
回答已采纳
2
回答
Weka InCompatible在文本分类中的
训练
和测试集
、
、
我有两个关于句子是否包含提到药物不良事件的数据集,
训练
和测试集都只有两个字段文本和标签{不良事件,无不良事件}我已经
使用
weka和stringtoWordVector过滤器在
训练
集上
使用
随机森林构建了一个
模型
我想测试构建的
模型
,方法是从测试数据集中删除类标签,在其上应用StringToWordVector过滤器,并
使用
它测试
模型
。当我尝试这样做时,它给我一个错误,说
训练
和测试集不兼容,可能是因为过滤器为测试数据集识别了一组不同的属性。
浏览 0
提问于2018-03-12
得票数 0
4
回答
数据中
缺失
的
值
、
、
、
、
我曾经经历过,大多数数据集都包含
缺失
的
值
,这使我们的任务变得有些困难。 请让我知道
如何
有效地
填充
那些
缺失
的
值
?是否有任何特定的技术来处理丢失的
值
?
浏览 0
提问于2017-08-31
得票数 5
回答已采纳
1
回答
我
如何
从头开始
训练
模型
,例如,
使用
inception v3或v4
来
使用
COCO数据集进行对象检测?
、
实际上,我们正在
使用
faster_rcnn_inception_resnet_v2_atrous_coco
预
训练
模型
来
训练
我们自己的数据集图像,但我们希望改进我们的目标检测。我
如何
从头开始
训练
模型
,例如,
使用
inception v3或v4
来
使用
COCO数据集进行对象检测?我希望像中描述的其他
模型
一样,生成一个名为faster_rcnn_inception_v3_c
浏览 30
提问于2018-01-04
得票数 0
2
回答
用nan标签进行时间序列预测的LSTM
训练
、
、
、
我目前正在通过Keras
使用
tensorflow。 标签的掩蔽层有相似之处吗?我目前正在通过Keras
使用
tensorflow。或者,也许可以改变损失函数,但我不知道
如何
改变,特别是在保持数值效率的同时。
浏览 0
提问于2019-12-09
得票数 2
回答已采纳
1
回答
分类器的
缺失
特征
、
如果我被赋予60个特性以及测试标签,而我要找到其他特性的价值,那么最好的方法是什么呢?
浏览 0
提问于2015-12-06
得票数 0
1
回答
数据集
训练
:在参数调整和
预
训练
模型
上收敛
、
、
我最近完成了一个“相当好的”TF2/keras
模型
,用于图像识别,
使用
了许多层,SGD优化,并从MobileNetv2
预
训练
模型
开始。我甚至没有考虑从其他
预
训练
模型
开始。我将优化器从SGD改为ADAM (应该更好,对吧?)而且它稍微更不准确。 那么,
如何
收敛到一个更好的预先
训练
好的
模型
、参数、
值
呢?这只是一次试错吗?
训练
我的
模型
需要大约
浏览 1
提问于2019-10-26
得票数 0
2
回答
训练
一个并不总是具备所有特征的
模型
、
、
、
我正在创建一个
模型
,该
模型
收集来自多个源的数据,并为跨这些源的实例确定一个信任级别(即。所有的来源都有不同的特性,但都有一行'Foo','Bar',等等,我想要一个信心水平)。问题是,我并不总是拥有来自所有来源的数据,这影响了我在运行最终培训
模型
时所拥有的特性的数量。 我已经考虑过为数据输入的每一个排列创建一个不同的
模型
,即。如果有来自数据来源A、B和C的可能输入,那么我将有一个为(A,B,C),(A,B),(A,C)和(B,C)
训练
的
模型
,但是这
浏览 0
提问于2023-01-07
得票数 1
回答已采纳
1
回答
大型的
预
培训语言
模型
是否已经“了解”NLP任务?
、
、
目前,NLP最先进的技术是在特定的任务上完善一个大型的预先
训练
的语言
模型
,如BERT/GPT等。这些语言
模型
是对大量数据进行
预
训练
,然后根据为回答问题、机器翻译等。而发布的流行标记数据集进行基本评估。由于这些数据集已成为评估这些
模型
的事实上的缺省
值
,这些数据集已一次又一次地在各种网站上发布。因此,这些数据集(
训练
和测试数据)基本上包括分类任务中的标签或Q/A任务中的答案。所以现在,当
训练
一种新的大型语言
模型
浏览 0
提问于2022-10-21
得票数 5
1
回答
在输入向量中传递一个NAN进行预测。
、
、
、
我有一个分类器,它
使用
给定的一组输入
训练
数据向量进行
训练
。培训数据中存在
缺失
值
,这些
值
被
填充
为numpy.Nan
值
,并
使用
计算机
填充
缺失
的
值
。但是,在输入向量用于预测的情况下,
如何
在缺少
值
的输入中传递?我应该把这个
值
作为nan传递吗?在这件事上,计算机起着作用吗?如果我必须手动填写这个
值
,我
如何</em
浏览 3
提问于2016-11-18
得票数 0
回答已采纳
1
回答
用新
模型
Keras连接自定义
预
训练
模型
、
、
我将Sports_1M caffe
模型
转换为Keras,并将其作为
预
训练
模型
使用
到新的Keras
模型
中,我还加载了
预
训练
的权重。 我删除了预先
训练
过的
模型
的顶层,最后与New连接起来。我不想再次
训练
加载的
预
训练
模型
(只是想
使用
预
训练
模型
的嵌入,并
使用
它<em
浏览 0
提问于2020-07-19
得票数 2
1
回答
将缺少的
值
替换为平均值(Weka)
、
、
在Weka中,有一个名为"ReplaceMissingValues“的过滤器,它允许
使用
每个属性的平均值
来
替换数据集中所有缺少的
值
。我想要替换某个属性的
缺失
值
,
使用
属于某个类的
值
的平均值。例如,在二进制数据集中,我认为
使用
只计算属于正类的记录的平均值
来
替换属于正类的记录中的属性的
缺失
值
会更正确。那么
如何
才能实现它呢?我们
如何
才能只替换属于某个类的记录的<
浏览 0
提问于2012-04-23
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用MICE进行缺失值的填充处理
【视频】为什么要处理缺失数据?如何用R语言进行缺失值填充?
大数据中填充缺失值很有效的树模型算法,MissForest算法
如何使用react-redux-form填充动态默认值
Excel中如何使用条件格式来隔行填充颜色
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券