腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
Python
使用
均匀
分散
的
响应
变量
准备
训练
数据
集
、
我正在做一个小
的
机器学习项目。 我
使用
的
数据
集
有56个输入参数和一个分类
响应
变量
(0/1)。我
的
问题是
响应
变量
不是
均匀
分布
的
。现在我
的
问题是,我想
准备
训练
数据
集
,即
响应
是
均匀
分布
的
。这就是
数据
的
浏览 37
提问于2020-11-24
得票数 0
1
回答
在培训、测试和生产过程中如何
准备
数据
?
、
、
、
、
大多数真实世界
的
数据
集
都有缺少值
的
特性。将缺失值替换为适当
的
值(如平均值)是特征工程中
的
一个很好
的
步骤。有时,我们还会在输入特性列以
训练
模型之前对其进行标准化/规范化。在建模之前,我们还将
数据
集
拆分为培训和测试
集
。 我
的
第一个问题是如何在这个分裂
的
数据
集中进行特性工程?我们是
使用
未分割特征
的
全局平均值
浏览 0
提问于2020-12-16
得票数 4
1
回答
可以在GPU模式下从Java应用程序运行TensorFlow吗?
、
我想
使用
一个预先
训练
的
模块来
训练
我自己
的
数据
集
,
使用
Python
对象检测模块,然后,我想在Java中运行经过
训练
的
数据
集
。我已经安装并测试了TensorFlow for Java。当我在互联网上搜索时,用Java
训练
TensorFlow是不可能
的
,所以为了
训练
,我
使用
Python</e
浏览 2
提问于2018-02-09
得票数 0
回答已采纳
1
回答
如何为spacy
的
自定义命名实体识别
准备
数据
?
、
、
、
我正在
准备
一个
训练
数据
集
,以便
使用
spacy进行自定义命名实体识别。我
的
数据
有一个
变量
'Text',它包含一些句子,一个
变量
‘name’,它有来自前一个
变量
(句子)的人
的
名字。在浏览了一些示例和spacy
的
文档之后,我意识到在
准备
数据
集
时必须传递实体
的
索引。我想知道在
准备
<
浏览 0
提问于2019-08-08
得票数 0
回答已采纳
1
回答
训练
和测试
数据
集
是否应该
使用
相同
的
计算机系数?
、
、
我正在学习如何
准备
数据
,构建估计器,并
使用
训练
/测试
数据
拆分进行检查。 我
的
问题是如何正确地
准备
测试
数据
集
。 我将我
的
数据
分成测试和
训练
集
。正如"Hands on with machine learning with Scikit-Learn"教我
的
那样,我为我
的
数据
准备<
浏览 19
提问于2019-08-21
得票数 0
1
回答
小批量梯度下降是否消除了分层对
训练
数据
集
的
影响?
、
、
在
数据
预处理中,
使用
分层洗牌确保原始
数据
集
的
分布反映在培训、测试和验证
数据
集中。 小型批处理梯度下降
使用
随机洗牌来确保小批中
的
随机性.我
的
疑问是-为什么我们应该在我们
的
数据
集
上执行分层洗牌,如果它要在
训练
期间以随机
的
方式被洗牌?
浏览 0
提问于2020-08-08
得票数 2
回答已采纳
1
回答
使用
大型
数据
集
训练
对话框
、
、
、
我有拥有用户查询和
响应
的
数据
集
。
数据
集
大小约为50K。
数据
存储在csv文件中,文件中分别有两列用于查询和
响应
。如何
使用
此
数据
集
训练
对话框流?我能用
python
训练
它吗?这是在他们
的
文档中提到
的
- 。但我想不出怎么
训练
它?我想像这样
训练
- 。但我不能完全理解如何做到这一点。
浏览 0
提问于2019-01-10
得票数 4
回答已采纳
1
回答
如何在模型
训练
期间
使用
图像/对象/视图、图像/对象/截断和图像/对象/困难?
、
使用
TF Object Detection为模型
训练
准备
TF记录
数据
时,需要指定以下
变量
:image/object/truncated我想知道在模型
训练
期间它们是如何
使用
的
,以及image/object/view
变量
的
可能值是什么,感觉这应该是一些预定义
浏览 0
提问于2017-07-15
得票数 0
回答已采纳
1
回答
training+testing
集
是否必须与预测
集
不同(因此需要对所有列应用时间偏移)?
、
、
、
我知道
的
一般规则是,我们应该测试一个
训练
有素
的
分类器,只有在测试
集
。p.s.1:
的
一般方法 在
数据
挖掘工具(用于多元统计和机器学习)中,为因
变量
指定角色作为目标
变量
(或在某些工具中
浏览 4
提问于2019-12-06
得票数 0
回答已采纳
2
回答
哪一个是最好
的
?
、
、
、
、
该模型是在一个包含400,000多个短语
的
大型
数据
集
上进行培训
的
,并且已经用大约1000个技术关键字进行了注释,其中只有我在
数据
集中提供
的
关键字才能被识别出来。培训
数据
集中
的
注释包括短语中技术关键字
的
特定位置,例如在下面的示例中,技术关键字"php“位于0-3和43-46位置。parallel', {'entities': [[27, 37, 'javascript']]
浏览 0
提问于2023-01-11
得票数 0
回答已采纳
1
回答
Mahout:如何分割成
均匀
分布
的
训练
集
、
、
我正在
使用
Mahout
的
朴素贝叶斯算法将亚马逊评论分类为正面或负面评论。
数据
集
不是
均匀
分布
的
。正面的评论比负面的评论多得多。随机挑选
的
测试和
训练
集
使用
随机挑选
的
元组进行mahout分裂,可以获得良好
的
阳性分类结果,但假阳性率也非常高。负面评论很少被归类为负面评论。我猜测,具有相同数量
的
正负tupels
的
均匀
分布
的</e
浏览 0
提问于2014-08-08
得票数 0
2
回答
如何在一个循环中
训练
几个模型
、
、
、
、
我想用caret包(7个
响应
变量
中
的
一个)在
的
一个循环中
训练
几个模型。} 我
的
变量
Ynames包含所有
响应
。每个模型必须
使用
一个
响应
变量
进
浏览 6
提问于2017-05-02
得票数 0
回答已采纳
2
回答
mlr3 -对新
数据
应用预处理
、
在这里
使用
lmr3verse包。假设我对用于
训练
Learner
的
训练
集
应用了以下预处理 preprocess <- po("scale", param_vals = list(center = TRUE, scale = TRUE)),param_vals = list(method = "one-hot")) 我想用predict(Learner, newdata = pred, predict_type="prob")命令预测
数
浏览 32
提问于2020-10-06
得票数 0
回答已采纳
1
回答
TreeBagger() (MATLAB)和不同数量
的
训练
和测试
集
上
的
变量
、
、
我正在
使用
MATLAB函数TreeBagger()进行随机森林分类,以完成一项任务。当测试
数据
的
变量
数量与
训练
数据
的
变量
数量不同时,它会给出错误。我被告知,
变量
选择应该只在
训练
数据
上进行,而不是在测试
数据
上,这样测试
数据
上就没有偏见。因此,在将初始
数据
集
(50个
变量
)拆分为
训练
集</e
浏览 0
提问于2015-12-20
得票数 1
1
回答
关于
使用
tf.train.shuffle_batch()创建批处理
在中,它给出了关于tf.train.shuffle_batch()
的
以下示例image_batch, label_batchnum_threads=4, min_after_dequeue=10000) 我不太清楚capacity和min_after_dequeue
的
含义这种设置
的
逻辑是什么,或者这意味着什么。如果输入有200张图片和200个标签,会发生什么?
浏览 9
提问于2016-09-02
得票数 17
1
回答
当我
的
CNN没有假阴性时,这意味着什么?
、
、
、
我正在
使用
卷积神经网络对具有二进制标签(0或1)
的
图像
数据
集
进行分类。在
训练
网络时,每个时代最终都有零个假阴性,这是否意味着我
的
网络只是将所有东西都归类为1,而不是费心去匹配0?
数据
集
是不
均匀
的
,但有更多
的
0。对于
训练
集
,0:1
的
比率约为8000:5000,对于验证,比率为700:500。
浏览 19
提问于2020-12-21
得票数 0
1
回答
验证
数据
中缺少类别
、
、
、
我在R中建立了一个基于
训练
数据
集
的
分类模型,其中包含12个分类预测器,每个
变量
包含几十到数百个类别。 问题是,在我用于验证
的
dataset中,一些
变量
的
类别比在培训
数据
中少。例如,如果我在
训练
数据
变量
v1中有三个类别-- 'a','b','c',那么在验证
数据
集中,v1只有两个类别-- 'a
浏览 4
提问于2016-02-16
得票数 2
回答已采纳
1
回答
原因
变量
或变换因
变量
预测性能度量
的
评价
、
、
、
、
我正在建立一个机器学习模型来预测scikit-learn
的
未来价格。因
变量
价格不是正态分布
的
,因此,我将只
使用
price对因
变量
np.log(price)执行日志转换。在此之后,我将把完整
的
数据
集
分成
训练
集
和测试组.因此,y_train和y_test现在都是经过日志转换
的
价格。经过机器学习模型拟合后,对拟合模型进行预测性能指标的计算,如MAPE误差。在对price方法和y_test
集</em
浏览 1
提问于2018-06-27
得票数 2
2
回答
关于不平衡
的
多标签
数据
集
、
、
我在
python
language.The
数据
集中做多标签新闻分类,我有两个文件。第一个CSV包含每一行
的
文章。第二,CSV包含每一篇文章
的
相应标签。以下是标签文件
的
快照这是dropbox链接.https://www.dropbox.com/s/7huzh41je735oqn/labelset.csv?dl=0
数据
集
是否不平衡?如何正确地将此
数据
集
分发到培训
集
浏览 0
提问于2019-06-12
得票数 1
1
回答
NLP API
的
现状(Api.ai,Wit.ai,Luis等)?
、
、
我工作
的
公司需要选择一个可用
的
NLP API供应商。对于POC,我已经集成了Api.Ai,我必须说它工作得很好。控制台UI是平滑和易于
使用
的
。REST也是如此。尽管我还需要检查和比较其他提供者(Luis、Wit.ai等)人们说Wit.ai (Facebook)控
浏览 5
提问于2017-06-12
得票数 2
点击加载更多
相关
资讯
如何用python制作自己的训练数据集
Ansys Lumerical | 采用一维光栅的出瞳扩展器的优化
使用Python构建和评估统计回归模型
机器学习的心腹大患:数据泄漏
基于python建立房价预测模型
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券