腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
不同
规模
的
分层抽样
、
我正在尝试创建一个用于分层采样
的
函数,该函数采用使用faker模块创建
的
数据帧,以及层、样本大小和随机种子。对于样本大小,我希望每个层中
的
样本数量根据用户输入而变化。这是我用于创建数据
的
代码: import pandas as pdimport random as rn#generating random numbers from任何帮助都是非常感谢
的
。
浏览 28
提问于2020-10-04
得票数 0
回答已采纳
2
回答
只读取一次文件进行分层采样
、
、
如果不知道每个子种群(阶层)
的
分布(或大小/概率),也不知道总体
规模
,是否可以只读取一次文件进行
分层抽样
?谢谢。 你好,林
浏览 3
提问于2016-06-07
得票数 1
回答已采纳
1
回答
使用词嵌入从大型语料库中查找概念
、
、
我正在尝试从Konkani语言
的
语料库中发现新
的
概念。我在1)领域特定语料库上训练了两个模型,2)在报纸语料库上。我已经使用Gensim word2vec来训练模型,但是我无法在向量空间中获得具有相似含义
的
术语。我做错了什么?
浏览 1
提问于2016-02-28
得票数 1
1
回答
PySpark比例
分层抽样
"sampleBy“
、
问题:如果您使用PySpark
的
sampleBy实现比例
分层抽样
,这不是与随机抽样相同吗?在PySpark中通过分数
的
sample
浏览 7
提问于2021-10-08
得票数 1
回答已采纳
1
回答
分层抽样
大小因R组
的
不同
而变化
、
我对R相当陌生,现在我被
分层抽样
困住了,当样本大小根据组发生变化时。 样本
的
大小因
不同
的
群体或阶层而异:我采用
分层抽样
,但不知道样本
的
大小。
浏览 3
提问于2017-10-09
得票数 0
回答已采纳
1
回答
理解numpy中
的
分层抽样
、
、
我目前正在完成一本关于机器
的
练习本,学习如何让我
的
脚湿润,这样就可以说是在训练了。目前,我正在研究一个房地产数据集:每个实例都是加州
的
一个区,有几个属性,包括该地区
的
中等收入,其
规模
和上限为15。作者希望根据收入中值进行
分层抽样
。他提供了创建收入类别属性
的
下一段代码。我不明白
的
是 为什么划分每个实例
的
median_income来创建地层在数学上是合理
的
?这一划分
的
结果到底意味着什么?还有其他方法
浏览 3
提问于2019-04-06
得票数 0
1
回答
无k褶皱
分层抽样
、
、
我可以使用
分层抽样
与80%
的
训练20%
的
测试,分裂
的
数据在蟒蛇? 我已经对此进行了调查,这是为了进行九层
分层抽样
。我不确定我是否只是把0作为迭代
的
次数才能工作,因为它是在交叉验证包中实现
的
,并且它们至少假定了2倍!
浏览 8
提问于2015-11-09
得票数 0
回答已采纳
3
回答
在理解一个小例子时需要帮助
、
、
对不起,我同意问题
的
题目不清楚。我想知道以下步骤
的
理解,这些步骤是从教科书“机器学习
的
手”中挑选出来
的
。> 3.0 7236 4.0 3639 1.0 822 2.0 0.318847 5.0 0.114438接下来,
浏览 0
提问于2018-06-03
得票数 1
回答已采纳
1
回答
关于Knn和拆分验证
的
问题
、
、
、
我有一个很大
的
数据库,里面有40k个分类器和2个分类类。在这个大型数据库中,76%
的
记录属于第一类。 我使用了一个70-30分割
的
分层抽样
,K-nn在k= 20上给出了最好
的
精度。( 2)即使我使用
分层抽样
,那么k
的
这么大值是否可能是由于数据库中两个类
的
不均衡造成
的
呢?
浏览 0
提问于2018-05-12
得票数 1
回答已采纳
1
回答
从
不同
的
输入集中获取相同分布
的
数据
、
、
、
我正在尝试创建一个在多个列表之间平均分布
的
训练数据集,每个列表都有
不同
类型
的
数据。我该怎么做?我查看了GroupKMeansFold和StratifiedFold,但我并不完全理解它。a = [a1, a2, a3.... a10000] c = [c1, c2, c3.... c10000] 我希望我
的
训练,测试,和val我还希望70%
的
培训数据在列表a、b、c之间均匀分布,与测试和val数据相同。我希望训练数据有来自a、b和c
的<
浏览 0
提问于2022-07-29
得票数 1
1
回答
数据分区中
的
类标签
、
、
假设将数据划分为训练/验证/测试集,以便进一步应用某种分类算法,而训练集并不包含完整数据集中存在
的
所有类标签--比如一些标签为"x“
的
记录只出现在验证集中,而不是在培训中。 这是有效
的
分区吗?以上结果可能会导致混淆矩阵不再是正方形,而且在算法中我们可能会评估一个错误,这会受到训练集中看不见
的
标签
的
影响。第二个问题是:用训练集具有所有现有标签
的
方式来处理上述问题并对数据进行分区是否是分区算法
的
共同之处?
浏览 2
提问于2013-12-07
得票数 2
回答已采纳
3
回答
如何对多标签多类分类进行
分层抽样
?
、
、
、
我提出这个问题,理由不多:我不知道为什么会出现这个错误。 所以,我想自己去实施
分层抽样
。在此,我需要帮助破译问题
的
原因,并在多标签分类中实施
分层抽样
,以便在培训期间也能很好地适用于个别批次。
浏览 0
提问于2018-06-13
得票数 12
1
回答
如何从数据集中获取保持相同类平衡
的
示例?
、
、
一种是对一两行
的
评论。第二是评级,在0到4之间,条目总数为8533。数据分布情况如下: 现在,我想从这个大小数据集(例如10、20、30等)中获取一个样本
浏览 1
提问于2018-10-24
得票数 0
1
回答
是否有一种“简单”
的
方法来使用h2o.ai创建分层
的
框架分割?
、
分层抽样
是很古老
的
,而且非常重要。 下面是在h2
浏览 6
提问于2019-11-22
得票数 0
1
回答
不同
比例
的
随机
分层抽样
、
我试图分裂
的
位置,这是一个因素与4个水平,但每个水平没有得到平等
的
抽样。在1892年
的
样本中-Location2: 615Location4: 502 如前所述,我正在尝试拆分整个数据集80/20,但我也希望每个位置被拆分为80/20,以便在培训和测试集中从每个位置得到一个均匀
的
比例。我看过一篇关于使用stratified包中
的
splitstackshape函数
的
文章,但是它似乎不想把我
的</e
浏览 2
提问于2016-08-09
得票数 1
回答已采纳
1
回答
分层抽样
变量选择
、
、
我试图在R中进行
分层抽样
,从我
的
数据中抽取样本,其中一个参数是组,它从保持数据集
的
相同初始分布取变量名到样本。 是否将响应作为分组变量包括在内是常见
的
,包括/排除它意味着什么?
浏览 0
提问于2017-11-08
得票数 2
2
回答
蟒蛇前科
分层抽样
、
、
上下文其目标是创建一个函数,使之能够从
分层抽样
中筛选出来,但使用考虑到
的
变量
的
某些比例,而不是原始数据集比例。return df_sampled column:--这是一个用于执行分层sampling.prior_dict:
的
分类变量,它包含按类别划分
的
百分比,在所选
的
variable.df:中,输入dataset.sample_size
浏览 8
提问于2022-09-16
得票数 4
回答已采纳
2
回答
不同
单位
的
规模
、
、
、
如何使用D3转换和显示来自
不同
单元
的
正确信息 所有数据都在mm中。label: 'sample2', x: 1200 }, ] 所以,问题是,我如何创建一个刻度来理解sample3应该是在4之后和5之前
的
同一位置
浏览 1
提问于2017-03-15
得票数 2
回答已采纳
1
回答
不平衡数据
的
分层平衡抽样(机器学习)
、
、
、
我很抱歉我
的
粗心大意。如果需要平衡抽样
的
方法,请访问下面的链接.有各种各样
的
答案。 我需要解决40个班
的
分类问题。数据属于0类,意味着进程
的
正常状态,其余
的
表示异常状态和产生问题
的
位置。 数据由13列和368816行组成。每一行都意味着每个数据集。368816数据集中
的
每个数据集都属于0到40类。但是,这是不平衡
的
。103260类数据集
的
数量为103260
浏览 2
提问于2017-09-21
得票数 0
回答已采纳
2
回答
使用多列
的
PySpark sampleBy
、
、
、
我想从PySpark上
的
数据框架中进行
分层抽样
。有一个sampleBy(col, fractions, seed=None)函数,但它似乎只使用一个列作为一个层。有没有办法使用多列作为一个地层?
浏览 5
提问于2017-05-09
得票数 5
回答已采纳
点击加载更多
相关
资讯
不同阵列规模的DBF计算量对比
DeepSeek手把手教程:聊聊不同规模的DeepSeek本地部署
不同规模建筑企业,如何让数智赋能?
不同规模企业数字化方案有什么区别
不同的环境,不同的营销
热门
标签
更多标签
云服务器
ICP备案
实时音视频
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券