腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
模拟
总体
分布
的
分层抽样
方法
、
、
、
、
我是R
的
新手,我最近对训练和测试分割使用了
分层抽样
,以确保两者
的
目标标签是相等
的
比例。现在我想使用下采样训练数据,以便
总体
分布
/训练
分布
类似于新
的
下采样
分布
。我想要下采样
的
原因是因为我有1100万行和56列,通过网格/随机/贝叶斯搜索进行参数调优需要几天时间如果有人能在这方面帮助我,我将不胜感激。下面是我
的</
浏览 23
提问于2020-03-04
得票数 2
2
回答
只读取一次文件进行分层采样
、
、
如果不知道每个子种群(阶层)
的
分布
(或大小/概率),也不知道
总体
规模,是否可以只读取一次文件进行
分层抽样
?谢谢。 你好,林
浏览 3
提问于2016-06-07
得票数 1
回答已采纳
1
回答
分层抽样
变量选择
、
、
我试图在R中进行
分层抽样
,从我
的
数据中抽取样本,其中一个参数是组,它从保持数据集
的
相同初始
分布
取变量名到样本。 是否将响应作为分组变量包括在内是常见
的
,包括/排除它意味着什么?
浏览 0
提问于2017-11-08
得票数 2
3
回答
在理解一个小例子时需要帮助
、
、
对不起,我同意问题
的
题目不清楚。我想知道以下步骤
的
理解,这些步骤是从教科书“机器学习
的
手”中挑选出来
的
。> 3.0 7236 4.0 3639 1.0 822 2.0 0.318847 5.0 0.114438接下来,
浏览 0
提问于2018-06-03
得票数 1
回答已采纳
1
回答
生成不涉及指数
的
排序随机数?
、
、
、
、
我正在寻找一个数学方程或算法,它可以在0,1
的
范围内,不借助除法,按升序产生均匀
的
随机数。我热衷于跳过除法操作,因为我正在硬件中实现它。谢谢。
浏览 2
提问于2013-11-09
得票数 2
回答已采纳
1
回答
在机器学习中,使用
分层抽样
来选择测试集数据有什么意义?
、
我目前正在学习机器学习,通过这本书“用Sci-kit学习和Tensorflow进行
的
手工机器学习”,由Aurelien著。在第76和77页,作者谈到使用
分层抽样
,以便您
的
测试集将更有代表性
的
整个数据。我真的不明白这一点,因为它不会影响你
的
训练模式
的
准确性?或者,选择更好
的
测试集将如何影响您
的
培训模型
的
准确性?
浏览 0
提问于2019-02-06
得票数 2
回答已采纳
2
回答
蟒蛇前科
分层抽样
、
、
上下文其目标是创建一个函数,使之能够从
分层抽样
中筛选出来,但使用考虑到
的
变量
的
某些比例,而不是原始数据集比例。return df_sampled column:--这是一个用于执行分层sampling.prior_dict:
的
分类变量,它包含按类别划分
的
百分比,在所选
的
variable.df:中,输入dataset.sa
浏览 8
提问于2022-09-16
得票数 4
回答已采纳
1
回答
由bootstrap
方法
得到
的
经验
分布
计算置信区间
、
、
我已经使用bootstrap
方法
计算了样本均值
的
经验
分布
,但现在我还需要使用我找到
的
经验
分布
来计算
总体
均值
的
置信区间。 在给定我
的
状态
的
情况下,有没有办法在Matlab中自动完成?如果不是,你如何找到
总体
均值
的
95%置信区间?
浏览 0
提问于2015-12-16
得票数 2
1
回答
R中简单蒙特卡罗积分
的
错误结果
、
、
、
我是关于数值积分
的
演讲
的
一部分。虽然讨论本身将进入更好
的
数值积分形式(主要是重要抽样和
分层抽样
),但我在我
的
部分章节中提到,蒙特卡罗积分抽样来自均匀
分布
。我发现:是给出了0.636597
的
答案,而不是预期
的
1。这个答案似乎与增加样本数量相当一致,我不知道为什么会有这么多
的
错误。其他计算,例如:给0.00053
浏览 2
提问于2016-12-05
得票数 2
回答已采纳
2
回答
如何在R中将
总体
分布
箱图与分组箱图放在一起
、
要根据一个组制作列"xcolumn“
的
多个箱图,我可以简单地这样做: boxplot(xcolumn ~ group, data = df) 并绘制
总体
分布
: boxplot(df$xcolumn)但是,是否可以将xcolumn
的
总体
分布
与分组
的
boxplot放在同一个图中?我希望将
总体
分布
作为第一个箱图,然后是每个组
的
箱图。
浏览 53
提问于2019-06-12
得票数 0
回答已采纳
1
回答
为什么我
的
分类器无法学习正类?
、
我目前正在执行分类,但我
的
分类器无法预测测试集上
的
阳性类。 正负
分布
是10:90。我使用
分层抽样
进行了5折交叉验证,结果似乎在所有折叠中都是连续
的
,而在测试中它预测所有类别都是阳性
的
。= cross_val_score(clf1, X, y, cv=skf.split(X, y), scoring='roc_auc')scores 相同
的
输出是0.6286471235534742 array([0.6295
浏览 16
提问于2019-04-23
得票数 1
1
回答
R中不同周转度物种丰度
的
模拟
数据集
、
我正在使用一个数据集,其中包含了100+物种在50+地点
的
丰富程度,超过20+时间点。我要
模拟
具有不同程度
的
群落周转量
的
等价数据集,即丰富
的
物种,保持丰富
的
/稀有的,稀有的我见过有人提到使用引导重采样
模拟
技术,其中可以根据两个组合中存在
的
所有物种
的
比例来指定“模板”和
模拟
数据集之间
的
期望差异我想知道这是否是获得所需
的
模拟
数据集
的
最佳<e
浏览 0
提问于2016-10-14
得票数 0
回答已采纳
1
回答
真正
的
误差和样本误差是什么?
我
的
重点是评估低渗
的
概念。error_D(h)=Pr_{x\in D}[f(x)\neq h(x)]error_S(h)=\frac{1}{n}\sum _{x\in S}
浏览 0
提问于2020-08-01
得票数 1
回答已采纳
1
回答
PySpark比例
分层抽样
"sampleBy“
、
问题:如果您使用PySpark
的
sampleBy实现比例
分层抽样
,这不是与随机抽样相同吗?在PySpark中通过分数
的
sampleBy
方法
实现比例
分层抽样
是很自然
的
。但是,这种
方法
是通过Bernoulli试验(硬币翻转)来实现
的
。对于
分层
浏览 7
提问于2021-10-08
得票数 1
回答已采纳
1
回答
R中对数正态
分布
Mu
的
置信区间
、
、
、
假设我们有一个大小为n=8
的
随机样本,样本
的
对数正态
分布
参数是mu和σ。由于它是一个小样本,从一个非正常
的
总体
,我将使用t置信区间。我进行了一个
模拟
,以确定90% t
的
真实(
模拟
) CI,其中mu=1和sigma= 1.5。 我
的
问题是,下面的代码遵循正态
分布
,它需要一个对数正态
分布
。我知道rnorm必须变成rlnorm,这样随机变量就来自于日志
分布
。但我需要改变穆和西格玛是什么。
浏览 3
提问于2014-02-18
得票数 0
2
回答
半球分层余弦加权样本
的
生成
、
、
、
我
的
应用程序是在光映射器中收集间接样本。
浏览 0
提问于2017-02-09
得票数 3
回答已采纳
1
回答
从概念上理解
模拟
退火
我刚刚被介绍到
模拟
退火,并希望更好地理解它,然后再深入研究代码,因为我觉得我不完全理解它,尽管我阅读了代码从我到目前为止
的
资源。因此,请随时纠正我目前对算法
的
理解:
模拟
退火算法
的
总体
目标是根据预先定义
的
计算
方法
(如TSP中
的
旅行距离或生物信息学中
的
密码子对
分布
)来达到最小(或最大)分数。然而,为了避免陷入局部最优状态,可以接受暂时较低(或更高)
的
分数,以获得更好
的</em
浏览 0
提问于2011-03-23
得票数 1
回答已采纳
1
回答
不平衡数据
的
分层平衡抽样(机器学习)
、
、
、
我很抱歉我
的
粗心大意。如果需要平衡抽样
的
方法
,请访问下面的链接.有各种各样
的
答案。 我需要解决40个班
的
分类问题。数据属于0类,意味着进程
的
正常状态,其余
的
表示异常状态和产生问题
的
位置。 数据由13列和368816行组成。每一行都意味着每个数据集。368816数据集中
的
每个数据集都属于0到40类。但是,这是不平衡
的
。103260类数据集
的
浏览 2
提问于2017-09-21
得票数 0
回答已采纳
2
回答
什么时候用t
分布
代替正态
分布
?
、
根据学生t
分布
wiki
的
文章,t
分布
被用来代替正态
分布
,“在样本规模小且
总体
标准差未知
的
情况下,估计正态
分布
种群
的
平均值”。一个未知
的
总体
标准差意味着它将不得不从样本本身估计,这是不准确
的
,与小样本
的
大小。根据Z-试验 wiki
的
文章,样本大小>= 30意味着使用正态
分布
,样本大小< 30意味着使用t
分布
。(T检验
浏览 0
提问于2019-11-10
得票数 2
1
回答
模拟
t -distributions -随机样本
我是新
的
模拟
演习在R,我想创建1000个样本大小25从t
分布
与自由度10。singlevector <- rt(5000, 10),它从大小为5000
的
t
分布
中生成数据,df = 10。因此,我将把它作为我
的
总体
,然后从它中取样。或者,我应该创建我
的
1000个样本调用这个随机
的
t生成器每次? 换句话说,创建一个包含25行和1000列
浏览 4
提问于2016-11-23
得票数 3
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
【考点92】抽样方法
PLC梯形图的总体分析和具体解读方法
考前必看:A-level数学常考知识点随机抽样方法大揭秘!
论文检测网址:教你如何降AIGC总体疑似度的方法
CorelDRAW找到分布面板的方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券