腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
0
回答
使用
随机
森林
时
的
时间
加权
样本
random-forest
我想知道是否有按
时间
对
随机
森林
的
训练
样本
进行指数
加权
的
最佳实践(对较新
的
样本
赋予更多权重)?我能想到
的
一种方法是根据给定
时间
的
权重对整个数据集进行采样和替换。有没有其他我应该考虑
的
方法?任何帮助都是非常感谢
的
!
浏览 2
提问于2018-07-18
得票数 1
回答已采纳
1
回答
sampsize和classwt
随机
森林
之间
的
差异
r
、
random-forest
有人能在R包
的
随机
森林
部分解释一下sampsize和classwt
的
区别吗?这两个参数之间有什么关系(假设问题是一个分类问题) 谢谢
浏览 1
提问于2015-05-14
得票数 3
1
回答
通过增加更多
的
单决策树,在线
随机
森林
random-forest
、
online-learning
随机
森林
(RF)是由决策树
的
集合(DT)产生
的
。通过
使用
套袋,每个DT被训练成一个不同
的
数据子集。因此,是否可以通过对新数据增加更多
的
决策树来实现在线
随机
森林
?例如,我们有10K
样本
,训练10DT
样本
,然后得到1K
样本
,而不是重新训练完全RF,我们添加了一个新DT。现在用10+1 DT
的
贝叶斯平均进行预测。此外,如果我们保留所有以前
的
数据,新<e
浏览 0
提问于2014-10-20
得票数 15
2
回答
如何平衡某个类
的
样本
数量非常多
的
训练数据集?
machine-learning
、
dataset
、
scikit-learn
、
random-forest
、
sampling
我一直在
使用
烂番茄电影评论数据集进行情绪分析预测。数据集具有5个类别{0,1,2,3,4},其中0是非常负
的
,而4是非常正
的
。数据集是高度不平衡
的
,'0': 7072 (4.5%), '1': 27273 (17.4%), '2': 79583 (50.9%), '3': 32927(21%), '4': 9206 (5.8%) 如你所见,2类有近50%
的
浏览 5
提问于2014-11-19
得票数 1
2
回答
随机
森林
技术/模型
machine-learning
、
data-mining
、
random-forest
、
machine-learning-model
、
self-study
有人能知道
随机
森林
的
不同技术/算法吗?我知道,
随机
森林
本身就是一个算法/模型,但我正在寻找它
的
另一个版本,就像我们在决策树中一样。基于
随机
森林
的
算法列表?谢谢
浏览 0
提问于2019-04-24
得票数 1
3
回答
渐进
随机
森林
?
machine-learning
、
classification
、
random-forest
我正在考虑
使用
随机
森林
来解决分类问题。数据是按顺序来
的
。我计划
使用
前N(500)来训练分类器。然后,
使用
分类器对数据进行分类。它会犯错误,错误有时可以被记录下来。我
的
问题是:我可以
使用
这些错误分类
的
数据来重新训练原始分类器吗?如果我简单地将错误分类
的
样本
添加到大小为N
的
原始训练集中,那么错误分类
样本
的
重要性将被夸大,因为更正后
的
浏览 1
提问于2013-07-08
得票数 1
2
回答
如何在RandomForest实现中对类进行
加权
?
scikit-learn
、
random-forest
据我所知,只对某些整体
样本
进行
加权
(假设我有50个正在训练
的
文件,第一个
样本
的
权重是其他所有
样本
的
两倍),而不是类。我找到了一些关于平衡
随机
森林
和
加权
随机
森林
的
论文。但是我还没有看到任何关于如何在scikit中
浏览 2
提问于2013-07-17
得票数 7
2
回答
random.sample
的
时间
复杂度
python
、
time-complexity
在另一个线程中,我看到二进制堆
加权
随机
样本
的
时间
复杂度等于O(n * log(m)),其中n是选择
的
数量,m是要选择
的
节点
的
数量。我想知道一个未
加权
的
随机
样本
的
时间
复杂度,它被Python用作random.sample。
时间
复杂度是简单
的
O(n),还是完全不同?
浏览 5
提问于2012-05-07
得票数 11
回答已采纳
1
回答
随机
森林
算法中
随机
状态参数
的
重要性是什么?
python-3.x
、
machine-learning
、
random-forest
随机
森林
有几个参数,其中一个是
随机
状态。我不知道它是做什么
的
,以及它对RF算法有多重要。
浏览 61
提问于2019-06-25
得票数 1
1
回答
随机
森林
中
的
out - of - bag错误是什么?
language-agnostic
、
machine-learning
、
classification
、
random-forest
随机
森林
中
的
out - of - bag错误是什么?它是在
随机
森林
中找到正确数量
的
树
的
最佳参数吗?
浏览 1
提问于2013-08-31
得票数 71
回答已采纳
1
回答
元
随机
森林
分类器是如何确定最终分类
的
?
machine-learning
、
classification
、
random-forest
我正试图确切地了解元
随机
森林
分类器是如何确定最终预测
的
,我知道存在一个投票系统,并且
使用
决策树
的
聚合来找到最终
的
预测,我从这里读到:Python中
的
随机
森林
分类:我阅读了RFC源代码:合奏/
森林
: 输
浏览 0
提问于2019-04-30
得票数 5
回答已采纳
2
回答
scikit学习中节点
的
重要性
scikit-learn
、
feature-importances
我正试图确切地理解feature_importances在scikit-learn
的
RandomForestClassifier中是如何工作
的
。关于ni_j
的
方程,我有两个问题(节点重要性方程,第一个方程在特性重要性一节中):我们能从数学上确定ni_j >= 0吗?,然后取所有树
的<
浏览 0
提问于2021-05-04
得票数 2
1
回答
Python中rpart.plot
的
等价物是什么?我想要可视化我
的
随机
森林
的
结果
python
、
scikit-learn
、
visualization
、
random-forest
、
decision-tree
在[R]中,你可以像这样可视化你
的
随机
森林
的
结果(无耻地从互联网上窃取图像)。Python中
的
等价物是什么?我可以
使用
feature_importances_获得我
的
sklearn
随机
森林
分类
的
结果,但我想知道他们将结果发送到哪个方向。我意识到,对于一个深
森林
,我不能检查每一个分支,但也许它可以
加权
概率?
浏览 10
提问于2015-06-18
得票数 4
1
回答
欠采样与class_weight在ScikitLearn
随机
林中
的
应用
python
、
scikit-learn
、
random-forest
我正在一个极不平衡
的
数据集( 1:10 000
的
比例)上应用ScikitLearn
的
随机
森林
。我可以
使用
类_weigth=‘balanced’参数。我看过,这相当于抽样过少。然而,这种方法似乎适用于
样本
的
权重,不改变实际
的
样本
数。 由于
随机
森林
的
每一棵树都是建立在训练集
的
随机
抽取子
样本
上
的
,所
浏览 4
提问于2017-04-14
得票数 3
回答已采纳
1
回答
随机
森林
:平衡测试集?
python
、
random-forest
、
imblearn
我试图在一个不平衡
的
数据集中运行一个
随机
森林
分类器(~1:4)。我
使用
imblearn
的
方法如下:rf.fit(train_features,train_labels) 在培训和测试集中
浏览 0
提问于2019-02-27
得票数 0
回答已采纳
1
回答
R中
使用
H2O
的
平衡
随机
森林
r
、
random-forest
、
h2o
、
multiclass-classification
由于我目前正在研究一个高度不平衡
的
多类分类问题,我正在考虑平衡
随机
森林
()。您是否有
使用
H2O实现平衡
随机
森林
的
经验?若有,可否请你详述以下问题: 是否有可能改变在H2O中创建引导
样本
的
默认过程,以得出平衡子
样本
(对于
随机
森林
中
的
每次迭代,从少数类中提取一个引导
样本
。从大多数类中
随机
抽取相同数量
的
案例(通过替换
浏览 16
提问于2018-08-23
得票数 0
2
回答
是否有可能从类概率中学习分类器(在sklearn中)
machine-learning
、
scikit-learn
我有(多类)培训数据,其中
的
课程是通过聚合手工标记
的
数据来学习
的
,因此一些行
的
值将为0、0、0、0.4、0.6。是否可以直接将其用作分类器
的
训练数据。我知道这应该是可能
的
逻辑回归,但似乎没有api支持它。(此外,我更喜欢
使用
比这更好
的
分类器。)
浏览 3
提问于2013-10-29
得票数 0
回答已采纳
3
回答
scikit中
的
样本
权重-在交叉验证中学习失败
python
、
machine-learning
、
scikit-learn
在训练
随机
森林
分类器
时
,我一直在尝试
使用
scikit-learn中
的
加权
样本
。当我直接将
样本
权重传递给分类器
时
,它工作得很好,例如RandomForestClassifier().fit(X,y,sample_weight=weights),但当我尝试网格搜索为分类器找到更好
的
超参数
时
,我遇到了麻烦:grid_sear
浏览 1
提问于2014-02-20
得票数 16
4
回答
学习
随机
森林
分类器能按树调整
样本
大小,处理类不平衡吗?
python
、
r
、
scikit-learn
、
classification
、
random-forest
关于滑雪板
随机
森林
的
简单问题: 在
随机
森林
的
R实现(称为randomForest )中,有一个选项sampsize()。这允许您根据结果来平衡用于训练每棵树
的
样本
。例如,如果
浏览 2
提问于2013-11-27
得票数 6
回答已采纳
2
回答
你能解释一个支持向量机
的
输出概率吗?
machine-learning
我正在尝试
使用
不同
的
分类算法,比如
随机
森林
,支持向量机,AdaBoost来构建一个二进制分类系统。我想
使用
这些分类器
的
输出来可视化一个分数。例如,在
使用
随机
森林
时
,我想
使用
属于A类
的
样本
的
概率来构建一个从0到100
的
分数。假设
随机
森林
输出一个概率(从0到1),
使用
它,因为得分
浏览 0
提问于2016-12-07
得票数 5
回答已采纳
点击加载更多
相关
资讯
九道门丨如何使用随机森林进行时间序列预测?
使用TwoSampleMR进行两样本的孟德尔随机化研究
机器学习之集成学习基础
随机森林
随机森林算法介绍
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券