腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
改变
randomForest
R
代码
中
节点
特征
子集
选择
的
采样
方法
、
、
、
我正在开发"
randomForest
“
R
包,以更改森林中树
节点
上
特征
子集
选择
的
采样
方法
。目前,随机森林使用简单
的
随机
采样
来实现这一点。我尝试使用以下命令查看
R
代码
getAnywhere(
randomForest
.default) 但是找不到
选择
了"mtry“
浏览 12
提问于2017-07-26
得票数 1
回答已采纳
3
回答
如何在
R
中使用包装器
特征
选择
算法?
、
、
我有几种算法: rpart,kNN,logistic回归,
randomForest
,朴素贝叶斯和支持向量机。我想使用前向/后向和遗传算法
选择
来找到用于特定算法
的
最佳
特征
子集
。我如何在
R
中
实现包装器类型
的
向前/向后和
特征
的
遗传
选择
?
浏览 2
提问于2016-04-20
得票数 1
1
回答
在scikit-learn
中
如何控制随机森林中
的
特征
子集
?
、
、
我正在尝试
改变
随机森林算法在为每个
节点
设置
特征
时所使用
的
方式。在Scikit-learn方式
中
实现
的
原始算法是随机
子集
。我想从几个
子集
的
几个选项
中
为每个新
节点
定义哪个
子集
。有没有直接
的
方法
来控制这样
的
方法
呢?如果没有,有没有办法更新Scikit-learn
的
相同
代码
?如果是,
浏览 0
提问于2015-07-02
得票数 2
1
回答
从
R
中
的
ggplot
中
过滤geom_lines?
、
我有一个绘图,显示了多次绘制
的
geom_line。下面显示了一个玩具示例。我想知道是否有可能从ggplot
中
过滤掉其中
的
一些行。我已经尝试在绘制之前对数据进行
子集
设置,但因为我试图绘制
的
(即下面
代码
中
的
ice1 )是一个奇怪
的
R
6对象,所以我不确定如何对其进行
子集
或
采样
。并且我不能从主数据集(在本例
中
是波士顿数据)中提取
子集
。 基本上,我试图找出
浏览 32
提问于2020-11-11
得票数 0
1
回答
R
随机森林:当要素表
中
的
列顺序发生变化时,OOB错误率会发生变化
、
我对
RandomForest
的
以下“行为”感到困惑,并想知道其他用户是否也经历过这种情况--以及我可以做些什么来避免这种情况:在其他条件相同
的
情况下(并且使用相同
的
OOB值),
randomForest
模型
的
结果(例如,它对错误率
的
OOB值估计)只能通过
改变
数据表
的
特征
(=列)
的
顺序来
改变
。在以下
代码
中
,i 1)运行
randomForest
浏览 48
提问于2020-04-27
得票数 1
1
回答
随机森林分类weka
、
、
属性已保存在csv文件
中
的
11列
中
。如果列
的
顺序
改变
,
Randomforest
& RandomTree是否可以在每个时间给出不同
的
精度?
浏览 1
提问于2013-09-18
得票数 0
1
回答
学习随机森林以查找所选要素
的
分数
、
、
、
我正在尝试理解每个
选择
的
特征
所获得
的
相关分数。
浏览 17
提问于2020-05-05
得票数 1
3
回答
特征
选择
是否可能保留相关
特征
?
、
、
、
、
我
的
目标是找到区分两个类
的
最重要
的
特性。使用多种特性
选择
方法
中
的
一种来实现这一点是有意义
的
。通常,
特征
选择
的
目标是消除这些冗余
的
特征
。因此,如果一组相关特性对类变量具有很强
的
预测能力,我希望它们都被确认为重要。(额外
的
问题是:如果我在我
的
浏览 3
提问于2017-03-22
得票数 1
8
回答
R
中
的
随机森林(y
中
的
空类和参数legth 0)
、
我第一次与随机森林打交道,我遇到了一些我无法解决
的
问题..当我对我
的
所有数据集(大约3000行)运行分析时,我没有得到任何错误消息。但是当我在我
的
数据集
的
一个
子集
(大约300行)上执行相同
的
分析时,我得到一个错误:names(dataset2) data.rforest <-
randomForest
(da
浏览 0
提问于2012-11-21
得票数 14
1
回答
使用
R
语言进行机器学习
特征
选择
①?
、
、
、
、
“自动
特征
选择
用于构建不同
子集
的
许多模型,识别哪些
特征
有助于构建准确模型,哪些
特征
没什么帮助。
特征
选择
的
一个流行
的
自动
方法
称为 递归
特征
消除(Recursive Feature Elimination)或RFE。 下例在Pima Indians Diabetes数据集上提供RFE
方法
例子。随机森林算法用于每一轮迭代
中
评估模型
的
浏览 709
提问于2020-09-03
1
回答
对一组
特征
向量进行
采样
,以获得每个
特征
的
“统一”直方图。
、
、
、
我有一个m向量(样本)
的
n个值(
特征
)
的
矩阵,其中m~ 10^6,n= 20,所有
特征
的
值都在0,1。 如果我计算每个
特征
的
直方图,它们是完全不同
的
。我计算了一个简单
的
10桶直方图,我可以看到,对于一些直方图,只有几个桶(甚至两个)包含所有样本,一些是倾斜高斯
的
,另一些是近似均匀
的
。我想对这些向量
中
的
一个
子集
进行
采样
,以便对所有
浏览 1
提问于2016-11-02
得票数 1
回答已采纳
1
回答
Spark MLLib如何在训练分类器时忽略
特征
、
、
我想仅使用每个LabeledPoint
中
的
特征
子集
在RDDLabeledPoint上训练分类器(这两个都是为了快速调整模型,并在每个LabeledPoint
中
包括不属于
特征
的
项,如I或评估指标)。我已经搜索了文档,但找不到一种
方法
来指定应该包括或忽略哪些列。
代码
如下,我使用
的
是Spark和MLLib 1.3.1,Scala2.10.4。如果不可能排除特定
的
特征
,那么在训练过程<em
浏览 1
提问于2015-06-10
得票数 3
1
回答
R
:在
randomForest
()调用中将foreach()与sample()过程一起使用
、
、
、
我有一个大
的
数据帧(~700n x 36000 p),并计划在
R
中进行
randomForest
分析。(子
采样
包括两个步骤:通过首先对行进行
采样
来创建平衡
的
数据集(在结果类上)(此部分有效),然后
选择
列
的
子集
。)期望
的
结果仍然是dim(p+3,Nrun)
的
数据帧,但每列将仅包含在该列表示
的
运行
中
随机
选择
的
变量
的
结
浏览 2
提问于2015-01-01
得票数 0
1
回答
randomForestSRC抽样方案
、
我正在使用
R
中
的
randomForest
包对不平衡数据进行建模。结果是一个二元变量,结果(no,yes)
的
相对频率为(2249(88% ),318 (12%) )。我
改变
了RF
中
的
采样
设计,强制使用所有318个yes结果和318个no结果,使用以下
代码
从可能
的
2249
中
随机
采样
。OOB错误率变为合理
的
44%为否,12%为是。rf1 <- <
浏览 0
提问于2017-11-06
得票数 2
1
回答
如何理解RandomForestExplainer输出(
R
包)
、
、
我有下面的
代码
,它基本上尝试使用Species从iris数据
中
预测。我真正介入
的
是找出解释物种分类
的
最佳
特征
(变量)。我发现包装是最好
的
服务目的。library(
randomForest
)forest <-
randomForest
::
randomForest
(Species ~ .forest) randomForestExplainer::plot_multi_
浏览 0
提问于2018-04-19
得票数 12
回答已采纳
2
回答
R
中
的
随机子空间法
、
、
对于如何实现(Ho,1998)在
R
中
描述
的
“随机子空间法”(一种集成
方法
),有什么想法吗?找不到包裹 何天锦(1998年)。"“。模式分析和机器智能
的
IEEE事务。
浏览 1
提问于2019-09-25
得票数 0
4
回答
如何提高
randomForest
性能?
、
、
我有一个38 MB大小
的
训练集(包含420000行
的
12个属性)。我正在运行下面的
R
片段,使用
randomForest
来训练模型。这对我来说需要几个小时。rf.model <-
randomForest
( data=newdata,有人能告诉我怎样才能提高我
的
表现吗?我
的</em
浏览 2
提问于2014-04-15
得票数 19
回答已采纳
1
回答
随机森林中树
中
每个结点变量
的
随机选取
、
、
在随机森林
方法
中
,对于每棵树,我们随机
选择
一组固定大小
的
变量(
特征
)。但是,一旦为该特定树冻结了该集合,该树
的
行为是否与常规决策树算法类似?我假设随机森林只是生成一堆经典
的
“决策树”,并将它们
的
投票推向最终
的
分类。真的是这样吗? 这是否意味着在树
中
的
每个
节点
,我们从为该树固定
的
变量集中随机
选择
m个变量?还是来自训练数据集
的
全局变
浏览 1
提问于2017-04-08
得票数 1
3
回答
去除噪声和冗余
特征
、
、
、
、
我已经从视频序列中提取了基于面部标记
的
特征
,作为这些标记在视频序列上
的
均值和标准差。需要根据这些标记将它们分为四个不同
的
类别。 总而言之,我有一个大约260个
特征
的
特征
集。我应该如何确定我
的
集合
中
哪些
特征
是嘈杂和冗余
的
。我在一些研究论文中读到了这一点,其中一些使用了我发现非常合适
的
加l取走
r
算法,但在这样
的
算法
中
,他们总是将一个
浏览 6
提问于2013-10-24
得票数 1
3
回答
weka对轮换森林
方法
中
的
分类属性做了什么?
、
我
的
期望是忽略分类属性,但是当我使用整个数据集进行分类时和从数据集中删除分类属性时,性能结果是不同
的
。 weka对轮换森林
方法
中
的
分类属性做了什么?
浏览 4
提问于2015-04-24
得票数 0
点击加载更多
相关
资讯
深入机器学习系列7-Random Forest
应用于地物识别的改进轮转森林算法-莱森光学
CVPR 2018文章解读——腾讯AI Lab
小白学R 第二十五课
可能没有你想象的那么复杂!
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
云直播
活动推荐
运营活动
广告
关闭
领券