腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
使用
套索
进行
R
特征
选择
、
、
我有一个很小的数据集(37个观察值x 23个
特征
),并希望
使用
套索
回归
进行
特征
选择
,以降低其维度。
浏览 27
提问于2020-11-03
得票数 1
回答已采纳
1
回答
从
特征
集中
选择
集成
特征
、
、
、
我有一个关于集合
特征
选择
的问题。 我的数据集由1,000个样本和大约30000个
特征
组成,它们被分类为标签A或标签B。我想做的是挑选一些可以有效地对标签
进行
分类的
特征
。我
使用
了三种方法,单变量方法(皮尔逊系数),
套索
回归和SVM-RFE(递归
特征
消除),所以我从它们中得到了三个
特征
集。我
使用
python scikit-learn
进行
特性
选择
。然后我在考虑集成
特征
<
浏览 2
提问于2015-12-11
得票数 3
1
回答
套索
特征
选择
结果和最佳
特征
的
选择
、
、
、
、
现在我将
套索
应用于
特征
选择
,并且
特征
回归系数的结果混合在(负/正/零)值之间。 我知道“任何具有非零回归系数的
特征
都是由
套索
算法
选择
的”。这是否意味着我可以
使用
所有正值和负值,并仅针对“值”对其
进行
排序,而忽略其正值或负值? (只关心其大小,而不管其方向)! 请回答我,如果你可以为我推荐任何有关这方面的简单文件,附加它或设置它的名称…
浏览 18
提问于2021-05-04
得票数 0
1
回答
基于L1正则化的LogisticRegression
特征
选择
、
、
我
使用
的LogisticRegression与penaly=l1 (
套索
正则化,而不是脊正则化l2)。Lasso使优化函数通过将部分
特征
权重设置为零(而不是脊线正则化,即保留一些非零权重的
特征
)来
进行
隐式
特征
选择
。是否有可能以某种方式从滑雪板中提取这种权重信息(
特征
选择
)?
浏览 0
提问于2016-09-24
得票数 1
1
回答
选择
Lasso系数非零的数据帧的列
、
、
、
、
我用scikit和pandas的数据集做了
套索
回归。我想试着使OLS适合
套索
选择
的
特征
。LassoCV(alphas = [1, 0.1, 0.001, 0.0005]).fit(X_train, y_train) 和 lassomodel.coef_ 我想要得到数据帧或numpy数组,其中包含
套索
系数不等于零的所有
特征
浏览 10
提问于2020-06-11
得票数 1
回答已采纳
1
回答
哪种方法是更好的拉索回归或顺序Foward
选择
?
、
、
考虑到
特征
之间的相关性,为了
选择
最优的Lasso回归或序列正向
选择
特征
(因为
特征
变换会转换无法解释的
特征
,所以不能对
特征
进行
pca )。 我所理解的事情很少:
套索
非常快,顺序前进的
选择
也非常缓慢。但我不确定lasso在相关
特征
下如何表现,即我认为权重可能分布在相关的
特征
(假设必要的
特征
)之间,而且由于共享Lasso而权重较低,可能表明它们是不相关的
特征</
浏览 0
提问于2016-11-07
得票数 3
1
回答
正交匹配追踪回归-我用错了吗?
、
、
、
、
我尝试这种方法作为正则回归,作为
套索
和弹性网的替代。我有40k个数据点和40个
特征
。
套索
选择
5个
特征
,正交匹配追求只
选择
1个。 是什么导致了这一切?我是不是用错了omp?也许它并不是用来作为一种回归。
浏览 0
提问于2016-03-29
得票数 4
回答已采纳
2
回答
在应用Lasso之前,应该省略高度相关的
特征
吗?
、
、
、
、
如果您能让我知道在
使用
Lasso logistic回归(L1)
进行
特征
选择
之前是否应该省略高度相关的特性,我将非常感激。真的,我在Raschka先生的书“(Python机器学习”中读到 正则化是处理共线性(
特征
间高度相关)的一种非常有用的方法。然而,这个内核 (通过引用维基百科)指出,保持模型中的相关特性会对
特征</
浏览 0
提问于2018-08-20
得票数 1
1
回答
套索
-在scikit坐标下降中
选择
初始点
、
、
我的问题在scikit中的Lasso上是相当普遍的:或者,也许我在scikit中遗漏了一个明显的选项来
选择
起点?
浏览 0
提问于2014-10-01
得票数 5
1
回答
我应该如何在
R
中
选择
逻辑回归的
特征
?
、
、
我尝试了几种方法为
R
中的逻辑回归
选择
预测因子。我
使用
套索
逻辑回归来消除不相关的
特征
,将它们的数量从60个减少到24个,然后在我的stepAIC逻辑回归中
使用
这24个变量,之后我进一步削减了1个变量,p值约为0.1。我还可以或应该
使用
哪些其他
特征
选择
方法?我试图寻找方差相关系数分析,但我没有找到
R
的任何示例,我认为在这种情况下我不能
使用
相关热图,因为我的输出是分类的?
浏览 1
提问于2021-03-11
得票数 0
1
回答
为什么
套索
不能
进行
特征
选择
?
、
、
、
我在一个只有15个
特征
试图预测二进制结果的数据集上拟合逻辑拉索。我知道LASSO应该做
特征
选择
和消除不重要的
特征
(系数= 0),但在我的分析中,它已经
选择
了所有的
特征
,而没有消除其中的任何一个。我的问题是: 这是因为我的
特征
太少,或者
特征
之间没有关联(对于分类模型来说,低co-linearity?)Is是一件坏事还是好事?所选的
特征
系数小于0.1,我能把它们解释为对模型不重要或不重要吗?附注:我
使用
python中的s
浏览 2
提问于2021-12-15
得票数 0
1
回答
交叉验证Lasso回归
、
、
、
、
我目前正在
使用
套索
进行
特征
选择
。首先,我执行10倍交叉验证,以找到收缩参数最低的MSE。我现在尝试计算训练集的MSE,但是这个值不符合cv-图。下面的公式据说提供了
套索
的均方误差,但为什么两者的数值不相同?准确地说,我
使用
相同的数据集
进行
交叉验证和计算MSE。 cv$cvm[cv$lambda == cv$lambda.min]
浏览 5
提问于2017-06-10
得票数 0
回答已采纳
1
回答
pandas apply min函数中数据帧中的
选择
列
、
、
、
我在每个数据帧中有100列,我想
选择
(不同数据帧的)列的组合,我的模型的得分中的X_train比最小值。有没有一些库可以
选择
这个列(神经元网络,遗传算法,蚁群,...)? 我如何实现它?
浏览 11
提问于2018-08-17
得票数 0
1
回答
用于股票预测的
特征
提取
、
、
、
我正在寻找要从数据中提取的
特征
,以便创建模型。有什么想法吗?
浏览 3
提问于2020-07-29
得票数 0
1
回答
我需要帮助来应用引导程序
、
我已经应用了
套索
和岭回归,找到了最优的λ,并重新构建了模型。但我不明白在那之后我该做什么。“。对于糖尿病数据集(上传到Moodle),我们希望
使用
10个
特征
(X变量)来预测prog (Y),这是基线后一年疾病进展的定量评估。变量prog是数据中的最后一列。在拟合岭回归和
套索
之前,不要忘记标准化所有的X变量,使它们在相同的尺度上。
使用
岭回归和
套索
预测程序。在两个回归中,
使用
交叉验证
选择
最优的λ。最优λ将对应于最小CV误差。对于最优的lambda
浏览 2
提问于2021-11-26
得票数 0
1
回答
回归用高基数分类
特征
的
特征
重要性(数值退化变量)
、
、
、
、
我试图利用随机森林的
特征
输入来对一个回归问题
进行
一些经验的
特征
选择
,其中所有的
特征
都是分类的,而且很多
特征
都有很多级别(大约在100到1000之间)。我知道团体
套索
,找不到任何容易
使用
的科学知识-学习。
浏览 0
提问于2017-04-05
得票数 12
回答已采纳
2
回答
群
套索
与
特征
选择
、
、
我将分类变量转换为虚拟变量,因为我的观察结果比我想要执行的特性
选择
的变量少得多。因为我把分类变量转换成虚拟变量,所以我知道我不能
使用
简单的lasso,因为它会删除部分虚拟变量。我还发现了群
套索
,它做稀疏群
套索
,并支持逻辑回归。据我所知,稀疏
套索
是组合
套索
和
套索
的组合。我尝试将它与参数值一起
使用
到group_reg=0,或者l1_reg=0跳转,即它只用于群
套索
,但在这两种情况下,它都会不断地降低部分虚拟变量。 我的问题是。如何在pyt
浏览 0
提问于2022-08-17
得票数 1
1
回答
在同一列车数据集上重复拟合Lasso模型
我用
套索
来
选择
特征
。我从网格搜索中
选择
了拉索参数。现在,我
使用
了最好的模型,我得到了适合训练数据集。因此,在70个变量中,我得到66个变量。我的疑问是,我是否应该在获得66个变量的情况下继续
进行
第一次迭代,或者在没有进一步的变量下降时,是否应该一次又一次地
进行
匹配?
浏览 0
提问于2018-06-10
得票数 0
1
回答
使用
大量
特征
执行Logistic回归?
、
、
、
、
我有一个包含330个样本和每个样本的27个
特征
的数据集,其中具有Logistic回归的二进制类问题。那么你有什么建议呢?我应该做所有可能的7个功能组合吗?我是否应该
使用
关联模型单独评估每个功能,然后只为最终模型
选择
最好的功能?我对分类和连续
特征
的处理也很好奇,我可以混合它们吗?如果我有一个分类的0-1和一个连续的0-100,我应该标准化吗?
浏览 0
提问于2017-07-28
得票数 0
3
回答
从scikit-learn中的one-hot-encoding回溯分类
特征
?
、
、
、
、
我正在尝试构建一个
套索
回归预测模型。我
使用
scikit learn中的OneHotEncoder,
使用
one-hot of-K方案对我所有的分类整数
特征
进行
了编码。你知道如何提取哪个分类整数
特征
对应哪个热编码数组吗?谢谢!
浏览 0
提问于2015-11-28
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用谱聚类(spectral clustering)进行特征选择
CAD教程 | 如何使用中望CAD灵活的选择方式——套索选择
R语言特征选择——逐步回归
利用scikit-learn进行机器学习:特征工程(二)特征选择
机器学习小窍门:Python 帮你进行特征选择
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券