腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(2076)
视频
沙龙
1
回答
请参阅
scikit
中
的
保留
方差
-
学习
多种
学习方法
、
、
为了决定使用多少个输出维度,我需要能够找到
保留
方差
(或解释
方差
,我相信它们是相似的)。
Scikit
-learn似乎拥有到目前为止最好
的
流形
学习
算法选择,但我看不到任何获得
保留
方差
统计
的
方法。有没有我遗漏
的
scikit
-learn API
的
一部分,或者计算
保留
方差
的
简单方法?
浏览 46
提问于2016-07-21
得票数 2
2
回答
sklearn -选择k时所
保留
的
方差
百分比
、
、
我正在使用
scikit
学习
主成分分析,并试图选择满足1-(sum I 1 to K Sii)/(sum J 1 to N Sjj) <= 0.01
的
最小分量数,其中S是svd对角线矩阵,以便保持99%
的
方差
scikit
学习
是否有一个函数,返回给定
方差
的
最小分量,
保留
%阈值? 谢谢。
浏览 1
提问于2015-11-03
得票数 1
回答已采纳
1
回答
如何应用PCA和随机森林训练
的
模型对数据进行测试?
、
、
、
在解决其中一个机器
学习
问题
的
过程
中
,我对训练数据进行主成分分析,然后利用
学习方法
对训练数据进行.transform处理。在观察了这些差异之后,我只
保留
了那些从转换后
的
数据
中
得到
的
列,这些列
的
方差
很大。现在,我很困惑如何在测试数据上应用经过训练
的
模型,因为测试数据
的
列数和
保留
的
转换数据(应用随机林
的
数据)是不同
的
浏览 0
提问于2016-04-03
得票数 3
回答已采纳
2
回答
学习
PCA方法中百分比值
的
解释
、
、
、
在
scikit
学习
中
,有一种叫做
的
方法。此方法接受百分比参数。将此参数解释如下: > # Make an instance of the Model 对于这个解释
的</em
浏览 3
提问于2018-06-08
得票数 4
回答已采纳
1
回答
保留
百分比
方差
的
PCA降维方法
、
、
、
我试图使用PCA减少MNIST数据集
的
维度。诀窍是,我必须
保留
一定百分比
的
方差
(例如80%),同时减少维数。我在用
Scikit
学习
。我正在做pca.get_variance比率,但它给我相同
的
值,不同
的
点位置,如9.7,或.97或.097。我也尝试过pca.get_variance(),但我认为这不是答案。我
的
问题是如何确保降低维数,并保持一定
的
方差
百分比?
浏览 2
提问于2016-05-20
得票数 2
回答已采纳
2
回答
最近
的
邻居和KNN之间有什么区别?
、
、
我正在
学习
制作推荐系统
的
教程,在那里我看到最近
的
邻居和KNN分类器是不同
的
。有人能解释一下,什么是最近
的
邻居,KNN之间有何不同?
浏览 0
提问于2021-04-26
得票数 5
2
回答
不同核密度估计方法
的
比较?
、
、
在python
中
,有几种做核密度估计
的
方法,我想知道它们之间
的
差异,并做出一个很好
的
选择。我想我们可以和1d, 2d,bandwidth selection,Implementation和performance做比较速度通常是快速
的
,可以在多维上执行,但在决定带宽方面没有帮手。 我查看了一下scipy.kde,似乎有一种带宽选择方法。
浏览 3
提问于2016-02-24
得票数 0
1
回答
使用机器
学习
进行价格预测
、
我应该使用什么机器
学习方法
来预测股票、黄金等价格? 我更喜欢使用Python,但我找不到起点,因为它对我来说太复杂了,我也不知道如何开始它。
浏览 49
提问于2019-05-27
得票数 -3
回答已采纳
5
回答
是否有必要在聚类之前对数据进行标准化?
、
、
在
scikit
learn有关DBSCAN
的
示例
中
,这里在行
中
这样做:但我不明白为何要这样做。毕竟,聚类并不假定数据
的
任何特定分布--它是一种无监督
的
学习方法
,因此它
的
目标是探索数据。 为什么有必要转换数据?
浏览 0
提问于2015-08-06
得票数 35
回答已采纳
1
回答
在
scikit
learn
中
测试不同
的
学习方法
、
、
、
有没有人可以教我如何在sklearn
中
测试几种不同
的
机器
学习方法
,一旦我让它与svm.SVC一起工作?我有:答案=我想要
学习
预测
的
二进制数组(1或0),形状约为1000 x 1[datatrain, datatest, answertrain(我也对sklearn
中
可用
的
方法
的
建议持开放态度,因为我对机器
学习
相对较新。)
浏览 1
提问于2018-09-01
得票数 0
回答已采纳
2
回答
什么是科学
学习
中最有效
的
超参数优化方法?
、
、
、
、
这里是关于科学
学习
中
的
超参数优化过程
的
概述。随机搜索比网格搜索速度快,但
方差
过大。在其他包
中
也有其他策略,包括
scikit
优化、自动滑雪和
scikit
超带。理想情况下,我希望使用带有基准
的</em
浏览 0
提问于2019-03-13
得票数 11
2
回答
Scikit
-
学习
PCA
、
、
、
我正在使用来自
的
输入数据(参见第3.1节)。 为什么协
方差
矩阵是不同
的
?更新
的</em
浏览 2
提问于2014-12-30
得票数 14
6
回答
在
Scikit
特性选择之后
保留
特征名
、
、
、
、
在运行了
Scikit
中
的
方差
阈值之后--
学习
一组数据,它删除了几个特性。我觉得我在做一些简单而又愚蠢
的
事情,但我想
保留
剩下
的
特性
的
名称。selector.transform(data)))x = VarianceThreshold_selector(data)更改以下数据(这只是行
的
一小部分1 2 38 1 0
浏览 6
提问于2016-10-02
得票数 19
回答已采纳
1
回答
迭代捕获和改进机器
学习
模型
的
工作流
我正在使用
多种
机器
学习方法
(支持向量回归、随机森林回归和通过
scikit
- learning进行
的
knn回归),并想知道如何确定哪种方法最适合于递增地递增我
的
训练样本10,000条记录。我
的
训练数据大小大约是80k记录,我
的
测试数据集大约是30k记录。随着培训规模
的
增加,我期望我
的
训练验证分数(RMSE,MAPE)在完整
的
训练数据集上会减少,而我
的
测试验证分数将会增加。,为了对这些机器
学习<
浏览 0
提问于2019-08-30
得票数 2
3
回答
Python
学习
pca.explained_variance_ratio_截止
、
、
当选择主成分数(k)时,我们选择k作为最小值,例如99%
的
方差
被
保留
。但是,在Python
学习
中
,我不能100%确定pca.explained_variance_ratio_ = 0.99是否等于"99%
的
方差
被
保留
“?有人能启发一下吗?谢谢。
学习
PCA手册在这里
浏览 10
提问于2015-09-30
得票数 45
回答已采纳
1
回答
scikit
中
的
NaN/inf值-
学习
多种
学习
功能
、
我有一个流形
学习
/非线性降维问题,其中我知道物体之间
的
距离,直到某个阈值,然后我只知道距离是“远”
的
。另外,在某些情况下,有些距离可能会丢失。我试图使用sklearn.manifold来执行查找一维表示
的
任务。自然
的
表示方式是将“远”距离表示为inf,而缺失距离表示为nan。然而,目前看来
scikit
-learn不支持nan和inf值,因为我得到了sklearn.manifold
中
的
多个
学习
函数
的
距离矩阵。
浏览 3
提问于2013-07-08
得票数 4
1
回答
为什么我
的
MLP模型每次运行都会产生不同
的
F1分数?
、
、
、
、
我不知道为什么我
的
MLP代码产生不同
的
F1-分数与每次运行。百分比
的
也有很大
的
不同。 我尝试过添加随机状态,但是仍然收到相同
的
结果。我很想知道我是不是遗漏了什么。
浏览 7
提问于2022-06-07
得票数 0
1
回答
优势函数-
方差
缩减
、
在解释优势函数时,通常认为使用基线可以减少
方差
。我没有找到任何具体
的
理由来证明这一点。有人能为减少
方差
提供一些参考或正式
的
理由吗?
浏览 0
提问于2016-12-22
得票数 1
回答已采纳
2
回答
python中最快速
的
线性回归实现
、
、
、
、
我正在进行一个逐步
的
模型选择,逐步降低变量
的
方差
通货膨胀因子超过一定
的
阈值。对于较大
的
数据集,OLS最快
的
实现是什么?基于梯度下降
的
方法会更快吗?科学知识有一个特别快
的
实现吗?更新1:似乎
scikit
学习
了LinearRegression
的</
浏览 4
提问于2014-07-01
得票数 4
回答已采纳
1
回答
关联大量变量
的
降维方法
、
、
我想将数据集
的
维数降到25-50-100维,然后计算这些维度之间
的
关联矩阵。我有连续
的
和离散
的
列。我还想知道哪些维度代表原始数据集中
的
单个变量束。我要补充
的
是,我没有输出变量,我只是试图在数据中找到相关性。在Python中有办法做到这一点吗?
浏览 0
提问于2021-02-25
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习中的集成学习方法综述
java编程中的框架学习方法
Github排名中的Pythonweb框架Flask学习方法
多模态学习方法在情感分析中的效果评估
半监督学习方法在图像分类中的实用性探索
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券