请参阅scikit中的保留方差-学习多种学习方法

、、

为了决定使用多少个输出维度，我需要能够找到保留方差(或解释方差，我相信它们是相似的)。Scikit-learn似乎拥有到目前为止最好的流形学习算法选择，但我看不到任何获得保留方差统计的方法。有没有我遗漏的scikit-learn API的一部分，或者计算保留方差的简单方法？

浏览 46提问于2016-07-21得票数 2

2回答

sklearn -选择k时所保留的方差百分比

、、

我正在使用scikit学习主成分分析，并试图选择满足1-(sum I 1 to K Sii)/(sum J 1 to N Sjj) <= 0.01的最小分量数，其中S是svd对角线矩阵，以便保持99%的方差scikit学习是否有一个函数，返回给定方差的最小分量，保留%阈值？谢谢。

浏览 1提问于2015-11-03得票数 1

回答已采纳

1回答

如何应用PCA和随机森林训练的模型对数据进行测试？

、、、

在解决其中一个机器学习问题的过程中，我对训练数据进行主成分分析，然后利用学习方法对训练数据进行.transform处理。在观察了这些差异之后，我只保留了那些从转换后的数据中得到的列，这些列的方差很大。现在，我很困惑如何在测试数据上应用经过训练的模型，因为测试数据的列数和保留的转换数据(应用随机林的数据)是不同的

浏览 0提问于2016-04-03得票数 3

回答已采纳

2回答

学习PCA方法中百分比值的解释

、、、

在scikit学习中，有一种叫做的方法。此方法接受百分比参数。将此参数解释如下： > # Make an instance of the Model 对于这个解释的</em

浏览 3提问于2018-06-08得票数 4

回答已采纳

1回答

保留百分比方差的PCA降维方法

、、、

我试图使用PCA减少MNIST数据集的维度。诀窍是，我必须保留一定百分比的方差(例如80%)，同时减少维数。我在用Scikit学习。我正在做pca.get_variance比率，但它给我相同的值，不同的点位置，如9.7，或.97或.097。我也尝试过pca.get_variance()，但我认为这不是答案。我的问题是如何确保降低维数，并保持一定的方差百分比？

浏览 2提问于2016-05-20得票数 2

回答已采纳

2回答

最近的邻居和KNN之间有什么区别？

、、

我正在学习制作推荐系统的教程，在那里我看到最近的邻居和KNN分类器是不同的。有人能解释一下，什么是最近的邻居，KNN之间有何不同？

浏览 0提问于2021-04-26得票数 5

2回答

不同核密度估计方法的比较？

、、

在python中，有几种做核密度估计的方法，我想知道它们之间的差异，并做出一个很好的选择。我想我们可以和1d, 2d，bandwidth selection，Implementation和performance做比较速度通常是快速的，可以在多维上执行，但在决定带宽方面没有帮手。我查看了一下scipy.kde，似乎有一种带宽选择方法。

浏览 3提问于2016-02-24得票数 0

1回答

使用机器学习进行价格预测

、

我应该使用什么机器学习方法来预测股票、黄金等价格？我更喜欢使用Python，但我找不到起点，因为它对我来说太复杂了，我也不知道如何开始它。

浏览 49提问于2019-05-27得票数 -3

回答已采纳

5回答

是否有必要在聚类之前对数据进行标准化？

、、

在scikit learn有关DBSCAN的示例中，这里在行中这样做：但我不明白为何要这样做。毕竟，聚类并不假定数据的任何特定分布--它是一种无监督的学习方法，因此它的目标是探索数据。为什么有必要转换数据？

浏览 0提问于2015-08-06得票数 35

回答已采纳

1回答

在scikit learn中测试不同的学习方法

、、、

有没有人可以教我如何在sklearn中测试几种不同的机器学习方法，一旦我让它与svm.SVC一起工作？我有：答案=我想要学习预测的二进制数组(1或0)，形状约为1000 x 1[datatrain, datatest, answertrain(我也对sklearn中可用的方法的建议持开放态度，因为我对机器学习相对较新。)

浏览 1提问于2018-09-01得票数 0

回答已采纳

2回答

什么是科学学习中最有效的超参数优化方法？

、、、、

这里是关于科学学习中的超参数优化过程的概述。随机搜索比网格搜索速度快，但方差过大。在其他包中也有其他策略，包括scikit优化、自动滑雪和scikit超带。理想情况下，我希望使用带有基准的</em

浏览 0提问于2019-03-13得票数 11

2回答

Scikit-学习PCA

、、、

我正在使用来自的输入数据(参见第3.1节)。为什么协方差矩阵是不同的？更新的</em

浏览 2提问于2014-12-30得票数 14

6回答

在Scikit特性选择之后保留特征名

、、、、

在运行了Scikit中的方差阈值之后--学习一组数据，它删除了几个特性。我觉得我在做一些简单而又愚蠢的事情，但我想保留剩下的特性的名称。selector.transform(data)))x = VarianceThreshold_selector(data)更改以下数据(这只是行的一小部分1 2 38 1 0

浏览 6提问于2016-10-02得票数 19

回答已采纳

1回答

我正在使用多种机器学习方法(支持向量回归、随机森林回归和通过scikit- learning进行的knn回归)，并想知道如何确定哪种方法最适合于递增地递增我的训练样本10,000条记录。我的训练数据大小大约是80k记录，我的测试数据集大约是30k记录。随着培训规模的增加，我期望我的训练验证分数(RMSE，MAPE)在完整的训练数据集上会减少，而我的测试验证分数将会增加。，为了对这些机器学习<

浏览 0提问于2019-08-30得票数 2

3回答

Python学习pca.explained_variance_ratio_截止

、、

当选择主成分数(k)时，我们选择k作为最小值，例如99%的方差被保留。但是，在Python学习中，我不能100%确定pca.explained_variance_ratio_ = 0.99是否等于"99%的方差被保留“？有人能启发一下吗？谢谢。学习PCA手册在这里

浏览 10提问于2015-09-30得票数 45

回答已采纳

1回答

scikit中的NaN/inf值-学习多种学习功能

、

我有一个流形学习/非线性降维问题，其中我知道物体之间的距离，直到某个阈值，然后我只知道距离是“远”的。另外，在某些情况下，有些距离可能会丢失。我试图使用sklearn.manifold来执行查找一维表示的任务。自然的表示方式是将“远”距离表示为inf，而缺失距离表示为nan。然而，目前看来scikit-learn不支持nan和inf值，因为我得到了sklearn.manifold中的多个学习函数的距离矩阵。

浏览 3提问于2013-07-08得票数 4

1回答

为什么我的MLP模型每次运行都会产生不同的F1分数？

、、、、

我不知道为什么我的MLP代码产生不同的F1-分数与每次运行。百分比的也有很大的不同。我尝试过添加随机状态，但是仍然收到相同的结果。我很想知道我是不是遗漏了什么。

浏览 7提问于2022-06-07得票数 0

1回答

优势函数-方差缩减

、

在解释优势函数时，通常认为使用基线可以减少方差。我没有找到任何具体的理由来证明这一点。有人能为减少方差提供一些参考或正式的理由吗？

浏览 0提问于2016-12-22得票数 1

回答已采纳

2回答

python中最快速的线性回归实现

、、、、

我正在进行一个逐步的模型选择，逐步降低变量的方差通货膨胀因子超过一定的阈值。对于较大的数据集，OLS最快的实现是什么？基于梯度下降的方法会更快吗？科学知识有一个特别快的实现吗？更新1:似乎scikit学习了LinearRegression的</

浏览 4提问于2014-07-01得票数 4

回答已采纳

1回答

关联大量变量的降维方法

、、

我想将数据集的维数降到25-50-100维，然后计算这些维度之间的关联矩阵。我有连续的和离散的列。我还想知道哪些维度代表原始数据集中的单个变量束。我要补充的是，我没有输出变量，我只是试图在数据中找到相关性。在Python中有办法做到这一点吗？

浏览 0提问于2021-02-25得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

sklearn -选择k时所保留的方差百分比

如何应用PCA和随机森林训练的模型对数据进行测试？

学习PCA方法中百分比值的解释

保留百分比方差的PCA降维方法

最近的邻居和KNN之间有什么区别？

不同核密度估计方法的比较？

使用机器学习进行价格预测

是否有必要在聚类之前对数据进行标准化？

在scikit learn中测试不同的学习方法

什么是科学学习中最有效的超参数优化方法？

Scikit-学习PCA

在Scikit特性选择之后保留特征名

迭代捕获和改进机器学习模型的工作流

Python学习pca.explained_variance_ratio_截止

scikit中的NaN/inf值-学习多种学习功能

为什么我的MLP模型每次运行都会产生不同的F1分数？

优势函数-方差缩减

python中最快速的线性回归实现

关联大量变量的降维方法

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐