将稀疏特征向量分解为单独的列

、、、、

在我的spark DataFrame中，有一列包含了CountVectoriser转换的输出-它是稀疏向量格式的。我想要做的是将这列再次“分解”成一个密集的向量，然后是它的组成部分行(这样它就可以用于外部模型的评分)。cannot be cast to org.apache.spark.sql.Rowval vecToSeq = udf((v: Ve

浏览 12提问于2018-01-30得票数 2

回答已采纳

2回答

稀疏单热表示的卷积神经网络

、、

我有一些基本的特征，我用一个热向量编码。我看到conv网被应用到一个密集的特征向量上。将conv网应用于稀疏特征向量有问题吗？

浏览 0提问于2015-05-18得票数 6

回答已采纳

2回答

求小一般复矩阵最大特征对的有效算法

、、

我正在寻找一种有效的算法来寻找一个小的，一般的(非方的，非稀疏的，非对称的)复矩阵A的最大特征对，大小为m×n。我的意思是小，我的意思是m和n通常在4和64之间，通常在16左右，但m不等于n。这个问题可以直接用一般的LAPACK SVD算法来解决，即gesvd或gesdd。然而，由于我正在解决数百万个这样的问题，并且只需要最大的特征对，所以我正在寻找一种更有效<e

浏览 5提问于2012-03-27得票数 2

1回答

堆积稀疏稠密矩阵

、、、、

是否有可能在python中堆叠稀疏和密集的numpy数组？我知道，对于密集的numpy数组，可以使用v堆栈/h堆栈来实现这一点。为了增加特征向量的数量，我想将一些列添加到稀疏矩阵中。

浏览 1提问于2013-08-24得票数 6

回答已采纳

1回答

Octave/Matlab:稀疏矩阵上的PCA :如何仅获得最重要的特征向量？

、、、

我使用Octave，并且有一个巨大的稀疏矩阵，我必须得到它的特征值。然而，如果我只使用一个函数来获得所有特征值和特征向量，结果将占用太多空间，因为输入矩阵由于某种原因是稀疏的。如何才能仅获得有限数量的最重要的特征向量？

浏览 1提问于2013-06-29得票数 2

回答已采纳

1回答

复稀疏矩阵A的Armadillo eigs_sym(A，k)

、、、

为了找到稀疏矩阵'A‘的最小特征值，下面的最小代码工作得很好：g++ -std=c++17 -A.t()*A ; std::cout << e ; }#include <

浏览 7提问于2020-08-20得票数 2

回答已采纳

1回答

如何利用稀疏矩阵生成滑动窗口特征

、、

将特征向量的稀疏CSR2d输入矩阵转换为滑动窗口特征向量的稀疏CSR2d矩阵。因此，对于大小为2的窗口，以一个非稀疏的例子为例： [3, 4, 5],变成： n = a.shape[0] return np.hstack(a[i:1+n+i-width:1] f

浏览 1提问于2017-11-28得票数 0

回答已采纳

1回答

sklearn:从多选特征中创建稀疏特征向量

我有如下所示的数据：1, 2, 3, 4, 5 其中以.*结尾的列是多项选择，它们所采用的值是绝对的。理想情况下，我可以将[{'20003': ['1', '2'], '20004': ['3', '4'], '34': 5}]传递给DictVectorizer，但目前还

浏览 0提问于2017-04-14得票数 0

3回答

近似大对称矩阵的3个特征值和特征向量的快速方法

、、、、

在我的示例中，我正在编写代码来计算一个非常大的 (简称MDS)的n矩阵( n = 500,000 )。理论上B<e

浏览 6提问于2016-11-25得票数 6

回答已采纳

1回答

稀疏矩阵的完全SVD库

、、

我想对包含大量零的大型矩阵进行奇异值分解。特别是从对称矩阵A的对角化得到的U和S，这意味着A=U*S*转置(U^*)，其中S是对角矩阵，U包含所有特征向量作为列。我在网络上搜索将奇异值分解和稀疏矩阵结合在一起的c++库，但是只能找到少数的库，而不是所有的特征向量。有没有人知道是否有这样的图书馆？另外，在得到U和S之后，我需要把它们乘成一些稠密的向量。

浏览 5提问于2015-11-22得票数 0

1回答

Python _

、、

我希望这不是一个坏问题，但我正在计算对称矩阵的特征向量和特征值，我们称之为A。我想得到它的第二大特征值对应的特征向量。[D, V] = scipy.sparse.linalg.eigs(L, 2)现在，我想做一些计算，根据“s”中的某些元素和其他一些数字进行比较> some number: do something with the first column/row

浏览 1提问于2015-09-03得票数 0

回答已采纳

1回答

尝试并行化scikit learn中的参数搜索会导致"SystemError: PyObject_Call中没有错误的空结果“

、

我使用的是scikit Learn14.1中的sklearn.grid_search.RandomizedSearchCV类，运行以下代码时出现错误：classifier.fit(X_scaled, y)SystemError: NULL result without error in PyObject_Call 这

浏览 0提问于2014-05-31得票数 1

1回答

计算scipy.sparse矩阵伪逆列子集的最快方法

、、、、

我正在寻找最佳的方法来计算稀疏矩阵A的伪逆列的子集。以下是一些相关事实：如有任何建议，

浏览 2提问于2016-05-27得票数 1

回答已采纳

2回答

Python中的CountVectorizer

、、、、

我正在研究一个问题，在这个问题中，我必须预测一封公司发送的电子邮件是否被打开，如果它被打开，我必须预测收件人是否点击了给定的链接。我有一个具有以下特性的数据集：对于电子邮件主体和主题，我可以使用CountVectorizer，但是如何将我的其他特性包含到由said CountVectorizer创建<e

浏览 0提问于2018-03-30得票数 0

1回答

求极大极稀疏矩阵的特征值

、、

有一个大小为NxN的矩阵A，其中N = 200 000。它非常稀疏，每一行都有M元素，其中M={6, 18, 40, 68, 102} (我有5个不同的场景)，其余的都是零。现在我想得到矩阵A的所有特征值和特征向量。问题是，我无法将矩阵A放入内存中，因为它大约有160 GB的数据。我正在寻找的是一个软件，可以很好地存储稀疏矩阵(没有零，我的矩阵只有几个MB)，然后把这个没有零的存

浏览 0提问于2014-03-21得票数 0

1回答

我有两个MySQL表，其中一个包含一组6,000个用户，另一个包含他们为产品提供的10000个评级。我想做一个特征向量矩阵，每一行都有一个特征向量矩阵，如果用户对特定产品(甚至是评分值)进行了评级，那么这些特征向量就表示用户为1或0。实现这一点的最佳方法是什么(还假设矩阵将是稀疏的？)。我很好奇我可以使用工具(如MySQL或MATLAB)来测试什么实现--最终目的是执行相似用户的集群。不知何故，我认为一个10,000列的</e

浏览 1提问于2012-01-27得票数 0

1回答

SciPy -计算对称矩阵中特定特征值的特征向量

、、、、

我有一个对称矩阵(无向图的邻接矩阵)，我有一个特定的特征值(最大特征值)，我想要与之相关的特征向量(左或右，任一，因为我认为左是对称矩阵的右转置)。我正在运行的图可以从数千个节点到数十万个节点，因此相应的邻接矩阵将很大。然而，密度是稀疏的，所以相应的矩阵也是稀疏的。在SciPy中有没有一种有效的方法来做到这一点呢？更好的是，有

浏览 3提问于2013-01-25得票数 2

回答已采纳

1回答

如何保存稀疏数据集以供scikit-learn使用？

、、

我想用scikit-learn分类器测试我的数据集。我使用Java动态创建特征向量，向量非常稀疏。我想将我的稀疏向量/数据集导出为一种可以轻松与scikit-learn一起使用的格式。我已经用Java语言编写了一个导出函数，将数据集导出为ARFF格式，但我发现用scikit-learn无法读取它。有一些用于ARFF文件的python解析器，但它们不支持稀疏数据集。即哪种格式？！

浏览 5提问于2015-05-15得票数 0

1回答

如何将星火中的映射转换为SparkML稀疏向量？

、、、

我的原始模式包含了很多我希望在ML模型中使用的映射类型，所以我需要将它们转换为SparkML稀疏向量。nullable = true) | |-- value: string (valueContainsNull = true)到目前为止，我的解决方案是将映射单

浏览 1提问于2018-02-01得票数 3

回答已采纳

2回答

用Java计算稀疏矩阵的复特征向量

、、、、

我试图计算一个潜在的大型稀疏非对称NxN矩阵(N > 10^6)的特征值和特征向量。我不需要所有的，但也许是第一个。理想情况下，我希望使用Java，但如果需要的话可以转到C、C++或Python。我的矩阵可能同时具有复特征值和特征向量。例如，请参见的结果。我找到了几种使用许多Java库进行评估的方法，并为它们编写了一些评估代码：但我面临的问题是，这些库不返回(至少我找不到方法)复值<em

浏览 16提问于2017-06-04得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

稀疏单热表示的卷积神经网络

求小一般复矩阵最大特征对的有效算法

堆积稀疏稠密矩阵

Octave/Matlab:稀疏矩阵上的PCA :如何仅获得最重要的特征向量？

复稀疏矩阵A的Armadillo eigs_sym(A，k)

如何利用稀疏矩阵生成滑动窗口特征

sklearn:从多选特征中创建稀疏特征向量

近似大对称矩阵的3个特征值和特征向量的快速方法

稀疏矩阵的完全SVD库

Python _

尝试并行化scikit learn中的参数搜索会导致"SystemError: PyObject_Call中没有错误的空结果“

计算scipy.sparse矩阵伪逆列子集的最快方法

Python中的CountVectorizer

求极大极稀疏矩阵的特征值

从MySQL表生成超大矩阵？

SciPy -计算对称矩阵中特定特征值的特征向量

如何保存稀疏数据集以供scikit-learn使用？

如何将星火中的映射转换为SparkML稀疏向量？

用Java计算稀疏矩阵的复特征向量

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐