获取等于max的所有列索引，并使用它们来索引另一个数组: numpy vs sparse csr_matrix

在这个问题中，我们需要获取等于最大值的所有列索引，并将它们用于索引另一个数组。我们可以使用numpy和sparse csr_matrix来实现这个目标。

numpy:
- 概念：numpy是一个开源的Python库，用于科学计算和数值操作。它提供了一个多维数组对象和一组用于操作这些数组的函数。
- 分类：numpy属于基于数组的计算库。
- 优势：numpy提供了高效的数组操作和数值计算功能，可以处理大规模数据集和高维数组。
- 应用场景：numpy广泛应用于数据分析、科学计算、机器学习等领域。
- 推荐的腾讯云相关产品：腾讯云AI计算平台（链接：https://cloud.tencent.com/product/tcaplusdb）

sparse csr_matrix:
- 概念：sparse csr_matrix是一种稀疏矩阵的存储格式，用于表示大规模稀疏矩阵。它只存储非零元素的值和它们的位置，可以节省内存空间。
- 分类：sparse csr_matrix属于稀疏矩阵的存储格式之一。
- 优势：sparse csr_matrix适用于处理大规模稀疏矩阵，可以减少内存占用和计算开销。
- 应用场景：sparse csr_matrix常用于处理自然语言处理、推荐系统、图像处理等领域的稀疏数据。
- 推荐的腾讯云相关产品：腾讯云AI计算平台（链接：https://cloud.tencent.com/product/tcaplusdb）

综上所述，对于获取等于最大值的所有列索引并使用它们来索引另一个数组的问题，可以使用numpy和sparse csr_matrix来实现。numpy适用于处理一般的数组操作和数值计算，而sparse csr_matrix适用于处理大规模稀疏矩阵。具体选择哪种方法取决于数据的规模和特点。

页面内容是否对你有帮助？

有帮助

没帮助

为什么与numpy数组相比，枕csr矩阵的行索引要慢一些？

、、、、

我不知道我做错了什么，但是与numpy数组相比，行索引csr_matrix似乎慢了大约2倍(参见下面的代码)。 csr矩阵的行索引不应该比密集矩阵更快，因为只有很少的非零元素被提取，如下所示。是否有更快的技巧使行索引更快对已参与的csr矩阵？ import numpy as np import timeit from scipy.sparse import csr_matrix # Generate random matrix A = np.random.rand(5000, 1000) # Make A sparse A[:, 4:] =0 # Create sparse matri

浏览 4提问于2015-12-01得票数 1

回答已采纳

1回答

通过增加一列简单地扩展csr矩阵

、、

我有这个代码 import numpy as np from scipy.sparse import csr_matrix q = csr_matrix([[1.], [0.]]) ones = np.ones((2, 1)) 现在如何将1列添加到矩阵Q中以获得结果形状(2，2)？(矩阵Q是稀疏的，我不想更改csr的类型)

浏览 0提问于2016-06-20得票数 0

1回答

如何有效地将可变数量的sparse.csr_matrix存储在内存中？

、、、

我有大约10,000个稀疏矩阵，每个矩阵的大小为5万×5，平均密度为0.0004。对于每个循环(10000次)，我将计算numpy数组并将其转换为csr_matrix，并将其附加到列表中。但是内存消耗与附加numpy数组一样高，但不像附加csr_matrices那样高。如何减少内存消耗，同时将这些10K稀疏矩阵存储在内存中，以便进一步计算？样本代码： from scipy.sparse import csr_matrix import numpy as np sparse_matrices = [] for i in range(10000): np_array = get_np

浏览 2提问于2017-05-31得票数 1

回答已采纳

1回答

将csr_matrix和numpy数组保存在一个文件中

、、

我需要保存一个大型稀疏csr_matrix和一个numpy数组，以便稍后能够读取它们。设X是稀疏的csr_matrix，Y是数字数组。目前我走的是以下几条有点疯狂的路线。 from scipy.sparse import csr_matrix import numpy as np def save_sparse_csr(filename,array): np.savez(filename,data = array.data ,indices=array.indices, indptr =array.indptr, shape=array.shape ) d

浏览 1提问于2016-07-21得票数 1

1回答

Python:修改稀疏数组元素

、、、

下面是Ipython屏幕的副本，其中'Lp‘是一个稀疏矩阵： Lp Out[198]: <9x9 sparse matrix of type '<type 'numpy.float64'>' with 63 stored elements (blocksize = 3x3) in Block Sparse Row format> Lp[0,0] Traceback (most recent call last): File "<ipython-input-199-b843d0976d55>&#

浏览 0提问于2014-09-12得票数 0

2回答

标量值的numpy数组的用例是什么？

、

在最新版本中，我发现： >>> import numpy as np >>> from scipy.sparse import csr_matrix >>> a = csr_matrix((3, 4), dtype=np.int8) >>> a[0,0] array(0) #instead of `0` 您还可以创建标量值的numpy数组(而不是向量/矩阵) np.array(0)，这与np.array([0])不同。np.array(0)的用例是什么？如何从np.array(0) (非类型转换使用int)获取数组中的

浏览 1提问于2019-07-24得票数 4

回答已采纳

3回答

cryptic scipy“无法转换整数标量”错误

、、、

我正在使用scipy.sparse.csr_matrix构造一个稀疏向量，如下所示： csr_matrix((values, (np.zeros(len(indices)), indices)), shape = (1, max_index)) 这对我的大多数数据都很有效，但偶尔我会得到一个ValueError: could not convert integer scalar。这会重现问题： In [145]: inds Out[145]: array([ 827969148, 996833913, 1968345558, 898183169, 1811744124,

浏览 4提问于2015-03-20得票数 5

2回答

当两个csr矩阵具有不相容的尺寸时，将它们组合在一起

、、、

我有两个稀疏矩阵，其中第一个具有 <1x40 sparse matrix of type '<class 'numpy.intc'>' with 10 stored elements in Compressed Sparse Row format> 第二个是： <9x15426 sparse matrix of type '<class 'numpy.int64'>' with 25 stored elements in Compressed Sparse Row form

浏览 2提问于2022-11-04得票数 0

回答已采纳

1回答

Sklearn决策树-同时使用稀疏矩阵和其他特征

、、、

我正在使用Sklearn决策树进行一些分类，我有两种类型的数据:分类数据和连续数据。我使用pd.get_dummies作为我的分类值，最终得到了90多个特性。当然，这是相当多的。问题是，然后我迭代max_features参数以获得我的模型的最佳分数，并且拥有20多个特征太耗时了。所以我认为Sklearn可以为我的分类特征使用稀疏矩阵，而不是使用0和1的70列。问题是: Sklearn能不能混合使用稀疏矩阵和规则数组？如果是，我该怎么做？目前我收到错误：setting an array element with a sequence 这里有一些代码来理解这个想法。我目前使用的是df_with

浏览 1提问于2018-12-10得票数 1

2回答

scipy.csr_matrix造成的意外结果

、、

>>> import numpy as np >>> from scipy.sparse import * >>> x1 = np.eye(3, dtype=float) >>> x2 = csr_matrix(x1, dtype=float, shape =x1.shape) >>> assert x2.todense().any()==x1.any() ## holds true >>> w = np.ones((3,1)) >>> dw1 = w - x1[:,

浏览 7提问于2016-12-29得票数 1

回答已采纳

1回答

有numpy.there吗？

、、

我想知道numpy.where (从booleans到indices)是否与从索引到booleans的相反，例如numpy.there。一个可能的实现可以使用席比的稀疏矩阵： from scipy.sparse import csr_matrix numpy_there = lambda there, n: numpy.array( csr_matrix(( [1]*len(there), there, [0, len(there)] ), shape=(1,n), dtype=numpy.bool ).todense())[0,:] numpy_t

浏览 2提问于2015-10-27得票数 2

回答已采纳

1回答

scipy稀疏矩阵和导致密集矩阵-如何加强结果稀疏性？

、、

在scipy.sparse.csr_matrix的一个轴上求和会产生一个numpy.matrix对象。考虑到我的稀疏矩阵真的很稀疏，我发现这种行为非常恼人。下面是一个示例： dense = [[ 0., 0., 0., 0., 0.], [ 1., 0., 0., 0., 0.], [ 0., 0., 0., 0., 0.], [ 0., 0., 0., 0., 0.], [ 2., 0., 4., 0., 0.]] from scipy.sparse import csr_m

浏览 14提问于2020-06-05得票数 1

1回答

如何在枕木中创建一个庞大的稀疏矩阵

、、、、

我试图创建一个非常庞大的稀疏矩阵，它有一个形状(447957347, 5027974)。它含有3 289 288 566个元素。但是，当我使用csr_matrix创建scipy.sparse时，它会返回如下内容： <447957346x5027974 sparse matrix of type '<type 'numpy.uint32'>' with -1005678730 stored elements in Compressed Sparse Row format> 创建矩阵的源代码是： indptr = np.array(

浏览 0提问于2014-04-30得票数 8

回答已采纳

2回答

快速构建非常大的稀疏矩阵

、、、

如何加快构建一个非常大的稀疏矩阵，其中每行对应于一列只有一个非零元素，而每列具有相等数量(平均)的非零元素？我有一个大小为N1- by -N2的大型(稀疏)矩阵，例如大小为1e8-by-5e4的矩阵，其中每一行只包含一个非零元素，该元素是随机选择的，没有被numpy.random.choice(numpy.arange(N2),size=N2,replace=False)替换。据我所知，构建矩阵的唯一方法是在for循环N1次中运行numpy.random.choice()。由于N1非常大，为了加快速度，我使用了scipy.weave import numpy as np from scip

浏览 0提问于2016-07-19得票数 2

2回答

向csr_matrix中添加一列零

、、、

我有一个MxN稀疏csr_matrix，我想在矩阵的右边添加几个只有零的列。原则上，数组indptr、indices和data保持不变，所以我只想改变矩阵的维数。然而，这似乎没有得到落实。 >>> A = csr_matrix(np.identity(5), dtype = int) >>> A.toarray() array([[1, 0, 0, 0, 0], [0, 1, 0, 0, 0], [0, 0, 1, 0, 0], [0, 0, 0, 1, 0], [0, 0, 0, 0, 1]]) &g

浏览 5提问于2014-10-20得票数 8

回答已采纳

1回答

如何只选择scipy.sparse csr_matrix的一些行？

、、、

下面是从Pandas dataframe中过滤行的示例，首先是密集的，然后是稀疏的。 import pandas as pd from scipy.sparse import csr_matrix df = pd.DataFrame({'thing': [1, 1, 2, 2, 2], 'score': [0.12, 0.13, 0.14, 0.15, 0.17]}) row_index = df['thing'] == 1 print(type(row_index), row_index) print(

浏览 1提问于2019-12-10得票数 0

1回答

在枕中创建DOK矩阵

、、

我有需要转换为DOK格式的numpy数组。为什么这样做： x = np.asarray([1, 0, 0]) y = scipy.sparse.dok_matrix(scipy.sparse.csr_matrix(x)) 但这并不是： x = np.asarray([1, 0, 0]) y = scipy.sparse.dok_matrix(x) 这会引发错误："TypeError:预期秩<=2密集数组或矩阵。“ 我在西西的文档中没有发现任何暗示我不能直接将数组转换成dok矩阵的东西。

浏览 2提问于2021-01-05得票数 0

回答已采纳

2回答

如何将scipy csr_matrix转换成行、列和数据的列表？

、、

我有一个scipy csr_matrix，它是按照文档中指定的方式创建的： import numpy as np from scipy.sparse import csr_matrix row = np.array([0, 0, 1, 2, 2, 2]) col = np.array([0, 2, 2, 0, 1, 2]) data = np.array([1, 2, 3, 4, 5, 6]) mtr = csr_matrix((data, (row, col))) mtr.toarray() array([[1, 0, 2], [0, 0, 3], [4, 5,

浏览 0提问于2017-11-03得票数 7

1回答

对压缩稀疏行格式(csr_matrix)的矩阵中的值取对数

、、、、

我对计数数据的对数感兴趣，这些数据是我对文本数据进行计数得到的。我很想测试这种转换(标准化)是否有助于提高sklearn中模型的性能。这就是我所拥有的： TEXT = [data[i].values()[3] for i in range(len(data))] from sklearn.feature_extraction.text import CountVectorizer vectorizer = CountVectorizer(min_df=0.01,max_df = 2.5, lowercase = False, stop_words = 'english')

浏览 37提问于2016-07-31得票数 1

回答已采纳

1回答

为什么我会收到关于枕木稀疏列切片的警告？

、、、、

csr_matrix的稀疏文档表明，这种矩阵对于行切片是有效的。使用此代码： import numpy as np from scipy import sparse dok = sparse.dok_matrix((5,1)) dok[1,0] = 1 data = np.array([0,1,2,3,4]) row = np.array([0,1,2,3,4]) col = np.array([0,1,2,3,4]) csr = sparse.csr_matrix((data, (row, col))) csr[:, 0] += dok 我收到警告： SparseEfficiencyWa

浏览 0提问于2018-05-11得票数 2

回答已采纳

1回答

企业社会责任稀疏矩阵实际上是COO吗？

、、

我最近一直在处理稀疏矩阵。我的目标是以某种方式将图的邻接列表转换为CSR格式，在这里定义为：。我看到的一个可能的选择是，我首先构造一个NumPy矩阵并使用scipy.sparse.csr_matrix进行转换。问题是，SciPy中的CSR与链接中讨论的有些不同。我的问题是，这仅仅是一个差异，我需要编写自己的解析器，或者SciPy实际上可以转换为链接中定义的CSR。更多关于这个问题，假设我有一个矩阵： matrix([[1, 1, 0], [0, 0, 1], [1, 0, 1]]) CSR格式由两个数组组成，列(C)和行(R)。我努力让自己看起来像： C:

浏览 5提问于2017-06-30得票数 0

回答已采纳

1回答

Python: csr_matrix中稀疏矩阵的乘法比numpy慢

、、

我正在尝试使用numpy和scipy.sparse.csr_matrix将稀疏矩阵与其自身相乘。矩阵的大小为128x256。其93%的值为0。具有讽刺意味的是，使用numpy的乘法比scipy.sparse快。我不知道为什么？我使用的代码是： import numpy,time W=numpy.random.choice([0, 1], size=(128,256), p=[0.93,0.07]) start=time.time() W1=numpy.matmul(W,numpy.transpose(W)) end=time.time() print(end-start) from scip

浏览 0提问于2019-07-03得票数 0

1回答

scipy.sparse.csr_matrix和scipy.sparse.lil_matrix有什么不同？

、

scipy.sparse.csr_matrix和scipy.sparse.lil_matrix有什么不同？这些矩阵表示稀疏矩阵，但我不知道有什么不同。此外，使用lil_matrix或csr_matrix的每一个优点是什么？

浏览 4提问于2021-09-17得票数 3

2回答

用布尔掩码分割枕叶稀疏矩阵

、、、

在0.10.0和0.10.1中，我在分割枕叶稀疏矩阵的方式上遇到了不同之处。请考虑以下代码： from numpy import array, ravel from scipy.sparse import csr_matrix mat = csr_matrix(array([[1, 0, 0], [0,1,0], [1,0,0]])) desired_cols = ravel(mat.sum(0)) > 0 print mat[:, desired_cols].A 在“参与0.10.0”中，我得到了我期望得到的： [[1 0] [0 1] [1 0]] 在0.10.1和0.12.

浏览 2提问于2013-11-19得票数 5

回答已采纳

1回答

将稀疏矩阵的值赋给numpy数组

、、、

import numpy as np import scipy.sparse as scsp from scipy.sparse import csr_matrix,lil_matrix # create an empty numpy matrix wi=np.empty((num_clusters*num_cluster_neurons, input)) for i in range(num_clusters*num_cluster_neurons): temp_neuron_prob=dic_cluster_prob[dic_neuron_cluster[

浏览 6提问于2018-01-08得票数 0

回答已采纳

1回答

将稀疏的熊猫数据保存为拼花文件

、、、

我想要保存一个稀疏的pandassdataframe文件。不幸的是，底层pyarrow似乎不支持稀疏数据类型。考虑下面的示例代码： from scipy.sparse import csr_matrix import numpy as np import pandas as pd arr = np.random.random(size=(1000, 5)) arr[arr < .9] = 0 sp_arr = csr_matrix(arr) sdf = pd.DataFrame.sparse.from_spmatrix(sp_arr, columns = ['a'

浏览 1提问于2022-07-28得票数 0

2回答

访问矩阵并将值放入矩阵的最快方法

、、、

我写了一个程序，并且一直在分析它。瓶颈如下(如果我使用稀疏矩阵)： 26534 0.775 0.000 66.657 0.003 compressed.py:638(__setitem__) 26534 2.240 0.000 59.438 0.002 compressed.py:688(_set_many) 13318 2.993 0.000 50.024 0.004 compressed.py:742(_insert_many) 3034231 23.087 0.000 38.101 0.00

浏览 1提问于2015-06-08得票数 5

2回答

如何将稀疏numpy数组转换为Dataframe？

、、、、

下面是代码片段， from sklearn.compose import ColumnTransformer from sklearn.preprocessing import OneHotEncoder ct = ColumnTransformer(transformers=[('encoder',OneHotEncoder(),[2,3,4])],remainder='passthrough') X = np.array(ct.fit_transform(x_data)) X.shape 对于shape，我得到如下输出 () 当我尝试打印X时，我得到如下输

浏览 55提问于2020-11-09得票数 0

回答已采纳

2回答

从稀疏矩阵创建行、列、数据pandas数据帧

、、、、

如何创建COO格式的稀疏矩阵，并使pandas数据帧不解嵌到密集布局，而是保留COO格式用于row,column,data import numpy as np import pandas as pd from scipy.sparse import csr_matrix from scipy.sparse import coo_matrix a = np.eye(7) a_csr = csr_matrix(a) a_coo = a_csr.tocoo() print(a_coo) (0, 0) 1.0 (1, 1) 1.0 (2, 2) 1.0 (3,

浏览 55提问于2021-08-06得票数 0

回答已采纳

1回答

如何在sckit的NearestNeighbors中使用自定义项标识符

、、、、

我使用sckit-学习NearestNeighbors作为电影的推荐引擎，与电影镜头数据库。推荐引擎是一个基于项的重指挥官(一个项目的邻居是其他项目)。我正在将该算法的一个腌制版本放在一个API烧瓶应用程序后面。我使用电影的电影镜头I(标识符)，它们不是连续的。例:电影1，电影2，电影3，电影7，电影11等等(没有电影5，6，8，9，10)。这些ID作为Pandas的Int64Index存储。为了能够检索到合适的电影邻居，我需要两件事：根据其电影镜头ID检索正确的电影矢量NearestNeighbors算法必须将这些自定义ID作为邻居返回，而不是numpy数组的连续ID 否则，我将无法

浏览 0提问于2022-04-03得票数 2

1回答

如何在scipy sparse lil_matrix中存储显式的0值？

、、、

scipy.sparse.lil_matrix对象似乎不会显式存储设置为0的值。其他稀疏矩阵，如csr_matrix，可以这样做。考虑以下示例： In [1]: from scipy.sparse import lil_matrix In [2]: import numpy as np In [3]: x = lil_matrix((5, 5), dtype=np.float32) In [4]: x[3, 3] = 0 In [5]: x Out[5]: <5x5 sparse matrix of type '<class 'numpy.float32&

浏览 0提问于2018-10-31得票数 0

1回答

只能使用稀疏数据的“.sparse”访问器

、、

我用sparse=True参数对我的数据执行了OHE --这似乎什么都不做？我试过： # One Hot Encoding df_ohe = pd.get_dummies(df, columns=cats, drop_first=True, sparse=True) df_ohe = df_ohe.sparse.to_coo().tocsr() #Explicitely convert df_ohe.memory_usage().sum() ...which返回 AttributeError:只能使用稀疏数据的“.sparse”访问器。我会感谢你的帮助。谢谢!

浏览 3提问于2019-10-16得票数 1

回答已采纳

4回答

将scipy sparse csr转换为pandas？

、、、、

我已经使用了 sklearn.preprocessing.OneHotEncoder 要转换某些数据，输出为scipy.sparse.csr.csr_matrix，如何将其与其他列合并回原始数据帧？我试着使用pd.concat，但是我得到了 TypeError: cannot concatenate a non-NDFrame object 谢谢

浏览 3提问于2016-05-01得票数 46

回答已采纳

1回答

将大型.tiff文件导入为稀疏矩阵

、、、

我有一个大的.tiff文件(4.4gB，79530×54980值)，它有一个带。由于只有16%的值是有效的，所以我认为最好以稀疏矩阵的形式导入文件，以保存RAM。当我首先以np.array的形式打开它，然后使用csr_matrix()将它转换成稀疏矩阵时，我的内核已经崩溃了。请参阅下面的代码。 from osgeo import gdal import numpy as np from scipy.sparse import csr_matrix ds = gdal.Open("file.tif") band = ds.GetRasterBand(1) array = np

浏览 9提问于2022-03-18得票数 1

回答已采纳

1回答

如何获取scipy.sparse.csr.csr_matrix的log2

、、

这段代码我在np.log2()上运行时出错。如果我给它输入的是tmp.data，而不是tmp，它就能工作。这导致我得出结论，np.log2()不能在scipy.sparse.csr.csr_matrix上工作，但可以在scipy.sparse.csr.csr_matrix上通过调用csr_matrix.data转换为ndarray。唯一的问题是，下面我可以更改的代码期望得到一个scipy.sparse.csr.csr_matrix。我做什么好？ import numpy as np from numpy.linalg import norm import scipy from scipy.s

浏览 0提问于2020-05-24得票数 0

1回答

试图从大型csr_matrix数组构造NumPy时出现的“杀死: 9”错误

、、、、

我试图解决一个马尔可夫链问题，在这个问题中，转移矩阵包含大约15万行和列，但是它是稀疏的(只有大约45万个元素是非零的)。我注意到，试图从这样大小的csr_matrix数组构造np.zeros矩阵会导致Killed: 9错误： In [139]: N = 150000 In [140]: T = np.zeros((N, N)) In [142]: import scipy.sparse In [143]: _T = scipy.sparse.csr_matrix(T) Killed: 9 是否有可能构造这样大小的csr_matrix？我是否需要将矩阵T作为一个csr_matrix来启

浏览 5提问于2017-10-30得票数 0

回答已采纳

2回答

scipy.sparse.csr_matrix中行的求和

、、、、

我有一个大的csr_matrix，我想添加行并获得一个新的csr_matrix，其列数相同，但行数却减少了。(上下文:该矩阵是从sklearn获得的文档术语矩阵，我希望能够根据与这些文档相关的代码快速组合文档) 举个最小的例子，这是我的矩阵： import numpy as np from scipy.sparse import csr_matrix from scipy.sparse import vstack row = np.array([0, 4, 1, 3, 2]) col = np.array([0, 2, 2, 0, 1]) dat = np.array([1, 2, 3, 4

浏览 7提问于2015-04-14得票数 2

回答已采纳

1回答

在scipy.sparse和numpy中处理不同的切片行为

、、、、

设置我知道，在.sparse-module中，稀疏矩阵与numpy-arrays不同。另外，我知道像这样的关于稀疏数组切片的问题。无论如何，这个问题和大多数其他问题都涉及切片的性能。我的问题是如何处理他们不同的切片行为。让我们创建一个示例： import numpy as np from scipy import sparse matrix = np.asarray([[0,0,0,1], [1,1,0,0], [1,0,1,0], [1,0,0,1], [1,0,0,1], [1,0,0,1]]) sparse_matrix = sparse.lil_matrix(matrix) #

浏览 0提问于2019-07-22得票数 0

回答已采纳

1回答

Python -在我的函数中编写就地选项[如何防止覆盖输入向量]

、、、、

我正在编写一个函数，它从稀疏向量中提取最上面的x值(如果小于x，则减少值)。我想包括一个“就地”选项，就像许多函数一样，如果选项是True，它会移除顶部的值，如果选项为False，则保留它们。我的问题是，我当前的函数是覆盖输入向量，而不是保持原样。我不知道为什么会发生这种情况。我期望解决我的设计问题的方法是包含一个if语句，它将使用copy.copy()复制输入，但是这会引发一个值错误(ValueError: row索引超过矩阵维度)，这对我来说没有意义。代码： from scipy.sparse import csr_matrix import copy max_loc=20 data

浏览 3提问于2020-12-29得票数 1

回答已采纳

2回答

scipy.sparse.csr.csr_matrix:Matrix扩展

、、、

我正在使用sklearn做机器学习，works.Here是我的两个变量： >>> matrix <1397x9576 sparse matrix of type '<type 'numpy.float64'>' with 44655 stored elements in Compressed Sparse Row format> >>> type(density) <type 'list'> >>> len(density) 1397 ma

浏览 1提问于2018-03-27得票数 1

回答已采纳

1回答

如何在csr_matrix中获得列的平均值和标准差？

、、、

我有一个稀疏的988x1向量(csr_matrix中的列)是通过scipy.sparse创建的。有没有一种方法可以在不将稀疏矩阵转换为稠密矩阵的情况下获得其均值和标准差？ numpy.mean似乎只适用于密集向量。

浏览 0提问于2013-03-29得票数 8

回答已采纳

2回答

如何得到两个稀疏矩阵的集合差？

、、

我有两个矩阵A和B，我想找出它们之间的集合差异:A中所有元素的集合，但不是B中所有元素的集合。生成的矩阵必须是相同的形状，所以另一种说法是，A和B中的元素都必须设置为零。例如，使用以下矩阵： import numpy as np from scipy.sparse import csr_matrix A = csr_matrix([[1, 2, 3, 4, 5]]) B = csr_matrix([[6, 0, 7, 0, 9]]) 其结果将是： C = [[0, 2, 0, 4, 0]] 到目前为止，我一直在尝试使用python的set difference函数： def set_diff

浏览 5提问于2016-02-18得票数 0

回答已采纳

1回答

稀疏矩阵间的余弦距离

、、

我试图了解如何使用csr_matrix API及其cosine功能，并且遇到了dimension mismatch问题。我有两个(3,3)个矩阵： a = scipy.sparse.csr_matrix(np.reshape(np.arange(9), (3,3))) b = scipy.sparse.csr_matrix(np.reshape(np.arange(9)*2+5, (3,3))) 我要计算a[0]和b[0] a-la cosine(a[0], b[0])的余弦相似性(或余弦距离)。如果打印出a[0], b[0]的维数，就会得到： (<1x3 sparse matrix

浏览 2提问于2016-04-28得票数 1

回答已采纳

2回答

将稀疏矩阵中的特定行相对应

、、、

我有一个具有I行和U列的大型稀疏矩阵(使用scipy.sparse)，U比I大得多。我有一个在0:I范围内的U随机数列表。我想创建一个新的稀疏矩阵，它将是一个U*U稀疏矩阵，用户u的行将保存原稀疏矩阵第一行中的所有U值。例如，如果原始矩阵是3*5矩阵： 0,0,2,1,0 0,0,3,4,1 1,1,0,2,0 随机数的列表为0,0,2,1,2 由此产生的汇总表应是： 0,0,2,1,0 0,0,2,1,0 1,1,0,2,0 0,0,3,4,1 1,1,0,2,0 我现在正在使用这个代码，它非常慢： for u in range(U): i= random_indices[u]

浏览 2提问于2021-04-10得票数 0

回答已采纳

2回答

获取稀疏矩阵- Python的存储元素数

、、

我正在使用Python中的大型稀疏矩阵。矩阵的表示给出了存储元素的数量，例如 <100000x100000 sparse matrix of type '<type 'numpy.float64'>' with 1244024860 stored elements in Compressed Sparse Row format> 我的问题是:如何让1244024860返回数字给我呢？，我想使用这个数字近似于非零元素的数量(即使有些存储的元素可能是零)。对于较小的矩阵，我使用的是sparse_mat.count_nonzero()

浏览 0提问于2018-08-24得票数 1

回答已采纳

1回答

有没有可能在不使用scipy的情况下用numpy构建coo和csr矩阵？

、、、

我必须使用sicpy的sparse.coo_matrix和sparse.csr_matrix的等价物对矩阵进行操作。但是，我不能使用scipy (它与我想在中使用的图像分析软件不兼容)。但是，我可以使用numpy。有没有简单的方法来完成scipy.sparse.coo_matrix和scipy.sparse.csr_matrix所做的事情，只用numpy？谢谢!

浏览 0提问于2014-11-04得票数 0

1回答

通过稀疏矩阵在枕中访问元素

、

我在python中有以下代码 # dense to sparse from numpy import array from scipy.sparse import csr_matrix # create dense matrix A = array([[1, 0, 0, 1, 0, 0], [0, 0, 2, 0, 0, 1], [0, 0, 0, 2, 0, 0]]) print(A) # convert to sparse matrix (CSR method) S = csr_matrix(A) print(S) # reconstruct dense matrix B = S.tode

浏览 5提问于2021-09-12得票数 0

回答已采纳

1回答

如何在稠密的numpy矩阵和稀疏的枕叶向量之间进行有效的矩阵乘法？

、、、、

使用@将稠密的numpy矩阵与稀疏的枕叶向量相乘是非常低效的。它似乎完全没有利用矢量的稀疏性。说我们有 A = np.eye(5000) x = np.eye(5000)[333] x = scipy.sparse.coo_matrix(x).T # make it a sparse vector 然后使用@进行乘法： %timeit A @ x 8 ms ± 78.7 µs per loop (mean ± std. dev. of 7 runs, 100 loops each) 让我们自己写一个极其糟糕的稀疏乘法： def mult_dense_with_sparse(A, x):

浏览 1提问于2018-09-12得票数 0

1回答

向scipy sparse添加维度

、、、

我希望给稀疏矩阵增加一个维度。在numpy中，这只是一个做[:,None]的问题。我尝试了reshape和resize，但没有任何成功。以下是一些虚拟数据： from scipy.sparse import csr_matrix data = [1,2,3,4,5,6] col = [0,0,0,1,1,1] row = [0,1,2,0,1,2] a = csr_matrix((data, (row, col))) a.reshape((3,2,1)) 最后一行给出了错误：ValueError: matrix shape must be two-dimensional。相反，执行

浏览 37提问于2020-07-07得票数 0

回答已采纳

2回答

重塑枕叶csr矩阵

、、

我如何有效地重塑和scipy.sparse csr_matrix？我需要在末尾加零行。使用： from scipy.sparse import csr_matrix data = [1,2,3,4,5,6] col = [0,0,0,1,1,1] row = [0,1,2,0,1,2] a = csr_matrix((data, (row, col))) a.reshape(3,5) 我知道这个错误： Traceback (most recent call last): File "<stdin>", line 1, in <module> File

浏览 0提问于2018-04-29得票数 0

回答已采纳