我有一个庞大的数据(文本)语料库,我已经将其转换为稀疏术语文档矩阵(我使用scipy.sparse.csr.csr_matrix来存储稀疏矩阵)。我希望为每个文档找到前n个最近的邻居匹配。我希望Python scikit-learn库中的NearestNeighbor例程(准确地说是sklearn.neighbors.NearestNeighbor)可以解决我的问题,但是使用空间分区数据结构(如KD trees或Ball trees )的高效算法不能处理稀疏矩阵。只有蛮力算法才能处理稀疏矩阵(这在我的情况
k stands for k-cycle, and A is the adjacency matrix, Pk-1 is the path count matrix
我现在正在尝试用python编写这个简单的公式,我可以使用NetworkX的adjacency_matrix函数来获得邻接矩阵,我也可以获得矩阵的迹。我只是不确定所谓的路径计数Pk矩阵,我在谷歌上搜索了一段时间,但在this.Could上没有找到直接的解释专家建议这个Pk矩阵是什么,我想知道是否有可能用