我试图用data.table包解决以下问题:[有没有比'‘更快的方法来子集稀疏矩阵 Error in Z[, cols] : invalid or not-yet-implementedtapply(.SD, INDEX = "gene_name", FUN = simple_fun, Z = Z, 以下是我的解决方案:
l
基本上,我有一个巨大的稀疏矩阵(大约300 k x 150 k,最初是用R的{tm}包创建的术语文档矩阵),它使用{slam}包保存为一个简单的三重子矩阵,并且我运行一个函数,它遍历一组术语,然后根据这些项对其进行细分不幸的是,细分过程非常缓慢。
在试图更快地找到子集的过程中,我偶然发现了data.table包,它在我使用它运行的</em
我正在尝试将dgCMatrix类的稀疏矩阵子集设置为训练和测试集,然后将这些矩阵转换为xgb.DMatrix对象以运行eXtremeGradientBoosting。我运行以下代码(它是可重现的):b <- cast_sparse(a,X1,X2,X3p[[1]]) :
The length of labels must equal to the numb
该文件是使用FFT函数作为卷积的输出创建的,其中涉及将原始光栅分解成六条,每条处理一条,并使用重叠添加方法将结果矩阵附加到csv文件中。我现在试图使用R包GeoTIFF将结果写回光栅文件类型(例如ESRI、等)。CSV文件中的每个数字映射到光栅的等效单元格。在R中这样做的明显方法是:library(data.table)
data <- fr
我有两个大小为100000 x 100000的sq矩阵(a,b)。我必须求这两个矩阵的差(c = a-b)。结果矩阵'c‘是一个稀疏矩阵。我想找出所有非零元素的索引。最简单的方法是使用两个for循环。但这是计算密集型的。你能告诉我任何算法或包/库,最好是在R/python/c中尽可能快地做到这一点吗?
我希望通过提供矩阵的维数m x n以及我期望的非零元素的数量来预先分配R中的稀疏矩阵(使用simple_triplet_matrix)。Matlab有函数"spalloc“(见下文),但我在R中找不到对应的函数。有什么建议吗?S= spalloc(m,n,nzmax)创建一个大小为m×n的全零稀疏矩阵S,该矩阵