目录
在调用cusp::io::read_matrix_market_file和cusp::convert函数对dia或ell格式的稀疏矩阵进行操作的时候,都可能会出现这个问题。
其实就是转换后的dia、ell等格式的矩阵太大了,报错提示你可能会把内存耗完。
但话说回来,现在N显卡动不动20+G的内存,一个8M的矩阵,不至于会把他耗完吧?
看到CUSP最新的0.6版本也只是在2016年发布,我估计在那时候显卡还没这么发达。而且通过nvidia-smi -lms动态查看显卡调用,发现才用了250M内存啊。所以应该是代码里进行了限制。
通过一步一步断点调试跟踪,最终发现,在这个地方进行了限制:
源码路径:cusp\system\detail\generic\conversions
先以coo_to_other.h来看:
(以read_matrix_market_file函数为例,convert函数可以照此调试跟踪。实际read_matrix_market_file内部也调用了convert)
可以发现,threshold被设置了1000000(1百万)个entries(元素),而我们的矩阵高达70000000(7千万)个元素。
前面的fill_ratio也不知道啥意思,但它的if用的是&&(与),那简单粗暴,直接把threshold改大试试(我改成了1e10)...
改完发现确实成功了,我这低端的MX150显卡都能存7千万个元素,那说明改大也没啥大问题。
1、主要我在CUSP的github和网上都没搜索到相应的解决方案,所以这里私自更改源码调大threshold,大家仅供参考。如果大家有更好的方法,欢迎留言评论~~
2、如果要改threshold,视实际使用情况,记得把目录下其他相关文件的threshold也改了。
3、记得改完后,重新nvcc编译哦。