前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >CUSP中报错xxx_matrix fill-in would exceed maximum tolerance

CUSP中报错xxx_matrix fill-in would exceed maximum tolerance

作者头像
小锋学长生活大爆炸
发布2022-06-19 15:58:37
2480
发布2022-06-19 15:58:37
举报
文章被收录于专栏:小锋学长生活大爆炸

目录

情景复现

报错原因

解决方法

最后说明


情景复现

在调用cusp::io::read_matrix_market_filecusp::convert函数对diaell格式的稀疏矩阵进行操作的时候,都可能会出现这个问题。

报错原因

其实就是转换后的dia、ell等格式的矩阵太大了,报错提示你可能会把内存耗完。

但话说回来,现在N显卡动不动20+G的内存,一个8M的矩阵,不至于会把他耗完吧?

看到CUSP最新的0.6版本也只是在2016年发布,我估计在那时候显卡还没这么发达。而且通过nvidia-smi -lms动态查看显卡调用,发现才用了250M内存啊。所以应该是代码里进行了限制。

解决方法

通过一步一步断点调试跟踪,最终发现,在这个地方进行了限制:

源码路径:cusp\system\detail\generic\conversions

先以coo_to_other.h来看:

(以read_matrix_market_file函数为例,convert函数可以照此调试跟踪。实际read_matrix_market_file内部也调用了convert)

可以发现,threshold被设置了1000000(1百万)个entries(元素),而我们的矩阵高达70000000(7千万)个元素。

前面的fill_ratio也不知道啥意思,但它的if用的是&&(与),那简单粗暴,直接把threshold改大试试(我改成了1e10)...

改完发现确实成功了,我这低端的MX150显卡都能存7千万个元素,那说明改大也没啥大问题。

最后说明

1、主要我在CUSP的github和网上都没搜索到相应的解决方案,所以这里私自更改源码调大threshold,大家仅供参考。如果大家有更好的方法,欢迎留言评论~~

2、如果要改threshold,视实际使用情况,记得把目录下其他相关文件的threshold也改了。

3、记得改完后,重新nvcc编译哦。

CUSP官方文档:CUSP: Main Page (cusplibrary.github.io)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-06-18,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 情景复现
  • 报错原因
  • 解决方法
  • 最后说明
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档