腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1091)
视频
沙龙
1
回答
cuSolverDN
或
其他
CUDA
库
是否
有
针对
密集
矩阵
的
QR
分解
的
批处理
版本
,以
求解
A*
x
=
b
?
、
、
我正在尝试
求解
A*
x
=
b
,其中A具有复数值,并且是稠密
的
。这个方法有没有“
批处理
”
的
版本
?或者我还可以使用
其他
CUDA
库
?
浏览 12
提问于2017-07-14
得票数 0
1
回答
求解
具有相同
矩阵
的
多个线性方程组
的
预计算策略?
、
、
通常在建模、数据处理和优化中;代码
的
密集
部分通常可以简化为
求解
许多线性方程组。solve for
x
1 in A
x
1 =
b
1..。诸若此类 有时
矩阵
'A‘在计算之间不会发生变化,我
的
问题是,我如何(以及何时)利用这一点与一些预计算?这假设您已经使用了为您
的
系统优化
的
线性代数
库</
浏览 0
提问于2016-06-01
得票数 2
回答已采纳
6
回答
y=Ax
的
Boost线性代数解法
、
、
、
boost
有
吗?其中A、y和
x
分别是
矩阵
(稀疏且可以非常大)和向量。Y
或
x
都可以是未知
的
。 我似乎在这里找不到它:
浏览 1
提问于2009-08-04
得票数 9
回答已采纳
3
回答
各种
b
's稀疏带Ax=
b
的
批次
CUDA
解
、
、
、
、
我
有
一个稀疏
的
带状
矩阵
A,我想(直接)
求解
Ax=
b
。我
有
大约500个向量
b
,所以我想为相应
的
500个向量
求解
。我对数据自动化系统非常陌生,所以我有点不知道我
有
什么选择。cuSOLVER
有
一个
批处理
直接
求解
器cuSolverSP,用于使用
QR
的
稀疏A_i
x
_i =
b
_i。(我对LU也没意见
浏览 3
提问于2015-05-07
得票数 6
回答已采纳
2
回答
用块稀疏
矩阵
求解
大型线性方程组
、
、
、
我想要
求解
Ax =
b
,其中A是一个非常大
的
正定对称分块
矩阵
,
x
和
b
是向量。当我说大
的
时候,我指的是对于一个nxn
矩阵
,一个和300,000一样大
的
n。下面是我想要
求解
的
一个小得多但具有代表性
的
矩阵
的
示例。这里是放大
的
相同
矩阵
,表明它是由
密集
矩阵
的</em
浏览 8
提问于2016-05-13
得票数 17
2
回答
用于
求解
许多“小/中”线性系统
的
CUDA
、
、
、
、
关于我正在尝试使用
CUDA
加速
的
问题
的
一些背景信息:我仍然<
浏览 7
提问于2017-07-23
得票数 1
3
回答
在julia中高效地
求解
特定
的
线性系统
、
、
我广泛使用Julia线性方程
求解
器res =
X
\
b
。由于参数
的
变化,我不得不在我
的
程序中使用它数百万次。这工作得很好,因为我使用
的
是小维度(最高可达30)。现在我想分析更大
的
系统,直到1000,线性
求解
器不再有效。 我认为可以
有
一个变通
的
办法。然而,我必须说,有时我
的
X
矩阵
是
密集
的
,有时是稀疏
的
,所以我需要一
浏览 34
提问于2016-07-21
得票数 3
1
回答
如何
求解
稀疏
矩阵
的
线性方程AX=
b
、
我
有
稀疏
矩阵
A(12万*12万)和一个向量
b
(12万),我想用特征
库
来
求解
线性系统AX=
b
。我试着跟踪文档,但总是有错误。我还尝试将
矩阵
转换为稠密,并解决了系统
的
问题。MatrixXd(A); Eigen::VectorXd RR = dec.solve(
b
)请帮我找出解决这个问题
的
办法
浏览 2
提问于2017-12-08
得票数 3
回答已采纳
2
回答
固定尺寸
的
SVD和
CUDA
中
的
解算器(在设备中)
、
、
、
、
我在GPU (
CUDA
)上实现了一个程序,它只使用主机(在C++中)启动新内核。在设备
的
计算过程中,需要、SVD、和
求解
系统
的
3
x
3 (稠密)
矩阵
,尺寸固定。我
有
自己
的
SVD和
求解
器实现,但它不是数值稳定
的
(因此不能使用)。由于我是C++和
CUDA
的
新手,我宁愿使用一个
库
来代替。但目前还不清楚数据自动化系统
的
支持(据说是实验性
的
浏览 2
提问于2015-10-28
得票数 1
6
回答
解线性方程组
、
我
有
一个由6个方程组成
的
系统,我需要在程序中一遍又一遍地
求解
(当然,
有
许多不同
的
输入)。我目前正在使用Cramer规则方法来解决这个系统,它工作得很好(似乎我
的
处理器真的很喜欢加法和乘法运算,尽管显式方程
的
长度超过2页,但它在1微秒内就得到了解)。然而,我需要解决
的
次数是巨大
的
,我正在寻找一种更快
的
方法。 问题是,有没有更快
或
更有效
的
方法来
求解
这些方程,或者像<e
浏览 3
提问于2010-07-24
得票数 6
回答已采纳
7
回答
尽可能快地计算
矩阵
的
零空间
、
、
、
我需要并行(
CUDA
)计算几千个小
矩阵
的
零空间(8
x
9,而不是我之前写
的
4
x
3 )。所有的参考文献都指向SVD,但是数值配方中
的
算法似乎非常昂贵,并且给了我很多东西,而不是我真正需要
的
空空间。还有没有
其他
常用
的
方法?
浏览 0
提问于2010-02-02
得票数 21
回答已采纳
1
回答
CUBLAS:解决许多(3
x
3)稠密线性系统
的
问题
、
、
、
、
我试图用
CUDA
10.1解决大约1200000个线性系统(3
x
3,Ax=
B
),特别是使用CUBLAS
库
。我接受了
的
提示,在统一内存
版本
中重写了建议
的
代码。该算法首先使用cublasgetrfBatched()进行LU
分解
,然后连续调用cublastrsm(),
求解
上、下三角线性系统。代码附在下面。我
的
问题/问题是: 过载问题:它崩溃,为超过10k
矩阵
分配内存。为什么?如何改进我
浏览 9
提问于2020-11-03
得票数 1
回答已采纳
2
回答
使用OpenMP
的
多级并行性--
有
可能吗?聪明?实用?
、
、
、
、
我目前正在为我管理
的
一个模拟工具开发一个C++稀疏
矩阵
/数学/迭代
求解
器
库
。好消息是我
的
求解
器和稀疏
矩阵
结构现在非常高效和健壮。坏消息是,我现在正在研究使用OpenMP
的
并行化,学习曲线有点陡峭。 我们
求解
的
域可以
分解
为子域,这些子域
以
块对角线格式聚集在一起。中
的
“热点”迭代
求解
器是
矩阵
向量乘法运算,我<em
浏览 2
提问于2010-07-02
得票数 6
回答已采纳
2
回答
解决超定约束系统
、
、
、
我
有
n实数变量(不知道,也不是很关心),我们称它们为
X
[n]。我也有它们之间
的
m >> n关系,我们称它们为R[m],形式如下:
X
[i] = alpha*
X
[j],alpha是一个非零正实数,i和j是不同
的
,但(i, j)对不一定是唯一
的
(即,相同变量之间可以
有
两个不同
的
阿尔法因子所以我现在要做
的
是在混合中添加另一个方程,
x
[0] = 1 (实际上任何常数都可以),然后用摩尔-彭罗斯伪
浏览 3
提问于2011-08-19
得票数 7
回答已采纳
2
回答
如何利用gsl在C++上实现左
矩阵
除法
、
、
、
、
我想实现
矩阵
A和列向量
B
之间
的
左
矩阵
除法。我想要
的
结果
X
= A\
B
是解,在最小二乘意义下
的
欠定
或
过定方程组AX =
B
。换句话说,
X
将norm(A*
X
-
B
)最小化,即向量AX -
B
的
长度。这意味着,我希望它
浏览 6
提问于2011-10-31
得票数 5
回答已采纳
5
回答
大
矩阵
反演方法
、
、
、
、
嗨,我一直在研究
矩阵
求逆(线性代数),我想用C++模板编程来实现这个算法,我发现有很多种方法,比如:Gauss消去法
或
LU
分解
法,我找到了函数LU_factorize (c++ boost library我想知道
是否
还有
其他
方法,从程序员
或
数学家
的
角度来看,哪种方法更好(优点/缺点)? 如果没有
其他
更快
的
方法,那么boost
库
中
是否
已经
有
了(
矩阵
)反
浏览 8
提问于2010-07-28
得票数 4
回答已采纳
1
回答
是否
有
一种方法可以进一步提高使用python
的
稀疏解决方案时间?
、
、
、
、
为了生成适当
的
稀疏
矩阵
,采用带带状结构,采用N=250、N=500和N=1000三种网格
的
有限单元
求解
泊松问题。这导致
矩阵
A=N^2xN^2和向量
b
=N^2
x
1
的
维数,即最大NxN为100万。如果有人
有
兴趣复制我
的
结果,我已经上传了
矩阵
A和向量
b
在下面的链接(它将在30天内到期) 。
矩阵
存储在I,J,V三重列中,即前两列分别是行和列
的
索引,第三列
浏览 1
提问于2020-10-17
得票数 9
回答已采纳
6
回答
Ax=
b
线性代数系统
的
C++内存有效解
、
、
、
、
我正在使用Boost UBlas
的
数值
库
绑定来解决一个简单
的
线性系统。下面的代码运行良好,只是它仅限于处理相对较小
的
'm‘
的
矩阵
A(m
X
m)。实际上,我
有
一个更大
的
矩阵
,维度为m= 10^6 (最大可达10^7)。 { ublas:
浏览 3
提问于2009-08-07
得票数 9
回答已采纳
5
回答
大
矩阵
求逆
、
、
、
、
我正在考虑取一个大
矩阵
的
逆
矩阵
,通常大小为1000
x
1000,但有时会超过100000
x
100000 (由于时间和内存
的
原因,它目前正在失败)。我知道正常
的
情绪是‘不要反其道而行之,找一些
其他
的
方法来做’,但这在目前是不可能
的
。这样做
的
原因是因为使用了已经制作
的
软件,这些软件希望得到
矩阵
的
逆
矩阵
。我已经快速浏览了
其他
浏览 1
提问于2012-06-27
得票数 18
回答已采纳
4
回答
CPU和GPU中
的
SVD速度
、
、
、
、
我在Matlab R2014a中测试svd,似乎没有CPU和GPU
的
加速。我使用
的
是GTX 460卡和Core 2 duo E8500。下面是我
的
代码:n=10000;Mh= rand(n,1000);%[Uh,Sh,Vh]= svd(Mh);tocMd= gpuArray.rand(n,1000);%[Ud,Sd,Vd]= svd(Md);toc 此外,每次运行
的
运行时间都不同,但CPU和GPU
版本<
浏览 0
提问于2014-11-07
得票数 8
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
开发者必读:计算机科学中的线性代数
一文揭开 NVIDIA CUDA 神秘面纱
使用 Python 生成二维码
用于机器学习的线性代数速查表
CV干货来袭
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券