本帖最后由 seumx 于 2013-11-1 18:06 编辑
acone 发表于 2013-11-1 07:00
非常感谢seumx老大给予的帮助,让我一大早就能看到这个好信息。
(1)我评估了一下,如果用迭代法的话 ...
(1)CG非析因形式的源代码那本很老的<GPU高性能运算之CUDA>书上有,照着敲进去就行了。我不知道你矩阵的性态怎么样,如果不太差那这个CG足够你用了
(2)我手上的卡只有3.0的,环境还是4.2,没有具体看过5.5的LU分解,貌似用DP做的。如果你有3.5的卡那就用sample的例子+cublas里的三角解方程调用两次就可以了。多说一句,LU分解是一个很好的CUDA例子,个人并不推荐用DP去实现这么通用性的算法,如果你时间不是很急我个人觉得还是自己实现下LU分解~一样可以实现非常棒的效果 |