如何用CUDA同时计算几百个实对称矩阵的eigenvalues/eigenvecot (转载) - JobHunting版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

JobHunting版 - 如何用CUDA同时计算几百个实对称矩阵的eigenvalues/eigenvecot (转载)

相关主题
● 今天一道面试题主动跪了	● One opening on GPU/GPGPU.
● 谁能言简意赅解释下为什么page rank算法肯定converge	● GPU 编程有没有钱途？ (转载)
● 请问各位有没有 Mathworks on site 的经历？	● 精算部门Software Programmer -CT (转载)
● 加州Sunnyvale工作机会(Dolby)	● C++ Software Engineer 工作求内推（Boston)
● Potential position on CUDA, image processing	● 跪求NVIDIA内推
● Google第二轮电面	● 真心求NVIDIA内推，两年CUDA研究经验，C/C++
● 现在搞CUDA的好不好找工作	● 招GPU工程师
● 求Graphic方面的书籍	● Image Processing行业怎么样？

相关话题的讨论汇总
话题: 矩阵话题: cuda话题: gpu话题: eigenvecot

进入JobHunting版参与讨论

1

(共1页)

g**********t 发帖数: 475	1 【以下文字转载自 Computation 讨论区】发信人: geneticdrift (不懂微积分), 信区: Computation 标题: 如何用CUDA同时计算几百个实对称矩阵的eigenvalues/eigenvecot 发信站: BBS 未名空间站 (Mon Jul 2 02:38:51 2012, 美东) 我有一个程序要反复计算几百个（约500个）64 x 64的实对称矩阵的所有的 eigenvalues/eigenvectors。自己用CUDA实现了一个Jacobi algorithm with chess tournament ordering。具体来说，每个block(含有32个threads)处理一个矩阵，这32 个threads并行消去一个矩阵中的32个off-diagonal elements，直到算法收敛。结果无误，计算单个矩阵所花的时间也和最近的一篇paper里的数据接近。但是这个算法和CPU 上的library比没有太大的优势。在同时处理这500个矩阵的情况下，和GSL里面高度优化的函数比较(用单CPU)，用GPU仅仅快了一倍。我觉得主要是Jacobi algorithm对于这个大小的矩阵效率太差，而GSL里面的函数用的好像是QR decomposition，虽然只有一个thread但是效率很高。有没有比较适合我的问题的能在GPU上高效执行的算法？有没有什么paper/code可以参考的？先谢谢了。
c****p 发帖数: 6474	2 因为里面的控制流太多了吧。 32 CPU 【在 g**********t 的大作中提到】 : 【以下文字转载自 Computation 讨论区】 : 发信人: geneticdrift (不懂微积分), 信区: Computation : 标题: 如何用CUDA同时计算几百个实对称矩阵的eigenvalues/eigenvecot : 发信站: BBS 未名空间站 (Mon Jul 2 02:38:51 2012, 美东) : 我有一个程序要反复计算几百个（约500个）64 x 64的实对称矩阵的所有的 : eigenvalues/eigenvectors。自己用CUDA实现了一个Jacobi algorithm with chess : tournament ordering。具体来说，每个block(含有32个threads)处理一个矩阵，这32 : 个threads并行消去一个矩阵中的32个off-diagonal elements，直到算法收敛。结果无 : 误，计算单个矩阵所花的时间也和最近的一篇paper里的数据接近。但是这个算法和CPU : 上的library比没有太大的优势。在同时处理这500个矩阵的情况下，和GSL里面高度优
s***0 发帖数: 117	3 What's the model of the GPU? And, did you try using the NVIDIA SDK eigenvalue code?
g**********t 发帖数: 475	4 显卡用的是tesla M2070 (Fermi generation)。已经看过了cuda SDK里面的例子，但是那个是bisection algorithm，貌似这个算法只能算eigenvalues，不能算eigenvectors? 【在 s***0 的大作中提到】 : What's the model of the GPU? : And, did you try using the NVIDIA SDK eigenvalue code?

1

(共1页)

进入JobHunting版参与讨论

相关主题
● Image Processing行业怎么样？	● Potential position on CUDA, image processing
● Openings in Qualcomm	● Google第二轮电面
● 发个mathworks电面	● 现在搞CUDA的好不好找工作
● Bloomberg offer (附面经)	● 求Graphic方面的书籍
● 今天一道面试题主动跪了	● One opening on GPU/GPGPU.
● 谁能言简意赅解释下为什么page rank算法肯定converge	● GPU 编程有没有钱途？ (转载)
● 请问各位有没有 Mathworks on site 的经历？	● 精算部门Software Programmer -CT (转载)
● 加州Sunnyvale工作机会(Dolby)	● C++ Software Engineer 工作求内推（Boston)

相关话题的讨论汇总
话题: 矩阵话题: cuda话题: gpu话题: eigenvecot

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)