由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 有没有玩CUDA的?
相关主题
请问程序同时在多个cpu上运行需要怎么改程序?谈谈想学好底层必不可少的东西
我写的CUDA屏保软件 (转载)看了那个招聘的帖子,自觉需要把 atoi温习一下。赶紧的
我写的CUDA屏保软件-公开源码 (转载)懂deepmind得说说
请问该学点啥?centos 7下自动安装各种CNN库
招GPU工程师 (转载)C++ Software Engineer 工作求内推(Boston)
问wdong一个问题,学习openGL从哪儿开始学好什么FP能替代python
opencl vs cuda问个选语言的问题
按说java也够快了并行可以降低计算复杂度??
相关话题的讨论汇总
话题: cuda话题: gpu话题: 有没有话题: tesla话题: 速度
进入Programming版参与讨论
1 (共1页)
k****f
发帖数: 3794
1
看了一下手册,感觉就是拼处理器个数的
按照单个指令速度,比intel的cpu差多了
cuda里面说,一个加法用4个周期,乘法要多一些,除法就更多了
那些峰值速度,哪些程序能接近呢??
w***g
发帖数: 5958
2
CUDA这东西最大的问题就是memory bandwidth. GPU跟main memory之间的带宽是一个瓶
颈. 对于那些用迭代法解方程之类的问题, 如果所有的数据都能放进GPU, 那自然很好
, 但是对大规模数据集其实GPU帮助并不大. 还有就是GPU的散热问题是很严重的, 这也
是GPGPU目前还不能被应用在服务器领域的一个原因.
CUDA目前发展还很不成熟, 编个正确的程序不难, 但是要手工优化内存地址的依赖关系
还是很难的.

【在 k****f 的大作中提到】
: 看了一下手册,感觉就是拼处理器个数的
: 按照单个指令速度,比intel的cpu差多了
: cuda里面说,一个加法用4个周期,乘法要多一些,除法就更多了
: 那些峰值速度,哪些程序能接近呢??

r*********r
发帖数: 3195
3
用 Tesla, 内存还是不小的. 一块C1060 就有4GB
k****f
发帖数: 3794
4
tesla太变态了,那么大内存的。
不过下一代GT300马上要出来的,据说有480个核心,速度应该在2G左右
算下来,有1T的速度了

【在 r*********r 的大作中提到】
: 用 Tesla, 内存还是不小的. 一块C1060 就有4GB
r*********r
发帖数: 3195
5
图形卡的供电散热确实有问题, 虽然峰值很高, 但是不能持续.
如果做 server side 计算, 还是要用 tesla.
现在做 machine learning, data mining 的, cuda 很热门.
跟 cluster 比起来, 感觉编程还是要简单一点.
p****f
发帖数: 251
6
不用学了,DUDA一定会被Larrabee淘汰。

【在 k****f 的大作中提到】
: 看了一下手册,感觉就是拼处理器个数的
: 按照单个指令速度,比intel的cpu差多了
: cuda里面说,一个加法用4个周期,乘法要多一些,除法就更多了
: 那些峰值速度,哪些程序能接近呢??

r******y
发帖数: 3838
7
wait openCL
1 (共1页)
进入Programming版参与讨论
相关主题
并行可以降低计算复杂度??招GPU工程师 (转载)
有熟悉CUDA的吗?不胜感谢赐教问wdong一个问题,学习openGL从哪儿开始学好
MacBook Pro is more powerful than NVDA GPU?opencl vs cuda
基本适合深度学习的笔记本laptop按说java也够快了
请问程序同时在多个cpu上运行需要怎么改程序?谈谈想学好底层必不可少的东西
我写的CUDA屏保软件 (转载)看了那个招聘的帖子,自觉需要把 atoi温习一下。赶紧的
我写的CUDA屏保软件-公开源码 (转载)懂deepmind得说说
请问该学点啥?centos 7下自动安装各种CNN库
相关话题的讨论汇总
话题: cuda话题: gpu话题: 有没有话题: tesla话题: 速度