请问有没有Nvidia GPU在CUDA上计算的benchmark - Hardware版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Hardware版 - 请问有没有Nvidia GPU在CUDA上计算的benchmark

相关主题
● 大家帮看看这台做GPU并行计算的机器	● 【数值计算】求机器配置建议！
● 现在AMD和NVidia计算方面的对比都不公平	● 大家说说 cuda 和 opencl 吧
● 求个建议装机计算用	● 那个$749的Lenovo Y470算是deal吗？
● 用于科学计算的单机该怎么配	● 请推荐4U机箱和电源（4GPU）
● 有什么好的GPU计算平台推荐吗?	● 矿机问题
● 3000的预算在Dell能买到什么样的workstation	● AMD的APU上跑ArrayFire的exception
● ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?	● 有了解AMD的APU的大虾吗?
● 我写的CUDA屏保软件	● ZZ显卡之争:NVIDIA笔记本反弹 AMD桌面前进

相关话题的讨论汇总
话题: cuda话题: nv话题: gpu话题: opencl话题: amd

进入Hardware版参与讨论

(共1页)

E***e
发帖数: 3430

具体到Monte Carlo的最好
类似这样的
找到的benchmark全都是在OpenCL上跑NV，明显不太公平
所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
问题问到再具体不过了，请那些不懂的不要进来犯贱扯什么CPU，优化，挖矿，dense
matrix, hyper之类不着边的东西。
我就是问NV GPU在CUDA上的benchmark，最好是Monte Carlo，谢谢！

S******n
发帖数: 5022

算Monte Carlo还是AMD的卡好。
CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
只要不涉及复杂的包含函数的科学计算，一般都是AMD的显卡快。特别是像金融计算、
密码学计算。

【在 E***e 的大作中提到】

: 具体到Monte Carlo的最好
: 类似这样的
: 找到的benchmark全都是在OpenCL上跑NV，明显不太公平
: 所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
: 问题问到再具体不过了，请那些不懂的不要进来犯贱扯什么CPU，优化，挖矿，dense
: matrix, hyper之类不着边的东西。
: 我就是问NV GPU在CUDA上的benchmark，最好是Monte Carlo，谢谢！

E***e
发帖数: 3430

要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了

【在 S******n 的大作中提到】

: 算Monte Carlo还是AMD的卡好。
: CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
: 只要不涉及复杂的包含函数的科学计算，一般都是AMD的显卡快。特别是像金融计算、
: 密码学计算。

z******i
发帖数: 1292

不如比微软的direct computing, AMD和NV就各显神通了。
NV也有OpenCL啊，NV的OpenCL最终也是靠CUDA执行的，CUDA层次更低。
你这个问法，其实就像在问：不同CPU上，一个使用汇编语言，一个使用Basic语言，
那个性能好。这个比法本来就有些不公平啊。

【在 E***e 的大作中提到】

: 要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了

a*s
发帖数: 425

像他这种问法，还那么狂，有意义么，太自以为是了
这里本来就是硬件论坛，不是科学计算的论坛，
而且，大家都可以有发表自己意见的权利
刚才我叫他自宫，他还真自宫了
然后，再起这个帖子，还在里面说什么”犯贱“
真不知道，这家伙怎么想的
你再自宫啊

【在 z******i 的大作中提到】

: 不如比微软的direct computing, AMD和NV就各显神通了。
: NV也有OpenCL啊，NV的OpenCL最终也是靠CUDA执行的，CUDA层次更低。
: 你这个问法，其实就像在问：不同CPU上，一个使用汇编语言，一个使用Basic语言，
: 那个性能好。这个比法本来就有些不公平啊。

E***e
发帖数: 3430

我只是从计算角度出发，不是从硬件角度出发
你用OpenCL在NV的GPU上跑计算
隔着一层转换
明显不是最高的效率
像一楼这样的比较根本没比头
从计算的角度，要比就要比同样的simulation
AMD在OpenCL上编
NV在CUDA上编
然后两个拼速度
这才有意义

【在 z******i 的大作中提到】

z******i
发帖数: 1292

http://vga.zol.com.cn/410/4108339.html
http://vga.zol.com.cn/410/4108340.html
http://vga.zol.com.cn/410/4108341.html
http://vga.zol.com.cn/410/4108342.html

【在 E***e 的大作中提到】

: 我只是从计算角度出发，不是从硬件角度出发
: 你用OpenCL在NV的GPU上跑计算
: 隔着一层转换
: 明显不是最高的效率
: 像一楼这样的比较根本没比头
: 从计算的角度，要比就要比同样的simulation
: AMD在OpenCL上编
: NV在CUDA上编
: 然后两个拼速度
: 这才有意义

E***e
发帖数: 3430

可是依然没有互相独立线程计算的暴力重复啊
CFD和其他用于图形的矩阵运算其实还不是monte carlo那么简单粗暴的

【在 z******i 的大作中提到】

: http://vga.zol.com.cn/410/4108339.html
: http://vga.zol.com.cn/410/4108340.html
: http://vga.zol.com.cn/410/4108341.html
: http://vga.zol.com.cn/410/4108342.html

a***e
发帖数: 27968

NV从opencl到CUDA会出现2X的性能损失不？

【在 E***e 的大作中提到】

E***e
发帖数: 3430

这就是我最好奇的问题
看了一圈下来没人说这件事
然后tomshardware拼命的在OpenCL上拼硬件
越来越有一种AMD写手的感觉

【在 a***e 的大作中提到】

: NV从opencl到CUDA会出现2X的性能损失不？

相关主题
● 3000的预算在Dell能买到什么样的workstation	● 【数值计算】求机器配置建议！
● ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?	● 大家说说 cuda 和 opencl 吧
● 我写的CUDA屏保软件	● 那个$749的Lenovo Y470算是deal吗？
进入Hardware版参与讨论

a***e
发帖数: 27968

很难想象会出现2X
Nv的OpenCL又不是什么新手
CUDA这种独门独户的东西，学校里用用，搞搞科研，上几个免费PHD靠谱
说实话，你要是软件公司的，除非NV给钱
否则你愿意搞个东西除了NV上能跑其他都不能跑的
写OpenCL的，至少都跑起来了，就算在NV效率差点，
也比CUDA在AMD和其他的完全起不来靠谱
你要的这种数据，其实应该看NV的market文档
要是丫自己都不敢吹，真的就别抱太大希望

【在 E***e 的大作中提到】

: 这就是我最好奇的问题
: 看了一圈下来没人说这件事
: 然后tomshardware拼命的在OpenCL上拼硬件
: 越来越有一种AMD写手的感觉

E***e
发帖数: 3430

如果2X以内，那绝对AMD靠谱了
OpenCL唯一要解决的就是一些数学函数还没找到好的Library
回头试试ArrayFire
多谢了！

【在 a***e 的大作中提到】

: 很难想象会出现2X
: Nv的OpenCL又不是什么新手
: CUDA这种独门独户的东西，学校里用用，搞搞科研，上几个免费PHD靠谱
: 说实话，你要是软件公司的，除非NV给钱
: 否则你愿意搞个东西除了NV上能跑其他都不能跑的
: 写OpenCL的，至少都跑起来了，就算在NV效率差点，
: 也比CUDA在AMD和其他的完全起不来靠谱
: 你要的这种数据，其实应该看NV的market文档
: 要是丫自己都不敢吹，真的就别抱太大希望

l*****e
发帖数: 714

titan不是号称有很强的科学计算能力吗，怎么比7970Ghz差这么多

p**********r
发帖数: 1693

可以查一下folding ppd或者boinc显卡项目的performance，其中wuprop项目就是专门
统计硬件计算能力的
http://wuprop.boinc-af.org/results/delai.py

E***e
发帖数: 3430

看不懂这网站是在干吗啊 T_T

【在 p**********r 的大作中提到】

: 可以查一下folding ppd或者boinc显卡项目的performance，其中wuprop项目就是专门
: 统计硬件计算能力的
: http://wuprop.boinc-af.org/results/delai.py

S******n
发帖数: 5022

因为titan有个开关，打开双精度开关，显卡频率下降，就是一计算卡。
而关闭双精度开关，显卡频率上升，就是一游戏卡。
自己决定。

【在 l*****e 的大作中提到】

: titan不是号称有很强的科学计算能力吗，怎么比7970Ghz差这么多

p**********r
发帖数: 1693

boinc是伯克利大学搞的一个开放式分布式计算平台，志愿者帮科研单位利用pc空闲能
力做计算，我上面给的链接是其中一个特殊的项目，专门统计各种机器计算效率的；目
前支持显卡计算的分布式项目有不下十个，跟生物有关的n卡项目我只记得gpugrid，你
可以查查她们用哪种方法计算.
folding@home是斯坦福一个生物教授搞的封闭式分布志愿计算平台，比boinc早了好几
年，是影响力和志愿者人数最多的分布式项目，单核cpu，多核cpu，a卡
n卡都支持；folding point per day是一个衡量显卡通用计算能力的比较直观的数据，
好多新卡评测里有这一项，网上统计数据比较多，又是做生物计算的，你可以重点查查
这是一个中文社区，没什么学术价值，你可以看看当科普了
http://www.equn.com/wiki
http://www.equn.com/forum/forum.php

【在 E***e 的大作中提到】

: 看不懂这网站是在干吗啊 T_T

E***e
发帖数: 3430

多谢了！！！

【在 p**********r 的大作中提到】

: boinc是伯克利大学搞的一个开放式分布式计算平台，志愿者帮科研单位利用pc空闲能
: 力做计算，我上面给的链接是其中一个特殊的项目，专门统计各种机器计算效率的；目
: 前支持显卡计算的分布式项目有不下十个，跟生物有关的n卡项目我只记得gpugrid，你
: 可以查查她们用哪种方法计算.
: folding@home是斯坦福一个生物教授搞的封闭式分布志愿计算平台，比boinc早了好几
: 年，是影响力和志愿者人数最多的分布式项目，单核cpu，多核cpu，a卡
: n卡都支持；folding point per day是一个衡量显卡通用计算能力的比较直观的数据，
: 好多新卡评测里有这一项，网上统计数据比较多，又是做生物计算的，你可以重点查查
: 这是一个中文社区，没什么学术价值，你可以看看当科普了
: http://www.equn.com/wiki

S******n
发帖数: 5022

最新的超级计算机排行榜公布之际，NVIDIA也趁机发布了号称有史以来性能最强的加速
器——Tesla K40 GPU。
Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
GK110大核心，这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
启了2688个流处理器，今天的Tesla K40则开满了全部2880个，而且用的是B1步进的新
核心。
不仅如此，Tesla K40的频率更高了，核心从732MHz提升到745MHz，并支持动态加速，
且有810MHz、875MHz两个档次，浮点性能因此增至单精度4.29TFlops、双精度1.
43TFlops(3:1)。
而显存不但频率从5.2GHz提升至6GHz，容量也翻一番、在该系列中首次达到了惊人的
12GB，为此使用了刚刚量产不久的4Gb(512MB) GDDR5显存颗粒，因此依旧是24颗。配合
384-bit的位宽，带宽也来到了288GB/s。
更令人印象深刻的是，Tesla K40的热设计功耗依然保持在235W。

E***e
发帖数: 3430

nv家的flops水分很大啊。。。

【在 S******n 的大作中提到】

: 最新的超级计算机排行榜公布之际，NVIDIA也趁机发布了号称有史以来性能最强的加速
: 器——Tesla K40 GPU。
: Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
: GK110大核心，这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
: 启了2688个流处理器，今天的Tesla K40则开满了全部2880个，而且用的是B1步进的新
: 核心。
: 不仅如此，Tesla K40的频率更高了，核心从732MHz提升到745MHz，并支持动态加速，
: 且有810MHz、875MHz两个档次，浮点性能因此增至单精度4.29TFlops、双精度1.
: 43TFlops(3:1)。
: 而显存不但频率从5.2GHz提升至6GHz，容量也翻一番、在该系列中首次达到了惊人的

相关主题
● 请推荐4U机箱和电源（4GPU）	● 有了解AMD的APU的大虾吗?
● 矿机问题	● ZZ显卡之争:NVIDIA笔记本反弹 AMD桌面前进
● AMD的APU上跑ArrayFire的exception	● 跑浮点运算，现在是AMD的好还是Nvidia的好？
进入Hardware版参与讨论

S******n
发帖数: 5022

怎么水分了？这张卡要$5500, 要是还差，就太对不住这价钱了。
跟Telsa K20X的对比：

【在 E***e 的大作中提到】

: nv家的flops水分很大啊。。。

S******n
发帖数: 5022

NVIDIA今天（11-19-2013）宣布了另外一条重要消息：已经与蓝色巨人IBM达成了广泛
的合作协议，将共同推进超级计算机技术的前进，IBM的软硬件都将支持NVIDIA GPU加
速。
首先在软件方面，IBM的各种企业级软件，包括、商业智能、预测分析、风险分析等等(
比如InfoSphere)，都将会引入CUDA GPU加速。
数据分析虽然一般不属于超级计算项目，但也需要强大的计算能力做支撑，这显然给
Tesla留下了充足的空间。

E***e
发帖数: 3430

那titan跑monte carlo比amd落后那么多
是因为amd专长monte carlo？

【在 S******n 的大作中提到】

: 怎么水分了？这张卡要$5500, 要是还差，就太对不住这价钱了。
: 跟Telsa K20X的对比：

S******n
发帖数: 5022

你贴的那个图应该是7990写错写成7970了。
正确的图是
7990是两块7970，所以大幅度领先Titan。
7970GE的monte carlo单精度下领先Titan 30%，双精度下领先Titan 20%——AMD的确专
长monte carlo。

【在 E***e 的大作中提到】

: 那titan跑monte carlo比amd落后那么多
: 是因为amd专长monte carlo？

E***e
发帖数: 3430

谢谢谢谢谢谢谢谢！

【在 S******n 的大作中提到】

: 你贴的那个图应该是7990写错写成7970了。
: 正确的图是
: 7990是两块7970，所以大幅度领先Titan。
: 7970GE的monte carlo单精度下领先Titan 30%，双精度下领先Titan 20%——AMD的确专
: 长monte carlo。

(共1页)

进入Hardware版参与讨论

相关主题
● ZZ显卡之争:NVIDIA笔记本反弹 AMD桌面前进	● 有什么好的GPU计算平台推荐吗?
● 跑浮点运算，现在是AMD的好还是Nvidia的好？	● 3000的预算在Dell能买到什么样的workstation
● 觉得今年AMD CPU GPU有的一战么？	● ATI的6870系列支持并行计算功能(GTX的CUBA那种)吗?
● 实验室要配机器，不差钱的，搞这个	● 我写的CUDA屏保软件
● 大家帮看看这台做GPU并行计算的机器	● 【数值计算】求机器配置建议！
● 现在AMD和NVidia计算方面的对比都不公平	● 大家说说 cuda 和 opencl 吧
● 求个建议装机计算用	● 那个$749的Lenovo Y470算是deal吗？
● 用于科学计算的单机该怎么配	● 请推荐4U机箱和电源（4GPU）

相关话题的讨论汇总
话题: cuda话题: nv话题: gpu话题: opencl话题: amd

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天