E***e 发帖数: 3430 | 1 具体到Monte Carlo的最好
类似这样的
找到的benchmark全都是在OpenCL上跑NV,明显不太公平
所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark
问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense
matrix, hyper之类不着边的东西。
我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢! |
S******n 发帖数: 5022 | 2 算Monte Carlo还是AMD的卡好。
CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。
只要不涉及复杂的包含函数的科学计算,一般都是AMD的显卡快。特别是像金融计算、
密码学计算。
【在 E***e 的大作中提到】 : 具体到Monte Carlo的最好 : 类似这样的 : 找到的benchmark全都是在OpenCL上跑NV,明显不太公平 : 所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark : 问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense : matrix, hyper之类不着边的东西。 : 我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢!
|
E***e 发帖数: 3430 | 3 要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了
【在 S******n 的大作中提到】 : 算Monte Carlo还是AMD的卡好。 : CUDA对AMD的唯一优势就是定义了一堆科学计算的函数。 : 只要不涉及复杂的包含函数的科学计算,一般都是AMD的显卡快。特别是像金融计算、 : 密码学计算。
|
z******i 发帖数: 1292 | 4 不如比微软的direct computing, AMD和NV就各显神通了。
NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。
你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言,
那个性能好。这个比法本来就有些不公平啊。
【在 E***e 的大作中提到】 : 要是能看看同样的任务在AMD+OpenCL和NV+CUDA上的表现就好了
|
a*s 发帖数: 425 | 5 像他这种问法,还那么狂,有意义么,太自以为是了
这里本来就是硬件论坛,不是科学计算的论坛,
而且,大家都可以有发表自己意见的权利
刚才我叫他自宫,他还真自宫了
然后,再起这个帖子,还在里面说什么”犯贱“
真不知道,这家伙怎么想的
你再自宫啊
【在 z******i 的大作中提到】 : 不如比微软的direct computing, AMD和NV就各显神通了。 : NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。 : 你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言, : 那个性能好。这个比法本来就有些不公平啊。
|
E***e 发帖数: 3430 | 6 我只是从计算角度出发,不是从硬件角度出发
你用OpenCL在NV的GPU上跑计算
隔着一层转换
明显不是最高的效率
像一楼这样的比较根本没比头
从计算的角度,要比就要比同样的simulation
AMD在OpenCL上编
NV在CUDA上编
然后两个拼速度
这才有意义
【在 z******i 的大作中提到】 : 不如比微软的direct computing, AMD和NV就各显神通了。 : NV也有OpenCL啊,NV的OpenCL最终也是靠CUDA执行的,CUDA层次更低。 : 你这个问法,其实就像在问: 不同CPU上,一个使用汇编语言,一个使用Basic语言, : 那个性能好。这个比法本来就有些不公平啊。
|
z******i 发帖数: 1292 | 7 http://vga.zol.com.cn/410/4108339.html
http://vga.zol.com.cn/410/4108340.html
http://vga.zol.com.cn/410/4108341.html
http://vga.zol.com.cn/410/4108342.html
【在 E***e 的大作中提到】 : 我只是从计算角度出发,不是从硬件角度出发 : 你用OpenCL在NV的GPU上跑计算 : 隔着一层转换 : 明显不是最高的效率 : 像一楼这样的比较根本没比头 : 从计算的角度,要比就要比同样的simulation : AMD在OpenCL上编 : NV在CUDA上编 : 然后两个拼速度 : 这才有意义
|
E***e 发帖数: 3430 | |
a***e 发帖数: 27968 | 9 NV从opencl到CUDA会出现2X的性能损失不?
【在 E***e 的大作中提到】 : 具体到Monte Carlo的最好 : 类似这样的 : 找到的benchmark全都是在OpenCL上跑NV,明显不太公平 : 所以很好奇能不能找到CUDA上跑各种NV GPU的benchmark : 问题问到再具体不过了,请那些不懂的不要进来犯贱扯什么CPU,优化,挖矿,dense : matrix, hyper之类不着边的东西。 : 我就是问NV GPU在CUDA上的benchmark,最好是Monte Carlo,谢谢!
|
E***e 发帖数: 3430 | 10 这就是我最好奇的问题
看了一圈下来没人说这件事
然后tomshardware拼命的在OpenCL上拼硬件
越来越有一种AMD写手的感觉
【在 a***e 的大作中提到】 : NV从opencl到CUDA会出现2X的性能损失不?
|
|
|
a***e 发帖数: 27968 | 11 很难想象会出现2X
Nv的OpenCL又不是什么新手
CUDA这种独门独户的东西,学校里用用,搞搞科研,上几个免费PHD靠谱
说实话,你要是软件公司的,除非NV给钱
否则你愿意搞个东西除了NV上能跑其他都不能跑的
写OpenCL的,至少都跑起来了,就算在NV效率差点,
也比CUDA在AMD和其他的完全起不来靠谱
你要的这种数据,其实应该看NV的market文档
要是丫自己都不敢吹,真的就别抱太大希望
【在 E***e 的大作中提到】 : 这就是我最好奇的问题 : 看了一圈下来没人说这件事 : 然后tomshardware拼命的在OpenCL上拼硬件 : 越来越有一种AMD写手的感觉
|
E***e 发帖数: 3430 | 12 如果2X以内,那绝对AMD靠谱了
OpenCL唯一要解决的就是一些数学函数还没找到好的Library
回头试试ArrayFire
多谢了!
【在 a***e 的大作中提到】 : 很难想象会出现2X : Nv的OpenCL又不是什么新手 : CUDA这种独门独户的东西,学校里用用,搞搞科研,上几个免费PHD靠谱 : 说实话,你要是软件公司的,除非NV给钱 : 否则你愿意搞个东西除了NV上能跑其他都不能跑的 : 写OpenCL的,至少都跑起来了,就算在NV效率差点, : 也比CUDA在AMD和其他的完全起不来靠谱 : 你要的这种数据,其实应该看NV的market文档 : 要是丫自己都不敢吹,真的就别抱太大希望
|
l*****e 发帖数: 714 | 13 titan不是号称有很强的科学计算能力吗,怎么比7970Ghz差这么多 |
p**********r 发帖数: 1693 | 14 可以查一下folding ppd或者boinc显卡项目的performance,其中wuprop项目就是专门
统计硬件计算能力的
http://wuprop.boinc-af.org/results/delai.py |
E***e 发帖数: 3430 | 15 看不懂这网站是在干吗啊 T_T
【在 p**********r 的大作中提到】 : 可以查一下folding ppd或者boinc显卡项目的performance,其中wuprop项目就是专门 : 统计硬件计算能力的 : http://wuprop.boinc-af.org/results/delai.py
|
S******n 发帖数: 5022 | 16 因为titan有个开关,打开双精度开关,显卡频率下降,就是一计算卡。
而关闭双精度开关,显卡频率上升,就是一游戏卡。
自己决定。
【在 l*****e 的大作中提到】 : titan不是号称有很强的科学计算能力吗,怎么比7970Ghz差这么多
|
p**********r 发帖数: 1693 | 17 boinc是伯克利大学搞的一个开放式分布式计算平台,志愿者帮科研单位利用pc空闲能
力做计算,我上面给的链接是其中一个特殊的项目,专门统计各种机器计算效率的;目
前支持显卡计算的分布式项目有不下十个,跟生物有关的n卡项目我只记得gpugrid,你
可以查查她们用哪种方法计算.
folding@home是斯坦福一个生物教授搞的封闭式分布志愿计算平台,比boinc早了好几
年,是影响力和志愿者人数最多的分布式项目,单核cpu,多核cpu,a卡
n卡都支持;folding point per day是一个衡量显卡通用计算能力的比较直观的数据,
好多新卡评测里有这一项,网上统计数据比较多,又是做生物计算的,你可以重点查查
这是一个中文社区,没什么学术价值,你可以看看当科普了
http://www.equn.com/wiki
http://www.equn.com/forum/forum.php
【在 E***e 的大作中提到】 : 看不懂这网站是在干吗啊 T_T
|
E***e 发帖数: 3430 | 18 多谢了!!!
【在 p**********r 的大作中提到】 : boinc是伯克利大学搞的一个开放式分布式计算平台,志愿者帮科研单位利用pc空闲能 : 力做计算,我上面给的链接是其中一个特殊的项目,专门统计各种机器计算效率的;目 : 前支持显卡计算的分布式项目有不下十个,跟生物有关的n卡项目我只记得gpugrid,你 : 可以查查她们用哪种方法计算. : folding@home是斯坦福一个生物教授搞的封闭式分布志愿计算平台,比boinc早了好几 : 年,是影响力和志愿者人数最多的分布式项目,单核cpu,多核cpu,a卡 : n卡都支持;folding point per day是一个衡量显卡通用计算能力的比较直观的数据, : 好多新卡评测里有这一项,网上统计数据比较多,又是做生物计算的,你可以重点查查 : 这是一个中文社区,没什么学术价值,你可以看看当科普了 : http://www.equn.com/wiki
|
S******n 发帖数: 5022 | 19 最新的超级计算机排行榜公布之际,NVIDIA也趁机发布了号称有史以来性能最强的加速
器——Tesla K40 GPU。
Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的
GK110大核心,这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开
启了2688个流处理器,今天的Tesla K40则开满了全部2880个,而且用的是B1步进的新
核心。
不仅如此,Tesla K40的频率更高了,核心从732MHz提升到745MHz,并支持动态加速,
且有810MHz、875MHz两个档次,浮点性能因此增至单精度4.29TFlops、双精度1.
43TFlops(3:1)。
而显存不但频率从5.2GHz提升至6GHz,容量也翻一番、在该系列中首次达到了惊人的
12GB,为此使用了刚刚量产不久的4Gb(512MB) GDDR5显存颗粒,因此依旧是24颗。配合
384-bit的位宽,带宽也来到了288GB/s。
更令人印象深刻的是,Tesla K40的热设计功耗依然保持在235W。 |
E***e 发帖数: 3430 | 20 nv家的flops水分很大啊。。。
【在 S******n 的大作中提到】 : 最新的超级计算机排行榜公布之际,NVIDIA也趁机发布了号称有史以来性能最强的加速 : 器——Tesla K40 GPU。 : Quadro K6000、GeForce GTX 780 Ti已经分别在图形工作站、桌面上用到了完整版的 : GK110大核心,这次终于轮到高性能计算了。此前首批用上GK110核心的Tesla K20X只开 : 启了2688个流处理器,今天的Tesla K40则开满了全部2880个,而且用的是B1步进的新 : 核心。 : 不仅如此,Tesla K40的频率更高了,核心从732MHz提升到745MHz,并支持动态加速, : 且有810MHz、875MHz两个档次,浮点性能因此增至单精度4.29TFlops、双精度1. : 43TFlops(3:1)。 : 而显存不但频率从5.2GHz提升至6GHz,容量也翻一番、在该系列中首次达到了惊人的
|
|
|
S******n 发帖数: 5022 | 21 怎么水分了?这张卡要$5500, 要是还差,就太对不住这价钱了。
跟Telsa K20X的对比:
【在 E***e 的大作中提到】 : nv家的flops水分很大啊。。。
|
S******n 发帖数: 5022 | 22 NVIDIA今天(11-19-2013)宣布了另外一条重要消息:已经与蓝色巨人IBM达成了广泛
的合作协议,将共同推进超级计算机技术的前进,IBM的软硬件都将支持NVIDIA GPU加
速。
首先在软件方面,IBM的各种企业级软件,包括、商业智能、预测分析、风险分析等等(
比如InfoSphere),都将会引入CUDA GPU加速。
数据分析虽然一般不属于超级计算项目,但也需要强大的计算能力做支撑,这显然给
Tesla留下了充足的空间。 |
E***e 发帖数: 3430 | 23 那titan跑monte carlo比amd落后那么多
是因为amd专长monte carlo?
【在 S******n 的大作中提到】 : 怎么水分了?这张卡要$5500, 要是还差,就太对不住这价钱了。 : 跟Telsa K20X的对比:
|
S******n 发帖数: 5022 | 24 你贴的那个图应该是7990写错写成7970了。
正确的图是
7990是两块7970,所以大幅度领先Titan。
7970GE的monte carlo单精度下领先Titan 30%,双精度下领先Titan 20%——AMD的确专
长monte carlo。
【在 E***e 的大作中提到】 : 那titan跑monte carlo比amd落后那么多 : 是因为amd专长monte carlo?
|
E***e 发帖数: 3430 | 25 谢谢谢谢谢谢谢谢!
【在 S******n 的大作中提到】 : 你贴的那个图应该是7990写错写成7970了。 : 正确的图是 : 7990是两块7970,所以大幅度领先Titan。 : 7970GE的monte carlo单精度下领先Titan 30%,双精度下领先Titan 20%——AMD的确专 : 长monte carlo。
|