E***e 发帖数: 3430 | 1 试图跑ArrayFire的GPU计算
在另一台机器上CUDA+ArrayFire都能跑
回到家里电脑上的APU+OpenCL+ArrayFire就出现如下问题
Unhandled exception at at 0x000007FEFDAA940D in helloworld_debug.exe:
Microsoft C++ exception: af::exception at memory location 0x000000000025E748.
不是很懂硬件软件什么的
这个是怎么回事?
是不是因为我APU不是专门留出来做计算的? |
|
x**********d 发帖数: 693 | 2 2048x2048 grid.
Arrayfire(Visual Studio, cuda_x64) vs. Matlab(2015a) gpuarray
FFT2: Arrayfire比matlab只快大约2.5倍
矩阵乘法: Arrayfire比matlab慢10倍????
感觉不make sense啊.....
GPU配置如下
---------------------------------------------------------------
Platform: CUDA Toolkit 8, Driver: CUDA Driver Version: 8000
[0] GeForce GT 720, 1024 MB, CUDA Compute 3.5
MultiprocessorCount: 2
---------------------------------------------------------------
【Update】 应该是显卡和主板等综合原因。。另外一台笔记本上AF比Matlab有快出10-
20倍,但是矩阵乘法仍然比台机上跑matlab慢。。c... 阅读全帖 |
|
E***e 发帖数: 3430 | 3 Build成功啊
一跑就挂
也不知这是啥问题了
AMD SDK和ArrayFire都装好了
应该不缺啥啊
缺了的话也build不了吧? |
|
E***e 发帖数: 3430 | 4 同一张NV卡把CUDA的OpenCL的SDK都装上会不会出问题啊?
我其实也不是为了比较性能
纯粹为了家里有个卡能干活
VS2012加ArrayFire CUDA
远程居然不能跑说找不到显卡 |
|
E***e 发帖数: 3430 | 5 恩
办公室的机器上OpenCL可以在独显上跑
不能在集显或CPU上跑
家里的机器是AMD的APU
OpenCL选哪个device都跑不了
选GPU,显示就挂了
选CPU,一跑电脑重启了
可能还是ArrayFire做的有点问题
只要能在高性能的独显上跑我就不愁了
等着GTX580寄到
了。
OpenCL |
|
E***e 发帖数: 3430 | 6 这些硬件你有多少在手上的?
我把代码发给你
你去注册个15天的arrayfire试用版
把手上的硬件一个个跑一遍如何?
比较关心580,7807XT,i7和i5
arrayfire可以在opencl上跑CPU
多谢了! |
|
E***e 发帖数: 3430 | 7 找几个数学函数有点烦人
不知道有没有比ArrayFire更好一点的
也不知道有没有类似CULA这样的东西。。。
唉 |
|
E***e 发帖数: 3430 | 8 如果2X以内,那绝对AMD靠谱了
OpenCL唯一要解决的就是一些数学函数还没找到好的Library
回头试试ArrayFire
多谢了! |
|
a*o 发帖数: 19981 | 9 co不是很懂,不过貌似CUDA是N家的,OpenCL是A家的?API都不大一样吧?
0x000000000025E748. |
|
a9 发帖数: 21638 | 10 你重新编译一下看,应该缺包了吧?
0x000000000025E748. |
|
|
E***e 发帖数: 3430 | 12 不管怎样先在恶霸上$200跳了个二手的GTX 580
反正早晚要入个CUDA卡
实在没时间在这种问题上较劲唉。。。 |
|
E***e 发帖数: 3430 | 13 Exception是这里扔出来的
//frame.cpp
static void __RethrowException(EHExceptionRecord *pThisException)
{
RaiseException( pThisException->ExceptionCode,
pThisException->ExceptionFlags,
pThisException->NumberParameters,
(PULONG_PTR)&(pThisException->params) );
}
然后仔细看发现我整个屏幕都不对了
边缘有各种不明条块在闪
看来是没法用做显示的GPU跑计算的 |
|
t*****z 发帖数: 1598 | 14
有点亏了。我前些天买一块580才166刀。前两天我看到一块同样的在拍卖,最后成交是
175刀。这两天有个deal,两块加起来330刀。 |
|
t*****z 发帖数: 1598 | 15 在另一台机器上用OpenCL试试? N卡也是支持OpenCL的。 |
|
E***e 发帖数: 3430 | 16 便宜的也有
卖家review不行
没时间怕扯皮啊 |
|
l******a 发帖数: 3803 | 17 should be no problem. SDK api áre just interface to video card. it does not
change hardware or firmware |
|
t*****z 发帖数: 1598 | 18 N卡的CUDA驱动装上的时候,OpenCL驱动也自动装上了。但是是否附带SDK我就不知道了。
要不这样:你的另一台机器是i3/5/7吗?有核心显卡吗?有的话,装上Intel的OpenCL
驱动和SDK就可以了。这样也不会跟你的N卡的CUDA冲突,如果你担心这个问题的话。 |
|
E***e 发帖数: 3430 | 19 今天发现根本不是问题
CUDA Toolkit装好,OpenCL的SDK也就一起都有了
not |
|
P**H 发帖数: 1897 | 20 580有什么亮点?760新的200吧,3d跑分差不多。
MC有 EVGA 580 refurb的 175。岂不是可以入?
N打压opencl,现在只有1.1。 I和A都1.2了。1.2加了改了很多,据说编程方便了。 |
|
t*****z 发帖数: 1598 | 21
580是费米架构,双精度性能高,是单精度的1/8。与之相比,后来的开普勒架构除泰坦
都是1/24,麦克斯韦是1/32。很多评测指出580跑计算完爆680,跟780各有胜负。 |
|
P**H 发帖数: 1897 | 22 太高端了。我还是老实拿显卡画三角形吧。flaot就够了。 |
|
|
l*******1 发帖数: 866 | 24 跑计算480都行。480和580架构上没区别,580基本就是功耗优化的480 re-spin。480慢
点是因为耗电高所以主频降了。但480便宜啊,100刀最多。 |
|
l*******1 发帖数: 866 | 25 是,compute的话4/5系列(fermi)不比6/7系列差。 |
|
|
|
E***e 发帖数: 3430 | 28 ArrayFire/C++下最简单的Pi模拟:
(single有水分,为了保证求和精确mix了一部分double,所以表现并不好)
CUDA_x64:
single 0.00859 sec
double 0.01696 sec
OpenCL_x64:
single 0.00916 sec
double 0.02275 sec
之前的猜测证实了
OpenCL在N卡上的double表现确实差很多 |
|
E***e 发帖数: 3430 | 29 公司实际状况比较复杂
开发这东西不能光看性能
还要看编程难易,要看公司里其他的analyst能不能pick up
CUDA如果开发出来速度快但是代码都没第二个人可以维护
老板也不会采纳
长远上看ArrayFire/C++可能是比较折中的选择 |
|
E***e 发帖数: 3430 | 30 论计算的话没发现
比如ArrayFire
两边通吃
换平台下拉菜单一选就好
连code都不用改 |
|
E***e 发帖数: 3430 | 31 去搞个免费版的ArrayFire自己写个段子测
或者搞个河蟹版的matlab跑他们的benchmark |
|
E***e 发帖数: 3430 | 32 arrayfire是写gpu程序,就像matlab一样
不过你们要业内认可就没办法了。。。 |
|
|
t*****z 发帖数: 1598 | 34 大多数是学校财产,但是我可以直接上机操作,只是不能把硬件拔下来插过去。我也很
好奇你的程序在我这可以跑多快。运行ArrayFire需要什么样的软硬件环境? |
|
E***e 发帖数: 3430 | 35 垃圾
别浪费时间
用arrayfire
去GPGPU_HC俱乐部看我的算例吧 |
|
E***e 发帖数: 3430 | 36 对了老汤,忘了跟你说
arrayfire开源了你知道不?
快去玩玩 |
|
t*****z 发帖数: 1598 | 37 可以重新焊一整个USB插头,难度低于破解超频限制所需要的焊接(需要插拔最小号的0
.4mm x 0.2mm的贴片电容)。如果你有心,可以试试。那什么ArrayFire我用不着啊,
现在连GPGPU也不需要用了。 |
|
a*o 发帖数: 19981 | 38 arrayfire装到机器上能立马产生点啥效果不?还是应用程序必须一个个用它的lib重写
才行? |
|
E***e 发帖数: 3430 | 39 MATLAB GPU is a joke.
If you want the speedup but don't want to learn CUDA, try Arrayfire. |
|
|
x**********d 发帖数: 693 | 41 就一般卡吧,3年前的dell desktop默认配的。难道是因为MultiprocessorCount太少了
,优越性体现不出来吗? |
|
|
x**********d 发帖数: 693 | 43 ...这对计算影响大吗? I mean 同一个卡跑af和matlab... |
|
t*******e 发帖数: 1633 | 44 这种超低端卡跑的快慢意义都不大,真有需要就买个好显卡,为了这种低端卡改程序根
本犯不上,锁男的时间也是钱 |
|
p**********i 发帖数: 276 | 45 卡太低端,显存太小,流处理器才两个,可能限制发挥了吧。 |
|
x**********d 发帖数: 693 | 46 本来用处也不是很大,但是最近写一个程序,一帧要跑1个多小时,调试起来太麻烦。
。。所以想上gpu,lab有workstation,但是我不太熟悉C++在linux上编程,想在自己
电脑上先试试,如果效果一般就算了。。PC有什么推荐的显卡吗? |
|
x**********d 发帖数: 693 | 47 有没有什么推荐的显卡呢?目前比较流行的都是几个处理器呢?我刚看我去年新买的笔
记本配的是GeForce GTX 960M,也只有5个MultiprocessorCount。。 |
|
F***Q 发帖数: 6599 | 48
a low-end GPU can easily be slower than a capable CPU. if you are low in
budget, a 1050Ti is a minimum for running anything meaningful. 980Ti and
1080 are selling around $300-$400, they are the bang for the buck ($ per
core).
apparently, the newer the generation, the more SMs, the better. |
|
x**********d 发帖数: 693 | 49 哦好吧,谢谢推荐。。我就是觉得很奇怪matlab竟然比af, which is a c++ wrapper
of Cuda 还快。。就矩阵乘法而言,用我目前的显卡,matlab gpuarray比cpu快30-40
倍, af下gpu和cpu基本持平 [facepalm] |
|
p**********i 发帖数: 276 | 50 那你试试用cuda,直接调用cublas就可以了。看看速度有没有变化。
: 哦好吧,谢谢推荐。。我就是觉得很奇怪matlab竟然比af, which is a c
wrapper
: of Cuda 还快。。就矩阵乘法而言,用我目前的显卡,matlab gpuarray比cpu快
30-40
: 倍, af下gpu和cpu基本持平 [facepalm]
|
|