w*****3 发帖数: 910 | 1 版上有熟悉GPU编程的么。
有个问题希望请教一下。
关于GPU并行运算的。 |
w*******n 发帖数: 4188 | 2 写在这吧,让大家都看看,集思广益
【在 w*****3 的大作中提到】 : 版上有熟悉GPU编程的么。 : 有个问题希望请教一下。 : 关于GPU并行运算的。
|
n***m 发帖数: 127 | 3 谁家的GPU?I的,N的还是A的?
【在 w*****3 的大作中提到】 : 版上有熟悉GPU编程的么。 : 有个问题希望请教一下。 : 关于GPU并行运算的。
|
f****a 发帖数: 4708 | 4 现在写,都应该用OpenCL。AN两家通吃。
【在 n***m 的大作中提到】 : 谁家的GPU?I的,N的还是A的?
|
s******v 发帖数: 4495 | 5 I = intel? N = nvida? a = arm?
【在 n***m 的大作中提到】 : 谁家的GPU?I的,N的还是A的?
|
a***e 发帖数: 27968 | 6 arm的GPU?
老大,你这个硅谷小道也太走位飘忽了
【在 s******v 的大作中提到】 : I = intel? N = nvida? a = arm?
|
w*****3 发帖数: 910 | 7 40MB/S 数据,共64路2.5GB/s 通过一个PCIe device 传到PCIe GPU。
能实现么。
GPU 可以64路并行处理这个数据么?
GPU对浮点运算能力怎么样? |
p*****u 发帖数: 225 | 8 传送带宽不知道,
64路并行没问题。更多都行。用CUDA。
【在 w*****3 的大作中提到】 : 40MB/S 数据,共64路2.5GB/s 通过一个PCIe device 传到PCIe GPU。 : 能实现么。 : GPU 可以64路并行处理这个数据么? : GPU对浮点运算能力怎么样?
|
s******v 发帖数: 4495 | 9 不懂就问呗,a到底是啥? 你也别光挤得我,倒是告诉我啊
【在 a***e 的大作中提到】 : arm的GPU? : 老大,你这个硅谷小道也太走位飘忽了
|
DK 发帖数: 194 | 10 前ATi,现amd
【在 s******v 的大作中提到】 : 不懂就问呗,a到底是啥? 你也别光挤得我,倒是告诉我啊
|
|
|
s******v 发帖数: 4495 | 11 偶,是amd
【在 a***e 的大作中提到】 : arm的GPU? : 老大,你这个硅谷小道也太走位飘忽了
|
l**t 发帖数: 10440 | 12 带宽也没问题,PCIE Gen1x16/Gen2x8/Gen3x4足够
【在 p*****u 的大作中提到】 : 传送带宽不知道, : 64路并行没问题。更多都行。用CUDA。
|
w*****3 发帖数: 910 | 13 问题是从一个PCIe slot 到另外一个PCIe slot
传输效率会不会降低
【在 l**t 的大作中提到】 : 带宽也没问题,PCIE Gen1x16/Gen2x8/Gen3x4足够
|
e*******r 发帖数: 1433 | 14 DX10 plus, MS require IEEE precision FP32 for GPU. If you want FP64, you
need to get NV or AMD DX11 card with double support. Double is a optional
feature in DX11, but normally main stream GPU should support it.
You need to know the advertised PE count of your GPU. You can kick off a big
thread group, but not all the thread are executed at the same time.
PCIE 16x bus can support your bit rate.
【在 w*****3 的大作中提到】 : 40MB/S 数据,共64路2.5GB/s 通过一个PCIe device 传到PCIe GPU。 : 能实现么。 : GPU 可以64路并行处理这个数据么? : GPU对浮点运算能力怎么样?
|
l**t 发帖数: 10440 | 15 不会,pcie是p2p的
【在 w*****3 的大作中提到】 : 问题是从一个PCIe slot 到另外一个PCIe slot : 传输效率会不会降低
|