如何提高GPU的利用率 - Programming版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 如何提高GPU的利用率

相关主题
● 大坑看晕了	● 谈谈想学好底层必不可少的东西
● 代码开源了	● 写给对系统感兴趣的人
● 10G网络到了	● nv的显卡能战胜intel的CPU么
● GPU的本质	● 没人讨论这个？
● 大牛讲讲JIT和AOT的比较吧	● 并行可以降低计算复杂度？？
● 再来推广下picpac	● 妈的怎么那么多鸡毛语言/软件
● GPU高手谈谈怎么利用GPU做data intensive的计算和mapreduce 吧	● tensorflow serving
● 请问程序同时在多个cpu上运行需要怎么改程序？	● 可以简单粗暴的矩阵化的程序，都会被...

相关话题的讨论汇总
话题: cpu话题: gpu话题: v100话题: tesla

进入Programming版参与讨论

1

(共1页)

l******n 发帖数: 9344	1 我用一台带Tesla V100显卡的机器做一些图像分类，显卡的温度一直在32左右，基本没有什么变化，功率在41W左右。Tesla V100最大功率可以到250W,最高温度到87。内存也还有一些剩余，虽然不多。个人感觉GPU利用率还有提升的空间，哪位给点建议。多谢
w*****r 发帖数: 197	2 titanv确实是良心卡，功耗比rtx titan低不少
f*******t 发帖数: 7549	3 是不是代码写错了没跑在GPU上？我用pytorch做training的时候显卡功率有明显变化。
o*******p 发帖数: 27	4 CPU使用率怎么样？会不会是瓶颈？把图像增大一倍试试？或者把Image Augmentation 暂时关掉看看？【在 l******n 的大作中提到】 : 我用一台带Tesla V100显卡的机器做一些图像分类，显卡的温度一直在32左右，基本没 : 有什么变化，功率在41W左右。Tesla V100最大功率可以到250W,最高温度到87。内存也 : 还有一些剩余，虽然不多。个人感觉GPU利用率还有提升的空间，哪位给点建议。 : 多谢
l******n 发帖数: 9344	5 gpu memory usage立刻可以看出gpu使用了没有。看开始的时候我看到功率到了190W,之后就降下来了。我一直monitor，有的时候会有一些波动，到60W，但是绝大部分时间是 41w左右没有使用的时候只有25W 【在 f*******t 的大作中提到】 : 是不是代码写错了没跑在GPU上？我用pytorch做training的时候显卡功率有明显变化。
l******n 发帖数: 9344	6 Architecture: x86_64 CPU op-mode(s): 32-bit, 64-bit Byte Order: Little Endian CPU(s): 12 On-line CPU(s) list: 0-11 Thread(s) per core: 1 Core(s) per socket: 1 Socket(s): 12 NUMA node(s): 1 Vendor ID: GenuineIntel CPU family: 6 Model: 85 Model name: Intel(R) Xeon(R) Gold 6150 CPU @ 2.70GHz Stepping: 4 CPU MHz: 2693.671 128G内存，cpu使用率不高现在用了image augmentation，看看不用augmentation同时一次性把图片全部都到内存，看gpu load会不会更高 Augmentation 【在 o*******p 的大作中提到】 : CPU使用率怎么样？会不会是瓶颈？把图像增大一倍试试？或者把Image Augmentation : 暂时关掉看看？
l*******m 发帖数: 1096	7 估计cpu pipeline太慢，CPU的使用率是多少，有没有400%？最好用gpu的benchmark 程序跑跑确认gpu没事：我用一台带Tesla V100显卡的机器做一些图像分类，显卡的温度一直在32左右，基本没有什么变化，功率在41W左右。Tesla V100最大功率可以到250W,最高温度到87。内存也还有一些剩余，虽然不多。个人感觉GPU利用率还有提升的空间，哪位给点建议。：
o*******p 发帖数: 27	8 试试把DataLoader里的num_workers设大些（=12）？【在 l******n 的大作中提到】 : Architecture: x86_64 : CPU op-mode(s): 32-bit, 64-bit : Byte Order: Little Endian : CPU(s): 12 : On-line CPU(s) list: 0-11 : Thread(s) per core: 1 : Core(s) per socket: 1 : Socket(s): 12 : NUMA node(s): 1 : Vendor ID: GenuineIntel

1

(共1页)

进入Programming版参与讨论

相关主题
● ubuntu apt-get 404了	● 大牛讲讲JIT和AOT的比较吧
● 芯片應該為軟件服務，譬如硬件加速的虛擬內存MMU、虛擬GPU、虛	● 再来推广下picpac
● windows vs. colinx 程序运行效率(续)	● GPU高手谈谈怎么利用GPU做data intensive的计算和mapreduce 吧
● what's the value for gcc -march= ?	● 请问程序同时在多个cpu上运行需要怎么改程序？
● 大坑看晕了	● 谈谈想学好底层必不可少的东西
● 代码开源了	● 写给对系统感兴趣的人
● 10G网络到了	● nv的显卡能战胜intel的CPU么
● GPU的本质	● 没人讨论这个？

相关话题的讨论汇总
话题: cpu话题: gpu话题: v100话题: tesla

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)