由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - RTX 2080 Ti 的深学性能如何?
相关主题
titan v评测不高啊[合集] 多线程程序的性能问题
Visual studio IDE 之父也被裁了 (转载)pyQT的性能
弱问:单精度变量转双精度如何让后8位为0不看好ruby
fortran 中数值精度怎么保证的?多说几句
问个选语言的问题F#离开windows是不是就没用了?
alphago能刷题吗?问一个关于C×和HBASE的性能比较问题
什么model的笔记本电脑性能好?谷歌大脑之父吴恩达(Andrew Ng)加盟百度
C++中virtual function的性能差是个误解ghc 7.6.3性能差嘛?
相关话题的讨论汇总
话题: ti话题: rtx话题: 2080话题: 深学话题: 性能
进入Programming版参与讨论
1 (共1页)
x*****2
发帖数: 117
1
不久前,lambdalabs做了测试,在不同模型下,FP32单精度性能 RTX 2080 Ti 比 GTX
1080 Ti高出27%到45%,FP16半精度中性能高出60%到65%。
我记得卫东好像说过他需要用PF64,是不是有这件事?
w***g
发帖数: 5958
2
我最开始自己实现过一个深学框架,然后为了验证正确性,要把
back-propate出来的导数和直接数值模拟算得的导数对比。
同样的程序,用fp32时两个数值相差经常在1%以上,改用fp64后
基本上就能比较完美地对上了。所以我一直有个印象,就是fp32
算比较深的神经网络时,其实数值精度是不太够的。
并不是说我需要FP64。

GTX

【在 x*****2 的大作中提到】
: 不久前,lambdalabs做了测试,在不同模型下,FP32单精度性能 RTX 2080 Ti 比 GTX
: 1080 Ti高出27%到45%,FP16半精度中性能高出60%到65%。
: 我记得卫东好像说过他需要用PF64,是不是有这件事?

x****u
发帖数: 44466
3
话说显卡算出来的浮点数从20年前就和理论上的对不上啊

【在 w***g 的大作中提到】
: 我最开始自己实现过一个深学框架,然后为了验证正确性,要把
: back-propate出来的导数和直接数值模拟算得的导数对比。
: 同样的程序,用fp32时两个数值相差经常在1%以上,改用fp64后
: 基本上就能比较完美地对上了。所以我一直有个印象,就是fp32
: 算比较深的神经网络时,其实数值精度是不太够的。
: 并不是说我需要FP64。
:
: GTX

w***g
发帖数: 5958
4
我那个用cpu跑的。cuda我没好好练过,不会写。

【在 x****u 的大作中提到】
: 话说显卡算出来的浮点数从20年前就和理论上的对不上啊
x****u
发帖数: 44466
5
当年3D加速卡起步的时候,用硬件渲染的效果就和软件按照公式算出来的不一样,而且
各个显卡都不同。怀疑是人为忽略了某些步骤或者校验以加速。

【在 w***g 的大作中提到】
: 我那个用cpu跑的。cuda我没好好练过,不会写。
1 (共1页)
进入Programming版参与讨论
相关主题
cassandra 的插入性能问题 (转载)问个选语言的问题
ms百度识图也蛮厉害的alphago能刷题吗?
面试big data的软件开发工作需要知道哪些算法和理论?什么model的笔记本电脑性能好?
嵌入式设备接了emulator的性能会不一样,会有什么原因了 (转载)C++中virtual function的性能差是个误解
titan v评测不高啊[合集] 多线程程序的性能问题
Visual studio IDE 之父也被裁了 (转载)pyQT的性能
弱问:单精度变量转双精度如何让后8位为0不看好ruby
fortran 中数值精度怎么保证的?多说几句
相关话题的讨论汇总
话题: ti话题: rtx话题: 2080话题: 深学话题: 性能