w***g 发帖数: 5958 | 1 其实是一个NUMA架构vector processor。
这其实是“计算”机的经典架构,早就有了。
之所以之前这种架构没火起来,是因为人类前几十年
对电脑的应用,比如办公和上网,其实都是“处理”
而不是“计算”。现在只不过是风水轮流转了。
Intel之所以能在挤这么多年牙膏,就是因为
“处理”这方面的快的需求其实已经到顶了。
(从“省”的角度看Intel其实一直在进步。)
老黄的兴起,其时代背景是“计算”需求将要被
大众化了。CS能发明的原理其实都已经被发明了,
只是短板轮流转而已。所以完全有可能能从
故纸堆里挖掘出牛逼东西来。
资本主义其实效率很高的。一方面就体现在一个
市场,如果只是同质性技术竞争,龙头企业
往往几十年都不会倒,直到颠覆性技术
出现。比如INTC, MSFT。反例是柯达和雅虎。
我自己觉得NVDA就是这样的龙头企业。
买股票另说。我长期持有的是AMD。 |
T*******x 发帖数: 8565 | 2 处理和计算,确实是两大模式。
:其实是一个NUMA架构vector processor。
:这其实是“计算”机的经典架构,早就有了。 |
W***o 发帖数: 6519 | 3 AMD 和INTC比起来就是under dog,董老板觉得有啥值得做股东的原因? |
w*****r 发帖数: 197 | 4 无论是处理还是计算,都没咱们散户什么事。
如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的pipeline,
开源并被人接受,也许能出名。。。
【在 w***g 的大作中提到】 : 其实是一个NUMA架构vector processor。 : 这其实是“计算”机的经典架构,早就有了。 : 之所以之前这种架构没火起来,是因为人类前几十年 : 对电脑的应用,比如办公和上网,其实都是“处理” : 而不是“计算”。现在只不过是风水轮流转了。 : Intel之所以能在挤这么多年牙膏,就是因为 : “处理”这方面的快的需求其实已经到顶了。 : (从“省”的角度看Intel其实一直在进步。) : 老黄的兴起,其时代背景是“计算”需求将要被 : 大众化了。CS能发明的原理其实都已经被发明了,
|
c*********e 发帖数: 16335 | 5 intel 会出来一个core 9, core 11 吗?
【在 w***g 的大作中提到】 : 其实是一个NUMA架构vector processor。 : 这其实是“计算”机的经典架构,早就有了。 : 之所以之前这种架构没火起来,是因为人类前几十年 : 对电脑的应用,比如办公和上网,其实都是“处理” : 而不是“计算”。现在只不过是风水轮流转了。 : Intel之所以能在挤这么多年牙膏,就是因为 : “处理”这方面的快的需求其实已经到顶了。 : (从“省”的角度看Intel其实一直在进步。) : 老黄的兴起,其时代背景是“计算”需求将要被 : 大众化了。CS能发明的原理其实都已经被发明了,
|
x****u 发帖数: 44466 | 6 我看过去gpu不火是因为摩尔定律
与其花时间写并行程序,不如等几年主频也就涨了10倍
【在 w***g 的大作中提到】 : 其实是一个NUMA架构vector processor。 : 这其实是“计算”机的经典架构,早就有了。 : 之所以之前这种架构没火起来,是因为人类前几十年 : 对电脑的应用,比如办公和上网,其实都是“处理” : 而不是“计算”。现在只不过是风水轮流转了。 : Intel之所以能在挤这么多年牙膏,就是因为 : “处理”这方面的快的需求其实已经到顶了。 : (从“省”的角度看Intel其实一直在进步。) : 老黄的兴起,其时代背景是“计算”需求将要被 : 大众化了。CS能发明的原理其实都已经被发明了,
|
L****8 发帖数: 3938 | 7 要有人搞基础设施建设 例如 cuDNN 否则没人用
【在 x****u 的大作中提到】 : 我看过去gpu不火是因为摩尔定律 : 与其花时间写并行程序,不如等几年主频也就涨了10倍
|
g****t 发帖数: 31659 | 8 更可能的是抄你的人出名
: 无论是处理还是计算,都没咱们散户什么事。
: 如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的
pipeline,
: 开源并被人接受,也许能出名。。。
【在 w*****r 的大作中提到】 : 无论是处理还是计算,都没咱们散户什么事。 : 如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的pipeline, : 开源并被人接受,也许能出名。。。
|
w***g 发帖数: 5958 | 9 说对啦!没有靠山,做出来牛逼的东西也是被人抄的命。
【在 g****t 的大作中提到】 : 更可能的是抄你的人出名 : : : 无论是处理还是计算,都没咱们散户什么事。 : : 如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的 : pipeline, : : 开源并被人接受,也许能出名。。。 :
|
t***s 发帖数: 4666 | 10 主要是拥抱非主流用户写了CUDA。然后非主流变成主流了。
【在 w***g 的大作中提到】 : 其实是一个NUMA架构vector processor。 : 这其实是“计算”机的经典架构,早就有了。 : 之所以之前这种架构没火起来,是因为人类前几十年 : 对电脑的应用,比如办公和上网,其实都是“处理” : 而不是“计算”。现在只不过是风水轮流转了。 : Intel之所以能在挤这么多年牙膏,就是因为 : “处理”这方面的快的需求其实已经到顶了。 : (从“省”的角度看Intel其实一直在进步。) : 老黄的兴起,其时代背景是“计算”需求将要被 : 大众化了。CS能发明的原理其实都已经被发明了,
|
|
|
m*****n 发帖数: 3575 | 11 这就是洞察力
【在 t***s 的大作中提到】 : 主要是拥抱非主流用户写了CUDA。然后非主流变成主流了。
|
g****t 发帖数: 31659 | 12 最近这个某手机CPU变慢的新闻。
最早相关的algorithm是我写的,也是我卖给客户的。
我很想出名,没人让我出...
2010年(?)我在EE板讲过这个想法,好多EE的人追着我骂。
说我不知道CPU 电源的基本知识。
可能ET等还存在的老ID,还有印象。帖子应该也还在。
【在 w***g 的大作中提到】 : 说对啦!没有靠山,做出来牛逼的东西也是被人抄的命。
|
a*****g 发帖数: 19398 | 13 我在特定场合写过类似的程序,但普通场合不会写,太违背常理了
【在 g****t 的大作中提到】 : 最近这个某手机CPU变慢的新闻。 : 最早相关的algorithm是我写的,也是我卖给客户的。 : 我很想出名,没人让我出... : 2010年(?)我在EE板讲过这个想法,好多EE的人追着我骂。 : 说我不知道CPU 电源的基本知识。 : 可能ET等还存在的老ID,还有印象。帖子应该也还在。
|
g****t 发帖数: 31659 | 14 一般人不具备从头做 新的, 跑在几千万上亿设备的系统 的能力。
因为强壮性要求高,所以最常见的是用已经存在多年的工具和
系统做延伸。
【在 a*****g 的大作中提到】 : 我在特定场合写过类似的程序,但普通场合不会写,太违背常理了
|
w********e 发帖数: 275 | 15 For IIoT or I2oT, cloud is not needed.
【在 w*****r 的大作中提到】 : 无论是处理还是计算,都没咱们散户什么事。 : 如果能写一个由IoT device直接往cloud里的DL框架送数据的End to end的pipeline, : 开源并被人接受,也许能出名。。。
|
x****u 发帖数: 44466 | 16 没有cuDNN的时候也有直接调用编译器加速的啊
【在 L****8 的大作中提到】 : 要有人搞基础设施建设 例如 cuDNN 否则没人用
|
l***p 发帖数: 358 | 17 计算和处理的差别,没懂,shed more light? |
h**********c 发帖数: 4120 | 18 一个CPU 电路三大块,有点忘了,运算器,指令集,cache
当代CPU还要考虑安全,可靠性,大量的校验,
你看各种编译器的单元测试,有很多8X7 不等于56的问题,
现在的软件和系统设计根本不从低层角度考虑这些问题,GPU就是一个80%裁掉的CPU。
只能说DUI。 |
x****u 发帖数: 44466 | 19 CPU里面的很多高成本组件只是针对非充分并行优化的串行程序才有意义的
比如流水线,分支预测,乱序执行,各种重命名,微指令,cache等等
如果计算任务高度适合并行化,那设计思路要推倒重来
归根结底还是因为目前主频撞到南墙了,只能加大并行度了
【在 h**********c 的大作中提到】 : 一个CPU 电路三大块,有点忘了,运算器,指令集,cache : 当代CPU还要考虑安全,可靠性,大量的校验, : 你看各种编译器的单元测试,有很多8X7 不等于56的问题, : 现在的软件和系统设计根本不从低层角度考虑这些问题,GPU就是一个80%裁掉的CPU。 : 只能说DUI。
|
m*****n 发帖数: 3575 | 20 现在GPU主频也要升到2G
这也太牛了吧?
【在 x****u 的大作中提到】 : CPU里面的很多高成本组件只是针对非充分并行优化的串行程序才有意义的 : 比如流水线,分支预测,乱序执行,各种重命名,微指令,cache等等 : 如果计算任务高度适合并行化,那设计思路要推倒重来 : 归根结底还是因为目前主频撞到南墙了,只能加大并行度了
|
|
|
x****u 发帖数: 44466 | 21 因为结构简单,提升主频反而容易
【在 m*****n 的大作中提到】 : 现在GPU主频也要升到2G : 这也太牛了吧?
|
m*****n 发帖数: 3575 | 22 3G是极限了吧?
难以想象,16nm这么个提升主频法,还不热爆了?
【在 x****u 的大作中提到】 : 因为结构简单,提升主频反而容易
|
x****u 发帖数: 44466 | 23 取决于你的数字电路多复杂啊
【在 m*****n 的大作中提到】 : 3G是极限了吧? : 难以想象,16nm这么个提升主频法,还不热爆了?
|