|
|
b********0 发帖数: 339 | 3 这个我不知道,但我知道INTEL也在做,与CPU做在一起,从长期看对Nvdia应有些影响。仅仅是为了图像就对Nvdia不利。 |
|
|
y*d 发帖数: 2226 | 5
现在行情变了Intel PHI才是王道
我在HPC行业混了很久,属于用GPGPU最早的一批人
现在这个行业里热门的话题是Phi |
|
g***3 发帖数: 2304 | 6 GPGPU的市场太小,一年下来没多少revenue |
|
C*****5 发帖数: 8812 | 7 【 以下文字转载自 Military 讨论区 】
发信人: yjz (研究组), 信区: Military
标 题: 铁流:中国超算芯片是怎样一步步追上英特尔的
发信站: BBS 未名空间站 (Thu Jan 28 13:24:32 2016, 美东)
2015年4月,美国商务部决定对中国四家国家超级计算机中心禁售至强PHI计算卡,当时
各种唱衰中国超算的声音不绝于耳。即便天河2号在2015年国际超级计算机大会上蝉联5
连冠,但因使用美国Intel公司的CPU而饱受一些别有用心之人的诟病,不少人声称没有
美国的CPU,天河2号要完蛋了。
现实却截然相反:
在ISC 2015发布会上,国防科大公布天河2A的升级方案,将采用国防科大自主研发的矩
阵2000(GPDSP)替代至强PHI计算卡。矩阵2000采用40nm制程,拥有16核,主频1G,双
精浮点2.4TFlops,功耗为200W。
新年伊始,从科技部公开的文章中透露出好消息——由上海高性能集成电路设计中心设
计的国产众核芯片已达到世界先进水平(美国情报部门对该芯片非常感兴趣,因此笔者
将其称为国产众核芯片)。该众核芯片采用28nm... 阅读全帖 |
|
a*******g 发帖数: 3500 | 8 gpu最早就是显卡, 后来收购了个搞物理计算卡的公司整了个phyX。 然后顺着这思路
搞GPGPU,整了cuda, tesla, 算是打入科学计算的hpc市场。 然后又顺着这思路搞
deeplearning, 估计又要打入数据中心市场。 intel的地位颇有危机啊 |
|
l********7 发帖数: 2974 | 9 GPU/CUDA的确很早就有了,如果早在2013/2014年,那时候AMD、NVDA都在竞争市场,还
不能判断谁优谁劣。
经过几年下来,CUDA/GPGPU已经开始基本垄断通用高速算法的用户群,在市场占据了主
导地位,又正好赶上DL/机器学习hype,所以起到推动作用。从长远看,这个通用平行
计算的市场份额,才是决定NVDA根本价值的关键点。
你可以去看AMD和NVDA两者的FA数据,那是天壤之别。以后只要NVDA自己不乱来,不太
可能成为下一个AMD那样的 - 我的个人观点和偏见,呵呵。 |
|
s*********r 发帖数: 1728 | 10 AMD 和 CUDA/GPGPU 算法 对应的是啥? |
|
C*****5 发帖数: 8812 | 11 Have you heard of GPGPU? |
|
|
a***m 发帖数: 5037 | 13 早就说今年要上百 乡下人说不能买 哈哈哈
我早年就有用nvda做过gpgpu了
这是个长期就靠实力的技术型公司
又遇上时代机遇 不暴涨不科学
: 不用说了。以前不买,看着涨到现在很难买下去了。
|
|
发帖数: 1 | 14
good
NVDA也是竞争对手,在GPGPU方面INTC和按摩店是穿一条裤子,OPENCL vs CUDA。
不过现在还是RUMOR。 |
|
发帖数: 1 | 15 在计算机时代,有个著名的摩尔定律,就是说同样成本每隔18个月晶体管数量会翻倍,
反过来同样数量晶体管成本会减半,这个规律已经很好地吻合了最近50年的发展,并且
可以衍生到很多类似的领域:存储、功耗、带宽、像素。
两年前的这个月是摩尔定律发表50周年,整整半个世纪。当时IEEE Spectrum为了纪念
摩尔定律50周年,特地发表了四篇关于摩尔定律的文章。其中一篇的题目叫“Moore’s
Law is Dying (and That Could Be Good)”,说的是摩尔定律不可能继续下去了。
1965年微芯片上的元件数增加了1倍,Gordon Moore于是预言这一趋势近期内将继续。
1975年他修改为每两年翻一翻,后来又说是18个月,或者说按指数律增长,每年46%。
这就是摩尔定律。摩尔定律预言了半导体产业50年的发展。摩尔预言了一个光辉的未来
,改变了世界。
这样高速的增长在其他产业是见不到的。美国的主粮玉米从1950年以后平均产量每年增
长2%,蒸汽涡轮式发电机把热能转换为电能,其效率在20世纪年增长率为1.5%,而1881
-2014室内灯光有效性(流明每瓦)年平均增长2.... 阅读全帖 |
|
|
发帖数: 1 | 17 房哥应该是指GPGPU, 玩游戏的鸡皮油只要便宜就卖得动, 但做AI/DL等没生态系统再
便宜也没人要。 |
|
C*****5 发帖数: 8812 | 18 谢谢
房哥应该是指GPGPU, 玩游戏的鸡皮油只要便宜就卖得动, 但做AI/DL等没生态系统再 |
|
f*****d 发帖数: 2285 | 19 我知道不少大的it 公司用amd的gpu做dl
这里就不展开了
:
房哥应该是指GPGPU, 玩游戏的鸡皮油只要便宜就卖得动, 但做AI/DL等没生态系统再
: 便宜也没人要。
|
|
p**f 发帖数: 3549 | 20 GPU架构比CPU简单多了,光CPU那个流水线,cache coherence就养活多少博士。GPU就
是堆几千个core傻算,理论上是个人都能设计出来,但上面的软件生态圈搞成GPGPU就
难了,要有人给你写软件。CUDA还是太底层,要那些非马工出身的research scientist
去写CUDA程序真是难为他们了。。但并行计算/异构计算本来就比串行计算难多了,难
的是软件,要正确调用并行核傻算,不然效率上不去。
不过这么多做AI chip的,还每家都要做,之后FANG,BAT全部都要做AI asic,连果子
都要自己设计GPU,看来我等硬工的春天要来了。以后跟马工一样,一手offer互相
competing,不满35万不卖身,噢耶!~
NVDA |
|
|
|
x****u 发帖数: 44466 | 23 严格说不是这样。现在说的GPU一般指的是GPGPU这种跑3D游戏的,现在的盒子不够强,
解码还是靠特别的DSP实现的。
硬解的一大特点是非常难支持非主流视频格式,比如动态补偿之类的东西,因为需要硬
件开发商配合。 |
|
b*********n 发帖数: 2975 | 24 【 以下文字转载自 PDA 讨论区 】
发信人: jiawen (嘉文), 信区: PDA
标 题: 硅谷公司的兴亡 (下) (转载)
发信站: BBS 未名空间站 (Thu May 19 11:28:31 2011, 美东)
发信人: perse (盐), 信区: SanFrancisco
标 题: 硅谷公司的兴亡 (下)
发信站: BBS 未名空间站 (Thu May 19 02:28:19 2011, 美东)
长话短说, 把二十年目睹的硅谷其他几个公司的怪现状再八卦一下.
第一个说NVDA. NVDA 本来没多少人, 影响可能不值一提. 在很多人眼里, NVDA
正是目下当红的小生, 应该远没到谢幕的时候. 不过NVDA的传统市场受到AMD/ATI
和intel集成显卡威胁, GPGPU缺乏商业软件支持, Tegra/Tablet business前有
Apple ipad挡路, 后有intel追赶, 边上有QCOM/TI等无数老杂牌的围追堵截, 就算
不看现在zoom, galaxy有多可怜, 将来只会更惨. NVDA还不是一个腐败的公司,
但NVDA是一个肤浅的公司. N... 阅读全帖 |
|
r***w 发帖数: 142 | 25 用不着一定在Brown作,我前两年上高性能计算的课程项目就是在BigBen和Ranger上作
的。后者是目前美国最大的cluster。不过你要把你的程序转成MPI实现。
也可以考虑用GPGPU来做。一样,你必须学会GPU编程。 |
|
f*******2 发帖数: 341 | 26 高通发布最新骁龙820芯片 手机明年上半年推出
腾讯科技 郭晓峰 12月11日报道
今日下午,美国高通公司在华发布其全新旗舰芯片骁龙820。目前,基于骁龙820的终端
产品已有超过70款正在设计中,涉及三星、索尼、华为、小米、LG等品牌,预计最快将
于2016 年上半年上市。
高通公司高级副总裁兼大中华区首席运营官罗杰夫在会上表示,到2019年全球智能手机
累计出货量将达到85亿部,装机量增长高达53%。高通在移动设备领域的芯片保持着良
好增长,2015年全球芯片出货量为9.32亿片,平均每天约250万片。
产品方面,骁龙820采用面向异构计算而设计的高度优化定制64位CPU——Qualcomm
Kryo。Kryo采用最新14纳米FinFET工艺制程,支持最高达单核2.2GHz的处理速度。Kryo
是定制Krait CPU的延续——Krait CPU支持骁龙 800、801和 805处理器。高通称,与
骁龙810处理器相比,Kryo CPU和骁龙820将带来最高达两倍的性能提升及功效提升。
对用户而言,功耗是最为关心的问题。高通称,骁龙820整体功耗降低30%。其GPU采用
Adren... 阅读全帖 |
|
p***e 发帖数: 1318 | 27 长话短说, 把二十年目睹的硅谷其他几个公司的怪现状再八卦一下.
第一个说NVDA. NVDA 本来没多少人, 影响可能不值一提. 在很多人眼里, NVDA
正是目下当红的小生, 应该远没到谢幕的时候. 不过NVDA的传统市场受到AMD/ATI
和intel集成显卡威胁, GPGPU缺乏商业软件支持, Tegra/Tablet business前有
Apple ipad挡路, 后有intel追赶, 边上有QCOM/TI等无数老杂牌的围追堵截, 就算
不看现在zoom, galaxy有多可怜, 将来只会更惨. NVDA还不是一个腐败的公司,
但NVDA是一个肤浅的公司. NVDA的三个founder里, 两个来自Sun. 而sun这个硅谷
最耀眼的big bust之所以如此萎缩的收场, 就是因为作为一个硬件公司而不懂物理.
sun没有fab, 靠TI fab, 别忘了, 现在TI都不自己作fab了, 靠TSMC. 而NVDA的
衣食父母就是TSMC. 和TSMC打过交道的都知道, TSMC是一个非常混账, 糊涂, 但又
死要面子的山寨公司. 而NVDA没有足够的知识去指导驾驭TSMC. 于... 阅读全帖 |
|
g*********n 发帖数: 808 | 28 三十年风水轮流转--八卦一下硅谷几大公司的兴亡
硅谷公司的兴亡(1)
所谓"霸祖孤身取二江, 子孙多以百城亡". 硅谷近年来不说是有末世气象, 起码有些曾
经盛极一时的公司, 已经是老态逼露,前景堪忧. 有些公司, 虽然不至于被受购或破产,
但下坡路是走定了. 完全没有badmouth在这些公司工作的硅工兄弟的意思,希望大家都
有好前途. 三十年风水轮流转, 闲聊一下硅谷大势. "黍离麦秀从来事,且置兴亡近酒缸
". 顺便也给自己提个醒, don't put all eggs in one basket.
随便举几个例子, 欢迎补充.
雅虎. 雅虎没有生机已经不是一年两年了. 杨致远很变态的拒绝了Balmer的傻Boffer,
几乎是放弃了唯一体面出逃的机会.随后carol bartz放弃search, 向MS倒贴投降, 让人
看得很莫名其妙.最近和Alibaba搞得这个插曲就更不知道让人演得是哪出. 杨以经被
YHOO踢出, 为什么还留在Alibaba board上.巴兹明明可以在董事局在近占一席, 为什么
不占. YHOO在这几件事上的作为, 完全体现出了一个彻底丧失生命力的公司,... 阅读全帖 |
|
B******1 发帖数: 9094 | 29 发信人: perse (盐), 信区: SanFrancisco
标 题: 硅谷公司的兴亡 (下)
发信站: BBS 未名空间站 (Thu May 19 02:28:19 2011, 美东)
长话短说, 把二十年目睹的硅谷其他几个公司的怪现状再八卦一下.
第一个说NVDA. NVDA 本来没多少人, 影响可能不值一提. 在很多人眼里, NVDA
正是目下当红的小生, 应该远没到谢幕的时候. 不过NVDA的传统市场受到AMD/ATI
和intel集成显卡威胁, GPGPU缺乏商业软件支持, Tegra/Tablet business前有
Apple ipad挡路, 后有intel追赶, 边上有QCOM/TI等无数老杂牌的围追堵截, 就算
不看现在zoom, galaxy有多可怜, 将来只会更惨. NVDA还不是一个腐败的公司,
但NVDA是一个肤浅的公司. NVDA的三个founder里, 两个来自Sun. 而sun这个硅谷
最耀眼的big bust之所以如此萎缩的收场, 就是因为作为一个硬件公司而不懂物理.
sun没有fab, 靠TI fab, 别忘了, 现在TI都不自己作fab了,... 阅读全帖 |
|
f*******e 发帖数: 8974 | 30 我觉得你举的多线程下载和处理器多线程是两码事。
据我所知windows不是并发多线程系统,所以理论上不能同时处理两个任务,只是在处
理器内部分配优先级,先到先作。所以我们看到的速度提高应该不是并行的结果,而是
指令处理顺序优化的结果。
现在的gpgpu编程应该是并行的,所以特定的程序在gpu上运行比在通用处理器上快很多
倍。
所以你的教授说的应该是对的,multi-core并行处理才是真正的并行,现在不也是朝这
个方向发展吗?
BTW,我不搞这个哈,不负责
BTW2,多线程下载效率绝对成倍增加,前提是服务器端的带宽和你自己的带宽都没用完
。如果你还用拨号,和现在的宽带比多线程没一点用。 |
|
D*****E 发帖数: 9352 | 31 ☆─────────────────────────────────────☆
GPGPU (谈判专家) 于 (Sat Apr 25 11:00:46 2009) 提到:
f-1签证,5月过期。6月可能要去西班牙开会旅行,然后回中国,请问
1。能不能申到去西班牙的签证,如果美国f1签证在开会期间已经过期了?
2。如果可以申到去西班牙的签证,能不能从西班牙飞回美国不入关,然后当天换航班
回中国?
非常感谢!
☆─────────────────────────────────────☆
mcheng82 (battles) 于 (Sat Apr 25 12:15:15 2009) 提到:
你提供回中国的机票可以签
不行,专机也要提供专机签证
☆─────────────────────────────────────☆
DeaDEyE (代代爱) 于 (Sat Apr 25 13:06:01 2009) 提到:
YMMV
NO, 所有飞来美国的航班都必须入关,不存在不入关的可能。
☆───────────────────────────────────── |
|
|
a********m 发帖数: 15480 | 33 gpu要读取都是显存. 作gpgpu处理的时候这些内容要反复几次. 这几次dma都是和总线冲
突的. 游戏里面gpu和pci占用已经很满了,用gpu做处理不实用. |
|
h*d 发帖数: 19309 | 34 昨天还在讨论这个,今天这个就悲剧了。
发信人: agnosticism (天气真好), 信区: TVGame
标 题: sony彻底冤大头了
发信站: 水木社区 (Sat Nov 21 20:29:05 2009), 站内
不知道PS4会用什么芯片
IBM 停止Cell处理器开发
from Solidot by matrix
6 people liked this
德国网站Heise Online证实(德语)IBM停止了Cell处理器的未来开发。 Cell处理器一
度被认为是一项革命性的产品,但实际应用证明它并不比竞争对手突出。IBM主管
DeepComputing的副总裁David Turek证实PoweXCell 8i是最后一款Cell处理器。当然停
止芯片设计并不意味着它的死亡,目前多数的Cell芯片主要由东芝公司生产,使用在索
尼公司的PS3主机上。Sun 曾经指出,3.2GHz的Cell处理器还没有1.4GHz的SUN Niagara
处理器快。有评论称,它并不比GPGPU强大,而灵活性又不如真正的CPU,IBM放弃它并
不让人意外。 |
|
a********m 发帖数: 15480 | 35 gpu每一个pass需要一样,分支应该是可以用了但是效率很低。 cell是cpu,不是介于
cpu/gpu之间,只是借鉴gpu思路。其实也说不好借鉴。cell和ee思路相当一致。ee的时
候gpu都还没出。
具体的效率跟应用程序有关。脱离了没意义。专门写个对p4特别友好的程序很可能p4超
过core duo. 俺说过了某些特殊的计算gpu应该更快。但是多数情况下cell更强。再说
连精度都是问题。至少俺觉得目前普通科学计算cell更强。这是个人看法,不要求别人
相信,俺也没啥证据。。 gpgpu已经几年了,比cell时间可长不少呢,当然前景还是
不错的,就是别太高估计。
apple |
|
a********m 发帖数: 15480 | 36 说的是游戏多媒体方面。 gpgpu现在也还很很大差距。 |
|
a********m 发帖数: 15480 | 37 gpgpu需要组织数据,dma上下,然后分析数据,占用系统总线还要避开正常显示处理。
不必要的等待太多,数据量小比较合适。但是多媒体和游戏都是数据量很大,没什么帮
助。 |
|
|
|
d****p 发帖数: 685 | 40 苹果OpenCL规范出来了,目前三大显卡生产商NVIDIA/AMD/Intel都宣布支持。三家各自
的出发点都不同:
1。NVIDIA已经有自己的CUDA,所以本质上更偏向自己的CUDA;但是看到竞争对手都在
捣鼓,怕自己被丢下。好在
OpenCL到实用至少1年2年,加上CUDA已经初步建立自己的用户群,所以心里有底。估计
其对OpenCL的支持会留一
手,最新的功能一定先上到CUDA上,两者性能会有差别。
2。AMD。对OpenCL全力支持。由于已经在GPGPU领域落后于NVIDIA,所以就等着雪豹早
点出来。我估计Raedon
系列显卡对雪豹/OpenCL支持最好。
3。Intel。开始进军高端显卡(Larrabee)。由于Larrabee采取和传统独立图形显卡不
同的体系结构,加上这是Intel
从未涉足的领域,开发员可能不会马上跟进,所以Intel对OpenCL的支持有不确定性。
微软基本不会理会OpenCL而专著DirectX11。未来10年就看这两者如何争夺嵌入移动图
形市场了。
有一篇很好的文章分析CUDA和OpenCL如下。
http://group.zol.com.c |
|
a***y 发帖数: 19743 | 41 ☆─────────────────────────────────────☆
decamp (decamp) 于 (Sat Jan 10 19:56:24 2009) 提到:
苹果OpenCL规范出来了,目前三大显卡生产商NVIDIA/AMD/Intel都宣布支持。三家各自
的出发点都不同:
1。NVIDIA已经有自己的CUDA,所以本质上更偏向自己的CUDA;但是看到竞争对手都在
捣鼓,怕自己被丢下。好在
OpenCL到实用至少1年2年,加上CUDA已经初步建立自己的用户群,所以心里有底。估计
其对OpenCL的支持会留一
手,最新的功能一定先上到CUDA上,两者性能会有差别。
2。AMD。对OpenCL全力支持。由于已经在GPGPU领域落后于NVIDIA,所以就等着雪豹早
点出来。我估计Raedon
系列显卡对雪豹/OpenCL支持最好。
3。Intel。开始进军高端显卡(Larrabee)。由于Larrabee采取和传统独立图形显卡不
同的体系结构,加上这是Intel
从未涉足的领域,开发员可能不会马上跟进,所以Intel对OpenCL的支持有不确定性。
微软基本不会 |
|
s****c 发帖数: 11300 | 42 GPGPU占优势的应用 能占所有应用的10%么?
另外你说的那些“高效” 有证据支持你的说法么? |
|
r******y 发帖数: 3838 | 43 GPGPU刚在起步,GPU可以在后台方便集联。 |
|
r******y 发帖数: 3838 | 44 1。不是所有应用都用上多核。相当多能平行计算的用GPGPU更有效率。
2。arm结构精简,遇瓶颈会晚点。 |
|
r******y 发帖数: 3838 | 45 gpgpu适合矩阵运算,解微分方程,这会是以后游戏最密集的运算。 |
|
a****a 发帖数: 5763 | 46 http://bbs.weiphone.com/read-htm-tid-527192.html
OpenCL
截至到现在,我们在《Snow Leopard:宝刀已铸成 关二爷请砍人(连载8/23)》
中探讨了程序开发者们究竟该如何充分利用现有的硬件资源来进一步提升计算机整体性
能,在《Snow Leopard充满活力的心脏——LLVM和Clang(连载9/23)》中了解了更为新
颖与现代的编译构建,在《持续完善,构建编程友好型环境(连载10/23)》中谈到了
Snow Leopard中新添加的编程语言扩展功能,并且在《Grand Central Dispatch:迎接
挑战(连载12/23)》中认识了基于这些新编译器的更强大更务实的并行API。所有这些都
意在帮助开发者和操作系统本身最大限度地利用已有硬件资源。
然而CPU却不是唯一镶满晶体管的元件。当涉及独立计算引擎时,每一台Mac中
都有另一块硅片无疑是更为显要的,那就是GPU。
引用
图形处理单元(graphics processing unit,GPU):是一种专门进行图形处理的
处理... 阅读全帖 |
|
a****a 发帖数: 5763 | 47 http://bbs.weiphone.com/read-htm-tid-556999.html
上篇讲到OpenCL的好处, 但是如果要让Mac用户的日常应用切实的体验到这些优势和影
响, 就需要程序员把OpenCL技术加入到他们的程序中去. 而历来, GPGPU的编程语音一
直没有在传统的桌面程序中得到广泛的应用. 这当中有几个原因.
最初, 针对GPU的编程需要用汇编语言, 而汇编语言跟传统用于桌面程序开发的语言的
差别很大. 在桌面程序的开发上, 广泛应用GUI, API等工具. 即使后来出现的类似C语
音的一些编程语言, 保留了一些针对图形的特性. 但大部分的开发者对于这部分东西仍
然感到很头痛, 像一门他们不太懂的外语一样避而远之.
其次, 即使使用GPU能在很大程度上提高速度, 但依赖于GPU来进行通用计算还是一个问
题, 就是会让程序本身的兼容性变得比较狭窄. 很多老款的GPU, 特别是笔记本上的,
无法运行像CUDA这样的语言.
而苹果在设计OpenCL的时候,有一个很关键的决定就是要让OpenCL不仅能运行在GPU上,
而且还要运行在CPU上. 一个OpenCL程序... 阅读全帖 |
|
P********e 发帖数: 2610 | 48 刚才看前边人发的Kenny Kerr的windows with c++
我相信做图象的人都用过他的这种方法,不过也没想到这种也可以上MSDN
INTEL再牛B也就4CORE,去看看nvidia多少个core,你就知道GPGPU了
估计就不是1700多秒,是几百秒了 |
|
h**********c 发帖数: 4120 | 49 msdn 主要是科普的吧,
如果没学过系统,架构(我记得主要是架构里讲hit rate), Kerr的文章还是不那么容易
吃透的.
GPGPU主要的问题太依赖硬件,
搞应用开发,象我要写程序,必须在LINUX和WINDOWS下都能跑,
有时候还要求在UNIX,APPLE上也能跑,
有一些搞数学的老头子,可能连笔记本都没用过. |
|