m********5 发帖数: 17667 | 1 差不多
但这DSP并不是真的用DSP做core,你叫Xeon-phi是GPDSP也可以
反正是和GPGPU不同,用的其实是CPU做core
编程使用起来更容易
但让人觉得奇怪的是,一般这种东西里面的core应该比市售的CPU简单,而堆数量,中
国这个只有16个core,就达到了人家60个core的一半性能... |
|
s****e 发帖数: 638 | 2 《铁流:中国超算芯片是怎样一步步追上英特尔的》看见这个帖子里大家在争论国防科
大的矩阵2000超算加速器,但七嘴八舌感觉说的都不太对。下面简单说说超算加速器。
天河曙光都是异构超算,系统是由大量不同类型指令集和体系架构的计算单元组成。这
些计算单元可以是通用CPU, 以及GPU, DSP, FPGA 等各种 coprocessor。通用CPU的计
算能力超强,但成本高功耗大,并行度相对低,适合高强度运算。GPU等专用计算单
元工作频率低,但内核巨多,非常适合大规模并行问题。 所以超级计算机的每个计算
节点就高低搭配,天河2号有16000个计算节点,每个节点用两片Intel Xeon CPU加3个
Xeon Phi coprocessor(协处理器) 加速。 这样针对不同的应用问题,开发人员可以
通过编程把任务灵活分配到 CPU 或协处理器上执行,实现最大效率。协处理器最常见
的是使用GPGPU,比如天河一号不同版本分别使用过AMD GPU 及Nvidia GPU。协处理器
当然也可以用FPGA,专用的ASIC。 或者使用专用众核芯片,例如第一代
Xeon Phi,60核,此处理器还添加... 阅读全帖 |
|
y*****s 发帖数: 2028 | 3 是水下的那一部分么?
我以为GPGPU就可以了呢。。 |
|
发帖数: 1 | 4 IBM的POWER 9芯片是14nm,NVIDIA Tesla V100 GPGPU是12nm, 估计美国人只要用10nm
芯片就可以得到百亿亿次计算速度,同时控制能耗在30兆瓦。
顶点目前速度是20亿亿次,能耗15兆瓦。
新计算机速度增加5倍,耗能增加1倍,10nm制程应该可以轻松达到。 |
|
s*m 发帖数: 1896 | 5 什么叫with the help of vector units?
要是放个GPGPU的话,flops会翻着个往上窜的
little
performance [ |
|
L***n 发帖数: 6727 | 6 gpgpu就得用tflops了,不然不好意思跟人打招呼 |
|
o****o 发帖数: 8077 | 7 I guess the same as GPGPU, just not as many pipes |
|
o****o 发帖数: 8077 | 8 最大问题是龙芯的整数运算比不过低端x86,浮点争不过GPGPU,这是个问题 |
|
p******a 发帖数: 582 | 9 tg看来是想要冲击世界第一的头衔,目前top500中只有两台实测linpack上1PF,分别是
第一cray的美洲豹Jaguar (1.75pf)和第二IBM的走鹃roadrunner (1.04pf),走鹃曾经
达到过1.4pf的速度,但是后来部分节点被分出去干别的事情了,现在的这个星云可能
已经超过了走鹃,进入三甲应该没有问题。而星云只是曙光6000的服务区就已经有3pf
的峰值1pf的实测。曙光6000目前看来是要采用类似于走鹃那样的混合架构,而且将混
合的更厉害,这个星云是x86+gpgpu,采用龙芯3b的计算区是mips还没有加入近来,到
时候龙芯要是能真的搞定的话我猜想实测能上3pf,峰值上10pf(万万亿次),登顶世界第
一,看来tg野心不小阿。 |
|
L***n 发帖数: 6727 | 10 gpgpu肯定是未来HPC的方向,软件库没有整好说明可以做的空间很多, 干吗
什么都向洋人要现成的, |
|
c***n 发帖数: 2232 | 11 体系结构不一样,性能不在一个级别上,单比效率没意义。要比就比单位性能下的
total cost of ownership. GPGPU的系统耗能低,达到同样性能用的芯片数量也少的多。
20 |
|
h*********n 发帖数: 11319 | 12 gpgpu2年前就上T了
你就把3b看成低功耗,核比较少,每个核功能比较强的gpgpu好了
年初
年夏
核,
flops的
/S的
高达
款芯 |
|
t*n 发帖数: 14458 | 13 这个俺纯外行灌水
你们继续科普
gpgpu2年前就上T了
你就把3b看成低功耗,核比较少,每个核功能比较强的gpgpu好了
年初
年夏
核,
flops的
/S的
高达
款芯 |
|
h*********n 发帖数: 11319 | 14 sb的绝招就是车轱辘sb话么?
gpgpu cell 都能轻松做到你说的全部要求 |
|
r***w 发帖数: 142 | 15 对了忘记说感受:
面试前听说google的面试都是从general software engineer开始的。无论你什么专业,必
须是个好的程序员才可能被接受。事实证明不完全是这样,如果他们需要你的专业,也
可能很灵活。
我带了几个我自己的demo video去。时候证明这些很有说服力。我写很多程序,大多数
性能比较高的实现都是用GPGPU作的。我所有的工作都是实时的,虽然算法不复杂,但
是性能都是行业里比较高的。他们很欣赏这个。
诚实,不懂的话不要纠缠狡辩。让他问下一题。
应该在面试前练习在白板上写程序。他们可能很严格,每一个人都作笔记并且用相机把
板子上写的东西存档。
多想,少辩。当我请求面试官给我20分钟思考的时候,他说你这样很好,因为想比说重
要多了。 |
|
f*******r 发帖数: 1086 | 16 楼主能够透露一下自己的研究方向吗?
我也是CS PHD,不过是做computer graphics方向的,看到你说demo用GPGPU,觉得很亲
切:)猜是基于cuda。
我下周也有google的电面,感觉需要准备不少基础知识,自己虽然平时一直写程序,但
是都是research code,像DP这种方法用的非常非常少,呵呵,也觉得挺无奈的,感觉找
工作的时候,如果不是企业研究院的researcher类职位,就是coding工了,前段时间联
系过一些大企业的研究院,但是都说想要我可是经费比较紧张,没有headcount,没办法
,只能是找coding类的工作,呵呵,像楼主这种能够找到和自己研究方向match的R&D位
置真的很幸运,非常羡慕!
恭喜,并且祝福后续一切都顺利! |
|
r***w 发帖数: 142 | 17 对了忘记说感受:
面试前听说google的面试都是从general software engineer开始的。无论你什么专业,必
须是个好的程序员才可能被接受。事实证明不完全是这样,如果他们需要你的专业,也
可能很灵活。
我带了几个我自己的demo video去。时候证明这些很有说服力。我写很多程序,大多数
性能比较高的实现都是用GPGPU作的。我所有的工作都是实时的,虽然算法不复杂,但
是性能都是行业里比较高的。他们很欣赏这个。
诚实,不懂的话不要纠缠狡辩。让他问下一题。
应该在面试前练习在白板上写程序。他们可能很严格,每一个人都作笔记并且用相机把
板子上写的东西存档。
多想,少辩。当我请求面试官给我20分钟思考的时候,他说你这样很好,因为想比说重
要多了。 |
|
a****n 发帖数: 1887 | 18 GPGPU(cuda), FPGA, MultiCore, 这三个东西以后在金融领域应该都不错
如果做EE, 我觉得FPGA发展前景很不错. |
|
n*******0 发帖数: 2002 | 19 俺说的都是个人意见,达人随便拍,lz仅供参考:
(2)parallel在高性能计算和集群上用的多。laptop上multi-thread有应用,但是对
就业来说多它不多没它不少,真要学的话看看openmp也就差不多了。。。。俺目前看到
的并行的职位都是intel/amd/nvidia还有石油公司和国家实验室直接面向phd和多年经
验的那种。你搞个实习project对于找工作不会有啥帮助。(ps:有谁知道multi-
thread和gpgpu的 job post千万通知俺一下,谢!!!)
(1)可以使找工作的时候多一条路,起码ios objective c的码农post可以拿到
interview,剩下的看造化。
(3)不了解。 |
|
e********5 发帖数: 422 | 20 给三星正下名 他们offer不差 phd有115kbase 这还是negotiate以前的开价 bonus有25
%—30%
里面人也挺nice
我已经从了别家了 就不继续negotiation 我觉得能negotiate到120k
要推荐的给我站内 我认识那个hiring manager
需要懂点gpgpu和game phys engine |
|
e********5 发帖数: 422 | 21 做game phys engine需要懂gpgpu programming
我认识hiring manager 谁要去 站内信
phd工资有l给了115k+ 25%bonus我觉得很不错了 |
|
|
e********5 发帖数: 422 | 23 之前推荐了好几个职位,反响都不错,hm也开心,版上同学也开心,我也可以拒得安心
点。要拒掉最后一个职位了,有人想去的给我发信,我直接转到hm邮箱。
AWS seattle, elastic mapreduce组,SDE。不是generic码工职位,需要懂HPC(起码
写过openmp, mpi的程序,写过gpgpu的更好),有scientific computing经验。当然算
法数据结构OO概念什么的要知道,白板写些基础题还是要会,但不用像版上大牛那么猛.
另外,关于amazon的绿卡,如果phd的pub够好,amazon也可以办EB1B,而且不用等到
SDE II,一切都看hm是不是足够看重你。 |
|
e********5 发帖数: 422 | 24 有个搞gpgpu的opening。。。在MD州 是个小公司。。谁有兴趣我可以给推荐
刚刚在班上贴了人家的job description结果被版主无情的删掉了 * _ *....说偶是中
介 T_T
只能再发一遍。。要是再被删那就只有算了 |
|
|
h******6 发帖数: 2697 | 26 我已经做了三年的cuda计算了……phd方向就是cuda,这个gpgpu计算是大势所趋,只不
过目前工业界还没达到那个规模。目前的确不是很好找工作或者实习如果单纯凭你的
cuda经验的话。希望我毕业的时候这个就业能好一些 |
|
s*****e 发帖数: 10 | 27 是啊,其实挺多公司都找GPGPU的人的,可惜没伪币,有的话,因该考虑开个club |
|
W******g 发帖数: 887 | 28 大牛是搞GPGPU的?
我怎么记得是搞手机显卡的?
mobile |
|
|
E*******0 发帖数: 465 | 30 divided and conque
cuda nvidia的GPGPU |
|
w****a 发帖数: 710 | 31 GPU编程一般用在两处啊
一个是图像渲染的,游戏或者仿真用,做效果。
一个是并行计算,GPGPU,现在Cuda/OpenCL啥的挺成熟了,做科学计算很给力。像一些
视频转码啊,图像处理啊,都可以用CUDA啥的做。
GPU分担CPU计算是个趋势啊。 |
|
h******6 发帖数: 2697 | 32 看你以后想去工业界还是研究所了 如果是想去工业界还是算了 md老子做了三年多CUDA
并行计算 现在找工作一个match的没有(当然除了nvidia) 基本都要图形图像的或者
GPU architecture的 当然大部分去工业界都是自废武功
GPGPU我也觉得是个趋势啊 莫非是现在工业界还没普及开来?求明眼人给指条活路 |
|
h******6 发帖数: 2697 | 33 大公司都用distributed不用单机并行 而且GPGPU要写出深度优化的程序需要多年的经
验 没办法堆砌硬件 可能这个对于普及是个硬伤 |
|
l*****t 发帖数: 2019 | 34 就是HPC,就街个?没有个啥Hadoop, columnr, gpgpu啥的? |
|
k****e 发帖数: 337 | 35 Anyone who has GPGPU/OpenCL/CUDA experience, welcome to apply. |
|
s******c 发帖数: 1920 | 36 最终是science问题,但现阶段还就是技术问题,怎么用网络,怎么用gpgpu,怎么调参数 |
|
g***3 发帖数: 2304 | 37 求推荐gpgpu的职位
参数
★ 发自iPhone App: ChineseWeb 8.7 |
|
g****a 发帖数: 81 | 38 我们组里现有两个2015春季intenship空缺。具体job description如下,如感兴趣,可
以把简历发给我信箱:[email protected]
(function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute('data-cfemail');if(a){s='';r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.substr(j,2),16)^r;s+=String.fromCharCode(c);}s=document.createTextNode(s);l.parentNode.replaceChild(s,l);}}catch(e){}})();
/* ]]> */
.
谢谢!
----------------------
Intel Job Description
Graphics SW Eng... 阅读全帖 |
|
m**********6 发帖数: 1 | 39 麻烦给我发简历的人还是要有些视频或者图像处理技术,不然简历经过manager和hr手
还是会被刷掉。简历比较符合的,我会给manager,最近项目比较忙,所以我就不回复
大家的email了。
大家好。我目前在Dolby工作,主要做Dolby Vision编码端相关的事情(跟传统的视频
编解码有点区别)。我们组想招一个人,做视频编码相关的Project。主要开发工作都
在OS之上,主要是SIMD优化,多线程,数据结构和算法层次的优化。然后会把research
codes转化为production codes。所以得自己从头到尾开发程序。做的事情也比较有意
思,代码开发比较多。Manager也很nice,会很信任放手让你去开发任务。有兴趣的人
,可以投简历,我会帮忙推荐的。薪水虽然跟现在那些很热的互联网公司没法比,但是跟
传统的那些公司(qualcomm,broadcom,cisco,intel)应该差不多。而且每两周有个周
五可以不用上班。
如果刚毕业的,要求应该会低些。如果有兴趣请发简历到 [email protected]
/* */
主要的职位要求如下:
Job Tit... 阅读全帖 |
|
发帖数: 1 | 40 第一你怎么知道股沟不设计芯片
第二cpu也未必是硬件瓶颈,scale可以up 可以out 看具体应用。碰巧deep learning在
很多场合里可以scale out 所以才大量上gpgpu |
|
发帖数: 1 | 41 第一你怎么知道股沟不设计芯片
第二cpu也未必是硬件瓶颈,scale可以up 可以out 看具体应用。碰巧deep learning在
很多场合里可以scale out 所以才大量上gpgpu |
|
p***r 发帖数: 4702 | 42 有点过时了。GPGPU 用得怎样?写个矩阵乘法用GPU 能比CPU 快几倍?
主要是底层做差不多了,职位不是很多。
EE |
|
m********u 发帖数: 3942 | 43 工作地点San Jose,CA
有兴趣的同学可以站内信或者发邮件:j***********[email protected]
The company are dedicated to leveraging advanced techniques to improving
lives and have a number of exciting projects in the field of AI, BI,
Robotics, SoC,Sensors.. We are looking for strong candidates of deep
learning and machine learning in system areas.
Key requirements and qualifications:
Experience with software development in parallel computing, HPC.
Experience with cloud computing and distributed data processing.
Experience with d... 阅读全帖 |
|
s******p 发帖数: 421 | 44 天河一号使劲吹国防科大的飞腾cpu
后来新闻稿透露,用了1万4千个xeon,7千个特斯拉的Gpgpu和2000个飞腾。后者简直就是充数的。
顺便说一句,一片特斯拉2050就是1TFLOPS, 一万亿次每秒,价格和能耗相当于千亿次的xeon。特斯拉真是凑数利器。 |
|
G***U 发帖数: 38 | 45 【 以下文字转载自 Shanghai 讨论区 】
发信人: GPGPU (谈判专家), 信区: Shanghai
标 题: 美国有啥像《第一财经》的电视台?
发信站: BBS 未名空间站 (Sun Oct 12 13:26:14 2008), 站内
介绍商业财经信息的 |
|
a********n 发帖数: 1287 | 46 不明白Nvdia出了这个东西股票还下跌,Cuda应该他是老大了 |
|
B********e 发帖数: 1062 | 47 The calculation is not that much for trading. |
|
b********0 发帖数: 339 | 48 你说的很对。
我是这样看的:我们做组合交易的要对数千股票同时测试(主要过程是独立的),所以
适合大规模并行运算的GPU也许更有利,测试中数据有点延迟问题不大。真正下单不会
太多,一分钟能完成几十个就足足够了,我们不追求毫秒级的准确度。
able
many
true
important). |
|
|
b********0 发帖数: 339 | 50 INTEL 也在做。将来很可能比用多个CPU系统更适合散户。 |
|