关于gpgpu的讨论汇总 - 话题女王

k****e
发帖数: 337

来自主题: JobHunting版 - One opening on GPU/GPGPU.

Experience on GPU/GPGPU/OpenCL/CUDA/DirectX is a must (any one of them is
fine).
Experience on image/video processing, computer vision is a plus
Fresh is welcome.
Send internal email to me.

c*i
发帖数: 348

来自主题: JobHunting版 - Phd求 Compiler ，HPC， GPGPU方面的2014 intern

Phd求 Compiler ，HPC， GPGPU方面的2014 intern 推荐谢谢

b********0
发帖数: 339

来自主题: Stock版 - 有人用GPGPU计算吗？

GPGPU计算在股票交易测试中应用的前途如何？

S**********n
发帖数: 264

来自主题: Stock版 - 有人用GPGPU计算吗？

not sure about the calculation part for trading. Algorithms have to be able
to be executed massive parallely in order to use GPGPU. Unforuntaly, many
things have to be done sequentially in this universe(I am sure this is true
for trading). Seems to me trading is more about speed of signal
transmission. On this sense, cables (cables and routers are more important).
On the other hand, big trading companies could afford to use multiple CPUs
instead of multiple GPU threads.

发帖数: 1

来自主题: Immigration版 - 审稿 - GPGPU方向

有两篇GPGPU方向的会议（不是顶会也不是水会）论文，有兴趣审稿的童鞋请私信给我
你的email和个人主页URL。本人是会议PC，合适的话我会给你发invitation letter。
需要在本周末结束之前审完。

发帖数: 1

来自主题: EB23版 - 审稿 - 并行/GPGPU计算方向

y*******n
发帖数: 3

来自主题: CS版 - GPGPU Desktop/Laptop

I'd like to buy a laptop/desktop with decent GPGPU capability.
I need it to do financial modelling and simulations.
And I will do OpenCL programming on the machine.
Any recommendation about the machine?
Thanks!

y*******n
发帖数: 3

来自主题: Hardware版 - GPGPU Desktop/Laptop

I'd like to buy a laptop/desktop with decent GPGPU capability.
I need it to do financial modelling and simulations.
Any recommendation about the machine?
Thanks!

G***U
发帖数: 38

来自主题: _Graphics版 - 讨论一下GPGPU

gpgpu.org，网上应该也有不少tutorial
个人感觉这个东西难成main-stream graphics research，在msra时和研究员讨论过：
无非是把cpu做的东西放到显卡上做，有一些特定的问题能算得快很多。fundamentally
没有太significant的contributions。
如果是做development的，这一块还是蛮好玩的。有rendering和shading programming
的基础的话，学起来不会花太多时间。NVidia最近出了个CUDA，也可以弄个玩玩。

w***n
发帖数: 1084

来自主题: _Graphics版 - 讨论一下GPGPU

I actually have some precision problem with GPGPU programming. The result
looks fine when my computational space is small (16*16 or so). But when I
increase the computational space to something like 256 bye 256, the
precision drops quickly to only 1e-6, which is much lower than CPU's (
usually 1e-12) based to my own experience.

p***s
发帖数: 866

来自主题: _Graphics版 - GPGPU的笔记本

计划在这个感恩节的时候去抢购一个笔记本，用来做GPGPU的计算，要求能支持OpenGL
2.0. 感觉现在的系统大多支持nVidia的显卡，所以想买用nVidia做显卡的笔记本。价
格在1000美元以内，性能在这个价格内越高越好。只是现在还拿不定主意，大家有什么
建议？请指教！

l**p
发帖数: 474

来自主题: _Graphics版 - GPGPU的笔记本

GPGPU on laptop.... not a good idea..

OpenGL

p***s
发帖数: 866

来自主题: _Graphics版 - GPGPU的笔记本

I agree. The performance on desktops for GPGPU is much better. But I only
need this laptop to learn and illustrate some ideas at home. My lab is
supposed to have desktops there. I don't want a desktop at home. It is
inconvenient for me to move.
Do you have any suggestions for both the laptop and the desktop? Thanks.

p***s
发帖数: 866

来自主题: _Graphics版 - Toshiba x205 S7483做GPGPU怎么样？

今天去bestbuy的local store去看了一下，发现了一个不错的deal:
Toshiba x205 S7483，其中我最感兴趣的是Nvidia 8700M GT with 256MB GDDR2
video memory. 平时售价$1500，这个星期的售价是$1350. 不知道black friday会不会
在这个价格上继续优惠。另外一点是这个笔记本比较重，9磅多，不过还可以承受，总
比台式机轻多了，呵呵。
在网上google了一下，好像这个型号今年9月30号刚出来，是用来game的，gaming
laptop。我觉得这个价格似乎可以接受，可以考虑用来做GPGPU。大家不妨讨论一下，
这个东东怎么样，有没有性价比更好的选择。
下面是这款笔记本的详细信息和链接：
* Enhanced Intel® Centrino® Duo processor technology with
Intel® Core™2 Duo processor T5450, Intel® PM965 chipset,
Intel®

a***y
发帖数: 19743

来自主题: Apple版 - [合集] 刚退了ipad

☆─────────────────────────────────────☆
laomagua (老马褂) 于 (Thu Apr 22 19:29:58 2010, 美东) 提到:
白玩了两周，结论，实在不需要这么大个itouch
☆─────────────────────────────────────☆
aaaty (阿提 - Hardcore Flash Hater) 于 (Thu Apr 22 19:37:13 2010, 美东) 提到:
你不是发过了吗？

☆─────────────────────────────────────☆
laomagua (老马褂) 于 (Thu Apr 22 19:38:34 2010, 美东) 提到:
发的是打算退，今晚去退了
☆─────────────────────────────────────☆
aaaty (阿提 - Hardcore Flash Hater) 于 (Thu Apr 22 19:41:13 2010, 美东) 提到:
不知道你哪来怎么玩的
我觉得这个不是大号ipo... 阅读全帖

发帖数: 1

来自主题: Military版 - 科14所耗时4年设计的华睿2号数字信号处理器...

近日，中国电科14所耗时4年设计的华睿2号数字信号处理器（DSP）顺利通过中国
“十二五”核高基重大专项芯片的验收。华睿2号则采用8核架构，加上基频提高一倍而
达到1GHz，使指令周期提高6倍而达到每秒4000亿次浮点运算（400GFLOPS）。
从数据上看，华睿2号的性能已经超越了美国的主流DSP芯片。14所是我国歼-20战
机有源相控阵雷达、预警机雷达、中华神盾雷达、反隐身雷达、反导预警雷达的研制单
位，华睿2号芯片性能强劲当然是我国重大武器装备自主化的福音。那么DSP芯片究竟是
什么？华睿2号出现后我们就高枕无忧么？今天，北国防务就来说说这事。
自从雷达数字化革命以来，其主要核心就是由前端的信号处理器与后端的数据处理
器所组成。所谓的 “数据处理器”其实与计算机CPU类似，负责数据的处理与逻辑分析
工作，例如计算目标的坐标、记忆/追踪目标位置、综合敌我识别器与雷达的情报提供
给显示处理器等等。在商用计算机市场成熟后，常选择民用CPU来定制成军用产品。但
由于信号处理的专门性，往往需要针对武器的特性设计专门的芯片，也就是所谓的 “
专用芯片”（ASIC）。
随着芯片技术的进步，民间... 阅读全帖

h******k
发帖数: 15372

来自主题: Military版 - 铁流：中国超算芯片是怎样一步步追上英特尔的

搜索了一下GPDSP这个新名词，搜索结果：
GPDSP 是什么？
分类： OpenCL GPU 通用计算超级计算机 DSP CUDA
GPDSP是国防科大首创，是应对美国禁售Xeon-PHI的技术储备和秘密武器。国防科大最
迟在2013年就开始着手GPDSP的研发工作。今年发布的矩阵2000采用40nm制程工艺，拥
有16核，主频1G，双精浮点2.4T，功耗为200W。因此，矩阵2000虽然在性能上因受制于
国内的制造工艺和设计水平，在性能上不如GPGPU，但在性能-功耗上已经略优于GPGPU
（2.4T/200W 对比 2.91T/300W)，而且已经大幅优于天河2号目前使用的第一代至强PHI
计算卡（2.4T/200W 对比 1T/300W）。
GPDSP相对于GPGPU更接近于CPU，能独立运行OS（Linux或其它实时内核），在编程方面
比GPGPU稍微容易一些（其实相对于CPU两者编程难度都很大）。矩阵2000也是带分支能
力的众核处理器，和Xeon- PHI是相似类型计算卡，理论上讲，扩充一些GPDSP编译指导
语句也能跑OpenMP代码。当然，GPDSP也能跑OpenC... 阅读全帖

h******k
发帖数: 15372

来自主题: Military版 - 铁流：中国超算芯片是怎样一步步追上英特尔的

S*********a
发帖数: 1640

来自主题: JobHunting版 - 求Graphic方面的书籍

最开始GPU是固定流水线的，即从Transformation到着色都是不可编程的固定流程。
后来发展成了可编程的，但还是单纯用于图形绘制。
再后来就有人想到利用这pipeline做别的用途，General Purpose的，即GPGPU，因为反
正当时的vertex shader, pixel shader，都已经可以根据自己的需要写计算程序，而
数据input可以作为texure等送入GPU，Final Image可以输出计算结果。这时候的GPGPU
还是靠往Render图形trigger GPU去计算的。让没有图形背景的人去写shader program
学习曲线比较长。
因为越来越多的领域开始对用GPU来加速可并行的计算感兴趣，NVIDIA就干脆出了CUDA
，跟C类似，这样不懂shader program的人也可以很快上手写GPGPU程序。
OpenCL是后来出的，架构方面很多照搬的CUDA。

c****n
发帖数: 587

来自主题: Stock版 - 移动CPU的战争

这是我google的，cuda和linpack
http://www.ece.neu.edu/groups/nucar/GPGPU/GPGPU-2/Fatica.pdf
cuda 和 matlab
http://developer.nvidia.com/object/matlab_cuda.html
也许这么说更合适些，复杂的运算需要并行和串行并存。可目前的现状是intc全方位打
压nvda，结果是nvda放弃了研发x86的努力，转向ARM。最终的结果不好预测，不过我
更看好 cuda + arm,而不是 n-core cpu.

。具体应用开发问题，是以前并行计算领域都讨论很多的。以前那个IBM的深蓝啥的，
多少core记不清了，有没有256 core?

l********7
发帖数: 2974

来自主题: Stock版 - time to buy qcom

个人觉得，TPU太专用了，而且DL肯定在广义的层次来看，应用和开发绝对不会只停留
于DL。
这里GPU其实说的是GPGPU，现在nvidia的CUDA已经以绝对优势占领了GPGPU（通用计算
）的大批（潜在？）用户市场。这个就类比于早年的专用单片机和通用CPU，是通用计
算能力的CPU使得个人计算机得到大规模普及，而开拓了新的海量市场。DL只是通用计
算的一个hype部分而已，而且自动驾驶也是其中的一个应用小方向而已。Database、科
学计算、分布计算、visualization、virtual／augmented reality都是其中的潜在应
用开发市场。依我个人的分析判断，所有这些市场已经开始形成以nvidia/CUDA为核心
技术的一个ecosystem的雏形了。

l********7
发帖数: 2974

来自主题: Stock版 - 买nvda就是买deep learning

这个我最早5月入市买NVDA的时候，分析过：DL也好，机器学习也好，迟早是个商业
hype，风头会过去。
而TF仍然是为学习算法而开发的一个平台，它能搞database吗，能搞高能物理科学计算
吗，等等。。。通用平行计算，是数据服务器这个海量市场的必要条件，还有就是谁占
据用户市场的问题（类似当年google占据了搜索用户一个道理）。
http://www.mitbbs.com/article/Stock/36692775_0.html
“这里GPU其实说的是GPGPU，现在nvidia的CUDA已经以绝对优势占领了GPGPU（通用计算
）的大批（潜在？）用户市场。这个就类比于早年的专用单片机和通用CPU，是通用计
算能力的CPU使得个人计算机得到大规模普及，而开拓了新的海量市场。DL只是通用计
算的一个hype部分而已，而且自动驾驶也是其中的一个应用小方向而已。Database、科
学计算、分布计算、visualization、virtual／augmented reality都是其中的潜在应
用开发市场。依我个人的分析判断，所有这些市场已经开始形成以nvidia/CUDA为核心
技... 阅读全帖

a***m
发帖数: 5037

来自主题: Stock版 - 高盛在NVDA上赚翻了

三年前一点都不奇怪
GPU做通用计算（GPGPU）多少年了你知道吗，10几年了。
相关编程工具早年用 Cg 后来 CUDA 。连cuda都快10年了。
GPU做DeepLearning是 GPGPU 自然的延伸
DL也远不止三年了。

a********m
发帖数: 15480

来自主题: TVGame版 - [业界]IBM正式放弃对CELL的后续投入研发！

你就是念念不忘你的pc呀。赫赫。
cell本身和gpu思路有些一样的地方。你夸gpu其实顺便也夸了cell了。gpu简单并行更
高在某些处理上还是很好的。俺也说cell取代gpu不实际。但是作为gpgpu的话gpu有些
地方比不上ell.
gpu并行限制大，shader基本上每个点处理都一样。spu是真正的cpu核心，每个程序都
可以不一样，都是普通的程序。应该是某些特别的计算用gpu有可能更快，但是多数情
况下通用计算spu更强。总的来说这两个是orange和apple（果饭不要扁俺，这个是误伤
）。
下面是网上提到的gpu的一些弱点。zt一下。
显示芯片目前通常只支持 32 bits 浮点数，且多半不能完全支持 IEEE 754 规格，有
些运算的精确度可能较低。目前许多显示芯片并没有分开的整数运算单元，因此整数运
算的效率较差。
显示芯片通常不具有分支预测等复杂的流程控制单元，因此对于具有高度分支的程序，
效率会比较差。
目前 GPGPU 的程序模型仍不成熟，也还没有公认的标准。例如 NVIDIA 和 AMD/ATI 就
有各自不同的程序模型。

s****c
发帖数: 11300

来自主题: Apple版 - 刚退了ipad

gpgpu在处理if-else类型程序时候效率差的可怕
而且在数据同步时候的贷款也非常成问题反而是不依赖总线的cpu更有优势
所以我说能靠gpgpu收益的程序类型恐怕不超过10%

s****c
发帖数: 11300

来自主题: Apple版 - 刚退了ipad

你知道gpgpu在什么方面有优势么？

自相矛盾自己打自己的脸啊连多核都用不上的程序要用gpgpu？
不如说arm现在性能太差离瓶颈还早

a****a
发帖数: 5763

来自主题: Apple版 - Mac OS X 背后的故事（九）半导体的丰收（下）zz

随着CPU与GPU合并成技术发展的趋势，苹果开发出了OpenCL框架，能够进行高速并行处
理的能力使OpenCL成为了业界标准，被广泛应用。
最近几年，GPU的发展吸引了很多来自科学计算界人士的目光。GPU有稳定的市场推动力
—公众喜闻乐见的电子游戏产生了源源不断的升级GPU的需求—因此比CPU的更新步伐更
快。从技术上讲，GPU本身就是多核架构，高端显卡往往有五百多个核心，即使低端的
集成GPU也有二三十个核心，所以能够通过并行来高效处理成千上万的线程。同时，对
于科学技算中的浮点计算，GPU往往通过硬件加速使其效率比传统CPU更高，因为图形渲
染等工作基本都是浮点计算。
GPGPU浮出水面
早期的GPU只能执行固定的程序，而不开放给程序员编程。随着时代的发展，图像处理
有时需要对着色器进行编程以实现一些特效，因此需要程序员可以使用GPU的汇编语言
写简单的着色程序。这自然对程序员要求过高，所以一些高阶的着色语言又被GPU厂商
开发出来。比如微软和NVIDIA共同开发的Cg语言，就能为顶点和像素编写专门的着色程
序。这类技术虽然面向图形渲染工作者，却吸引了一小簇科学计算研究者的兴趣。... 阅读全帖

w***g
发帖数: 5958

来自主题: CS版 - 有谁需要GPU Programmer 的么

CPU的优化主要是在cache和lock contention两方面，需要针对具体的code手工实现，
不是-O3就能搞定的。一个程序跑的快不快，首先看算法，然后看实现上的优化，比如C
++用vector还是deque还是直接上int[]之类的,然后是一般性的cache和lock的优化，最
后还是不够快才做针对CPU的优化，比如手工上SSE指令，手工调cache line长度之类的
。到了这一步想要提高即使一倍的速度也是千难万难了。GPU的优化远比CPU的优化难，
而且真正有效的应用领域也远小于CPU，除了游戏以外的市场实在太小。而且即便在这
些有限的领域，CPU跟GPU的差距也在不断缩小。我自己觉得GPGPU在五年之内就会死掉
。同时在Intel的CPU里会出现越来越多GPU的技术。现在在GPGPU上面投资钱和精力，即
使一时能有收效，从长期看来也是不值得的。【在 shingoxlf (shingo) 的大作中提
到: 】

w***g
发帖数: 5958

来自主题: CS版 - 有谁需要GPU Programmer 的么

a**u
发帖数: 492

来自主题: Hardware版 - 日本东京工业大学将用Tesla建全球最强超级计算机

Tokyo Tech的TSUBAME算Tesla的样板工程了吧
http://www.nvidia.com/object/weather.html
青木尊之
http://wwwold.titech.ac.jp/tokyo-tech-in-the-news/j/archives/2010/03/1269388800.html
intel一直唱衰GPGPU
论点是编程麻烦，包括Cell
青木尊之也有提到过这个问题
除非是巨无霸级别的机构
否则搞学术必然要community合作
太专用化的代码不好要求人人都掌握
07年intel搞了个Single-chip Cloud Computer 80核展示
前段时间说今年要送些48核的给学术机构试用
卖点之一是IA构架
http://techresearch.intel.com/articles/Tera-Scale/1826.htm
p.s.
上次大老板说想找TYAN搞台GPGPU的小cluster试试
后来不知为啥没了下文
或许因为我们这行做计算基本都是open community code
眼下能用上GPU的太少了
回头有空了研究研究这个
P

p**l
发帖数: 125

来自主题: Hardware版 - ZZ显卡之争:NVIDIA笔记本反弹 AMD桌面前进

对的，A卡的驱动难用（自己没体会，听隔壁装A的GPGPU说的），而且N卡在GPGPU建立
山头早不少

t*****z
发帖数: 1598

来自主题: Hardware版 - 高端神卡Nvidia K20。升级主机求大神们建议。。。

楼主，如果你不搞GPGPU的话，这卡真心一点用都没有，它又不能玩游戏。插在你的电
脑里徒然费电，还让本身掉价。还不如放在角落里吃灰。所以楼主，想办法卖掉是正经。
如果楼主真心想搞GPGPU（包括挖矿、渲染农场、蛋白折叠、找外星人），我建议楼主
弄一块Socket LGA1150的，单个CPU插槽的、支持ECC内存的服务器主板。Newegg上这类
主板一般150到200间。然后弄一颗有核显的、性价比高的Xeon E3，比如E3-1246v3，才
250到300间。同时弄2到4条ECC内存。
然后就利用核显提供视频，不用别的独立显卡了。另插GeForce桌面卡的问题在于：
GeForce和Tesla的驱动是不一样的，未必能够共存。所以用Tesla的人一般会花贵的多
的钱去入同为专业卡的Quadro。楼主不值得这样做。
这样的机器一配起来，楼主一下就上了人生的新层次。

Motherboard

h*******n
发帖数: 82

来自主题: Programming版 - 请大牛们帮忙看一段并行c++代码的效率问题

CPU level，可以试试intel TBB,不过最后速度和openmp应该差别不是太大
要blast speed，只有写到GPU里面运行，速度提升100倍以上，如果你的运算需要大规模
parallel computation的话，记得买个好的显卡，差别太大了。一个小的台机，配一个
好的显卡
轻松打败你的32核服务器。
GPGPU有很多选择，
比较火的c++ 11里面c++ AMP,前提有个支持directx11的显卡，那么c++ AMP可以利用
direct compute在显卡上跑C++程序，门槛应该比较低，但是你要跨平台就要另作打算
nvidia cuda也是个不错选择，记得买NV的显卡
openCL也不错
你要是会写opengl，懂点shader的话，也可以用老的technique
http://www.mathematik.uni-dortmund.de/~goeddeke/gpgpu/tutorial.

y

发帖数: 1

来自主题: Programming版 - 中年EE转纯CS建议

新年求建议：
准备今年或者明年转行纯CS，目前主要工作是众核处理器性能分析，工作语言C（Linux
Kernel）和Python（Pandas），简单分析过JVM和Java数据库应用程序，但对OOP和FP
不是很熟，对armv8的microarchitecture和底层指令集很熟。
在转行CS上非常纠结，因为没有太多时间和精力刷题，以前用C++刷过，但其实还是用C
语言的思想而不是OOP，断断续续学过Java，但是跟C++区别很大，不能同时看。
项目准备从深度学习和GPGPU入手，毕竟可以用上以前学的硬件架构和高性能计算知识
，手上有Nvidia的Jetson TX1开发板，一直想做点什么。
请问大家未来转纯CS（FLAG之类）是跟风直接上Java刷题，还是应该继续深度学习C++
和GPGPU。我认识身边的朋友很多都是直接刷Java进入的FG，他们就是拼刷题熟练度，
只会Java表面那些东西，对系统知识要求不高，连JVM底层的那些性能问题都没听说过
，就拿大offer了。

发帖数: 1

来自主题: Computation版 - 无标题

Multiple PhD positions with full financial support are now available (
starting from Fall 2018) with Dr. Cong Liu in the department of Computer
Science at UT-Dallas.
Dr. Liu’s research focuses on the areas of Real-Time Systems, GPGPU, and
Data-driven Cyber-Physical Systems. According to www.csrankings.org, UT-
Dallas is ranked No. 8 nationally in the general area of embedded & real-
time systems due to Dr. Liu’s contribution. His supervised PhD students are
publishing at top conferences such as ... 阅读全帖

发帖数: 1

来自主题: Computation版 - PhD student positions at EECS@University of Texas, Dallas

Multiple PhD positions with full financial support are now available (
starting from Fall 2018) with Dr. Cong Liu in the department of Computer
Science at UT-Dallas.
Dr. Liu’s research focuses on the areas of Real-Time Systems, GPGPU, and
Data-driven Cyber-Physical Systems. His research is funded by both NSF (
including the prestigious NSF CAREER award) and industry. For more
information, please visit: http://www.utdallas.edu/~cong
There are currently three general projects to be worked on:
1. P... 阅读全帖

S*********4
发帖数: 5125

来自主题: Military版 - 中国成功研制实测性能超千万亿次的计算机 2010-05-27 07:46:12

中国成功研制实测性能超千万亿次的计算机 2010-05-27 07:46:12
中评社北京5月27日电／新华网记者27日从曙光公司获悉，我国首台实测性能超过千万
亿次的高性能计算机“星云”近日在曙光公司天津产业基地研制成功。
“星云”高性能计算机将于今年年底交付国家超级计算深圳中心，用于科学计算、
互联网智能搜索、基因测序等行业和领域。
曙光公司总裁历军说，作为曙光6000千万亿次高效能计算机系统两大分区之一的服
务分区，“星云”采用X86处理器，该分区由近6万个通用处理器核及近5000个GPGPU加
速部件组成，峰值性能为每秒近3000万亿次，实测Linpack性能达到每秒1000多万亿次
。
目前，这一实测性能超过了落户在天津滨海新区的我国首台千万亿次超级计算机“
天河一号”，后者实测Linpack性能为每秒500多万亿次。
据了解，曙光6000千万亿次高效能计算机系统的计算分区目前正在紧张研制中。
曙光6000高效能计算机系统由中国科学院计算技术研究所、曙光信息产业（北京）
有限公司、国家超级计算华南中心联合研制，由曙光公司天津产业基地制造，设计目标
是满足未来云计算环境的应用

y****e
发帖数: 23939

来自主题: Military版 - 中国研制出千万亿次超级计算机“星云”，超过“天河一号”

“星云”高性能计算机将于今年年底交付国家超级计算深圳中心，用于科学计算、互联
网智能搜索、基因
测序等行业和领域.
北京时间5月28日消息，从曙光公司获悉，我国首台实测性能超过千万亿次的高性能计
算机“星云”近日
在曙光公司天津产业基地研制成功。
曙光公司总裁历军说，作为曙光6000千万亿次高效能计算机系统两大分区之一的服务
分区，“星云”采
用X86处理器，该分区由近6万个通用处理器核及近5000个GPGPU加速部件组成，峰值性
能为每秒近
3000万亿次，实测 Linpack性能达到每秒1000多万亿次。
目前，这一实测性能超过了落户在天津滨海新区的我国首台千万亿次超级计算机“天河
一号”，后者实测
Linpack性能为每秒500多万亿次。
据了解，曙光6000千万亿次高效能计算机系统的计算分区目前正在紧张研制中。
曙光6000高效能计算机系统由中国科学院计算技术研究所、曙光信息产业(北京)有限公
司、国家超级计
算华南中心联合研制，由曙光公司天津产业基地制造，设计目标是满足未来云计算环境
的应用需求，将
于2010年底交付国家超级计算深圳中心使用。
曙光公司成立于1995年，实

b*****e
发帖数: 5476

来自主题: Military版 - 中国研制出千万亿次超级计算机“星云”，超过“天河一号”

这个机器用了大量GPGPU快50％有啥稀奇的

y****e
发帖数: 23939

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

每个节点都是multi-core的啊，
GPGPU就跟不要提了，那是几百个算术处理单元啊
看来你还真是门外汉

c***n
发帖数: 2232

来自主题: Military版 - 橡树岭搞了个小不拉子的混合系统在玩儿

你丫有病啊，差不多发的每个帖子都改一改。
啥叫潮流，用GPGPU做混合系统的超级计算机啊。现在Top500上三个都是中国出的。

h*********n
发帖数: 11319

来自主题: Military版 - 最新超级计算机500强排名出炉：日本K夺冠

很扯
GPGPU中看不中用，那么多会议把它当热点搞毛啊

h*********n
发帖数: 11319

来自主题: Military版 - 龙芯为何不行? 因为根本没有目标...

不懂装懂
性能差那是和intel amd制程领先的桌面cpu比。秒杀君正之流毫无难度。
龙芯3b浮点性能也有100多G，这可是有多层缓存一致性协议有大量指令级并行的实打实
的性能，不是gpgpu堆算数运算器堆出来的纸面性能。

s********a
发帖数: 303

来自主题: Military版 - 送给取笑龙芯的人：账房先生算不好国家利益

Cell有做家用计算机的吗？要么是图形应用，要么是服务器吧，最近那个blade还停产
了。Larrebee是GPGPU，龙芯好想不是吧。其实Larrebee这样的东西正是龙芯不值得存
在的原因。

h*********n
发帖数: 11319

来自主题: Military版 - 美国禁止向中国出口与超级计算机有关的技术

网易这种养猪网忽悠的就是你这种喷子
龙芯3是为HPC量身定做，浮点峰值122GFlop。A8浮点性能如何？
还尼玛用sunspider比硬件，尼玛怎么不用汽车音量功率测马力啊？
在这帮傻逼眼里，Intel Larrabee, IBM Cyclops, NV的GPGPU一定都是渣，因为
sunspider跑不过苹果A8啊。

y*z
发帖数: 3244

来自主题: Military版 - 铁流：中国超算芯片是怎样一步步追上英特尔的

2015年4月，美国商务部决定对中国四家国家超级计算机中心禁售至强PHI计算卡，当时
各种唱衰中国超算的声音不绝于耳。即便天河2号在2015年国际超级计算机大会上蝉联5
连冠，但因使用美国Intel公司的CPU而饱受一些别有用心之人的诟病，不少人声称没有
美国的CPU，天河2号要完蛋了。
现实却截然相反：
在ISC 2015发布会上，国防科大公布天河2A的升级方案，将采用国防科大自主研发的矩
阵2000（GPDSP）替代至强PHI计算卡。矩阵2000采用40nm制程，拥有16核，主频1G，双
精浮点2.4TFlops，功耗为200W。
新年伊始，从科技部公开的文章中透露出好消息——由上海高性能集成电路设计中心设
计的国产众核芯片已达到世界先进水平（美国情报部门对该芯片非常感兴趣，因此笔者
将其称为国产众核芯片）。该众核芯片采用28nm制程，峰值双精度浮点运算速度超过每
秒3万亿次（3TFlops），完全追平了Intel第二代Xeon Phi（也是Intel最好的众核芯片
）——第二代至强PHI计算卡产品代号“Knights Landing”，采用了14nm工艺，双精度
浮点性能超过3T... 阅读全帖

h******k
发帖数: 15372

来自主题: Military版 - 铁流：中国超算芯片是怎样一步步追上英特尔的

感觉GPDSP是general purpose DSP的意思，用DSP做通用计算？

GPGPU
PHI

m********5
发帖数: 17667

来自主题: Military版 - 铁流：中国超算芯片是怎样一步步追上英特尔的

差不多
但这DSP并不是真的用DSP做core，你叫Xeon-phi是GPDSP也可以
反正是和GPGPU不同，用的其实是CPU做core
编程使用起来更容易
但让人觉得奇怪的是，一般这种东西里面的core应该比市售的CPU简单，而堆数量，中
国这个只有16个core,就达到了人家60个core的一半性能...

y*z
发帖数: 3244

来自主题: Military版 - 铁流：中国超算芯片是怎样一步步追上英特尔的

h******k
发帖数: 15372

来自主题: Military版 - 铁流：中国超算芯片是怎样一步步追上英特尔的

感觉GPDSP是general purpose DSP的意思，用DSP做通用计算？

GPGPU
PHI

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天