关于linpack的讨论汇总 - 话题女王

全部话题 - 话题: linpack

a*****s
发帖数: 2663

来自主题: Hardware版 - Multi Threaded LINPACK score

来来来，大家都来试试
E5-1620 v2 14sec 982ms
i******[email protected] 19sec 891ms
都是linpack，这回E5-1620赢了。
https://www.dropbox.com/s/8v4cm0jf13j5wln/Multi%20Threaded%20LINPACK%
20Ultimate.zip

g**1
发帖数: 10330

来自主题: Military版 - 天河二号蝉联全球最快超算或可再领先一年ZT

http://www.top500.org/blog/lists/2013/11/press-release/
China’s Tianhe-2 Supercomputer Maintains Top Spot on 42nd TOP500 List
2013-11-18 08:29:48+00:00
MANNHEIM, Germany; BERKELEY, Calif.; and KNOXVILLE, Tenn.—Tianhe-2, a
supercomputer developed by China’s National University of Defense
Technology, retained its position as the world’s No. 1 system with a
performance of 33.86 petaflop/s (quadrillions of calculations per second) on
the Linpack benchmark, according to the 42nd edition of the twice-... 阅读全帖

k****s
发帖数: 162

来自主题: Military版 - 中国高性能计算机排名（07年版）

刚出来的天河之星投入实用还需要多长时间呢，应该做过很多软件测试吧。国内前五
的两个在天津了...
1
厂商：曙光
型号：曙光 4000A/640x4 Opteron 2.2GHz/Myrinet
安装地点：上海超级计算中心
年份：2004
应用领域：科学计算/工业
处理器数：2560
Linpack值(Gflops)：8061.00
Linpack来源：C
峰值(Gflops)：11264.00
效率：0.72
2
厂商：联想
型号：深腾6800/256x4 Itanium 2 1.3GHz/QsNet
安装地点：中国科学院计算机网络信息中心
年份：2003
应用领域：科学计算
处理器数：1024
Linpack值(Gflops)：4148.00
Linpack来源：C
峰值(Gflops)：5324.80
效率：0.78
3
厂商：IBM
型号：南开之星 xSeries Xeon 3.06 GHz, Myrinet/768
安装地点：天津南开大学科学计算研究所
年份：2004
应用领域：科学计算/教育
处理器数：800
Linpack值(Gflops)：3284.00
Linpa

t******t
发帖数: 15246

来自主题: Military版 - 美国力推Graph500超级计算机排名天河一号未上榜

排名
http://cnbeta.com/articles/129655.htm
在2010年11月17日美国新奥尔良举行的SC2010会议上，美国圣地亚国家实验室与Intel
、IBM、AMD、NVIDIA和Oracle合作定义并发布了一个新的基准测试排名Graph 500，它
是利用图论去分析超级计算机在模拟生物、安全、社会以及类似复杂问题时的吞吐量，
并进行排名，而不是像Linpack那样只针对比较传统的数值运算能力。
圣地亚国家实验室的研究人员表示，希望通过这个测试能促使计算机厂商构建可处理复
杂问题的架构。新的计算标准定义细微且重要，因为它可能对未来几十年的计算机架构
产生重要影响。
Kronecker乘法生成小的合成图形，真实建模图形就是这类生成的大型版本，被用于
Graph500基准测试。点击高分辨率图片的缩略图，同时也可获得更高分辨的EPS文件。
很多科学家认为Linpack测试是一个基本测试机制，可以得知一个计算机执行基本计算
的速度有多快，但对于这个计算机处理实际问题的能力没有太大关系。在SC2010会议上
，一位超级计算机供应商高管开玩笑说，将10万部Androi... 阅读全帖

c*m
发帖数: 1599

来自主题: Military版 - 相比龙芯，申威的“芯”路历程为什么平坦很多？

10月2日，雷锋网刊登专栏作者铁流的文章《相比龙芯，申威的“芯”路历程为什么平
坦很多？》，试图解密一款因军方背景而带有神秘色彩的全自主芯片——申威。全文如
下：
相对于从诞生之初就处于舆论风口浪尖的龙芯，国内另一款走全自主道路的芯片——申
威，相比之下就低调得多。无论是传统纸媒还是网络媒体，申威的曝光率比起龙芯、海
思、展讯等国产芯片都要低得多，而且相比于嘲讽天赋技能被点满的龙芯，申威极少成
为网媒和充满虐气的网民的攻击对象。
申威的军方背景更是给它带一缕神秘的色彩。下面，让我们一起走进申威，解密申威的
“芯”路历程。
1、申威的诞生
上世纪60-70年代末，中国在高性能计算机领域也曾有过自己的辉煌——哈军工曾经制
造出具有分时操作系统和汇编语言、FORTRAN语言及标准程序库的441B系列计算机。北
京大学、北京有线电厂等单位联合研制150计算机。清华大学、北京无线电三厂研制生
产了130、131、132、135、140、152、153系列计算机近千台。国防科大成功研制出151
计算机，华东计算技术研究所成功研制1001中型集成电路计算机和HDS-9计算机，其中
HDS-9计算机每... 阅读全帖

p*z
发帖数: 365

来自主题: Military2版 - 老美修改规则了，不和tg一起玩

美国力推Graph500超级计算机排名欲取代Top500
http://cnbeta.com/articles/129655.htm
在2010年11月17日美国新奥尔良举行的SC2010会议上，美国圣地亚国家实验室与Intel
、IBM、AMD、NVIDIA和Oracle合作定义并发布了一个新的基准测试排名Graph 500，它
是利用图论去分析超级计算机在模拟生物、安全、社会以及类似复杂问题时的吞吐量，
并进行排名，而不是像Linpack那样只针对比较传统的数值运算能力。
圣地亚国家实验室的研究人员表示，希望通过这个测试能促使计算机厂商构建可处理复
杂问题的架构。新的计算标准定义细微且重要，因为它可能对未来几十年的计算机架构
产生重要影响。
Kronecker乘法生成小的合成图形，真实建模图形就是这类生成的大型版本，被用于
Graph500基准测试。点击高分辨率图片的缩略图，同时也可获得更高分辨的EPS文件。
很多科学家认为Linpack测试是一个基本测试机制，可以得知一个计算机执行基本计算
的速度有多快，但对于这个计算机处理实际问题的能力没有太大关系。在SC2010会议
上，一... 阅读全帖

c*m
发帖数: 1599

来自主题: Hardware版 - 相比龙芯，申威的“芯”路历程为什么平坦很多？ (转载)

【以下文字转载自 Military 讨论区】
发信人: cym (纯爷们), 信区: Military
标题: 相比龙芯，申威的“芯”路历程为什么平坦很多？
发信站: BBS 未名空间站 (Fri Oct 2 15:25:49 2015, 美东)
10月2日，雷锋网刊登专栏作者铁流的文章《相比龙芯，申威的“芯”路历程为什么平
坦很多？》，试图解密一款因军方背景而带有神秘色彩的全自主芯片——申威。全文如
下：
相对于从诞生之初就处于舆论风口浪尖的龙芯，国内另一款走全自主道路的芯片——申
威，相比之下就低调得多。无论是传统纸媒还是网络媒体，申威的曝光率比起龙芯、海
思、展讯等国产芯片都要低得多，而且相比于嘲讽天赋技能被点满的龙芯，申威极少成
为网媒和充满虐气的网民的攻击对象。
申威的军方背景更是给它带一缕神秘的色彩。下面，让我们一起走进申威，解密申威的
“芯”路历程。
1、申威的诞生
上世纪60-70年代末，中国在高性能计算机领域也曾有过自己的辉煌——哈军工曾经制
造出具有分时操作系统和汇编语言、FORTRAN语言及标准程序库的441B系列计算机。北
京大学、北京有线电厂等单位联... 阅读全帖

m******g
发帖数: 621

来自主题: Military版 - 神威太湖之光成为TOP500第一名

http://www.top500.org/news/new-chinese-supercomputer-named-worlds-fastest-system-on-latest-top500-list/
New Chinese Supercomputer Named World’s Fastest System on Latest TOP500
List
June 20, 2016, 4:01 a.m.
System achieves 93 petaflop/s running LINPACK on Chinese-designed CPUs
China draws Equal to the U.S . in Overall Installations
FRANKFURT, Germany; BERKELEY, Calif.; and KNOXVILLE, Tenn.—China maintained
its No. 1 ranking on the 47th edition of the TOP500 list of the world’s
top supercomputers,... 阅读全帖

t**t
发帖数: 27760

来自主题: Hardware版 - China’s Tianhe-2 Supercomputer Takes No. 1 Ranking on 41st

MANNHEIM, Germany; BERKELEY, Calif.; and KNOXVILLE, Tenn.--Tianhe-2, a super
computer developed by China’s National University of Defense Technology, is
the world’s new No. 1 system with a performance of 33.86 petaflop/s on the
Linpack benchmark, according to the 41stedition of the twice-yearlyTOP500 l
ist of the world’s most powerful supercomputers. The list was announced Jun
e 17 during the opening session of the 2013 International Supercomputing Con
ference in Leipzig, Germany.
Tianhe-2, or M... 阅读全帖

w***g
发帖数: 5958

来自主题: Programming版 - 过几年再看吧

我做过关于计算性能的估计，再更新下。
1997年的深蓝的linpack数是11.38GFLOPS. (1997)
NVDA的显卡的linpack数不好查。只能估计。
Tesla S2050的Linpack数428.9 GFLOPS，raw peak是4.13 TFLOPS，也就是
说cuda的linpack数能做到1/10 raw peak的样子。
最新代的titan X pascal raw peak是10,962 GFLOPS。也就是说相当于
10962 * 428.9 / 4130 / 11.38 = 100x深蓝。
就是GTX 1080 (~$600)也相当于80x深蓝。
这是玩游戏的配置。NVDA的deep learning专用硬件
DGX-1(~$120K)，差不能多相当于800x深蓝。
至于一个集群能连进去多少个GPU那就另说了。
开源的alphago出现只是早晚的事情，只不过普通玩家搞不到
那么多硬件，也没有面子去拿围棋国手做测试。
不过要是摩尔定律不败，再加上算法改进，不出五年
我们就应该能随便玩到干的过任何人类的围棋AI。

t*********e
发帖数: 1136

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

又不是我想争Linpack谁好谁不好。你看看前面的贴。是那些人拿Linpack说事。
我说Big Table, Map Reduce, Hadoop是方向。他们要争Linpack。
曙光05-06年OEM谁家的产品我不清楚。这个星云用Mellanox是事实。
Infiniband的Market只是Ethernet的大概百分之一二吧。其中因素很多。
但是不论如何市场证明Ethernet是主流。

c***n
发帖数: 2232

来自主题: Military版 - 我天朝终于研究出自主生产的超级神鸡，神威。 (转载)

神威蓝光: Linpack性能795.9TFlops，效率74.37%
天河1A: Linpack性能2.57PFlops，峰值4.7PFlops
日本的“京1号”: Linpack性能8.2P,效率93%,峰值8.8PFlops

l******n
发帖数: 1683

来自主题: Hardware版 - 屌丝的近期比较失败的PC升级

linpack跑什么intel burn呀, 去这download个intel自己发布的linpack程序跑跑吧,
http://software.intel.com/en-us/articles/intel-math-kernel-libr
ownload
linpack只要内存不足够小, 90%的效率一般是没问题, 拼得就是理论峰值.

S*********4
发帖数: 5125

来自主题: Military版 - 中国成功研制实测性能超千万亿次的计算机 2010-05-27 07:46:12

中国成功研制实测性能超千万亿次的计算机 2010-05-27 07:46:12
中评社北京5月27日电／新华网记者27日从曙光公司获悉，我国首台实测性能超过千万
亿次的高性能计算机“星云”近日在曙光公司天津产业基地研制成功。
“星云”高性能计算机将于今年年底交付国家超级计算深圳中心，用于科学计算、
互联网智能搜索、基因测序等行业和领域。
曙光公司总裁历军说，作为曙光6000千万亿次高效能计算机系统两大分区之一的服
务分区，“星云”采用X86处理器，该分区由近6万个通用处理器核及近5000个GPGPU加
速部件组成，峰值性能为每秒近3000万亿次，实测Linpack性能达到每秒1000多万亿次
。
目前，这一实测性能超过了落户在天津滨海新区的我国首台千万亿次超级计算机“
天河一号”，后者实测Linpack性能为每秒500多万亿次。
据了解，曙光6000千万亿次高效能计算机系统的计算分区目前正在紧张研制中。
曙光6000高效能计算机系统由中国科学院计算技术研究所、曙光信息产业（北京）
有限公司、国家超级计算华南中心联合研制，由曙光公司天津产业基地制造，设计目标
是满足未来云计算环境的应用

y****e
发帖数: 23939

来自主题: Military版 - 中国研制出千万亿次超级计算机“星云”，超过“天河一号”

“星云”高性能计算机将于今年年底交付国家超级计算深圳中心，用于科学计算、互联
网智能搜索、基因
测序等行业和领域.
北京时间5月28日消息，从曙光公司获悉，我国首台实测性能超过千万亿次的高性能计
算机“星云”近日
在曙光公司天津产业基地研制成功。
曙光公司总裁历军说，作为曙光6000千万亿次高效能计算机系统两大分区之一的服务
分区，“星云”采
用X86处理器，该分区由近6万个通用处理器核及近5000个GPGPU加速部件组成，峰值性
能为每秒近
3000万亿次，实测 Linpack性能达到每秒1000多万亿次。
目前，这一实测性能超过了落户在天津滨海新区的我国首台千万亿次超级计算机“天河
一号”，后者实测
Linpack性能为每秒500多万亿次。
据了解，曙光6000千万亿次高效能计算机系统的计算分区目前正在紧张研制中。
曙光6000高效能计算机系统由中国科学院计算技术研究所、曙光信息产业(北京)有限公
司、国家超级计
算华南中心联合研制，由曙光公司天津产业基地制造，设计目标是满足未来云计算环境
的应用需求，将
于2010年底交付国家超级计算深圳中心使用。
曙光公司成立于1995年，实

t*********e
发帖数: 1136

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

这是不稀奇。专搞Infiniband的公司就那两三家。
稀奇的事有人居然吹牛“曙光已有1us的switch”，还是两年前就有了。最后
牛皮被戳，原来是买的Mellanox的。这和交大的陈先生有一比。
星云的核心技术：CPU，GPU，Interconnect，系统软件，都不是自己开发的。
全是买来的。这样的成果有多大的意义？
至于Ethernet Switch是不是适合HPC。我又问了一下我的一个朋友。现在
10G的Linpack效率已达80%以上。Google “Arista Linpack”即可。不久
40G和100G就要出来了。和Infiniband相比差距会更小。
再说Supercomputer这个市场很小。Cray Computer一年的Revenue只有2亿
3千万美元。还不到HP服务器Revenue零头的零头。Sun夕阳日下的时候
Server Revenue也有一百多亿美元。所以中国大搞Supercomputer是没有
什么意思的，是浪费资源。
我以前的老师曾参加过国防科大银河亿次机项目。最后又怎样？没有多少
实际效益。

。

h***i
发帖数: 1970

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

你知道你在说什么吗，Big Table, Map Reduce, Hadoop要争Linpack？他们要争啥？:-
) 他们要解决的问题也不一样。Map Reduce, Hadoop解决的问题都是相对来说比较简单
的问题，问题本身很容易并行处理，不需要大量的通信。而Linpack测试需要大量的
inter communication，latency 是最重要的，这就是为什么用infiniband的原因，多
年前大家是用Myrinet。

m**********e
发帖数: 12525

来自主题: Military版 - 1小时内打击全球任何目标,美帝提出，中国实现了

没用过超级计算机吧?
超级计算机的运算能力是按Linpack计算的,拜托先去查一下什么叫做linpack

y********l
发帖数: 3970

来自主题: Military版 - 中国科大包揽SC16大学生超算竞赛双料冠军

中国科大包揽SC16大学生超算竞赛双料冠军
信源：科学网｜编辑：2016-11-18｜网址：http://www.popyard.org
11月16日，在美国盐城湖举行的2016全球超级计算机大会（SC16）大学生超算竞赛中，
中国科学技术大学代表队成功打破LINPACK性能基准测试（HPL）世界纪录，创下了31.
15TFLOPS的新高；并最终凭借优异表现获得总分以及LINPACK测试双料冠军——这是该
项赛事历史上首次有队伍获得双料冠军。

o*****p
发帖数: 2977

来自主题: Military版 - 中国最好结局就是拉美陷阱

圆珠笔芯
中国现在能不能造出圆珠笔芯？
https://www.zhihu.com/question/40793398
不能，因为没人去造。
这是一个性价比问题，不是技术问题。
也就是说，你花钱设置工厂，制造设备。然而生产出来，并不会比别人卖的便宜，不一
定对得起付出成本，就这么简单。
网上把这个问题夸大了，其实全世界只有瑞士和日本在生产这玩意儿，并不是说这是什
么技术垄断。
芯片
http://news.xinhuanet.com/tech/2016-04/27/c_128936782.htm
据QUESTEL的报告，在过去18年里，全球芯片专利数量实现了6倍的增长，中国芯片专利
量则增长了23倍，在芯片专利申请数量方面，中国已成为第一大国，并连续5年蝉联全
球第一。
通用芯片：
神威·太湖之光（英语：Sunway TaihuLight）是由中国国家并发计算机工程技术研究
中心研制的超级电脑，2016年6月20日在LINPACK性能测试中以 93 PFLOPS 的测试结果
超越同为中国组建的天河二号（LINPACK成绩约为34 PFLOPS），成为世界上最快的超级
计算机。
神威... 阅读全帖

D*****i
发帖数: 8922

来自主题: Military2版 - 龙芯3B流片成功[zz]

超级计算机的Gflops不都是用LINPACK测得吗？Intel的SSE干这个不行。
网上有人测了3B的矩阵乘法性能（基本相当于LINPACK了），效率超过90%。虽然我也没
见过正式报告，不过以前见过一些资料，他们在向量单元的优化上还是下了番功夫的。

N****w
发帖数: 21578

来自主题: Military2版 - 龙芯3B流片成功[zz]

找到科大那个基于 336 颗 2F 的 KD-50-1 的 Linpack 结果
谁给看看。。。
HP Linpack性能：0.34 Tflops
http://kd50.ustc.edu.cn/test/NODE324.log.txt

H**********k
发帖数: 224

来自主题: Hardware版 - 哪款cpu计算能力强？

matlab最早是个wrapper for BLAS (or LINPACK)，用的不是intel mkl，后来（大概
r14，具
体版本号无所谓）intel mkl性能不错，就用mkl了。
不都是。有些人喜欢gotoBlas或者其他的BLAS implementation. 有人用amd cpu跑
intel mkl
没有优势，就跑AMD的BLAS.
BLAS, LINPACK这些可以wiki到。

l******n
发帖数: 1683

来自主题: Hardware版 - 想买一堆赛扬3300做cluster，牛人帮俺算一算

俺来估算一下, 8个节点的话峰值计算速度是2.5Gx4x2x8=160G, 搞个普通的千兆网跑
linpack测试的话大概效率能到50%, 也就是实测能到80G, 峰值上等价于3个i7 960,
实测的linpack大概2个把.

p******e
发帖数: 528

来自主题: Hardware版 - i7-5960X可不可以干掉所有Xeno?

请问你的X5650x2CPU跑这个Intel的Linpack能达到多少的flops？
https://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-
download
我在i73930上测大概能达到140－150Gflops。而在i5-26xx
上测大概是60－70Gflops的样子。

h******t
发帖数: 872

来自主题: ChinaNews版 - World's fastest supercomputer belongs to China --CNN

http://edition.cnn.com/2010/TECH/innovation/10/28/china.supercomputer.mashable/
(Mashable) -- Unveiled Wednesday at the Annual Meeting of National High
Performance Computing (HPC China 2010) in Beijing, Tianhe-1A is the world's
fastest supercomputer with a performance record of 2.507 petaflops, as
measured by the LINPACK benchmark.
Tianhe-1A was designed by the National University of Defense Technology (
NUDT) in China, and it is already fully operational.
To achieve the new performance record, ... 阅读全帖

c*****r
发帖数: 8227

来自主题: Military版 - 天河一号配置

多阵列可配置协同并行体系结构
6144颗英特尔CPU
5120颗AMD GPU，
内存98TB，
点点通信带宽40Gbps，
共享磁盘1PB。
系统峰值性能1.206PFlops
Linpack性能560.3TFlops

O******n
发帖数: 1505

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

street view需要返回一个全局的结果么？
google搜索，amazon，这些都是典型的极粗粒度应用，特点就是不需要频繁的通信，
负载平衡只在任务级来做，对正确性几乎没有要求
你干嘛不举图形学的例子呢？raytracing根本就没有什么通信，所以做渲染的大机器不
叫集群，叫渲染农场，那是只要堆钱就能提高速度的领域，偏偏这个领域对速度的要求
并不急迫
“绝对比中国那个超级机的传输容量大好多倍了”
真有你的，嘴唇一开一闭，张嘴就来。data center和HPC就是橘子和苹果的关系。你如
果对他们组的额工作有基本的了解，就不会说这种话了。还千兆以太网哪。这东西确实
低技术，科大一个组用龙芯+ethernet一个月就搞出来万亿次的机群了，可惜linpack效
率不到40%。HPC应用需要的是低延迟，这就是infiniband能卖高价的原因。

w*******q
发帖数: 1764

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

现在supercomputer和cluster区别不是没有，看个人观点，就是有也很小很模糊也没有
什么定义，包括那些大牛也说不出个公认的所以然的。off the shelf components 因
该是cluster的基本特征，因为便宜而且性能不错，所以这个模式很快就扩散了被大多
数人用了，向当年cray那样专门的supercomputer现在不说芬毛菱角也是十分少见了。
这个攒cluster还是相当有技术含量的，至于google那种data center和supercomputer
和mainframe这三个从本质上解决的问题就不一样，要达到的目的也不一样，data
center和前些年火的grid computing和现在火的cloud computing倒是一个门出来的。
其实这种东西主要看实际中运行的效果怎么样，HPC更重要的能不能解决现实的运算问
题，linpack那个指标实际上不说明太大问题的，国内的这个实际效果不好说，估计差
距还不小，不过这个应试考试的硬指标上来也不容易，还是有进步的。

O******n
发帖数: 1505

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

受不了了。还真有以为可以凭借google 挑战内行的人啊.你有没有阅读能力？
我说了曙光会用以太网么？我说了曙光比infiniband强么？我打你的脸，是因为你自己
在这里散布高性能计算不过是用以太网攒机的谬论。自己去看排行榜，用GigaEthernet
的机器最高排名28，前100名里只有这一台。用的统统是x86处理器，几乎全都是过去一
年内出厂，平均linpack效率却不到50%。这些机器基本都是IBM和HP卖给金融公司和物
流公司的业务服务器，是HPC中的草根阶层，根本算不上supercomputer。这就是你嘴里
的高科技？
事实是：以太网在top10的科学计算巨型机里，完全没有立足之地。
事实是：曙光这种你眼高手低看不起的公司，互联网络技术也远远超出以太网集群的水平

end-
switches
约两
得东
群差

x*******1
发帖数: 28835

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

my boss said it's great. I also feel proud. It's not easy even just buying
from nvdia and intel.
The biggest problem is not in hardware. It;s from software and tuning.
xing yun can just play <50% peak performance. It means the peers from china
have poor tuning technique in MPI, linpack, and blas.

l******n
发帖数: 1683

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

同学呀, 你得搞清楚, linpack这个测试本身对网络的要求就不高, 尤其是延迟
方面. 理论上如果系统的总内存无穷大, 即使网络连接再差, 在计算足够大的
矩阵的时候, 都能达到线性加速比.
曙光方面, 现在啥情况不太清楚, 但是至少05-06年的时候就已经有了
infiniband的产品, 当时向我们推销过.
争论infibiban好还是ethernet好没啥意义, ethernet不意味着就门槛低而且
经济, 比如10年前左右, 即使不考虑延迟方面, 千兆以太网也并不经济.

l******n
发帖数: 1683

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

linpack是一个应用测试, Hadoop是一种架构, 两个根本就不是一回事.
大计算量的东西很多, 不同应用有不同的要求, 的确有些应用可以很
容易分治, 而且子任务间的通讯量很小, 但是这只是一部分而已。
曙光当年应该是自己做的网卡, 用的别人家的switch.
市场需要细分的, 在HPC这个领域, 现在的情况是infiniband是主流.

O******n
发帖数: 1505

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

你到底有没有阅读能力？因为曙光不如infiniband才要买，不等于曙光连以太网的4us
延迟
都做不出来。
我用4台机器超大内存点对点互联搞个迷你集群，linpack效率怎么也能上90%。你有没
有基本的scalability概念？你给我说说top500里那一台以太网机器的效率达到了80%？
现在的人抬杠都完全不关心事实了，赶着怎么说话有气势怎么用词喷得爽就行？

t*********e
发帖数: 1136

来自主题: Military版 - 超级计算机五百强：中国“星云”傲居第二

我敢说曙光可商业化的连以太网的4us延迟就是做不出来。你说能那你拿真数据
给大家看看。可别来什么OEM的。
我提了你可以google "arista linpack"。80%的效率。对照了一下top500，
是第208位，4000个Procs, Dell，便宜普通的架构。不是几台机器糊弄人的。
当然不是前列。但是那个机构本来不是干这行吃饭的。用用大路货就行。
这怎么不是事实？

4us

h******1
发帖数: 126

来自主题: Military版 - 中国超级计算机星云或称霸全球超级计算机500强

规模一大以后什么都是问题：
1、互联：万级十万级的CPU之间如何相互连接？全互联的成本无法承担，如何实现优化
的互联拓扑，省钱并且高效？
2、功耗：CPU，网卡，switch等等的散热？散热不好会造成硬件系统的稳定性问题；而
且，系统构建完成，省电就是最直接的省钱，如何优化CPU运行频率（CPU throttling
），如何控制switch和网卡的功耗？
3、软件优化：1.27/2.98的效率（数据来自主贴，未验证），并且还是最经常优化的
Linpack的峰值数据，效率是比较低的。Top10的机器，星云和天河是效率比较低的两台
，还有很大的优化空间！
超级计算毫无疑问是高科技，这也是美国依然对中国限制出口的领域。

m********t
发帖数: 1591

来自主题: Military版 - 中国超级计算机星云或称霸全球超级计算机500强

这个新闻比较土，用linpack，星云和美洲虎的差距相当明显，不可能短期赶上的
理论峰值的确是星云好一些，呵呵

e***l
发帖数: 710

来自主题: Military版 - “天河一号”千万亿次超级计算机zz

峰值性能1.206PFlops，LINPACK测试性能563.1TFlops@575MHz；
理论峰值就是所有的处理单元性能的线性加和，花钱加设备就能达到。
实测性能才代表系统整合的好坏。这个数值只有理论的一半不到，效率不算很高。

O******n
发帖数: 1505

来自主题: Military版 - 天河-1A 排名世界第一了

盆子都什么德行啊。linpack测的就是双精度性能。本次升级性能提升的主要原因就是
采用了双精度性能大大改进的Fermi GPU

g**1
发帖数: 10330

来自主题: Military版 - 天河-1A 排名世界第一了

这是6月的排名。新的下周公布。
http://news.cnet.com/8301-13924_3-20020991-64.html
The new system would top another Chinese supercomputer also using Nvidia
chips called Nebulae, rated at 1.271 petaflops (one petaflop is one
thousand trillion operations per second). Both the Nebulae and Tianhe-1A
performance ratings are based on the Linpack benchmark, the most widely
used performance yardstick for supercomputers. Nebulae is currently
rated No. 2 in the world based on the Top500 June list. The Oak Ridge
system is... 阅读全帖

J********3
发帖数: 3151

来自主题: Military版 - 中国的天河-1A超级计算机成世界第一了

中国的天河-1A超级计算机成世界第一了，scored 2.507 petaflops as
measured by the LINPACK benchmark. That moves it past Cray's 2.3 petaflops
Jaguar located at Oak Ridge National Lab in Tennessee.
http://www.nytimes.com/2010/10/28/technology/28compute.html?_r=4&nl&emc=a1

O**l
发帖数: 12923

来自主题: Military版 - 橡树岭搞了个小不拉子的混合系统在玩儿

我们没谈什么混合系统这玩意能用的软件都没几个做出来放在这那浪费电干什么
hpc做出来是用的不是run linpack的
你就说 ibm这两有没有赶上潮流

O**l
发帖数: 12923

来自主题: Military版 - 橡树岭搞了个小不拉子的混合系统在玩儿

再问一句啥叫潮流拿nvdia 的芯片加速？
做出来放在那天天run linpack

O**l
发帖数: 12923

来自主题: Military版 - 橡树岭搞了个小不拉子的混合系统在玩儿

running a range of science and engineering codes
1p 是run这个不是你的linpack
倒了

t******t
发帖数: 15246

来自主题: Military版 - 中国的新超级电脑不是真的世界最快

《MIT技术评论》的一篇文章指出，中国采用GPU加速的天河一号A超级计算机只是峰值
运算速度世界最快，在实际运算中它无法维持长时间的高速计算，而美国的超级电脑却
能连续几天高负荷运算。美国国家超级计算机应用中心主任Thom Dunning表示，在GPU
上达到峰值速度十分困难。天河一号A采用了7,168颗NVIDIA Tesla M2050 GPU和14,336
颗CPU，GPU的瓶颈在于搭配的显存速度不够快，因此GPU在大部分时间总是无所事事。
GPU速度和显存速度之间存在明显的不匹配情况。即使中国的超级计算机软件工程师能
发明新的科学计算软件，在较少访问内存的情况下实现接近峰值的速度，Linpack基准
测试也无法清楚指示出它的实际应用性能。由于系统对GPU的依赖，意味着现有的绝大
多数超级计算机应用程序都必须重写——这是一项巨大的挑战。
http://hardware.solidot.org/article.pl?sid=10/11/08/0915244

s****n
发帖数: 8912

来自主题: Military版 - xiaoju特大利好日本研制世界最快计算机:每秒运算超1万万亿次

本超级计算机“京”首次突破每秒1万万亿次运算速度技术大关，问鼎世界第一
近日，日本的技术人员成功突破了超级计算机每秒1万万亿次运算速度的技术难关。周
三，日本IT业巨头富士通公司和日本政府所属日本理化研究所共同宣布两者已经在神户
合作开发出一款运算速度可以达到每秒1.051万万亿次的超级计算机。
这款新型超级计算机名为“京”，这是全球首款运算速度越过1万万亿次大关的“超级
运算机器”。当下周公布官方的超级计算机全球500强名单时，它将当之无愧获得世界
第一的殊荣。日本理化研究所所长，2001年度诺贝尔化学奖得主野依良治说：“在科技
领域，虽然不知道能否实现，但我们必须力争第一。”
本周早些时候，中国的技术人员们让全世界大吃一惊，他们首次运用完全由本国设计的
处理器芯片制造出一台名为“神威蓝光”的超级计算机，安装在山东省国家超级计算济
南中心。但是这台超级计算机的运算极限速度是无法进入世界前10位的：其峰值运算速
度约为每秒1千万亿次，日本的“京”号超级计算机的运算速度超出它10倍有余。
但在此之前，中国的超级计算机“天河一号”在去年11月曾以每秒4701万亿次的峰值速
度问鼎全球第一。... 阅读全帖

y*h
发帖数: 25423

来自主题: Military版 - 公知安息吧: “天河二号”排名世界第一，用国产CPU

你在Super Computing Conference上提这个问题会让人笑死的。
Top 500里基本都是美国的技术，有些有自己的特色而已。天河也是美国的Intel做运算
的核心，富士通也是美国的Sparc内核技术，定制互联通讯也是基于很多美国技术的，
自己做点优化而已。美国现在的问题是Funding Agency对线性规模扩展的计划不同意，
比Titan大一个数量级的proposal在去年Titan刚出来时就有了，但是这样扩充没意思，
功率就是一个大问题，很多人觉得这样搞下去计算中心越来越大耗电越来越惊人不是个
事，所以美国下一代机器现在还没有统一的意见，何况美国联邦政府的经费今年自动缩
减近10%。Intel的MIC实际也是GPU的老路，编程复杂，软件需要重新写，跑Linpack
benchmark好看，但并不好用，所以也并不怎么受追捧，更多的考虑实用的计算中心还
是以通用CPU为主。
现在的主要问题是，没有什么革命性的创新，所以很难引起funding agency的兴趣，剩
下的只有一招了，就是宣扬中国威胁论，打着中国抢了第一的旗号来要钱。这一招在国
会那里可能还真能管用。
... 阅读全帖

y*h
发帖数: 25423

来自主题: Military版 - 公知安息吧: “天河二号”排名世界第一，用国产CPU

知识该更新了。所谓“排名前几位的超级计算机”现在都是cluster集群。shared
memory的SMP超级计算机基本已经被市场淘汰了，成本差距太大了。
现在的情况是，市场上现成的商品CPU、memory、interconnection性能都已经足够好了
，从市场上买现成的就能组装出性能非常好的机器了，Top 500里第6、第7的机器都是
苦逼的屌丝大学在市场上直接购买大路货的商品CPU、memory、interconnection组装的
白菜机。只有争第一为国争光的政府计划才能打着旗号搞到足够的钱来定制，但是大多
也只是定制interconnection而已，都声称比商品的最好的IB还快，实际上做IB的公司
也不是吃素的，人才技术都不比研究所里的差，标准本身对他们有限制而已。定制CPU
太贵了，AMD、Intel的价格便宜量又足，加上跑Linpack Benchmark很牛的nVidia的GPU
，抢名次很实用，现在大家都用这些，只有富士通和IBM/日立还在苦苦坚持。

t**********8
发帖数: 1683

来自主题: Military版 - 天河二号成世界最快超级计算机

天河二号成世界最快超级计算机中国超级计算机重返世界之巅
来源: CoolBullet 于 2013-06-17 06:17:09 [档案] [博客] [旧帖] [转至博客] [给
我悄悄话] 本文已被阅读：358次字体：调大/调小/重置 | 加入书签 | 打印 | 所有
跟帖 | 加跟贴 | 查看当前最热讨论主题
天河二号
天河二号机房
新华网报道，时隔两年半后，中国超级计算机运算速度重返世界之巅。国际TOP500组织
17日公布了最新全球超级计算机500强排行榜榜单，中国国防科学技术大学研制的“天
河二号”以每秒33.86千万亿次的浮点运算速度，成为全球最快的超级计算机。
相比之下，美国能源部下属橡树岭国家实验室的“泰坦”从上次第一名降至本次第二名
，其运算速度为17.59千万亿次。专家们表示，由于“天河二号”的速度比第二名快近
一倍，中国有可能保持桂冠至少一年时间。今后，全球最快超级计算机的位置将可能出
现由中美日三国计算机交替把持的局面。
排行榜主要编撰人之一、美国田纳西大学计算机学教授杰克·唐加拉现场核实了“天河
二号”的运算速度。他说，对“天河二号”印象“非常深刻”，它拥... 阅读全帖

topics