o****o 发帖数: 8077 | 1 looks like the efficiency is lower than 50%~~~is this normal for Peta level
super computer? |
y***i 发帖数: 11639 | 2 被超过的天河一号,速度现在世界排名第5
http://www.top500.org/lists/2009/11
以前很了不起,现在已经不吸引眼球了。
level
【在 o****o 的大作中提到】 : looks like the efficiency is lower than 50%~~~is this normal for Peta level : super computer?
|
y***i 发帖数: 11639 | 3 奇怪,这个峰值性能好像已经超过2009年11月份的世界第一的计算机了
曙光公司总裁历军说,作为曙光6000千万亿次高效能计算机系统两大分区之一
的服务分区,“星云”采用X86处理器,峰值性能为每秒近3000万亿次,实测L
inpack性能达到每秒1000多万亿次。
http://www.top500.org/list/2009/11/100
level
【在 o****o 的大作中提到】 : looks like the efficiency is lower than 50%~~~is this normal for Peta level : super computer?
|
p*****c 发帖数: 1506 | 4 美国人就是牛啊,前十除了老中和德国佬各占一个,剩下全是老美的
【在 y***i 的大作中提到】 : 奇怪,这个峰值性能好像已经超过2009年11月份的世界第一的计算机了 : 曙光公司总裁历军说,作为曙光6000千万亿次高效能计算机系统两大分区之一 : 的服务分区,“星云”采用X86处理器,峰值性能为每秒近3000万亿次,实测L : inpack性能达到每秒1000多万亿次。 : http://www.top500.org/list/2009/11/100 : : level
|
y***i 发帖数: 11639 | 5 德国佬's is from IBM, so only China and US.
【在 p*****c 的大作中提到】 : 美国人就是牛啊,前十除了老中和德国佬各占一个,剩下全是老美的
|
O**l 发帖数: 12923 | 6
这样都能说
中国那个也是x86的
so only US
【在 y***i 的大作中提到】 : 德国佬's is from IBM, so only China and US.
|
s********e 发帖数: 13723 | 7 CD上说江南所有家伙比这个强,但是有知识产权问题,所以不能公开
【在 O**l 的大作中提到】 : : 这样都能说 : 中国那个也是x86的 : so only US
|
O**l 发帖数: 12923 | 8
从历史经验来看
tg的保密 一般都是保落后
【在 s********e 的大作中提到】 : CD上说江南所有家伙比这个强,但是有知识产权问题,所以不能公开
|
s****r 发帖数: 31686 | 9 LOL, 属实
【在 O**l 的大作中提到】 : : 从历史经验来看 : tg的保密 一般都是保落后
|
h****l 发帖数: 7290 | 10 你这是泄密
【在 O**l 的大作中提到】 : : 从历史经验来看 : tg的保密 一般都是保落后
|
|
|
p*****c 发帖数: 1506 | 11 江南所是啥所?
【在 s********e 的大作中提到】 : CD上说江南所有家伙比这个强,但是有知识产权问题,所以不能公开
|
s****r 发帖数: 31686 | 12 泄密没有
前两天听电台节目, 嘉宾说需要美国开放高科技出口, 其中一条就是中国需要大量的
超级计算机。 肯定不是这种自己攒的烂玩意, 中国想买IBM的。 美国不开放不卖
【在 h****l 的大作中提到】 : 你这是泄密
|
s********e 发帖数: 13723 | 13 你们说中国的高性能机是硬件不行呢,还是软件,我觉得可能还是软件。你们说硬件这
玩意也能进前10了,基本够用了。 |
c*****1 发帖数: 3240 | 14 嘿嘿,这有点老了吧
【在 y***i 的大作中提到】 : 德国佬's is from IBM, so only China and US.
|
O**l 发帖数: 12923 | 15 偶觉得tg芯片能做到啥水平 美帝应该一清二楚吧
保密也没啥必要
江南所 不买amat的设备?? |
s********e 发帖数: 13723 | 16 江南所估计还那个水平,顶多也就是跟龙芯那样设计一下
【在 O**l 的大作中提到】 : 偶觉得tg芯片能做到啥水平 美帝应该一清二楚吧 : 保密也没啥必要 : 江南所 不买amat的设备??
|
o****o 发帖数: 8077 | 17 江南所那个是alpha21164系列的山寨吧,即使加入tg利用最新科技的改进也好不了哪去
了,毕竟是10年前的玩意儿了,虽然架构在当时是很nb
【在 O**l 的大作中提到】 : 偶觉得tg芯片能做到啥水平 美帝应该一清二楚吧 : 保密也没啥必要 : 江南所 不买amat的设备??
|
o****o 发帖数: 8077 | 18 软件
土鳖目前也就用10多个节点搞计算,人美帝都是用上万个节点并行了,软件上的差距简
直就是个大茶几
【在 s********e 的大作中提到】 : 你们说中国的高性能机是硬件不行呢,还是软件,我觉得可能还是软件。你们说硬件这 : 玩意也能进前10了,基本够用了。
|
s****r 发帖数: 31686 | 19 所以土鳖还是谗美帝的计算机啊, 可惜美帝不卖, 只卖土鳖柑橘牛肉啥的, lol
【在 o****o 的大作中提到】 : 软件 : 土鳖目前也就用10多个节点搞计算,人美帝都是用上万个节点并行了,软件上的差距简 : 直就是个大茶几
|
o****o 发帖数: 8077 | 20 麻痹的,硅公们在哪儿呢?
【在 s****r 的大作中提到】 : 所以土鳖还是谗美帝的计算机啊, 可惜美帝不卖, 只卖土鳖柑橘牛肉啥的, lol
|
|
|
y***i 发帖数: 11639 | 21 2009年11月,最新的排名啊。
【在 c*****1 的大作中提到】 : 嘿嘿,这有点老了吧
|
h****l 发帖数: 7290 | 22 ft,就是我们同事的程序,也可以用几百个节点计算啊。
【在 o****o 的大作中提到】 : 软件 : 土鳖目前也就用10多个节点搞计算,人美帝都是用上万个节点并行了,软件上的差距简 : 直就是个大茶几
|
b*****e 发帖数: 5476 | 23 你这是扯淡,上百节点很多开源软件就能行
美帝上万节点的code也不多,大部分几千个效率就不行了,俺现在就在排名前10的机器
上,目前最多的一个job也只用了1024个。
【在 o****o 的大作中提到】 : 软件 : 土鳖目前也就用10多个节点搞计算,人美帝都是用上万个节点并行了,软件上的差距简 : 直就是个大茶几
|
o****o 发帖数: 8077 | 24 平均平均
这个10几个节点的数据出自上海超算,不过目前似乎确实有提高,咱老中也不笨嘛,摸
上手了搞起来就快了
【在 b*****e 的大作中提到】 : 你这是扯淡,上百节点很多开源软件就能行 : 美帝上万节点的code也不多,大部分几千个效率就不行了,俺现在就在排名前10的机器 : 上,目前最多的一个job也只用了1024个。
|
w**h 发帖数: 1121 | 25 出手这么大方,能源部 ?
【在 b*****e 的大作中提到】 : 你这是扯淡,上百节点很多开源软件就能行 : 美帝上万节点的code也不多,大部分几千个效率就不行了,俺现在就在排名前10的机器 : 上,目前最多的一个job也只用了1024个。
|
w**h 发帖数: 1121 | 26 MPI 是标准语言,和多少结点没关系。并行计算效率高低主要取决于程序员自己努力和
问题难度,自己解决,不依靠计算机软件并行化。
【在 o****o 的大作中提到】 : 软件 : 土鳖目前也就用10多个节点搞计算,人美帝都是用上万个节点并行了,软件上的差距简 : 直就是个大茶几
|
x*******1 发帖数: 28835 | 27 需要tuning的东西太多。 application, mpi, network, OS需要裁减。 一般tg的机器
效率能有peak的一半就不错了。 以前是不上好网络。 现在上了好网络,看来还是
tuning不行。 |
y****e 发帖数: 1785 | 28 呵呵,上面top10里面几十个node的job也不少阿
【在 o****o 的大作中提到】 : 平均平均 : 这个10几个节点的数据出自上海超算,不过目前似乎确实有提高,咱老中也不笨嘛,摸 : 上手了搞起来就快了
|
w**h 发帖数: 1121 | 29 如果计算机真的只能并行使用10多个节点的话,那还是多想想比较底层的东西吧,
例如操作系统之类的.但是10多个节点比较少,实测计算机性能的时候怎么
可能做出来高性能呢 ?
【在 o****o 的大作中提到】 : 平均平均 : 这个10几个节点的数据出自上海超算,不过目前似乎确实有提高,咱老中也不笨嘛,摸 : 上手了搞起来就快了
|
s****r 发帖数: 31686 | 30 实测性能的时候如果使用很同意parallize 的workload的话, 性能就上来了
【在 w**h 的大作中提到】 : 如果计算机真的只能并行使用10多个节点的话,那还是多想想比较底层的东西吧, : 例如操作系统之类的.但是10多个节点比较少,实测计算机性能的时候怎么 : 可能做出来高性能呢 ?
|
|
|
w**h 发帖数: 1121 | 31 但是处理器数目就10 多个,太少了.一般并行程序作得好的话.处理速度是
线性增长,如果有10 个处理器并行,总处理速度就是10倍于单处理器的速度,
想作到实测性能千万亿次,那单个处理器得性能相当惊人才行.
【在 s****r 的大作中提到】 : 实测性能的时候如果使用很同意parallize 的workload的话, 性能就上来了
|
t*******r 发帖数: 22634 | 32 靠!啥并行程序能牛到这个地步啊?某些很容易向量并行处理的数值算法
例外 …………
【在 w**h 的大作中提到】 : 但是处理器数目就10 多个,太少了.一般并行程序作得好的话.处理速度是 : 线性增长,如果有10 个处理器并行,总处理速度就是10倍于单处理器的速度, : 想作到实测性能千万亿次,那单个处理器得性能相当惊人才行.
|
o****o 发帖数: 8077 | 33 速度随处理器数目线性增长的算法或者项目不多吧,MCMC算一个。
大多数科学计算效率衰减都很厉害
【在 w**h 的大作中提到】 : 但是处理器数目就10 多个,太少了.一般并行程序作得好的话.处理速度是 : 线性增长,如果有10 个处理器并行,总处理速度就是10倍于单处理器的速度, : 想作到实测性能千万亿次,那单个处理器得性能相当惊人才行.
|
w**h 发帖数: 1121 | 34 所以觉得你说的那个上海的机器应该相当古老了吧?
10几个节点,这个太少了.
【在 o****o 的大作中提到】 : 速度随处理器数目线性增长的算法或者项目不多吧,MCMC算一个。 : 大多数科学计算效率衰减都很厉害
|
t*n 发帖数: 14458 | |
s****r 发帖数: 31686 | 36 嗯, 这个是科技(低), 俺也没学过, 胡说八道, 重在参与
【在 t*n 的大作中提到】 : 没学过并行计算的人含羞漂过~~~~
|
w****2 发帖数: 12072 | 37 中国人软件这方面挺强的,应该很快会很快的。
商业软件不行是因为盗版。不存在盗版问题的地方中国软件都不错。
【在 x*******1 的大作中提到】 : 需要tuning的东西太多。 application, mpi, network, OS需要裁减。 一般tg的机器 : 效率能有peak的一半就不错了。 以前是不上好网络。 现在上了好网络,看来还是 : tuning不行。
|
t*******r 发帖数: 22634 | 38 HKC 啊,软件 != coding 滴,算法及算法实战得出的具体参数才是
分高下之处。
【在 w****2 的大作中提到】 : 中国人软件这方面挺强的,应该很快会很快的。 : 商业软件不行是因为盗版。不存在盗版问题的地方中国软件都不错。
|
c*****z 发帖数: 1211 | 39 上海超算的机器1000个节点,30000个核。。。不过平时上去的作业平均就使用十几个
节点,大了效率就降低。而且都是美国人搞得商用软件,fluent啥的,美国人自己也就
跑十来个节点。
这个星云效率超过50%,而且用了GPU,相当厉害,不过软件当然是美国人的东西多。
【在 w**h 的大作中提到】 : 所以觉得你说的那个上海的机器应该相当古老了吧? : 10几个节点,这个太少了.
|
b*******d 发帖数: 192 | |
|
|
p******a 发帖数: 582 | 41 tg看来是想要冲击世界第一的头衔,目前top500中只有两台实测linpack上1PF,分别是
第一cray的美洲豹Jaguar (1.75pf)和第二IBM的走鹃roadrunner (1.04pf),走鹃曾经
达到过1.4pf的速度,但是后来部分节点被分出去干别的事情了,现在的这个星云可能
已经超过了走鹃,进入三甲应该没有问题。而星云只是曙光6000的服务区就已经有3pf
的峰值1pf的实测。曙光6000目前看来是要采用类似于走鹃那样的混合架构,而且将混
合的更厉害,这个星云是x86+gpgpu,采用龙芯3b的计算区是mips还没有加入近来,到
时候龙芯要是能真的搞定的话我猜想实测能上3pf,峰值上10pf(万万亿次),登顶世界第
一,看来tg野心不小阿。 |
o****o 发帖数: 8077 | 42 机器也是百万亿次的了,刚出来的时候TOP500排名第十,不算古老了
主要是软件都是老美的,受制于人
【在 w**h 的大作中提到】 : 所以觉得你说的那个上海的机器应该相当古老了吧? : 10几个节点,这个太少了.
|
O**l 发帖数: 12923 | 43
cpu 不受制?
【在 o****o 的大作中提到】 : 机器也是百万亿次的了,刚出来的时候TOP500排名第十,不算古老了 : 主要是软件都是老美的,受制于人
|
O**l 发帖数: 12923 | 44
3pf
龙虾3b 啥代号
这代号很新鲜啊 哈哈
【在 p******a 的大作中提到】 : tg看来是想要冲击世界第一的头衔,目前top500中只有两台实测linpack上1PF,分别是 : 第一cray的美洲豹Jaguar (1.75pf)和第二IBM的走鹃roadrunner (1.04pf),走鹃曾经 : 达到过1.4pf的速度,但是后来部分节点被分出去干别的事情了,现在的这个星云可能 : 已经超过了走鹃,进入三甲应该没有问题。而星云只是曙光6000的服务区就已经有3pf : 的峰值1pf的实测。曙光6000目前看来是要采用类似于走鹃那样的混合架构,而且将混 : 合的更厉害,这个星云是x86+gpgpu,采用龙芯3b的计算区是mips还没有加入近来,到 : 时候龙芯要是能真的搞定的话我猜想实测能上3pf,峰值上10pf(万万亿次),登顶世界第 : 一,看来tg野心不小阿。
|
p******a 发帖数: 582 | 45 呵呵,和我估计的一样。
超级计算机五百强:中国“星云”傲居第二
在德国汉堡举行的2010年国际超级计算大会上,TOP500.org组织公布了第35届全球超级
计算机五百强排行榜,中国新近研发完成的“星云”(Nebulae)高居亚军位置,一举创
造了中国在这项排行榜上的傲人新纪录,同时中国“天河一号”排在第七位。这样,中
国不但打破了美国对前三甲的长期垄断,也第一次在前十名中占据了两个席位。
“星云”超级计算机是前十强中的唯一一名新成员。它位于深圳国家超级计算机中心,
由曙光公司的曙光TC3600 刀片系统集群组成,内部采用Intel Xeon X5650 2.66GHz六
核心处理器、NVIDIA Tesla C2050计算卡,总计120640个计算核心,运行Linux操作系
统,最大浮点性能1.271PFlops(全球第三个突破1PFlops大关),峰值可达2.9843PFlops
,甚至超过美洲虎28%之多,是全球理论性能最高的超级计算机。
位于天津国家超级计算中心的中国“天河一号”(Tianhe-1)上次位列第五,目前最大性
能仍保持在563.1TFlops不变,滑落至第七位。此 |
o****o 发帖数: 8077 | 46 CPU 好歹从黑市买到了能凑出来还可以的机器
软件买也买不到,商用的性能都受限制
【在 O**l 的大作中提到】 : : 3pf : 龙虾3b 啥代号 : 这代号很新鲜啊 哈哈
|
L***n 发帖数: 6727 | 47 开源软件中国做的好?有什么拿的出手的项目?
【在 w****2 的大作中提到】 : 中国人软件这方面挺强的,应该很快会很快的。 : 商业软件不行是因为盗版。不存在盗版问题的地方中国软件都不错。
|
s********e 发帖数: 13723 | 48 中国的实际数目估计有30,军队里面肯定有些“见不得人的” |
y***i 发帖数: 11639 | 49 没必要啊。就算是搁在中科院,只要设备以及人员隔离开,和不见人也没区别。
【在 s********e 的大作中提到】 : 中国的实际数目估计有30,军队里面肯定有些“见不得人的”
|
s********e 发帖数: 13723 | 50 就是说军方的高性能计算机不一定拿来参加评比了
【在 y***i 的大作中提到】 : 没必要啊。就算是搁在中科院,只要设备以及人员隔离开,和不见人也没区别。
|
|
|
w**h 发帖数: 1121 | 51 平均一个节点有30多个处理器? 那我就明白了.这样的话,一个作业十几个节点,
几百个处理器,是挺正常的.
【在 c*****z 的大作中提到】 : 上海超算的机器1000个节点,30000个核。。。不过平时上去的作业平均就使用十几个 : 节点,大了效率就降低。而且都是美国人搞得商用软件,fluent啥的,美国人自己也就 : 跑十来个节点。 : 这个星云效率超过50%,而且用了GPU,相当厉害,不过软件当然是美国人的东西多。
|
c*****z 发帖数: 1211 | 52 32核,8路
【在 w**h 的大作中提到】 : 平均一个节点有30多个处理器? 那我就明白了.这样的话,一个作业十几个节点, : 几百个处理器,是挺正常的.
|
o****o 发帖数: 8077 | 53 在曙光5000百万次问世之前一年,总参的机器就达到百万次规模
这个是中科大计算中心的新闻里面泄的。
另外金怡濂说有能力用“国产处理器”搭建百万亿到千万亿次的机器,这话时2009年说的
【在 s********e 的大作中提到】 : 就是说军方的高性能计算机不一定拿来参加评比了
|
w*******q 发帖数: 1764 | 54
3pf
这个东西投资要上去,而且这种东西钱得从政府来,不管你多有水平,钱都得足够才行
,日本的水平很高,不过富士通的
项目政府补贴给砍了以后就悲剧了.
【在 p******a 的大作中提到】 : tg看来是想要冲击世界第一的头衔,目前top500中只有两台实测linpack上1PF,分别是 : 第一cray的美洲豹Jaguar (1.75pf)和第二IBM的走鹃roadrunner (1.04pf),走鹃曾经 : 达到过1.4pf的速度,但是后来部分节点被分出去干别的事情了,现在的这个星云可能 : 已经超过了走鹃,进入三甲应该没有问题。而星云只是曙光6000的服务区就已经有3pf : 的峰值1pf的实测。曙光6000目前看来是要采用类似于走鹃那样的混合架构,而且将混 : 合的更厉害,这个星云是x86+gpgpu,采用龙芯3b的计算区是mips还没有加入近来,到 : 时候龙芯要是能真的搞定的话我猜想实测能上3pf,峰值上10pf(万万亿次),登顶世界第 : 一,看来tg野心不小阿。
|
c*****1 发帖数: 3240 | 55 峰值岂不是第一了?性能么,有用过曙光系列的么?维护的如何?
9843PFlops
【在 p******a 的大作中提到】 : 呵呵,和我估计的一样。 : 超级计算机五百强:中国“星云”傲居第二 : 在德国汉堡举行的2010年国际超级计算大会上,TOP500.org组织公布了第35届全球超级 : 计算机五百强排行榜,中国新近研发完成的“星云”(Nebulae)高居亚军位置,一举创 : 造了中国在这项排行榜上的傲人新纪录,同时中国“天河一号”排在第七位。这样,中 : 国不但打破了美国对前三甲的长期垄断,也第一次在前十名中占据了两个席位。 : “星云”超级计算机是前十强中的唯一一名新成员。它位于深圳国家超级计算机中心, : 由曙光公司的曙光TC3600 刀片系统集群组成,内部采用Intel Xeon X5650 2.66GHz六 : 核心处理器、NVIDIA Tesla C2050计算卡,总计120640个计算核心,运行Linux操作系 : 统,最大浮点性能1.271PFlops(全球第三个突破1PFlops大关),峰值可达2.9843PFlops
|