由买买提看人间百态

topics

全部话题 - 话题: gflops
首页 上页 1 2 (共2页)
N****w
发帖数: 21578
1
来自主题: Military2版 - 龙芯3B流片成功[zz]
那就是吧。2F 3GFlops,那 3B 8 核 128GFlops 估计不太现实
http://kd50.ustc.edu.cn/introduction.php
龙芯2F处理器技术参数
四发射超标量RISC结构,兼容MIPS III指令集,主频750 MHz,3 GFlops/s
h*******o
发帖数: 778
2
来自主题: Military2版 - 前一篇帖子小数点错了一位,汗
发热量和频率成平方关系? 线性关系吧...
其实单纯比较GFLOPS没什么意思,还是跑同样的benchmark的throughput, power,
energy才有意义..
y*d
发帖数: 2226
3
都是一年前的旧闻了
龙芯3C原来设想的还是很牛的:16核每核OOO 4发射2个256位FMA FPU, 300多GFlops,
28nm工艺。原计划今年内能流片,明年量产。比同期IBM,Oracle/Sun,Fujtsu的处理器都要快
(Intel 也许会通过MIC放个卫星)
但是据最近流传的消息,合作厂商出了重大问题(不是指台集电)
龙芯3C估计要严重delay了
m*********e
发帖数: 533
4
全球一盤棋:漫談2018年的中美博弈(下)
中國的半導體產業
中美貿易戰最引發人們的關注點是中興通訊的休克事件,所以半導體技術是一個重要話
題。
中國的半導體產業的確落後美國,但是沒有一般人想像的落後這麼多。美國對中興通訊
禁售高通的晶片和谷歌的安卓操作系統,中興立刻倒地宣布休克。這是非常戲劇性和吸
引眼球的事件,自然成為最佳話題和群體討論的焦點。吹捧美國的人立刻拿這個大作文
章,說什麼中國科技如何差勁、如何沒有根基、落後美國多少年...等。其實中興休
克倒地是事實,但是它再度爬起來並不難,因為中國的科技是有根基的。當中興爬起來
的時候,前景會更好。
首先,美國禁呔瑢е轮信d休克,是一個犯規的出擊,並不是美國有多厲害,用拳
擊的術語來說,這是一個“cheap low blow”。拳擊賽中,腰部以下是不能打的。所謂
"low blow"就是打肚子,在拳擊賽中是犯規的。“cheap low blow” 直接白話翻譯就
是「犯規的賤招」。
在WTO的組織架構下,產業鏈各有各的分工,上游產業的國家禁售產品給下游產業的國
家是不被允許的,是非常廉價和惡劣的傷害行為,表現的是愚蠢的衝動,並不能顯示... 阅读全帖
w***q
发帖数: 12
5
We are talking about Petaflops now. That's 1E6 GFlops. What age are you
living in?
D*****i
发帖数: 8922
6
来自主题: Stock版 - 移动CPU的战争
不管你怎么搞,给出GFLOPS/W指标就行。
a***e
发帖数: 27968
7
来自主题: Stock版 - 移动CPU的战争
ref?goog全换成SSD?
就目前看到的SSD,功耗不比HDD有优势,flash的写很耗电的
而且SSD容量太低,2T的硬盘,就算10Krpm多少瓦
你看看2TSSD阵列得多少瓦
就算能力不是光看GHZ的,还是把Gflops/W的数据或者MIPS/W
拿出来比较有说服力

,google前一阵子把硬盘都换成ssd了,结果光省下的电费都已经把升级的成本冲销了
。更何况现在ARM 的计算能力已经很高了,2Ghz 马上就要出了。
的算下来同等计算能力功耗还是比atom小。
f**********n
发帖数: 258
8
来自主题: Stock版 - xeon phi就是翔啊
xeon phi就是翔. Maybe good at GFLOPS per Watt.
A*******y
发帖数: 11148
9
来自主题: TVGame版 - ps3和pc的主要硬件对比
ps3的cpu规格如下
PowerPC-base Core @3.2GHz
1 VMX vector unit per core
512KB L2 cache
7 x SPE @3.2GHz
7 x 128b 128 SIMD GPRs
7 x 256KB SRAM for SPE
* 1 of 8 SPEs reserved for redundancy total floating point performance: 218
GFLOPS
8核每个3.2Gz实在是很牛,但实际工作起来应该有很大折扣,intel的Core2Ex 3.0g就
要卖到$1000,基本相当于两个ps3整鸡了。初步推测相当于intel的Duo E6850 3.0g。
显卡也是个关键指标,提供的资料我看不太懂,不过根据市场发售的时间,应该也就跟
GeForce 7xxx相当。
GPU RSX @ 550MHz
–1.8 TFLOPS floating point Performance
–Full HD (up to 1080p) x 2 channels
–Multi-way programmable pa
b***u
发帖数: 12010
10
来自主题: TVGame版 - 索轮王
不能不说从硬件上看x1真失败。GFLOP少这么多,还做的这么大。
h**********y
发帖数: 1293
11
和这些没关系。
我比的是raw gflops
w*********g
发帖数: 30882
12
【 以下文字转载自 Military 讨论区 】
发信人: wayofflying (小破熊), 信区: Military
标 题: 登月明显不符合人类科技进步规律
发信站: BBS 未名空间站 (Wed Dec 18 12:41:43 2013, 美东)
不明白为什么老将和轮子总是选择性忽视。
1946年2月4日,美国军方和政府部门的代表、著名的科学家一起挤在宾夕法尼亚大学的
一个房间里。当一位陆 军将军轻轻按下电钮后,占满整整三堵墙的机器立即亮了起来
,人们热烈鼓掌,高声欢呼:“ENIAC活了!”并且向总工 程师埃科特祝贺。“ENIAC
”就是世界上第一台电脑。
今天: 今天的电脑的计算能力跟当年对比,ENIAC: 300 FLOPS
Intel Core i7 980 XE : 107.6 GFLOPS
今天的计算机性能是当年的数亿倍。成本却只有当年的千百分之一。工业界制造个笔记
本电脑象喝口
水一样容易。
1969年夏天,国际互联网的雏形在美国出现,它由四个电脑网站组成,一个在加州大
学分校,另三个在内华... 阅读全帖
f**k
发帖数: 906
13
☆─────────────────────────────────────☆
thrivechen (得陇望蜀) 于 (Wed Sep 12 21:53:46 2007) 提到:
由于学习的需要,老板给我弄了一个HPC Cluster的帐号。Cluster远在德国的Erlangen
。那边给我们提供的数据是有200个节点,每个节点有4个Processor,由此可见其不是
泛泛之辈了。
下午,老板让我去修一门HPC的课程,是CS的一个大牛开的。大牛来自印度,不过现在
领导着几个大型实验室和其他学校的一个DOE的大项目。
他告诉我已经过了注册期,没法注册了。但是我可以sitting in。由于课已经上了2个
星期了,所以他专门把前2个星期的内容给我简要讲了下,并且把作业给了我一份。
作业是调查HPC最新500强。 下面我列一些数据吧:
第一名:大名顶顶的“蓝色基因” BlueGene. 它有65536个dual-processor的节点----
总共有131072个processor,峰值是367000 GFlops。
来自大名鼎鼎的IBM,2005年,由三大
J*******3
发帖数: 1651
14
A single Cell processor can reach double precision 100 GFLOPs.
330 Godsons only do just 1000GFLOPS job. it is not jok, isn't it?
IBM's new planned supercomputer, IBM Roadrunner, will be a hybrid of General
Purpose CISC as well as Cell processors. It is reported that this
combination will produce the first computer to run at petaflop speeds. It
will use an updated version of the Cell processor, manufactured using 65 nm
technology and enhanced SPUs that can handle double precision calculations
in
l**n
发帖数: 7272
15
好像GFLOPS 数偏低。没法在2048x1536的分辨率下干太多事儿。
不过这是去年的产品了。当时Tegra2的GPU就让人大跌眼镜。NVDA如果不提高Tegra系列
的GPU,Tegra怎么有竞争力。
R********n
发帖数: 3601
16
【 以下文字转载自 HUST 讨论区 】
发信人: thrivechen (得陇望蜀), 信区: HUST
标 题: 中国在干嘛?睡大觉?
发信站: BBS 未名空间站 (Wed Sep 12 21:53:46 2007)
由于学习的需要,老板给我弄了一个HPC Cluster的帐号。Cluster远在德国的Erlangen
。那边给我们提供的数据是有200个节点,每个节点有4个Processor,由此可见其不是
泛泛之辈了。
下午,老板让我去修一门HPC的课程,是CS的一个大牛开的。大牛来自印度,不过现在
领导着几个大型实验室和其他学校的一个DOE的大项目。
他告诉我已经过了注册期,没法注册了。但是我可以sitting in。由于课已经上了2个
星期了,所以他专门把前2个星期的内容给我简要讲了下,并且把作业给了我一份。
作业是调查HPC最新500强。 下面我列一些数据吧:
第一名:大名顶顶的“蓝色基因” BlueGene. 它有65536个dual-processor的节点----
总共有131072个processor,峰值是367000 GFlops。
来自大
l***q
发帖数: 208
17
来自主题: CS版 - CPU double precision
有没有理论的公式计算CPU的double precision计算能力能达到多少GFLOPS,以E8500为
f********t
发帖数: 260
18
自从上次阿法狗战胜李世石之后,本人其实并不是很抱太大的期望能看到柯洁能够获胜
,但是用电子电竞的观点来说,就是输也要打出自己的风采,第一局人机大战柯洁虽然
失败了,但是输的不多,多方评价中柯洁的棋艺水平还是挺高的,这局比赛中一直步步
紧逼AlphaGo,坚持最后时刻才打出GG。
试问谁的游戏生涯没被电脑虐过?不过和阿法狗的情况不同,以往电脑PK人类大多数时
候电脑都有作弊帮助,毕竟你的普通的单机游戏PC性能有限,那么问题来了:一只阿法
狗等于多少台PC主机呢?
根据目前的一些资料说,阿法狗存在多个版本,去年和李世石对战的版本采用了是分布
式计算版本,意思就是由多个计算机群组成的,据说最少用到了1202个CPU和176个GPU
(显卡),外加100+左右的计算加速卡等等。。
最常见的就是I7的CPU搭配GTX1060的配置。普通版本的I7为四核八线程处理器,如果简
单按照核心数换算的话,一台低配版的阿法狗大概等于300~500台左右的PC主机。
单纯计算核心数显然有点简单粗暴了,对于计算机能力,业界普遍用“浮点性能”的指
标说法,16年战胜李世石的阿法狗在新闻中强调,其计算能力是IBM当... 阅读全帖
x****g
发帖数: 109
19
是啊,很难说把所有现有的程序,用一种系统的方法把计算都移植到这上面,
只能根据具体的应用,把程序改成能够在这上面运行的。一旦改成了,能快很多,号称
可以干到100 GFLOPS
C********n
发帖数: 6682
20
现在top500排名第一的 DOE server 是1105000 GFLOPS
但是用了13万个 Power cpu
平均每个CPU才 10Gflops不到
l***h
发帖数: 392
21
来自主题: Hardware版 - 为什么大家这么黑NV呢?
想想支持C/C++,以后也能支持Fortran,单双精度,带L1,L2,ECC的GPU 是多么强
大。
比如现在最快的cluster也才几P,一个Telsa就差不多1TGFLOPS。
intel最快的cpu也才几个G,还超贵。买一个16核的box,都得7k左右,还不是共享所有
内存。
parallel起来也才几个GFLOPS。对computing来说带L1,L2,单双精度,编程友好得
massive
cores GPU绝对是个milestone。以后就该叫General process unit了。NV把宝都压在
HPC上,贡献还是很大,intel太黑了。估计如果这一代的产品在HPC上挣了钱,下一
代NV就要退出Game market了。
至于对游戏得影响,我不是很了解,但结构变了,对现在结构得游戏能有多大提高很难
说,但以后得游戏如果相应得改变方式,会不会有很大提高呢。当然可能ATI得以后就
真得是Game process unit了。
u**d
发帖数: 211
22
来自主题: Hardware版 - 为什么大家这么黑NV呢?
gpu 作为通用性的平台,有很大的局限性
比如 cuda 里对于 thread 的概念
cuda 里的 thread 严格来说并不是像 cpu 一样一个独立的运算单位
它的 scheduling 是基于 warp 为单位的 (1 warp = 32 threads)
32 threads 必须执行相同的 instruction,彼此之间不能 concurrency,否则就是死锁
基本上,通用型的 concurrency 很难实现,而多数 application 偏偏用的很多
总的来说,gpu 所谓的 gflops,都是在平台上做了牺牲才换来的
(限制同步,并行效率当然高啦)
这些对于图形计算来说是合理的(比如像素之间很少需要同步)
但是对于其他的应用,能不能比 cpu 快还很难说呢
而且 gpu 和内存(进而磁盘)之间的带宽也是瓶颈
如果需要大规模的数据访问,还是很慢,又限制其应用范围。
要说 hpc,这个东西算算微分方程还行。一般应用实在不容易
根本还是并行算法不容易设计。很多即使写出来,同步太多,还是达不到效果。
一个简单的例子,写个并行排序的算法到不大困难,
可是要是并行最大流-
s****c
发帖数: 11300
23
来自主题: Hardware版 - 为什么大家这么黑NV呢?
这个最大的问题在于软件方面的匮乏
你说的那个早就有名字了 叫做GPGPU
这个的问题就是理论峰值计算能力和实际能得到的相差太远 更不要说适用的范围也有
限了
至于支持C的效率如何 这个还要进一步实验验证 而且就算在游戏的物理特效上来看 如
果不用nv自家的physicX 只有几个GFlops的cpu甚至比显卡的效果还好
nv的问题跟当初3dfx很像,由于市场面比较窄很想开拓一片独占市场 结果往往不难么
动人
这次新的gpu核心太大 功耗太大 性能并不达到很多人的预期 已经可以说是接近失败的
一款产品了
q********g
发帖数: 10694
24
来自主题: Hardware版 - Tesla C2050 还是3个GTX 480?
有点私活儿,有人赞助,要上GPU了。考虑了很久,到底上Tesla呢还是3个GTX480呢。
目前个人想到的后者的好处是,后者以后处理二手容易。欢迎给点意见。
Form Factor 9.75" PCIe x16 form factor
# of Tesla GPUs 1
# of CUDA Core 448
Frequency of CUDA Cores 1.15 GHz
Double Precision floating point performance (peak) 515 Gflops
Single Precision floating point performance (peak) 1.03 Tflops
Total Dedicated Memory*
Tesla C2050 3GB GDDR5
Tesla C2070 6GB GDDR5
Memory Speed 1.5 GHz
Memory Interface 384-bit
Memory Bandwidth 144 GB/sec
Power Consumption 247W TDP
System Interface
l***h
发帖数: 392
25
我买了一个,觉得还不错,GFLOPs 有 580,dp 也有差不多100。win 评分7.6。
当然温度比较高,平常大概50左右,全跑大概80-90。
不过这个价格其实一般般。我上次在newegg买的275,
还送了一个tv tuner,所以估计马上就会掉到270左右的。
还有看评价,好像EVGA还是那个牌子的有一款的散热不是很好。你可以查一查。

shipping
and
G*****7
发帖数: 1759
26
看具体做什么了。
大规模gradient descent优化比如训练neural nets,或者前后有依赖性的计算,拼主
频;
大规模least square, linear systems,拼gflops,也就是主频+并行核+新版sse;
生物的基因分析、数据库密集应用,就要看io了。
l******n
发帖数: 1683
27
来自主题: Hardware版 - 屌丝的近期比较失败的PC升级
不是一个东东呀, 虽然有点关联. 正好手上有个二代的i3-2120, 浮点峰值是: 3.3 x 8
x 2 = 52.8Gflops, 实际结果贴一部分吧. 对应的i7 920浮点峰值只不过: 2.6 x 4 x
4=41.6Glops而已.
Size LDA Align. Time(s) GFlops Residual Residual(norm) Check
1000 1000 4 0.049 13.6485 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.033 20.0284 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.034 19.7985 1.029343e-12 3.510325e-02 pass
1000 1000 4 0.033 20.2894 1.029343e-12 3.510325e-02 pass
2000 ... 阅读全帖
S******n
发帖数: 5022
28
来自主题: Hardware版 - R9-290X终于放出来了
AMD的专业卡要雄起了。。。
AMD:"Our software is so poor that we have to pry hardware for you to buy
our cards."
R9 290X (Hawaii) currently has three-quarters of their units FP64 disabled.
AMD终于知道游戏卡就是游戏卡,专业卡就是专业卡。新Fire Pro真是有令人恐怖的双
精度浮点能力啊。估计Fire Pro 的双精度浮点在 2.5 Tflops. (R9 290X 700 Gflops
的doublefloat已经已经不算弱了,不过跟上一代的7970比起来好像还是弱一点。)
S******n
发帖数: 5022
29
来自主题: Hardware版 - R9-290X终于放出来了
AMD的专业卡要雄起了。。。
AMD:"Our software is so poor that we have to pry hardware for you to buy
our cards."
R9 290X (Hawaii) currently has three-quarters of their units FP64 disabled.
AMD终于知道游戏卡就是游戏卡,专业卡就是专业卡。新Fire Pro真是有令人恐怖的双
精度浮点能力啊。估计Fire Pro 的双精度浮点在 2.5 Tflops. (R9 290X 700 Gflops
的doublefloat已经已经不算弱了,不过跟上一代的7970比起来好像还是弱一点。)
z******i
发帖数: 1292
30
来自主题: Hardware版 - 求个建议装机计算用
其实AMD显卡的双精度更好,问题在于功耗不好,散热不好,所以集群时很少采用AMD的
卡。(集群计算的卡一般都是不带风扇靠散热片散热的。靠大空调。)
跟AMD R9 290X对应的专业显卡,单精度 5.6 Tflops,双精度2.8 Tflops, 价格$4000
以上吧。(290X自己是单精度5.6 Tflops,双精度700 Gflops。)
跟AMD Radeon™ HD 7970对应的专业显卡是AMD FirePro™ W9000。 (两者
性能都是单精度 4.0 Tflops,双精度1.0 Tflops)前者价格300美元,后者价格3500美
元。差别主要是ECC校验和驱动程序。
http://www.amd.com/US/PRODUCTS/WORKSTATION/GRAPHICS/ATI-FIREPRO
GTX Titan跟Tesla K20X的关系也是这样的,GTX Titan卖$999,Tesla K20X卖$3499。
E***e
发帖数: 3430
31
感觉玩双精度还是早晚的事,冥思苦想还是想投入一个双精说得过去的计算卡。
听大大们说GTX 580是民用下面titan之后最强的
看amazon上才200多,想买一块回来 prototyping 用
可是不知道这卡双精度上到底有多少性能
搜了半天不知道该信谁的
E***e
发帖数: 3430
E***e
发帖数: 3430
33
这么看580双精度也就那么回事啊?
S******n
发帖数: 5022
34
580上面还有590呢。。。这些卡现在还买得到么?
S******n
发帖数: 5022
35
因为580的CUDA数量太少。。。只有512 CUDAs
话说费米的架构还是相当不错的,要是达到2880个CUDAs,绝对比titan强得多。
E***e
发帖数: 3430
36
可是590双精度如何?
S******n
发帖数: 5022
37
也就是580双卡而已。
买580不如买780,双精度差不多,差别不到10%。
双精度强的民用卡,也就 AMD 7950 7970 7990 以及 NV titan而已。
c*****e
发帖数: 3226
38
double 是什么意思?插2块卡? 费老电了,我的现在就是一块580
E***e
发帖数: 3430
39
580/780这样的DP能力貌似差点劲
还是咬咬牙考虑titan吧。。。
S******n
发帖数: 5022
40
2014年台积电都没有安排AMD 、NV 20nm工艺的显卡流片,看来20nm显卡至少要等到
2015年才能面世。
28nm -> 20nm, 同等面积晶体管数量可以翻倍吧。估计到时显卡就超过6000 cuda了。
l*****o
发帖数: 9235
41
你还是买泰坦吧,除了没有ECC矫正,偶尔会出不可重复的错误以外,应该够了。
E***e
发帖数: 3430
42
双精度浮点数计算
i******t
发帖数: 22541
43
上 760 吧! 价钱还便宜
E***e
发帖数: 3430
44
双精度计算太差
i******t
发帖数: 22541
45
多大差别
举个例子
t*********n
发帖数: 378
46
Link?还是内幕消息?
t*****z
发帖数: 1598
47
来自主题: Hardware版 - 用于科学计算的单机该怎么配
谢谢指点!GTX650这样的入门N卡的双精度gflops跟A家的几款挖矿神卡比可以说是忽略
不计吧。即使是这样的低端卡,我插上去后计算时间也有显著缩短(我的计算的确是用双
精度的)。我想买块好点的卡恐怕就可以缩短一个数量级了吧。
t*****z
发帖数: 1598
48
来自主题: Hardware版 - 求推荐双cpu的工作站
我忽然觉得771平台也有可取之处。771平台上最强的Xeon X5492,买一对还不到两百块
,passmark评分直逼主流i7 。771的主板也是便宜得很。最大的好处是内存便宜。楼主
不是要大内存嘛?看这个deal你一定会激动:
http://www.ebay.com/itm/DELL-R905-128GB-UPGRADE-KIT-32x-4GB-PC2
有条件再配两块GTX 295,加起来不到四百块,Gflops可战Tesla K20。装完机器发个帖
到百度图拉丁吧,一准能被强势围观。
E***e
发帖数: 3430
49
借了一个7970跑array fire
根本没有那么神
如果N卡配CUDA,A卡配OpenCL的话
两个的表现基本就和double gflops成正比
网上那些吹的神乎其神的什么A卡表现好
都是N卡配OpenCL去拼A卡配OpenCL做的测试
那自然拼不过
对A卡失去兴趣了,以后老老实实混CUDA了
t*****z
发帖数: 1598
50
你的代码写得真不错,完全把性能发挥出来了,达到了这些设备的理论GFlops数值。
首页 上页 1 2 (共2页)