h*******x 发帖数: 12808 | 1 龙芯那个基本上是自己设计的,除了指令集。没办法,你自己搞一套指令集,接下来就
要自己搞一套os,然后编译器,上层软件,整个一个产业链,做不到。就是最开始吹牛
完全自主知识产权,吹的有点大了。
中国真正完全自主知识产权的cpu也有,北大众志,从指令集到设计,完全自己搞的,
改写了编译器,重新编译了linux,搞了一套系统,主要就是Net PC,做个终端机用。
在一些医院,图书馆也在用了。只是北大那个比较低调,不像中科院吹的那么火。
不过现在跟amd合作了,可能会搞x86的东西。
人的
性?
也弱 |
|
N****w 发帖数: 21578 | 2 指令集根本不是问题
垃圾 x86 指令集不也是称霸全球
关键是设计上能不能提高性能/功耗比
ARM 那也不是靠指令集多少优势,主要是设计 |
|
t*****z 发帖数: 1598 | 3 跑个分看看。12核果然不是盖的,wPrime 32M成绩3.994秒(越低越好)。
这是什么概念呢?现在流行的那些U,i5-4670K大约10秒,i7-4770K大约7秒,桌面王者
i7-4960X大约5秒,顶级服务器2xE5-2697v2(24核3.5GHz!)接近3秒。
世界纪录是1.547秒,是把双路Xeon X5680超频到5.65GHz实现的。世界纪录排名靠前的
几乎全是Xeon 5600系列,在那之后的Xeon因为难以超频,跟排行无缘。i7-4770K的世
界纪录是3.421秒(超频到6.47GHz)。
这再次说明今年CPU技术发展缓慢,就算是E5v2,比X5650的先进之处无非是几条新指令
集。我亲测过,新的AVX指令集对旧的SSE指令集的提高果然明显,但是我的领域内很少
有软件支持AVX的。 |
|
d***a 发帖数: 13752 | 4 单从技术上说,arm没有什么不能取代x86的理由。x86指令集架构,最开始是为低端嵌
入式系统设计的,和后来arm的定位类似。可以这样说,当年x86在CISC类处理器中的位
置,相当于90年代arm在RISC类处理器中的位置,都是低端处理器,强调低成本低功耗。
现在呢,指令集架构的重要性已经比较低了,性能主要是由微架构和制程来决定。如果
Intel想做arm指令集的高性能处理器,很快就能做出来。 |
|
t*******y 发帖数: 57 | 5 hehe,性能啥是不错,偶不满的地方是自己用自己一套指令集.
不然我只需要记住一套指令集,就能用在多种unix上面,为solaris多记一套指令集很不爽:(
当然如果你只搞solaris当然没有这个缺陷了.呵呵
BTW,其他这些Unix和Solaris比起来没有啥和SystemV差的远不远的说法 |
|
h*********n 发帖数: 11319 | 6 我不是做这一行的,所以我只能简略的解释给你听
我不知道ARM架构是什么意思,我只知道有ARM的指令集,其中又分成不同的v5, v7等等
,新版本总会增加些向量化的多媒体和内存指令。要实现/支持这些指令,有两个办法
,要么用“ip core”,要么自己设计arm兼容的CPU。这里的设计,不是说像前面某id
想象的那样,from scratch.没有哪个公司有钱和时间做这种蠢事。而是在已有的设计
上,fine tuning,有的放矢的做些优化。
ARM提供的恰恰就是类似于“公版”的IP core,之所以说类似,是因为这一个core 并
不是完全不可更改,运算器的数量,cache的大小都可以customize。但是更细节的
design,流水线长度,bypass的通路,顺序/乱序执行的通路,多核cache的一致性协议
,这些都是不可能更改的。这些都是牵一发而动全身的技术细节,ARM公司不可能投入
人力物力帮助每个ip core licencee把关。
architecture license说的是什么?就是给你更改甚至重新设计这些技术细节的机会。
要这么玩,需要大量的熟悉micro arch... 阅读全帖 |
|
c****p 发帖数: 6474 | 7 ARMv7到ARMv8指令集变化算不上巨大。。
删掉一些v7指令,加了一些v8指令(其中还有一部分是把v7指令改了个名字,比如LDRD
->LDP,实际执行指令的data path变化不大)。
指令译码肯定要变(主要也是针对有变动的指令进行微调),32b->64b相关的数据通路
肯定也得变。
但是架构和微架构不一定要变(而且还要考虑向下兼容问题)
苹果在这点上很厉害,一帮厂商吵吵着要出64位核,结果苹果不声不响地都把64位核量
产了;
也许苹果加进去了新的feature(更激进的指令调度、多线程支持等等),但是出于保
密人家没说,
但是不管咋说,仅仅32->64是不可能带来性能翻倍的结果的。 |
|
m***a 发帖数: 13878 | 8 谈到“中国芯”,很多人第一个反应就会是龙芯。
自2000年开始研发到现在,龙芯已经有十五年的历史。虽然媒体不时会报道一些关于龙
芯的消息,但由于市面上难以见到实物,外界对它的了解实在少得可怜。从立项开始,
龙芯的研发单位中科院计算所就立志要做到世界一流水平的CPU;那么在2015年的今天
,他们的产品究竟达到了什么水平呢?
我们先了解一些背景知识:龙芯是中科院计算所龙芯项目组研发,兼容MIPS指令集,具
备完全自主知识产权的CPU系列。龙芯分1号、2号、3号三大产品线,分别对应超低功耗
嵌入式芯片、低功耗SoC与主流PC、服务器CPU几大目标市场。目前代表龙芯最强水平的
型号是龙芯3B-1500 CPU,有8个核心,32nm制造工艺,主频1.2GHZ;其次是四核心的龙
芯3A 1.2GHZ。
因为使用的MIPS指令集与主流的x86、ARM不同,龙芯平台无法直接运行大多数常见的性
能测试集;加上产品没有大量上市、用户稀少等原因,媒体、评测机构不太容易了解它
的实际性能表现。所幸计算所公开了一些内部性能测试数据,我们得以从中分析龙芯的
实力。
计算所使用的测试软件是专业领域常用的跨平台测试... 阅读全帖 |
|
F******k 发帖数: 7375 | 9 谈到“中国芯”,很多人第一个反应就会是龙芯。
自2000年开始研发到现在,龙芯已经有十五年的历史。虽然媒体不时会报道一些关于龙
芯的消息,但由于市面上难以见到实物,外界对它的了解实在少得可怜。从立项开始,
龙芯的研发单位中科院计算所就立志要做到世界一流水平的CPU;那么在2015年的今天
,他们的产品究竟达到了什么水平呢?
我们先了解一些背景知识:龙芯是中科院计算所龙芯项目组研发,兼容MIPS指令集,具
备完全自主知识产权的CPU系列。龙芯分1号、2号、3号三大产品线,分别对应超低功耗
嵌入式芯片、低功耗SoC与主流PC、服务器CPU几大目标市场。目前代表龙芯最强水平的
型号是龙芯3B-1500 CPU,有8个核心,32nm制造工艺,主频1.2GHZ;其次是四核心的龙
芯3A 1.2GHZ。
因为使用的MIPS指令集与主流的x86、ARM不同,龙芯平台无法直接运行大多数常见的性
能测试集;加上产品没有大量上市、用户稀少等原因,媒体、评测机构不太容易了解它
的实际性能表现。所幸计算所公开了一些内部性能测试数据,我们得以从中分析龙芯的
实力。
计算所使用的测试软件是专业领域常用的跨平台测试... 阅读全帖 |
|
a*****y 发帖数: 33185 | 10 由多方面神学家和哲学家口述,经尊敬的麦尔赛纳神父搜集的①
先生:
本世纪的一些新的巨人们竟敢向一切事物的造物主进行攻击,为了使他们感到狼狈
起见,你从事了用证明造物主的存在而巩固了他的宝座,而且你的计划似乎执行得非常
完善,好心的人们都希望从今以后不再有人在仔细读过你的《沉思集》以后不承认有一
个为一切事物所依存的永恒的上帝,因此我们认为告诉你同时也请求你在我们将在下面
向你指出某些地方上再传播这样一种光明,使得在你的著作中如果可能的话不存留任何
不是经过非常清楚、非常分明地证明了的东西,这是很得当的。因为由于不断的沉思,
多年以来你已经锻炼了你的精神到如此地步以致在别人认为模糊的、靠不住的那些东西
上,对你来说可以是比较清楚的,你可以用一种单纯精神的灵感来领会它们,看不出别
人认为模糊不清地方,那么,最好是把那些需要更清楚地、更大量地加以解释和证①法
文第二版下面还有“反驳第二、第三和第五个沉思”。
明的东西告诉你;而且,当你将在这一点上满足我们之后,我们就不认为还有什么
人能够否认你为了上帝的光荣和公众的利益而已经开始推论的那些理由应该被采取作为
证明了。
... 阅读全帖 |
|
g******z 发帖数: 5809 | 11 Nehalem在高速缓存层次进行了重大的改变,而在其他方面的改进也不少。
Nehalem的TLB规格
首先是在TLB方面的改进。一方面当前的应用程序正在变得越来越庞大,而另一方
面处理器的核心越来越多、又加入了SMT技术,这两方面都使得同时处理的应用程序需
要更多的内存空间去执行。这就使得TLB的设计改进成为必然。对于之前的Core2微结构
的处理器而言,只具有一级TLB。Core2处理器的一级指令TLB具有128 个表项,而一级
数据TLB为256个表项。而在Nehalem中,一级指令TLB仍然为128个表项,但是一级数据
TLB削减到了64个表项。 Nehalem加入了统一的512表项二级TLB,二级TLB被一级指令和
数据TLB所共享。从目前而言,Nehalem的这个改动可能对性能的提升作用并不明显。但
是二级TLB相对比较容易扩充,后续设计中有可能通过进一步扩充二级TLB的容量以提升
存储映射的性能。
其次是在非对齐高速缓存访问方面的改进。Intel的指令集支持两种16字节的SSE存
储访问指令:对齐访问与非对齐访问指令。对齐访问指令只能执行对齐访问,所访问的
数 |
|
w****2 发帖数: 12072 | 12 你要知道cpu(central processing unit)是微机出来之后(78年)才有的,以前的计
算机没有这个东西,而是很多器件组成的,所以叫cpc(central processing complex)
。中国核控制的计算机就是这种complex。我刚上大学第一门专业课<计算引论>就讲
过这个cpc。杨夫清就搞过这个的。当时控制核武器的计算机是不需要电风扇猛吹风的,
这个已经解密了,前不久电视播了。
龙芯是故意要license的,以便商用化,因为要别人的软件可以在上面跑(最近正在搞
x86指令的虚拟执行,成功的话就可以跑windows,现在只能跑linux)。其实以前也搞
过自己的cpu的指令集,就因为不通用,所以不能推广。所以龙芯这一次李国杰故意搞
一个比较通用的指令集, 故意要license。跟你这个计算机盲没法说。
青霉素还真栽不到日本或共产党上. 中国1944年试制出盘尼西林. 那批科学家真去找过
宋子文,宋真那么回答的。再看新中国:
"内战结束后,陈毅入主上海。...在话剧《陈毅市长》中,陈毅找到了著名化学家齐仰
之,请其出山,主持青霉素的生产工作。这个齐仰之的剧本 |
|
S******8 发帖数: 24594 | 13 龙芯3B 8核处理器静悄悄地出笼
据龙芯提供的资料显示。龙芯3号是面向高吞吐率计算和高性能计算,降低成本和功耗
的需要而设计的多核芯片。龙芯3A4核处理器是功耗最低的多核服务器芯片。与intel芯
片的高性能相比,龙芯3号更重视性能功耗比这个指标的先进性。而能够充分体现出这
个特色的是最新的龙芯3 B芯片。在其提供的性能对比表里。龙芯3B的双精度峰值达到
128GFLOPS为龙芯3A计算能力的8倍,超过了Intel Core i7 980 XE。尽管还落后AMD
Opteron X12但是龙3B的功耗只有40瓦。
主频 1GHz
微体系结构 集成8个64位超标量处理器核,每个处理器核具有如下特点:
支持MIPS64指令集及龙芯扩展指令集;
9级超流水线结构;
四发射乱序执行结构;
2个定点单元、2个浮点单元和1个访存单元;
每个浮点单元支持256位向量运算;
采用交叉开关进行核间互连;
通过HT接口进行片间可伸缩互连
高速缓存 每个处理器核的一级指令cache和数据cache各64KB
八个处理器核通过交叉开关共享4MB的二级cache
内... 阅读全帖 |
|
x****o 发帖数: 21566 | 14 俄罗斯公司MCST发布了性能非常强劲的四核CPU Elbrus-4C,这是俄罗斯摆脱受制美国
芯片制造巨头Intel和AMD走出的一大步。
Elbrus-4C使用的是Elbrus ISA指令集架构,而不是SPARC指令集架构。Elbrus属于封闭
专有架构,很难搞到关于这套架构的具体信息,但是我们知道的是这个架构能够模拟
X86指令。如果你还记得全美达的Crusoe,那么Elbrus架构应该也是采用类似的原理:
在程序运行时刻,x86的程序代码可以通过虚拟机进行转换并执行。虽然不如在硬件中
提供X86支持运行速度快,但不失为一种解决办法。
以俄罗斯自主研发来看,该CPU非常先进,但绝不是非常先进的芯片。Elbrus-4C四核
CPU采用的是TSMC的上上代65纳米制程。可以在800Mhz的时钟频率下运行,等同于64-
bit双精度25 gigaflops(一个gigaFLOPS等于每秒109次浮点运算)。技术规格中说
Elbrus-4C有9.86亿个晶体管,考虑到CPU没有整合GPU,这个数量还是非常可观的。
Elbrus-4C和目前西方芯片相比,很可能只落后几年,然而很难进行直观对比... 阅读全帖 |
|
f***y 发帖数: 4447 | 15 科技日报讯(记者申明)“兆芯处理器的整体性能已经能够对标国际主流标准,以ZX-C
系列CPU及KX-5000为例,已经可以对标Intel第六代i3处理器,主机频率可以达到2GHz
,对于日常办公应用、4K解码,甚至运行使命召唤、古墓丽影等主流3D游戏已经毫无压
力。”近日,上海兆芯集成电路有限公司副总经理罗勇博士在接受记者采访时表示。
高端通用CPU是计算机、服务器的核心,同时也是集成电路行业最富有技术含量的产品
之一,更与网络信息安全密切相关。
罗勇表示,兆芯在发展国产x86解决方案的道路上,始终秉持着“自主可控、兼容主流
和产业完备”的发展目标。兆芯是目前国内唯一同时掌握中央处理器、图形处理器和芯
片组三大核心技术的公司,在自主可控方面,兆芯拥有一支由大陆本土人才构成的完整
的研发团队,全面掌握着x86解决方案全平台实现技术,并且自主构建了全流程设计规
范、设计标准,以及处理器芯片实现的全部环境。研发团队不仅掌握了x86处理器开发
的完整代码,更具备完全自主的IP开发能力。
此外,兆芯国产自主可控通用处理器全面兼容x86指令,并支持CPU虚拟化技术,能稳定
、流畅运行全系列Wind... 阅读全帖 |
|
发帖数: 1 | 16 美国海军早没有什么“军用芯片宙斯盾”和“军用芯片声呐”了。
90年代的宙斯盾基线6.1是最早使用部分商用系统集成的宙斯盾体系,而在2002财年的
基线7.1是第一种全COTS商用处理器的宙斯盾。基线7.1C是第一种开放架构的宙斯盾。
海军的宙斯盾,主系统最早使用AN/UYK-7 32位计算机系统,使用UNIVAC 1108架构。80
年代给AN/SPY-1B开发的AN/UYK-43 32位机使用同样指令集,运算速度提升3倍以上,并
且使用主动冗余技术,大大降低了系统故障的概率。
MK99火控分系统负责引导SPG-62照射雷达,由AN/UYK-20 16位计算机进行引导;80年代
后期更换16位的升级版本AN/UYK-44,运算速度提升4-6倍,该计算机的处理速度是90万
指令/秒,内存2MB。
90年代升级版本的AN/UYK-43引入开放商用处理单元模块,可以最多增加6块VMEbus集成
板。
90年代AN/UYK-43基本已经由AN/UYQ-70计算机更换,该系统的运算速度是AN/UYK-43的
960倍,商规改进型AN/UYK-43的155倍。该计算机对于COTS货架商用芯片的集成... 阅读全帖 |
|
m******8 发帖数: 2153 | 17 计算机科学之父诞辰100周年:身为同性恋遭受不公正待遇,阿兰图灵英年早逝
爱白网 老虎
2012-01-01
2012年是“人工智能之父”图灵诞辰100周年。图灵奠定了现代计算机科学和人工智能
的基础,同时在数学、逻辑学、密码分析学、哲学领域均有相当高的成就。远离战火、
享受和平的人们,每个在日常生活中使用计算机的人,每个受益于现代计算机科学的人
,都应该对图灵心存感谢。
2012年将是爱白图灵主题年,我们将在这一年里陆续发布相关文章和组织纪念活动。
刚刚推出的iPhone4S中的语音助手Siri,引起了很多人的注意。很多人觉得,机器
能够理解人类提出的问题,还能做出回答,是十分有趣的事情。马上有人用各种BT问题
“拷问”Siri,看它如何回答,也得到了各种各样欢的欢乐结果。但最为Siri的成功而
感到欢欣鼓舞的,应该是计算机科学家们。因为61年前(1950年),“人工智能之父”
图灵提出了人工智能领域著名的“图灵试验”,用于判定一台机器是否具有智能,这
个试验简单说就是,看一台机器能否顺畅地与人聊天,而不被对方发现是机器。Siri还
不完美,但应该说,它的出现和商业化,标志着人类在人... 阅读全帖 |
|
s********r 发帖数: 403 | 18 电面之前我已经知道 hiring freeze 了。不过大些的公司都这样,即使 freeze,有时
招聘机制也会照常运转。电面没准备,不过2周后收到一个 onsite request。
地点 Boulder, Colorado
问的都是极其基本的问题,翻转 linklist, 判断有没有 loop,string 等等。
不过有一个例外,面 director 的时候,出现了些从没见过的问题。
汇编实现 abs(x-y),但是指令集有限制,没有减法指令。
实时系统 hardware software co-design, Timer,等等。
他说用linklist support 多个timer 。我有些不同意,O(N) 的数据结构不适合real-
time system, 不过没讲,反正他是 director,他说linklist 就 linklist,可能有
些 case 是可以使用的。
还顺便探讨了一下未来的正处于开发阶段用于支持 concurrency 的指令集。
和 director 是比较有意思的一轮。
碰到个 Georgia Tech 毕业的印度人,中午一起吃饭,人还不错。
... 阅读全帖 |
|
a********m 发帖数: 15480 | 19 指令集优化和架构优化不一样。架构优化区别现在依然有。主机架构不需要考虑通用计
算,和pc区别很大。指令集优化你觉得现在一样了,俺说不好。为主机加特殊指令每次
都发生,当然这次为了降低成本不一定干了。
PC |
|
r**l 发帖数: 72 | 20 性能还没有作上去
,关键技术是binary translation
又叫software dynamic translation
你可以把它看作是编译之下,microarch之上的一种技术,
可以节省功耗,优化性能,兼容不同的指令集
但是现在做的不是很成熟,尤其是性能这一块没有作上去;
以至于很多人误解为这仅仅是一种有利于指令集兼容的技术和一种
有利于低功耗的技术,
实际上这种技术对于性能提高也有很大的潜力可挖,
尤其是大结构的super scalar指令调度部件在小尺度下
越来越走向尽头;
这种把调度移到binary traslation层的方法会很有前途。
可怜的是transmeta公司费尽心机,最后可能还是给intel做了夹衣。
intel已经全面掌握新一代vliw的技术,以后采用binary translation不过就是加
一个固件层,
请而一举
赫赫 |
|
p****t 发帖数: 11416 | 21 【 以下文字转载自 Hardware 讨论区 】
【 原文由 piglet 所发表 】
Mac的非开放型设计,有致命的缺点但是也是有好处的,就是可以精雕细作
设计得最合理。要说现在地Mac也不见得就比PC慢多少,至少从CPU上看,
我估计733MHz(好像现在最高是这个Freq.)的PowerPC可以抵得上1GHz的
PIII——因为首先Mac不用考虑向下兼容问题,所以其指令集可以加以优化,
而且好像是纯RISC的处理器(不过似乎指令数比x86指令集还多),加上
1MB的L2 Cache9不过是半速运行)还是很不错的说。Mac的图形子系统现在
倒真的是落后于PC了,这恐怕也是同PC GAME的大发展有关。
另外,Mac没有PC那么多的软硬件兼容性问题(当然就那么几样东西,想不
兼容也难呀!)而且有一些相当优秀的软件。当然,现在有说法,如果M$
不开发Office for Mac,那么立马就能让Mac下课(这也是Jobs天天嘲笑
WinXP只有一个“P”是自己的,其它都是抄袭Mac OS却也不敢真得罪M$的
原因吧)。数年前如果你是做专业图形设计,那么就非Mac不可,当然现在
不是这样了 |
|
G****a 发帖数: 10208 | 22 ===============第一章 版面符号===============
┌─┬──────────────────────────────────┐
│m │被版主标记m的文章 │
│g │被版主标记g的文章 │
│b │被版主标记m+g的文章 │
│U │被版主标记m,并设置为不可回复的文章 │
│O │被版主标记g,并设置为不可回复的文章 │
│8 │被版主标记m+g,并设置为不可回复的文章 │
│* │未读文章 ... 阅读全帖 |
|
f***y 发帖数: 4447 | 23 除了AMD授权的海光集团在开发X86处理器之外,国内还有另一个阵营开发X86处理器,
那就是上海兆芯,他们是跟VIA威盛合作的。
日前上海兆芯副总经理在采访中表示兆芯处理器的整体性能已经能够对标国际主流
标准,最新处理器已经可以对标英特尔的第六代Corei3处理器,运行主流游戏无压力,
而下一代兆芯X86处理器性能看齐英特尔Corei5处理器。
科技日报报道称,上海兆芯集成电路有限公司副总经理罗勇博士在接受记者采访时
表示"兆芯处理器的整体性能已经能够对标国际主流标准,以ZX-C系列CPU及KX-5000为
例,已经可以对标Intel第六代i3处理器,主机频率可以达到2GHz,对于日常办公应用
、4K解码,甚至运行使命召唤、古墓丽影等主流3D游戏已经毫无压力。"
国产处理器对标英特尔Corei3处理器的说法不是第一次出现,2017年同样是科技日
报报道了国内核高基项目十多年来的进展,其中提到飞腾、龙芯、申威和兆芯等国产
CPU的单核性能从"十二五"初期不到Inteli3CPU的10%分别提升到36.4%、33.3%、25.8%
和51.5%。
这里面性能接近Corei3一半性能的依然是... 阅读全帖 |
|
a*******g 发帖数: 3500 | 24 cpu的指令集就那么一百多个指令,这还是抽象的指令,不是具体的微代码。具体微代
码的指令数估计更少,指令数越少 越不容易出bug,什么硬件电路执行相应的操作都是
研究无数年的东西了,基本上不会有啥大问题。 |
|
h*h 发帖数: 27852 | 25 http://www.yinwang.org/blog-cn/2015/10/18/turing
图灵的光环
仿佛全世界的人都知道,图灵(Alan Turing)是个天才,是他创造了计算机科学,是
他破解了德国纳粹的Enigma密码。由于他的杰出贡献,计算机科学的最高荣誉,被叫做
“图灵奖”。然而根据自己一直以来对图灵机等计算模型的看法,加上一些历史资料,
我发现图灵本人的实际成就,相对于他所受到的崇拜,其实相差甚远。
由于二战以来各国政府对于当时谍报工作的保密措施造成的事实混淆,再加上图灵的不
幸生世所引来的同情,图灵这个名字似乎拥有了一种扑朔迷离的光环。人们把很多本来
不是图灵作出的贡献归结在他身上,把本来很平常的贡献过分地夸大。图灵的光环,掩
盖了许多对这些领域做出过更加重要贡献的人。
图灵传
2012年,在图灵诞辰一百周年的时候,人们风风火火的召开各种大会,纪念这位“计算
机之父”,很多媒体也添油加醋地宣传他的丰功伟绩。还有个叫Andrew Hodges的人,
抓住这个时机推销自己写的一本传记,叫做《Alan Turing: The Enigma》。这本书红
极一时,后来还被改... 阅读全帖 |
|
e****a 发帖数: 4783 | 26 胳膊呢,就是ARM,全称是Acorn Risc Machine。
ARM是一种32位的RISC架构,如今的RISC虽然比刚提出RISC时候的CISC还复杂,但是毕
竟,RISC的思路不仅是为了精简指令集,更重要的是,硬件便宜了,晶体管白菜价了,
内存不用那么省了,我们可以省别的了。比如指令长短一致,省了指令解码电路和取指
时间,也不用担心跳转的时候,一不小心跳到某个指令中间去了。cache对齐也简单了
,流水线也可以多级了,bit-per-watt也提高了,种种好处,让大家心动不已。
于是,有的公司开始专注于设计架构,而不是自己生产,主要是为了在有限的资源前提
下,把架构的优势发挥到极致。至于生产,就交给那些玩fab这种粗活的公司去吧,您
只要从我这里买IP就可以了。ARM就是这么一间卖IP的公司。
ARM卖IP卖得好,一来是性能好,二来是架构丰富,除了胳膊,人家还有指头。Thumb是
16位的版本,很多公司买来做自己的控制器。有了指头,人家还能拿咖啡,ARM的某些
芯片里面集成了java的硬件处理器。
当然让胳膊在mobile时代称雄最重要的因素,还是胳膊省电,这个也是ARM专注于架... 阅读全帖 |
|
H********g 发帖数: 43926 | 27 【 以下文字转载自 Military 讨论区 】
发信人: hsh (nidaye), 信区: Military
标 题: 王垠: 图灵的光环
发信站: BBS 未名空间站 (Mon May 9 12:34:11 2016, 美东)
http://www.yinwang.org/blog-cn/2015/10/18/turing
图灵的光环
仿佛全世界的人都知道,图灵(Alan Turing)是个天才,是他创造了计算机科学,是
他破解了德国纳粹的Enigma密码。由于他的杰出贡献,计算机科学的最高荣誉,被叫做
“图灵奖”。然而根据自己一直以来对图灵机等计算模型的看法,加上一些历史资料,
我发现图灵本人的实际成就,相对于他所受到的崇拜,其实相差甚远。
由于二战以来各国政府对于当时谍报工作的保密措施造成的事实混淆,再加上图灵的不
幸生世所引来的同情,图灵这个名字似乎拥有了一种扑朔迷离的光环。人们把很多本来
不是图灵作出的贡献归结在他身上,把本来很平常的贡献过分地夸大。图灵的光环,掩
盖了许多对这些领域做出过更加重要贡献的人。
图灵传
2012年,在图灵诞辰一百周年的时候,人们风风火火的... 阅读全帖 |
|
h*******x 发帖数: 12808 | 28 你这就是非科班出身的geeker典型问题,知道很多时髦名词,但是不了解这些名词的具
体含义。忽悠一般人没问题,但别忘了程老大的“高体”可是p大cs研究生的必修课。
你说的这些:多发射,乱序执行按序提交,分支预测都是用来挖掘的指令集并行性的具
体技术,统称为superscalar的技术,核心问题在于解决乱序执行带来的数据冒险和预
测失败的快速恢复,常见算法包括register renaming,scoreboard,tomasulo,牺牲
者trace等等。所有这些算法都是在上个世纪八九十年代的paper里面提出的。在90年代
也基本都被用到了cpu的设计中了。
其实同频比较是没有什么太大的意义,有些cpu的体系结构就是为了简化单条指令功能
以便细化pipeline可以做到更高的频率来提高性能,risc基本理念就是这样,p4,mips
也是这样。有些结构的设计,增加单条指令的功能,做到低频率也有很高的性能,这是
超长指令字的基本理念,比如ia64架构的安腾处理器。具体哪种结构性能好,没搞出之
前谁也不知道,而且受到当时工艺很大的限制。
另外提高工艺可不是想象的那么简单。光刻技术受到光波波... 阅读全帖 |
|
d***a 发帖数: 13752 | 29 说说我个人的看法。我觉得对大多数mobile程序来说,来自于ARMv8的影响,可能有三
个比较主要的因素。第一是寄存器数目的增加,这对性能会有可见的影响,也许在5-10
%上下。
第二是去掉了一些指令和指令集feature。ARMv7有一个的特点,所有的指令都支持
conditional execution。这个支持本身是好事,可以减少跳转指令的数目,但每条指
令都带这个feature,我觉得过头了,对流水线的实现会有比较大的负面影响。ARMv8改
成非常有限的支持,对流水线的实现效率应该是大有好处的。
第三是对浮点数的SIMD支持更好了。这对有浮点运算的程序有很大的影响。
"苹果自己都没说是因为64位,所以才跑的快的不是",这是苹果的一贯风格,少提技术
上的事,就象苹果从来不宣传OS X是一个Unix系统。知道的人自然知道,不知道Unix为
何物的大妈用户,也不会因此就买苹果的计算机。 |
|
a***e 发帖数: 27968 | 30 MIPS在汇编级的指令集还是很简单的,最基本的那些,当cpu已经够了
但是这样搞些复杂指令,就要很多步,于是就加指令,搞得risc像cisc
问题是要搞多少个复杂指令对性能优化最有用
搞到最后,就是crisc和rcisc的区别
现在龙心好像也在搞一层解码器,可以硬解一些x86,效率好像还凑或
典型的微代码化,不过估计后来的那些狗屁mmx都不行
很好奇intel和amd的微代码都是什么样的集合 |
|
h*h 发帖数: 27852 | 31 【 以下文字转载自 Military 讨论区 】
发信人: hsh (nidaye), 信区: Military
标 题: 王垠: 图灵的光环
发信站: BBS 未名空间站 (Mon May 9 12:34:11 2016, 美东)
http://www.yinwang.org/blog-cn/2015/10/18/turing
图灵的光环
仿佛全世界的人都知道,图灵(Alan Turing)是个天才,是他创造了计算机科学,是
他破解了德国纳粹的Enigma密码。由于他的杰出贡献,计算机科学的最高荣誉,被叫做
“图灵奖”。然而根据自己一直以来对图灵机等计算模型的看法,加上一些历史资料,
我发现图灵本人的实际成就,相对于他所受到的崇拜,其实相差甚远。
由于二战以来各国政府对于当时谍报工作的保密措施造成的事实混淆,再加上图灵的不
幸生世所引来的同情,图灵这个名字似乎拥有了一种扑朔迷离的光环。人们把很多本来
不是图灵作出的贡献归结在他身上,把本来很平常的贡献过分地夸大。图灵的光环,掩
盖了许多对这些领域做出过更加重要贡献的人。
图灵传
2012年,在图灵诞辰一百周年的时候,人们风风火火的... 阅读全帖 |
|
w*****s 发帖数: 842 | 32 CISC和RISC只从指令集的角度来讲的,并不能解释ARM的低功耗
ARM面向嵌入式,低功耗还是在于其体系结构的特点:
- 单发射,简单低频流水线(5-9 stage pipeline)
- memory 和 cache 结构简单
- 指令精简带来的例如ALU和寄存器文件的精简
- 其他架构的简化例如MMU,exception handler etc...
对比Intel X86结构的处理器:
- superscalar,高频,深度流水 (as long as 20 stages or more)
- 面向general-purpose,大容量L1 & L2 Cache,复杂Cache结构降低miss rate
- 指令相对复杂支持多媒体指令扩展,etc.
- 为支持通用OS引入的复杂内存管理单元(MMU)和 Exception Handling..
... |
|
z*****n 发帖数: 7639 | 33 你正好理解错了。
RISC是把一个复杂的CISC指令用一堆短小指令来执行。
所以CISC的指令集很大,包含了很多复杂指令诸如浮点计算等。
RISC省电的主要原因大概是芯片里面逻辑门的数量
比CISC要少很多,因为不用用硬件来执行很多复杂逻辑。 |
|
c****p 发帖数: 6474 | 34 操作系统说白了也是一个有序的指令的集合。
只要编译(把源代码变成指令集合的过程)操作系统的时候让编译出的指令支持ARM的
指令集就行了。
所以上面有人说是OS支持ARM,而不是ARM支持OS。 |
|
l*h 发帖数: 4124 | 35 龙芯已现身最快的超级计算机 但要20年才能卖到美国
尽管龙芯已经现身世界上最快的超级计算机,不过这并不代表龙芯处理器的黄金时代已
经到来,据龙芯设计团队负责人胡伟武称,还需要20年才能把龙芯处理器卖到美国去,
“就像我们的服装业(经历的)那样”。
龙芯2B处理器
目前龙芯处理器主要面向低功耗上网本和机顶盒市场,今年迟些时候第三代龙芯处理器
将会首度出现在petaflop-scale级别的超级计算机上。龙芯处理器是基于MIPS指令集,
之前一直不能应用在桌面级电脑和超级计算机上,但是它可以兼容X86指令集。
GODSON之父(GOD) 胡伟武
胡伟武指出龙芯处理器还需要另外的20年才能满足国内市场对芯片的需求,部分原因在
于目前国内的芯片厂缺乏掌握相关复杂技术的工程师。最后,胡伟武强调,随着中国信
息经济的发展,这将会实现。 |
|
r**********g 发帖数: 22734 | 36 赵策,难得我们一致同意啊。巴布就已经被伊斯兰开除了,巴哈伊更是异端。伊斯兰干
巴哈伊就像当年嫉妒干魔门一样狠毒。巴哈伊的总部在以色列海法。你明白了么?
沙漠教版本演化过程:
1.0版:犹太人是选民,其他死啦死啦地,律法不可以变,上帝直接告诉摩西的。相当
于汇编,只能用希伯来语指令集。低级语言。
2.0版:上帝自己直接下来变成人,大家信我都可以得救。开放了民族限制,但是指令
集还是不可以变。相当于C,各个民族可以自定义函数。但是律法还是定的,相当于关
键词定了。是为天主东正。
2.5版:上帝派来不是自己是先知,而且派了很多——穆神是最后一个。人其实没有原
罪,也是信了,做了事功就能升天拿处女。相当于给C来了个很好用的standard
library,用libary升天方便很多。
3.0版:新教,信上帝就行,怎么信无所谓。黑哥们载歌载舞或者酷刑自焚都行。C++,
可以overload,重载运算符,各种继承,多重继承。
4.0版:巴哈伊,魔门。动态语言,上帝不断派人下来,随时更新系统,在虚拟机上跑
,各种设备都行,同时设立了标准化的组织结构,一段时间发布ISO标准。是为Java。
赵策你一定... 阅读全帖 |
|
d********a 发帖数: 3698 | 37 HFT-D4(银河飞腾DSP/700/800/900SMT),是一种DSP芯片,专职于大规模数据运算。
在同等
工艺的条件下(如CMOS0.18um),我们的性能比外国最先进的同级芯片高出40%!!!该系
列的名
字,就是江提的字。问题在于,人家的工艺实际上比我们先进,那么我们的优势就被抵
消了。目前,
我国跟踪了世界顶级的64为架构IA-64,,国防科技大学目前有一
款还处于
保密状态的代号X的CPU,与它处于同一水平。另外,航空电子、航天电子、军用计算机
,所有的芯片
我们都可以国产化。西北工业大学某所开发了所有的这些芯片,由中芯国际流片。它们
分别为:龙腾
C1、龙腾C2、龙腾R1、龙腾R2、龙腾S2、龙腾D2。由于这些芯片的指令集都有知识产权
,所以没有
用于市场化,在民用上,主推MIPS指令集的龙芯1、龙芯2、龙芯3。目前,中芯国际已
经能制造龙芯
2标准的CPU了,而且有更先进的工艺。但是考虑到市场等因素,龙芯2暂时还是和意法
半导体合作。
中芯国际是目前我国规模最大、技术最先进的芯片代工企业。直逼台积电。但是在技术
上与台积电还
有1代的差距 |
|
d********a 发帖数: 3698 | 38 YHFT-D4(银河飞腾DSP/700/800/900SMT),是一种DSP芯片,专职于大规模数据运算。
在同等
工艺的条件下(如CMOS0.18um),我们的性能比外国最先进的同级芯片高出40%!!!该系
列的名
字,就是江提的字。问题在于,人家的工艺实际上比我们先进,那么我们的优势就被抵
消了。目前,
我国跟踪了世界顶级的64为架构IA-64,也就是Intel Itanium,国防科技大学目前有一
款还处于
保密状态的代号X的CPU,与它处于同一水平。另外,航空电子、航天电子、军用计算机
,所有的芯片
我们都可以国产化。西北工业大学某所开发了所有的这些芯片,由中芯国际流片。它们
分别为:龙腾
C1、龙腾C2、龙腾R1、龙腾R2、龙腾S2、龙腾D2。由于这些芯片的指令集都有知识产权
,所以没有
用于市场化,在民用上,主推MIPS指令集的龙芯1、龙芯2、龙芯3。目前,中芯国际已
经能制造龙芯
2标准的CPU了,而且有更先进的工艺。但是考虑到市场等因素,龙芯2暂时还是和意法
半导体合作。
中芯国际是目前我国规模最大、技术最先进的芯片代工企业。直逼台积电。但是在技术
上与台积电还
有1代的... 阅读全帖 |
|
r*****n 发帖数: 964 | 39 设计指令集看起来简单,其实不然。要考虑流水线优化,编辑器优化和未来扩展等等一
系列的东西。特别是一系列的tool chain,自己做绝对头大。
没有自己的指令集就相当于没有自己的灵魂。我很佩服北大的老程,他是真的自己都做
了,很低调,没有龙芯吹得响。 |
|
e****l 发帖数: 3319 | 40 由于缺少授权,龙芯只能使用类似MIPS的简单指令集,而不能用x86架构的复杂指令集
。所以龙芯cpu先天不能跑windows。对于在windows生态系统里面生存了二十年的pc用
户来说,一下子改用linux肯定不适应。这一点是龙芯的先天不足。所以龙芯个人用户
这条路走不通,也许高性能计算和服务器以后可以使用龙芯。 |
|
e****l 发帖数: 3319 | 41 arm哪用x86指令集啊,它使用的是精简指令集(RISC) |
|
r****r 发帖数: 306 | 42 中国自主“芯”向何处:郭台铭暗讽赵伟国的冷思考
日前,紫光集团董事长赵伟国前往中国台湾,并建议中国台湾开放陆资投资IC设计行业
,并愿意让旗下两家IC设计公司展讯、锐迪科与联发科合并,甚至与世界半导体教父、
台积电董事长张忠谋商谈入股收购的事宜。
针对于此,鸿海董事长郭台铭称,赵(伟国)不过是一个炒股的投资者,怎么能去问台积
电董事长张忠谋、一个世界半导体教父,公司多少钱要卖?张忠谋60多年半导体经验,
“不是你今天用钱就可以买的”。问题来了,为何在郭台铭心中只是个炒股的投资者(
就差说是玩资本的机会
主义者了)?这背后反映出我们发展中国“芯”存在怎样的问题?
尽管郭台铭的话不乏倾向性和偏激的成分,但也道出了紫光集团,甚至是中国(大陆)
所谓自主芯片发展的一种模式,即金钱堆出来的并购。众所周知,从2013年底开始,紫
光便频频在并购市场发力,其并购的对象几乎无一例外是来自于芯片行业产业链较有实
力的企业。其中业内最为熟知的17亿美元收购展讯,9亿美元收购锐迪科,接受英特尔
15亿美元(约合90亿元人民币)注资其并购的展讯和锐迪科,以及近期频频曝出的收购
联发科,直至台积电,给业内的感觉... 阅读全帖 |
|
c***l 发帖数: 2490 | 43 几乎所有的美国科技巨头,都加入了苹果与美国联邦调查局的大战。
据美国媒体报道,当地时间周四,包括推特、空中餐宿(Airbnb)、领英(LinkedIn)
和亿贝(eBay)在内的17家互联网企业联名向联邦法院提交了一份“法庭之友”文件,
宣布支持苹果保护用户隐私的立场。
科技巨头齐上阵
FBI希望苹果能够开发一款程序,来解锁一名“恐怖袭击”凶手的手机,从而获得去年
12月2日一起枪击事件的关键证据。那起袭击共导致14人死亡,22人受伤。
苹果担心FBI今后会将这一程序用于大规模的侵犯用户隐私。这一观点得到了美国主流
科技企业的支持,谷歌、微软、脸书、亚马逊、思科、雅虎等15家企业同样“组团”提
交了法律声明。
英特尔和美国电话电报公司(AT&T)昨天也分别做出了类似的声明。
苹果的“老冤家”三星这次也站在了同一条战壕里。三星表示,用户隐私“非常重要”
,任何寻求在设备中设置技术后门的要求都将会破坏信任。不过三星还表示,保护用户
的隐私非常重要,但当前情况尚未决定是否提交“法庭之友”文件支持苹果。
中国手机厂商华为的消费者业务CEO余承东也表示,“保护用户隐私非常重要,我们支
持苹果。隐... 阅读全帖 |
|
j*******n 发帖数: 10868 | 44 如果只是指令集兼容而已,设计是自己的,那也算牛逼了,你也不可能独创一个与众不
同的指令集 |
|
|
w*********g 发帖数: 30882 | 46 国产CPU彻底悲剧:好话说尽 联想拒绝用龙芯
2015-09-08 15:55:57 出处:电脑报 编辑:万南 人气: 27697 次 评论(301
)点击可以复制本篇文章的标题和链接
让小伙伴们也看看:
163
收藏文章
作为国家工业和信息化部软件与集成电路促进中心(简称CSIP)的官员,过去几年间,孙
加兴、高松涛等多次去联想集团拜访,他们非常希望联想集团能支持龙芯。
联想和龙芯都源自中国科学院计算技术研究所,按照很多人的想法,联想作为全球最大
的电脑公司之一,是最有理由采用龙芯的,如果采用龙芯,龙芯可以至少占领国内PC市
场半壁江山。
国产CPU悲剧:好话说尽 联想拒绝用龙芯
但迄今为止,联想的PC并未采用任何一款龙芯。“目前新一代龙芯在CPU最核心的技术
微结构方面,跟国外的主要厂商终于已经基本持平了,差距方面仅差5%、10%左右。”8
月下旬,在龙芯新一代四核处理器3A2000、3B2000发布会上,龙芯中科技术有限公司总
裁兼龙芯总设计师胡伟武说。
问题还是“有没有人用”,对此龙芯自身也很清楚——今年6月,胡伟武在接受央视采
访时所说:“我们... 阅读全帖 |
|
g*q 发帖数: 26623 | 47 众所周知,目前绝大多数的手机芯片厂商都是采用ARM公司的CPU架构,通过购买ARM公
司已经设计好的CPU内核授权来进行芯片设计。但是能够自主设计CPU内核的手机芯片厂
商则是凤毛麟角,目前只有高通、苹果、三星三家厂商。而苹果和三星基本都是自用,
所以在公开市场上,只有高通一家手机芯片厂商具有自主设计手机处理器的能力。
而在去年6月份的时候,芯智讯就独家报道了“展讯成功研发自主CPU”的消息。随后在
去年8月的展讯全球合作伙伴大会的专访环节,时任展讯CEO的李力游也再次确认了这款
自主芯片已经基本ready了。当时甚至透露这款芯片会在2017年年底发布。但是,随后
却没了消息。而且现在李力游也已经离开了展讯,去了Imagnation担任CEO。这也使得
不少人认为这款芯片黄了。
然而今天,在CITE2018展会现场紫光的展台上,笔者发现了首次展示的紫光展锐(展讯
与RDA合并后的公司)自主研发的手机处理器——SC9850KH。
根据之前芯智讯采访了解到的信息显示,展锐拿了ARM的指令集授权,这款SC9850KH似
乎是基于ARM Cortex-A53架构重新设计而来,虽然是四核心CPU... 阅读全帖 |
|
发帖数: 1 | 48 什么逻辑,你做了优化,证明你的芯片能run一些基本的
商用软件,才能有市场
10年左右胡威武从政府那里拿大钱开公司,还花了大钱
买MIPS专利,芯片都做出来了,这点小小优化没钱做?
再说龙芯是MIPS指令集,又不是什么全新指令集,就是需要
优化,在OS层级的优化也不多,这成本和芯片本身的研发代价
就是九牛一毛
你是真知道龙芯只是优化问题,还是随便说说的? |
|
A***g 发帖数: 1816 | 49 在CPU相关的技术里,这个指令集其实是技术含量最低的,但是市场成分最高的。你可
以设计自己的指令集,可是现有的操作系统和程序最起码都要重新编译一个新的版本,
这还是最好的情况,坏的情况是要重新写。没有公司愿意投入这么大的精力,就为了一
个新的小芯片 |
|