t****l 发帖数: 236 | 1 计算机系在系统级芯片并行性研究上取得可喜成绩
近日,由计算机系研究生胡向辉和导师华蓓副教授及校友唐锡南博士合作的论文“
High-performance IPv6 Forwarding Algorithm for Multi-core and Multithreaded
Network Processors”被国际并行处理一流会议,ACM SIGPLAN Symposium on
Principles and Practice of Parallel Programming 2006年(PPoPP?2006)发表。唐锡
南和胡向辉参加了在纽约召开的国际会议,并于3月31号在大会上宣读此论文。这是该会
自1988年创办以来首次录用中国大陆高校和科研单位的论文。
ACM PPoPP 是计算机系统领域的一流国际会议之一,会议的主题包括并行编程原理、
并行编程工具、以及并行编程应用等。由于它是计算机并行处理方面最高级别的国际会议
之一,论文录取的竞争是异常激烈和富有挑战。从1988年到2005年,除美国外,其他国家
和地区在PPoPP上发表的学术论文各自最多不超过6篇,中国台 |
|
l*c 发帖数: 1 | 2 并行计算的能力不会超过图灵机, 因此一定可以用单CPU模拟
其实直觉上并行性并不能提供高于递归函数的能力,任何属于
递归可枚举(且非递归)或其上的函数(语言)直觉上在加入并行性后仍
不可计算,各种不可计算的判定问题显然不可能通过加入
并行性来解决 |
|
d*****l 发帖数: 8441 | 3 F-35遭遇滑铁卢——已基本无法先于歼-20服役
尽管已有不少改进,但由于其成本耗费倍受争议,f-35项目又被推迟一年。10月,
2架f-35b型战斗机完成72次垂直着陆和短距起飞,这是f-35项目5项发展目标之一,洛
克希德·马丁公司(以下简称洛·马)希望2011年年底能完成。
随着时间的推移,期望也随之改变。10年前,美财政预算有余,而如今,却负债累
累。作为五角大楼最大的购买计划,耗资3800亿美元的f-35战斗机难逃最为严厉的审查
。f-35理应为美国防中蒸蒸日上的装备项目,然而现在它却还在初级阶段停步不前。
2001年10月26日,时任空军部长詹姆斯·罗彻宣布洛·马赢得f-35项目承包合同时
,他预计f-35a型机单价约4000万美元,美国和至少8个国家的空军有购买欲望。目前,
美国防部f-35项目负责人大卫·文内特希望在生产高峰时(这个目标在2017年前不可能
完成)f-35的单价为8000万美元。罗彻当初预计f-35战斗机投入使用是2008年,而实际
上2008年是f-35试飞的第一年。美国海军陆战队日前决定在2016年部署f-35b型战斗... 阅读全帖 |
|
l***a 发帖数: 198 | 4 原文:
http://blog.sciencenet.cn/blog-268546-1154610.html
量子计算的理论基础
量子计算的理论基础是量子力学,相比传统计算,它声称的巨大性能提升来自于量子态
的叠加性。
我发现很难跟量子计算(量子信息)的研究者解释清楚,他们说的量子力学实际上是非
相对论量子力学,而非相对论量子力学只是一套近似理论,并不代表真实的物理。在量
子信息研究者的眼中,只有一套神奇的理论叫做量子力学,谁也说不清楚怎么回事,但
是它就是对的。谁反对都没有用,爱因斯坦也不行。无论爱因斯坦有多么伟大,在与量
子力学的交锋中全都败下阵来。
其中最重要的一个争论,爱因斯坦认为世界是局域实在的,局域意味着满足相对论,不
能超光速,实在意味着客观世界独立于人的意识而存在。而量子力学认为,世界(量子
)是非局域的,量子现象可以超光速;世界(量子)在测量之前讨论它是不是客观实在
是没有意义的;量子的非局域性已经得到了众多实验的严格证明。(这里说的量子力学
观点存在重大争议,量子非局域性的实验证明,也没有得到广泛的认可。)
在非相对论量子力学中,作用势是唯象的,作用量传播速度无穷大... 阅读全帖 |
|
s********e 发帖数: 425 | 5 我感觉你想了解的问题可以归于科学计算范畴。科学计算在物理、机械工程,医学等多
个应用领域都需要。例如物理或天文里计算多个天体相互之间的作用力的问题(N-body
problem),天体数量可以达到几万到几十万;又比如医学中有医学图像重构问题(比如
backprojection),需要把多幅机器拍摄的原始图像以某种组合方式重构成医生能看懂
的图像,图像像素数可以是几千乘几千。
虽然可能处理三五个数据所使用的算法极其简单,但是由于数据量巨大,算法复杂度随
着数据量的增长迅速增加,于是同样简单的算法就无法使如此庞大的数据量在可接受时
间内算完,于是就构成了NP-complete问题。
这些都是需要超级计算机(supercomputer)来运算,也就是cluster或multiprocessor
。根据问题所需数据量的大小,运算时间从几小时到几天都有,一两个月也有可能。
运算方法概括来说叫做并行计算。具体就是尽可能编出并行性(Parallelism)高的程
序,使得庞大数据能够并行处理,比如一万个天体分给八个cpu同时运算,每个cpu算
1250个;1024x1024的图像分给16个cpu,每... 阅读全帖 |
|
a****l 发帖数: 8211 | 6 我觉得现在的parallel没有进展完全不是技术上没要求,相反,实际的工程需要有巨大的
要求,未来看来也只会是越来越大,唯一的问题是现在的技术太局限,需要一个大牛搞一
个大的突破.
从小的方面说,我觉得并行性讨论dependency,test企图在这个上面搞出东西根本就是错
误的.我觉得关键是,现在的通用程序本身就是串行的,特别是文本式的程序,本质上就是
一个从上到下从左到右的大串,你硬要把它变成巨量并行的是逆天而为.我觉得数据流式
的图形程序才能是本质上并行的,不改变这点,很难得到根本的改变.
另外,并行也是有根本极限的,就象你所看不起的shannon's law,我最近做了一些学习后
特别崇拜,觉得描述的实在是分毫不差.并行的也有一个叫Amdahl's law,除非逆天的人
才能突破.
conferences
discussion
that
on.
there |
|
i***s 发帖数: 39120 | 7 根据安徽临泉县警方调查,当地一名农民在接近17年的时间里,强奸116人(38人未遂),多数还并行实施了抢劫,而受害者多为留守妇女,大多保持沉默。
3月30日,安徽临泉县白庙镇卞庄,几名老人在聊天。村里大部分青壮年外出务工,留下妇女、老人和孩子。摄影 钱昊平
临泉县白庙镇净堂村装有摄像头。临泉县在395个村都安装了视频监控。
3月31日,一名妇女在做工。男人们外出打工,当地很多盖房的工地上都有女人在干活。
临泉县一男子17年犯强奸案百余起,受害者多为留守妇女,大多保持沉默;凸显打工潮下乡村治安问题
根据安徽临泉县警方调查,当地一名农民在接近17年的时间里,强奸116人(38人未遂),多数还并行实施了抢劫。
这名嫌疑人侵犯目标明确:留守妇女。家中无青壮劳力,这些妇女不敢抵抗,同时因社会压力,也不敢报警。
青壮劳力外出务工是中国农村普遍现象,农村社会治安问题日益突出。如何加强农民防范能力,维护农村社会安全?安徽临泉警方做了多种尝试,但遇到种种难题。
近三年后,那场遭遇给刘守茹(化名)造成的伤害已渐渐褪去。
4月1日,再次回忆,她面带笑容:“这辈子没受过那个气,一定要报案抓了他。”
刘守茹家在... 阅读全帖 |
|
G*******s 发帖数: 4956 | 8 首先给大家看个故事,然后再探讨经文:
林慈信牧师的《基督教教义发展史》中提到这个:
http://blog.sina.com.cn/s/blog_622134fd01013i7l.html
基督论的发展史(1):基督论的争辩
HISTORY OF THE DOCTRINE OF CHRIST (1):
The Christological Controversies
(Louis Berkhof, A History of Christian Doctrines, pp. 101ff.)
基督论与三位一体之问题的关联
Connection of Christological and Trinitarian Problems
基督论的难题可以从一般神学(译注:神论)方面,与拯救论方面来加以
研究。早期教父对基督论拯救方面的关系,虽未曾加以轻忽,但他们在重要的讨论上却
没有重视。在三位一体争论的气氛中,他们从一般神学(译注:神论)方面来研究基督
,乃天经地义的事,而三位一体争论所导致的决定则是,基督为神的儿子,事与父同质
的,因此祂是神。从此而发生的问题,就是基督... 阅读全帖 |
|
z*****n 发帖数: 633 | 9 契入空性的关键
越尘居士
一、契入空性的通用教法 2
二、特殊的引导方便 4
三、对方法与环境等因素的考量 6
四、常见错误辨正 7
五、 心闻无遮出尘初步(略去)
5.1第一步引导,心闻无遮扯脱根尘
5.2明晰出尘
5.3第二步引导, 毗婆舍那
5.3契入空性前常见错误的校正
5.4伴随进展的现象
六、 广大无边菩提道――继续深入(略去)
一、契入空性的通用教法
在契入空性之前,行人应当在佛法的修学方面已经建立了一定的基础。要以言之为
三主要道,即出离心,苦集灭道; 菩提心,广大慈悲,利益一切众生趋向解脱;正见
,缘起性空,无主宰,非实有。 此三主要道见诸三藏十二部,前贤大德均已广说。若
圆满三主要道,则行人业已成佛。这里作为契入空性前的基础,对出离心方面的大致要
求是对世间法知虚妄而有节制,菩提心方面要求大致是愿菩提心及少分行菩提心范围,
而对正见的要求则是闻思范围。 在此基础上,行人以戒律为防护,以禅修为增上,依正
见经毗婆舍那而契入空性。由思维所成见通向空性现量见道的关键过渡是毗婆舍那,即
在思维心下对自心相似相续正观缘起。 若得相应,则行人得以现量体会无生本觉... 阅读全帖 |
|
发帖数: 1 | 10 第一节 学密者的省思
学密宗多年,各种开示都指称:密宗的戒定慧、见修行果、信解行证都较显教超胜
,利根精进者甚至可以即身成佛,比起显教需一大阿僧祇劫才能入初地,三大阿僧祇劫
才能成佛,差距实在难以想象。藏密强调自己观成佛菩萨的果位观修,来自历代成就上
师的灌顶与加持,因此精进求法修持,上焉者心契空乐明,证悟大手印;中焉者本尊观
想坚住,佛慢坚固;下焉者每天观修咒念不断,严戒精进,坚信临终时,必能光明解脱
或往生本尊刹土。
藏密典籍开示、观行知见,许多与显教不同;遇到戒律开遮持守、修学知见显密恰
好相反时,强调应依止胜妙的果地金刚乘见解,舍弃下劣的因地般若乘知见。“藏密超
胜显教”如果是事实的话,则密续开示、口诀导引开示,都应超胜或等同 释迦牟尼佛
的经典开示;藏密祖师证量,亦都应超胜或等同显教祖师证量。但为什么学了大手印、
大圆满、诵观空咒、入无分别平等住多年,执意识心不起妄念即是佛地真如,能离于三
界系缚,住于涅槃之境,即是轮涅不二,即身成佛;却连流通最普遍的《心经》都弄不
通,只知道“不生不灭、不垢不净、不增不减”是在讲十八界的根源──第八识如来藏
,整篇《心经》都在描述第... 阅读全帖 |
|
w*****r 发帖数: 7106 | 11 藏传佛教的内涵ZT
教授:格鲁/果硕仁波切
时间:一九九八年七月十一日
地点:白马山菩提讲堂
整理:刘凯玲
转自:大眼观世
一、出离心、菩提心、空性正见慧——三圣道为入于密乘修持之根基
金刚乘佛法从印度传至西藏,事实上金刚乘佛法并非独立于大乘佛法之外,和大乘
佛教是一体的;只是修持时藉大乘的波罗密多乘(因乘)和金刚乘(果乘)交互修持,
特别是用金刚乘修持,如果正确修持得到佛果是很快的(即金刚最上乘无上瑜伽密,即
身成佛的法门);所以,我们修持金刚乘的目的||成佛,和一般波罗密多乘及显教根
本目的是一样的,都是要成佛;如果没有显教修持的内容作基础,要证得佛陀果位根本
不可能。
显教修持不只是自己修菩提心,追求解脱轮回的痛苦,更进一步也要让众生修持菩
提心,离开轮回的痛苦,得到佛果位。这样的目的之下,我们要是想成佛果位,若没有
这两样作为根本,说要证佛陀果位是不可能的事。所以,金刚乘要证得佛陀果位,须以
显教为修持内涵,如菩提心、出离心、空性的正见为修行基础。
佛陀非常善巧地根据各种因缘、根器、处境而度化众生。如果众生想求得解脱,在
痛苦轮回中生起出离世间之见,佛陀以小乘的教化来教导这些众... 阅读全帖 |
|
m**d 发帖数: 21441 | 12 据央视新闻8月11日消息,量子芯片相当于未来量子计算机的“大脑”,研制成功后可
实现量子的逻辑运算和信息处理。有了计算,量子的存储及控制技术也必不可少。这款
三明治型的固态量子存储器,在低温有磁场的辅助设备中才能工作。
中科院量子信息重点实验室研究员周宗权表示,下一步发展方向,要把这个量子存储器
做小做得齐整化,以延长它的寿命,最终我们希望做成一个像经典的便携式U盘一样方
便使用的器件,实现超远距离的量子态量子信息的传输。
量子计算机以其惊人的计算速度和性能被认为即将颠覆现有的普通计算机,“量子芯片
”作为量子计算机的“大脑”,是体现和普通计算机差异的核心。目前,国内外研究机
构都开始对这一领域展开了研究,而中国也无疑已经走在了前列。
在8月4日出版的《自然》杂志的一篇封面文章中,与马里兰大学联合量子研究所(JQI)
和量子信息和计算机科学联合中心成员Christopher Monroe一起合作的研究人员提出了
第一个完全可编程和可重新配置的量子计算机模块。
上周,《物理评论快报》(Physical Review Letters)报道称,牛津大学教授的研究
实现了量子计算机研发进程的一... 阅读全帖 |
|
a*******g 发帖数: 3500 | 13 amd的ipc跟intc差不多了
intc主要是频率高点。
现在来看增加并行性是未来的发展方向,因为单核效率基本上到头了。
超线程,多核,乃至异构计算都是增加并行性的不同阶段。 |
|
n*******0 发帖数: 2002 | 14 上perfmon和resmon看硬件瓶颈,没瓶颈的话看你的算法的并行性。都没问题的话,那
你去应聘matlab和高斯吧,去把他们的程序并行性提升提升。。。。 |
|
z****e 发帖数: 54598 | 15 作为论据,我找到了中文的翻译,但是那个youtub链接失效了
Go语言之父谈Go:大道至简
时间:2012-07-05 15:40 作者:王然
导读:这篇文章是Google首席工程师、Go语言之父Rob Pike自己整理的6月21日在旧金
山给Go SF的演讲稿。Rob提到:Go语言本是以C为原型,以C++为目标设计,但最终却大
相径庭。值得一提的是,这3门语言都曾当选TIOBE年度语言。
几个礼拜之前我被问到:“对于Go语言,最令你惊讶的是什么?”当时我就明确地给出
了答案:“虽然我希望C++程序员能够使用Go作为替代拼,但实际上大部分Go程序员都
是从Python和Ruby转过来的,其中却少有C++程序员。”
我、Ken以及Robert都曾是C++程序员,在我们编写软件时觉得应该设计一门更适合解决
这个问题的编程语言。奇怪的是,其他程序员似乎却不关心。
今天我将说说是什么让我们决定创造Go语言的,及其出乎意料的结果。这里我谈的更多
的会是Go而不是C++,所以即使你不懂C++也没关系。
主旨可以简单地总结为:你更同意Less is more还是Less is less?
这里有一个... 阅读全帖 |
|
t******t 发帖数: 15246 | 16 排名
http://cnbeta.com/articles/129655.htm
在2010年11月17日美国新奥尔良举行的SC2010会议上,美国圣地亚国家实验室与Intel
、IBM、AMD、NVIDIA和Oracle合作定义并发布了一个新的基准测试排名Graph 500,它
是利用图论去分析超级计算机在模拟生物、安全、社会以及类似复杂问题时的吞吐量,
并进行排名,而不是像Linpack那样只针对比较传统的数值运算能力。
圣地亚国家实验室的研究人员表示,希望通过这个测试能促使计算机厂商构建可处理复
杂问题的架构。新的计算标准定义细微且重要,因为它可能对未来几十年的计算机架构
产生重要影响。
Kronecker乘法生成小的合成图形,真实建模图形就是这类生成的大型版本,被用于
Graph500基准测试。点击高分辨率图片的缩略图,同时也可获得更高分辨的EPS文件。
很多科学家认为Linpack测试是一个基本测试机制,可以得知一个计算机执行基本计算
的速度有多快,但对于这个计算机处理实际问题的能力没有太大关系。在SC2010会议上
,一位超级计算机供应商高管开玩笑说,将10万部Androi... 阅读全帖 |
|
f**o 发帖数: 12685 | 17 国际上最高品质和最高效率的单光子源
基于单光子的量子计算原型机结构
十超导量子比特的纠缠态
基于超导量子处理器的线性方程解法演示
世界首台超越早期经典计算机的光量子计算机在我国诞生
我要分享
文章来源:量子信息与量子科技创新研究院 发布时间:2017-05-03 【字号: 小
中 大 】
5月3日,中国科学院在上海召开新闻发布会,宣布世界首台超越早期经典计算机的
光量子计算机在我国诞生。
中科院院士、中国科学技术大学教授潘建伟及其同事陆朝阳、朱晓波等,联合浙江
大学教授王浩华研究组,近期在基于光子和超导体系的量子计算机研究方面取得了系列
突破性进展。在光学体系方面,研究团队在2016年首次实现十光子纠缠操纵的基础上,
利用高品质量子点单光子源构建了世界首台超越早期经典计算机的单光子量子计算机。
在超导体系方面,研究团队打破了之前由谷歌、美国国家航空航天局(NASA)和加州大
学圣塔芭芭拉分校(UCSB)公开报道的九个超导量子比特的操纵,实现了目前世界上最
大数目的十个超导量子比特的纠缠,并在超导量子处理器上实现了快速求解线性方程组
的量子算法。相关系列成果发表于国际学术期刊... 阅读全帖 |
|
p*z 发帖数: 365 | 18 美国力推Graph500超级计算机排名欲取代Top500
http://cnbeta.com/articles/129655.htm
在2010年11月17日美国新奥尔良举行的SC2010会议上,美国圣地亚国家实验室与Intel
、IBM、AMD、NVIDIA和Oracle合作定义并发布了一个新的基准测试排名Graph 500,它
是利用图论去分析超级计算机在模拟生物、安全、社会以及类似复杂问题时的吞吐量,
并进行排名,而不是像Linpack那样只针对比较传统的数值运算能力。
圣地亚国家实验室的研究人员表示,希望通过这个测试能促使计算机厂商构建可处理复
杂问题的架构。新的计算标准定义细微且重要,因为它可能对未来几十年的计算机架构
产生重要影响。
Kronecker乘法生成小的合成图形,真实建模图形就是这类生成的大型版本,被用于
Graph500基准测试。点击高分辨率图片的缩略图,同时也可获得更高分辨的EPS文件。
很多科学家认为Linpack测试是一个基本测试机制,可以得知一个计算机执行基本计算
的速度有多快,但对于这个计算机处理实际问题的能力没有太大 关系。在SC2010会议
上,一... 阅读全帖 |
|
g******z 发帖数: 5809 | 19 Core凭借革命性的微架构革新,为Intel重新夺回了性能王者桂冠。而2007年底Intel发
布的45nm Penryn微处理器,更进一步拉开了与AMD的技术差距。Intel非但没有就此停
下脚步,更进一步加速推出了的新一代Nehalem微架构的CPU,希望凭借这款处理器给予
AMD无情的一击。
Nehalem的设计目标是找到折衷的设计方案,为各种应用场合的处理提供一个单一的、
可扩展的平台。众所周知,不同领域的应用程序在表现上有着极大的差异。例如矩阵运
算、视频编解码、数据库等领域的处理具有很高的并行性,因此新出现的程序越来越多
的采用多线程的方式编写;而同时相当多的较老的应用程序仍然采用单线程的方式编写
,编译等一些特殊领域的应用也很难被并行化处理。再例如对于一些专业工作者,处理
速度至关重要,运行一遍应用来对自己手头的数据进行处理往往要几天甚至一个月的时
间;但使用笔记本出差的用户却对笔记本的巡航时间更为关注。
Nehalem的出现,正是想为这些应用提供单一的解决方案,由用户根据自己的应用选择
处理器的使用和运行方式。Nehalem既需要为已存在和即将涌现的多线程应用程序服务 |
|
d***a 发帖数: 13752 | 20 CPU的benchmark分数一般不好相加。你想问的,是用双CPU能不能有两倍的加速比吧,
也就是执行时间减少一半。
首先假设用的是parallel workload。一般来说,会差一些,因为很少有完美并行的程
序。串行的执行部分,同步,数据交换,这些因素会降低并行效率。但有些特殊的情况
下,会有超过两倍的加速比。 |
|
f****n 发帖数: 355 | 21 第 三 部 分
第十四章 视觉觉知(1)
“宇宙就像一部展现在我们眼前的伟大的著作。哲学就记载在这上面。但是如果我们
不首先学习并掌握书写它们所用的语言和符号,我们就无法理解它们。”
——伽利略
现在让我们总瞰一下到目前为止我们所涉及到的领域。本书的主题是“惊人的假说”
——即我们每个人的行为都不过是一个拥有大量相互作用的神经元群体活动的体现。克里
斯托弗·科赫
(Christof Koch)和我认为探索意识问题的最佳途径是研究视觉觉知,这包括研究
人
类及其近亲,然而,人们观看事物并不是一件直截了当的事情,它是一个建设性的、复杂
的处理过程。心理学研究表明,它具有高度的并行性,又按照一定的顺序加工,而“注意
”机制则处于这些并行处理的顶端。心理学家们提出过若干种理论试图来解释视觉过程的
一般规律,但没有一种更多地涉及脑中神经元的行为。
脑本身是由神经元及大量支持细胞构成的。从分子角度考虑每个神经元都是一个复杂
的对象,常具有无规则的、异乎寻常的形状。神经元是电子信号装置。它们对输入的电学
和化学信号快速地作出反应,并将它们的高速电化学脉 |
|
|
k******a 发帖数: 2436 | 23 其实主要是沾了近年来gpu发展的光。当然无论怎么说还是很牛的。
除了simulation等等并行性较高的题,内存要求大的计算瓶颈还是在interconnector上
罢。 |
|
w*****e 发帖数: 74 | 24 问题并行性高,可以解决。有解决方案又有什么用?咱和铁道部又没有关系。就算有丁
书苗二世,她也不会来上mitbbs。 |
|
s********0 发帖数: 71 | 25 机器人的名字最早由1920年捷克作家Karel Čapek提出,直到在1960年代才走进人
类世界,如今已被广泛使用,但21世纪的机器人是否需要一次飞跃?《科学美国人》的
一篇文章谈论了量子机器人,描述了量子机器人相对于标准机器人的优势。作者称,量
子机器人是结合了机器人技术和量子计算的机器人,机器人是一种能完成一系列复杂任
务的自主机器,控制机器人的程序是基于人工智能。量子机器人则内含复杂的量子系统
,控制机器人的程序是基于量子搜索算法和量子强化学习算法。量子强化学习是基于量
子态的叠加和量子并行性。作者认为,在应用量子效应后,与标准机器人相比,量子机
器人将更快更精确能同时执行多个任务 |
|
y***i 发帖数: 11639 | 26 【 以下文字转载自 USTC 讨论区 】
发信人: sunnyday (胖头鱼。按斤卖就赚了), 信区: USTC
标 题: 中国科大在国际上首次实现用量子计算机求解线性方程
发信站: BBS 未名空间站 (Tue Jun 11 00:57:45 2013, 美东)
最近,由中国科学技术大学潘建伟院士领衔的量子光学和量子信息团队,在国际上首次
完成用量子计算机求解线性方程组的实验。该研究成果发表在6月7日出版的《物理评论
快报》上。
线性方程组广泛地应用于几乎每一个科学和工程领域,包括数值计算、信号处理、经济
学和计算机科学等。比如与我们日常生活紧密相关的气象预报,就需要建立并求解包含
百万变量的线性方程组,来实现对大气中各种物理参数(温度、气压、湿度等)的模拟
和预测。而高准确度的气象预报则需要求解具有海量数据的方程组,假使要求解一个亿
亿亿变量的方程组,即便是用现在世界上最快的超级计算机也至少需要几百年。2009年
,美国麻省理工学院教授塞斯·罗伊德等提出了用于求解线性方程组的量子算法,认为
借助量子计算的并行性带来指数级的加速,将远远超越现有经典计算机的速度。
潘建伟团队发展了... 阅读全帖 |
|
a***e 发帖数: 27968 | 27 本来量子计算目前就是一坨qbit.这东西并行性搞翻某些算法没毛病而已
你要丘比特搞定无理数空间干啥,不就是50丘比特模拟一下就是了
量子告诉你,连续的世界是个假象,你搞啥无理数不是作么? |
|
c***1 发帖数: 652 | 28 吐血了 白宫文件说those waiting for lpr这可以指所有等绿卡的人 也可以指满足某
些条件的人 理论上讲哪怕我perm刚刚交也算waiting for lpr. 而移民局细则明确把这
个人群限定在those who filed adjustment of status。白宫是领导 不可能说那么细
。而移民局是实施者 用的都是很清楚没有歧义的技术用语。
白宫那个fact sheet只是给彻底的外行大致看一下 根本没有可施行性。要看干货还得
看uscis memo。我就纳闷了 uscis memo 说的那么清楚 你还一直纠结这个泛泛的白宫
文件干啥呢? |
|
q*z 发帖数: 13362 | 29 多核的作法我觉得很正常
图像处理的算法并行性很高,半导体工艺提高了,同样的die size,多塞几个core,省得重
新设计逻辑,或者提高频率费电.make sense
出来 |
|
h*******x 发帖数: 12808 | 30 你这就是非科班出身的geeker典型问题,知道很多时髦名词,但是不了解这些名词的具
体含义。忽悠一般人没问题,但别忘了程老大的“高体”可是p大cs研究生的必修课。
你说的这些:多发射,乱序执行按序提交,分支预测都是用来挖掘的指令集并行性的具
体技术,统称为superscalar的技术,核心问题在于解决乱序执行带来的数据冒险和预
测失败的快速恢复,常见算法包括register renaming,scoreboard,tomasulo,牺牲
者trace等等。所有这些算法都是在上个世纪八九十年代的paper里面提出的。在90年代
也基本都被用到了cpu的设计中了。
其实同频比较是没有什么太大的意义,有些cpu的体系结构就是为了简化单条指令功能
以便细化pipeline可以做到更高的频率来提高性能,risc基本理念就是这样,p4,mips
也是这样。有些结构的设计,增加单条指令的功能,做到低频率也有很高的性能,这是
超长指令字的基本理念,比如ia64架构的安腾处理器。具体哪种结构性能好,没搞出之
前谁也不知道,而且受到当时工艺很大的限制。
另外提高工艺可不是想象的那么简单。光刻技术受到光波波... 阅读全帖 |
|
h*******x 发帖数: 12808 | 31 有必要的说明的这么细吗?弄得跟上课似的,除了咱俩别人更看不懂。给大众看的东西
,我都尽量简化了,谁买cpu,还去看看先学学tomasulo怎么回事?
我啥时候争论risc/cisc了?我帖子里面压根就没出现cisc的字眼吧,VLIW和cisc可不
是一回事。我当然知道现代x86在微指令的级别都是risc结构了,只是一时手懒没打而
已。我举例子是想说,把cpu放到同频率去比较性能来说明设计优劣没有意义。
扯到cache容量和内存带宽之类这就是另一件事情了,属于存储架构的设计,在书里面
就是另一个章了,这里面又有很多的新的说道。
影响性能的很多,编译器和os的设计,都会影响到性能,这东西讨论下去就没个完,一
本书都写完不完。
至于争论superscalar包括什么更没意思,我说他们都是挖掘指令级并行性的方法,这
个没错吧。
上面这些都没啥,学术上争论,我就不计较了。可是我啥时候说T4500性能很烂了?这
是我的原帖:
******************************************
发信人: handsomex (潇潇细雨), 信区: PKU
标 题: Re: 微风看... 阅读全帖 |
|
l*********i 发帖数: 483 | 32
锡
会
~~~~~~~~~~~~~~~~~~~不至于吧
,
应该是做个presentation之类
的
吧,宣读论文?
、
议
家 |
|
|
S******e 发帖数: 688 | 34 恭喜,恭喜。
懂行的给说说这个是不是像报道中说的一流?
不是不相信,就是想印证一下。多谢。 |
|
n*******u 发帖数: 343 | 35 据分析,“在国际xx大会上宣读论文”似乎是做会议presentation的标准中文译法,呵呵
吧
类 |
|
a******g 发帖数: 88 | 36 PPoPP确实是一流,不过大陆以前有没有就想不起来了... |
|
j****u 发帖数: 1413 | 37 请注意文章的定语,这是来自中国大陆高校和科研机构的第一篇论文。
这个事实是专门核实过的。此前Intel(还是IBM) 中国实验室发过一篇文章,
但文章的知识产权是属于鬼子资本家的。论文有和海外校友的合作,但第一作
者是科大研究生,所有算法设计、实验都是在科大完成的。这篇是第一篇产
权属于真正属于大陆高校的。 |
|
x*b 发帖数: 253 | 38 我们这个方向2005大陆的11篇文章全军覆没。
今年叶一片都没有。
上
成 |
|
|
a**x 发帖数: 215 | 40
胡向辉是我大学同班同学(9517),刚刚在中城故乡味搓了一顿
上来就看到这篇帖子,有意思。
锡
会
、
议 |
|
x***u 发帖数: 336 | 41 at least it is a good start. Glad to see that. I worked with hua bei in
college.
上
成 |
|
s******y 发帖数: 28562 | 42 最近,由中国科学技术大学潘建伟院士领衔的量子光学和量子信息团队,在国际上首次
完成用量子计算机求解线性方程组的实验。该研究成果发表在6月7日出版的《物理评论
快报》上。
线性方程组广泛地应用于几乎每一个科学和工程领域,包括数值计算、信号处理、经济
学和计算机科学等。比如与我们日常生活紧密相关的气象预报,就需要建立并求解包含
百万变量的线性方程组,来实现对大气中各种物理参数(温度、气压、湿度等)的模拟
和预测。而高准确度的气象预报则需要求解具有海量数据的方程组,假使要求解一个亿
亿亿变量的方程组,即便是用现在世界上最快的超级计算机也至少需要几百年。2009年
,美国麻省理工学院教授塞斯·罗伊德等提出了用于求解线性方程组的量子算法,认为
借助量子计算的并行性带来指数级的加速,将远远超越现有经典计算机的速度。
潘建伟团队发展了世界领先的多光子纠缠操控技术,成功运行了求解一个2×2线性方程
组的量子线路,首次从原理上证明了这一算法的可行性。审稿人评价 “实验工作新颖
而且重要”、“这个算法是量子信息技术最有前途的应用之一”。《物理评论快报》把
该论文选为重点推介论文,并且在美国物理学会的网站专... 阅读全帖 |
|
d********u 发帖数: 5383 | 43 为什么“起始成本低"?怎么把现有的BUSINESS LOGICS移植到云上?谁来做移植的事?
谁来维护?怎么扩展?安全性怎么解决?怎么解决并行性?通讯效率怎么保证?这些事
是那些叫嚣云的人永远也不告诉你的,因为他们也不知道。
目前的云跟以前的GRID(顺便说一句,当年有人叫嚣GRID比谁都起劲,现在不知道为什
么,又转到云上来了,没他不懂的),再以前的CLUSTER,还有现在的WEB SERVICE,到
底啥区别?不要上来先来两结论,里头包俩新名词。那是给VC装B用的,不解决实际问
题。
这个事情不是拷贝几个脚本就解决的事。你搭一堆SERVER,然后跑个OFFICE ONLIEN或
者GOOGLE DOC,就叫云?
顺便说一句,中小企业是指人数说的,不是指他们做的事情。30人的小企业做的事,你
连听都听不懂。这也是为什么ERP市场如此混乱的原因--SAP以为自己NB,拿出去的东
西跟SHIT一样。为什么?因为他不懂人家企业的真正需要,只是卖以前的老底,瞎JB实
施而已。相反,一些小企业却玩儿的风声水气,就是因为他懂。云的实施也一样,什么
都不懂你怎么去帮别人实施呢?可话又说回来了,你真 |
|
w****w 发帖数: 521 | 44 应该说是函数式的思维,不是过程式的。
说到复杂度,我这里基本上只说了我要什么,没说怎么去得到。照现在SQL Server/
Oracle Engine的水平应该能优化到你们那样先把所有行排序,给个行号再做下去。这
个所有行排序显然不是必需的,会严重影响并行性。再过10年,我的code在2万个core
上的SQL Sever 2024上运行,绝对会比你们的快。 :) |
|
t****g 发帖数: 35582 | 45 OS基于GPU写不太可能吧。
OS的几大核心功能,任务调度,内存管理,设备驱动并行性都不高。
就连老黄也没狂到要取代CPU,GPU在可预见的将来也就是个协处理器的角色。 |
|
a***e 发帖数: 27968 | 46 7970按说法是通用性强很多
但数据上没表现出来
其实图形的那些很多不需要通用性的
从AMD的那个介绍,改进的部分其实和图形关系不大
主要是改善通用计算的调度和编程
另外因为内存结构,可能crossfire的scale会好很多
所以俺怀疑这个gaming图形性能也就这样了,基本就是SP#*GHZ
ATI架构整体还是小SP,高频和nV的大SP对掐
只不过这个3D的东西并行性好,多SP占便宜
同样的做法放到CPU就被秒了
虽然推土机多线程也很牛叉 |
|
d******a 发帖数: 32122 | 47 比如两块benchmark 9000的CPU
通过并行计算等等协调,或者干脆用在支持双CPU的主板上
计算能力比benchmark 9000x2=18000的单CPU如何? |
|
N*******t 发帖数: 66 | 48 就是计算每个节点的流域面积吗?如果是,这实际上是个很简单的问题,接近O(n)复杂
性吧。简单地说就是,把那些节点连成有向图,然后先历遍所有叶子节点(最上游节点
),计算它们的流域面积(就是节点面积),然后历遍那些已计算流域面积的节点的下
游节点,对那些它们所有上游节点都已计算流域面积的节点计算流域面积(就是把上有
节点的流域面积加起来再加上它自己的节点面积)。然后按这个方法依次历遍下游节点
,计算流域面积。希望没理解错楼主的问题。
node |
|
l*****a 发帖数: 135 | 49 这里牛人多,问个python的小白问题。
python建的web service性能能和java建的匹配吗?前段时间要建个web service,需要
并行性等等很好,IT组最后还是用了java的。我是无所谓,我不是纯码工,但是很好奇
。 |
|