T*******x 发帖数: 8565 | 1 转知乎
想像一下你是一个973首席科学家,你的课题是用一个牛逼闪闪超级计算机模拟一杯水
,看看在里面慢慢拽铁球阻力有多大。你的想法很简单:直接精确模拟每个水分子!
你给电脑里输入了水分子的真实大小(一个参数),形状(比如说用了2000个参数描述
)和不同距离的作用力(又用了2000个参数),你的超级计算机很牛,直接模拟了10^
26个水分子。然后你把铁球也建了模放了进去,用计算模拟的方法算出了让铁球慢慢前
进需要克服的阻力。和实验一比,发现精确吻合!好开心,只要再模拟几回,多攒点数
据就可以发nature了!
这时系统管理员给你发email,说你占了太多的cpu时间,别人啥事都干不了。让你想办
法把计算量减少一点。
怎么办呢?你想了想,觉得铁球这么大,你不用把模拟搞得这么精细也能得到正确答案
。所以你决定把模拟用的水分子体积加10倍,这样就只要模拟10^25个分子了。但是光
这样搞不行,得出的结果肯定不对,因为有些纳米级的小运动造成的宏观效果没了。这
时你有一个学生说,老板,其实咱可以试着改改另外那4000个参数,说不定能把失去的
东西给补偿回来。你觉得靠谱,开动聪明的大脑想了想,心算出了每个参数需要的改变
。于是你用更大的分子和新的参数重新计算,精确的再现了之前得到的数据。(注意,
这时你已经对你的系统进行了一次 renormalization)
系统管理员觉得你好欺负,又要求你降低占用的资源。
你大手一挥说“这简单,我能把cpu时间降到1/10000000000”,你就把刚才那个增大分
子尺寸+调整参数的过程重复了10遍,现在你的分子体积比真实水分子大10^11次方倍,
但是你仍然牛逼的算出了和实验精确相符的阻力。
在你的nature 文章里,把为了简化计算发明的这个方法叫Renormalization group (RG
)。把每次模拟时水分子的大小叫做RG scale, 然后你把每次用的参数按照水分子的大
小列了个表,把它们在尺寸增加时的变化,叫做参数的RG running。你把用这种方法得
到的这个新模型,叫做low energy effective theory (EFT).
最后,你有点惊讶的发现,当你一步步增大水分子尺寸时,本来都很关键的4000个参数
,有些干脆变成0了,有些参数和其它的参数成正比了。总之到最后,你只用了大概10
个自由参数就完美的描述了这一杯水。你把那些最后没用的参数叫irrelevant
parameters,把它们描述的形状/作用力叫irrelevant operator. 你把这些irrelevant
parameter/operator 都去掉,得到的那个精简的理论模型就叫做renormalizable
theory。它和你之前得到的EFT几乎是一样的。
这时,系统管理员又来欺负你,说你能不能就模拟两个水分子,这样他就可以用超算玩
游戏了。但是这回你两手一摊,说哥们这真不行,如果我的水分子选的比我的铁球还大
,那无论怎么调参数,我的计算肯定失败,下一篇science就发不出来了!(在水分子
的例子里,RG scale不应当接近铁球的尺寸,在真正的场论里,有技术可以允许把RG
scale选择的和物理过程的尺寸相当。但是在任何情况下,RG scale都不应该比物理过
程的尺寸更长。)
而且,重整化了很多次之后,似乎你得到的这个的系统越来越不像一个个水分子。那它
像什么呢?你发现剩下的那几个参数里,其中一个的计算值和实验测出来的密度一样,
其中一个和温度一样,另一个和压强一样,等等。也就是说这个系统经过了多次重整化
之后变得更像一杯连续流体而不是很多小分子。这个现象也非常普遍,因为自然界中不
同尺度的现象本来就是很不一样的。你于是在文章中指出重整化可以用来研究不同尺度
的规律之间的联系和转变。
-------
吐个槽,“重整化群”真是物理名词界的一朵奇葩,把一个本来平易近人的词翻译的不
明觉厉。这个词英文是 renormalization group(RG). Normalize 大家都认得,基本
意思是给一个变量乘个常数,让它更符合一些简单要求。比如几何里说 normalized
vector, 就是说改变了一个矢量的定义,让它的长度等于一. re-normalize 就是不断
的 normalize. group 这里是泛指变换,不指数学上严格的群。renormalization
group 的字面意思就是“不断重新定义参数的一组变换”。
-------
警告!前方有大量物理名词出没!!
重整化群在物理中有很多深远的影响。标准模型是我们描述粒子物理的基本理论,它是
一个renormalizable theory. 从RG的角度看,它就相当于我们在上面把尺度扩大的10^
10得到的effective theory。也就是说,真正的基本理论埋藏在比标准模型小的多的尺
度。标准模型的尺度是多少呢?是10^-18米。所以终极理论描述的过程要比这个还小的
多。我们离终极理论还很远很远。
现在想象,如果你的计算机无限强大,你能模拟无限大的一杯水。(现在不考虑铁球了
)你不断的重复上面的这个RG过程,最后会怎么样呢?很可能,最后当你增大分子体积
的时候,你发现系统的所有参数都不再需要变化了!这时,你就说你的系统有了scale
symmetry,尺度不变性。你把这个尺度不变的模型叫一个不动点。后来你发现,可以乱
改最初的那个精确分子模型的参数,但大部分情况下,经过很多轮RG running,它还是
跑到了同一个不动点。你就说所有这样的微观理论都属于同一个universality class.
有时系统也会跑到另一个不动点。所以你发现RG对输入的微观系统实现了一个分类。这
个和机器学习很像。(如何理解“深度学习和重整化群可以建立严格映射”,这一结论
对领域有何影响? - 物理学) 两个非常不一样的系统宏观上行为可以是完全相似的(
属于同一个universality class)。比如在三相点的水,和在相变临界态的铁磁体就可
能属于同一个universality class。在物理体系里,这个分类和相变的对称性破缺有关。
-------
@Alex Huang 问了一个很好的问题:重整化群对什么样的系统是有效的?也就是说,什
么情况下这个办法能有效的简化模型,降低计算量?
重整化群有效本质原因是不同尺度的过程之间往往有一种相对的独立性。如果你的系统
是这样的,那重整化群的方法会给你有用的结果。
想像一下你站在一艘长200米的大轮船上,波长一米的小浪你能感觉到吗?即使同样的
浪高,如果波长变成200米,这浪就能让船晃起来,让你晕的不行。所以,短距离的过
程(波长一米的浪)对长距离的过程(大船的行驶)基本影响不大,最多可能就是改变
了大船遇到的阻力。所以如果我们在模拟时可以不直接再现这种短距离过程,只要改变
一些长距离的参数(行船的阻力)把它们的影响合适的加进去,就仍然可以精确的模拟
系统长距离上的行为。当然在更复杂的问题里,你需要用计算的方法得出每一个参数随
RG scale的变化,这样你自然能算出最终那些参数是重要的。
-------
最后,我在这里故意回避了量子场论,牺牲了一些技术细节,是想让非物理专业的读者
对重整化的概念和操作有一个直观的认识。本文的目的是让读者以后能想起来用RG的思
路解决问题。以上对RG的理解是上世纪量子场论的重大进步之一,后来也被用于描述其
它物理体系。主要的推动者是前年去世的 Kenneth G. Wilson, 这个理解方式也被叫做
Wilsonian RG。基于这个想法,Wilson同时也提出了用离散格点模拟量子场论的办法,
这个方法今天叫lattice QCD, 需要用到目前世界上最好的超级计算机,和本文中水分
子模拟也有更多直接对应的地方。我昨天听说,lattice qcd终于被发展到可以从第一
原理出发,精确的计算质子和中子的质量差。(这也是当下唯一的办法。) Wilson泉
下有知,也可以安心了!本小弱特以此文向Wilson和做lattice qcd的猛士们致敬。 |
T*******x 发帖数: 8565 | 2 转知乎
刷到了多年前的老问题,这个问题非常有意义,所以我想从其他角度来回答一下。
我个人对于重整化群的理解为:重整化群将不同能标之间的物理联系起来,它们之间的
联系可以用重整化方程描述。 (能标这个词可能对于不学物理的人来说比较陌生,但是
我又找不到其他合适的词语,如果你对能标这个词不熟悉,可以简单理解为位置、区域
。)
有关于这句话,其他答主已经描述的比较详细了。然而仅仅是文字描述的话,可能体会
不是那么贴切,其实有一个非常好的简单例子可以用来说明这件事,可以和高赞答主的
回答结合起来看,这个例子是 重力势能。
我们在中学学过,一个质量为 [公式] 的小球,在距离地面高度为 [公式] 的地方,重
力势能为:
[公式]
其中 [公式] 是一个常数。但我们知道,这个公式仅仅在地表附近是适用的,当我们慢
慢离开地球的时候(能标改变),这个公式就不再适用了。
这样一个在一定范围内适用的理论,我们称之为有效理论。与之相对的适用范围更大一
些的理论我们称之为 “完整”理论。那么,对于重力势能,更“完整”一些的理论是
什么呢,这个中学也学过,那就是:
[公式]
其中 [公式] 为万有引力常数,[公式] 为地球质量,[公式] 为地球半径。这个“完整
”理论的适用范围明显就大了很多。
如果我们想要看清“完整”理论和有效理论之间的联系,可以对“完整”理论进行一个
泰勒展开:
[公式]
势能的常数项是不重要的,我们可以看出,有效理论实际上可以理解为是“完整”理论
在某一能标(在这个问题上,这一能标是地球附近)的低阶近似。
一般来说,“完整”理论是比较复杂的。一般讨论物理问题时,只需要讨论相关能标附
近的物理就足够了,不需要讨论“完整”理论所覆盖的全部能标范围。同时也有很多时
候,我们压根不知道正确的“完整”理论是什么样子的。
基于各种各样的原因,我们还是想用 [公式] 这样简单的公式。
那么,该怎么做呢?
我们可以把“完整”理论中的其他效应,整合重力加速度 [公式] 中,把它换成一个有
效重力加速度 [公式],把公式写成:
[公式]
显然此时[公式] 是一个和 [公式] 有关的因子了,在不同的能标 [公式] 处,[公式]
是不同的。
这便是不同能标处的物理不同。但如果你只考虑某一个能标的物理,你仍然可以把你所
在能标的 [公式] 当作一个常数来输入,然后用简单的公式进行计算。即使你不知道正
确的“完整”理论是什么样子,你也可以通过实验测出不同能标下的 [公式],然后给
出各个能标下的理论预言。
那么,不同能标的物理该如何联系起来呢?可以用微分方程来描述 [公式] 在不同能标
下的变化:
[公式]
这就是所谓的重整化群方程,将不同能标下的物理联系起来。
[公式] 就是所谓的beta function,是由“完整”理论给出的。在我们这个例子的“完
整”理论给出的结果是:
[公式]
其中的负号是重要的,代表随着高度的升高,有效重力加速度 [公式] 会减小,这也是
符合预期的。 |
T*******x 发帖数: 8565 | 3 看来这个重整化不只是为了对付积分无穷大这么简单的啊,而是一个跨尺度的联系纽带。
研究复杂体系,牛顿拉格朗日的方法不好使了,要用场论的方法。比如物质场,强度场
,速度场,等等。也可以说这是对超多体拉格朗日法的一种简化,把超多体离散系统用
连续统来简化。连续统简化的好处是有一堆分析的工具可以用,最重要的就是能求导。
这是研究复杂系统的第一步。
重整化是第二步。当然还可以有其他的第二步。我觉得。
重整化是研究,目前写出来的这个场论方程,想象它是从超多体超细粒度拉格朗日法,
转化而来的,或者不是转化而来,而是唯象而来,但是也想象它底下有超细粒度的“介
质”,在这种情况下,粗粒化,还能不能得到同样的场论方程?或者说这个粗粒化的过
程能push到什么程度?场论参数在这个过程中应该是连续变化的,同时场论方程形式不
变。如果场论参数发生跳变,意味着相变,或者原场论方程不再适用。
研究复杂体系,还需要很多步骤。这可以说是新物理。 |
V********u 发帖数: 80 | |