T*******I 发帖数: 5138 | 1 http://www.wuda-alumni.org/forum/A0/p0/html/439.html
zt 贴于2005/10/12 12:23 (武汉大学校友论坛)
(陈希孺,1934年2月11日生于湖南省望城县,1956 年毕业于武汉大学数学系,
后就职于中国科学院数学研 究所。1961年到中国科技大学从事数理统计教学与研究 工
作至今。陈希孺1980年任教授,1981年任博士生导 师,1997年当选为中科院数理学部
院士,现担任中国数理统计学会理事长及中国统计学会副会长等职。)
解放以来特别是改革开放20余年来,我国在发展数理统计学方面取得了很大的成
绩。同时我们也很清楚,与先进国家相比,我们仍有一段不小的差距。我们不难列举出
这一差距的种种表现。笔者认为,差距的存在不是主要问题。重要的在于“运行机制”
(借用一个流行的经济学术语)。“机制”对了。学科的发展走在正确的道路上,进入“
良性循环”,弥合现有的差距就不是难事。
日本可以作为一个例子,从时间上说,日本在这个学科上起步不比我们早。大致
上,日本的数理统计学是二战后“从零开始”发展起来的。时至今日,虽然日本在数理
统计学的理论研究方面并未有给人深刻印象的建树,但在应用和方法研究方面,其成就
得到国际公认,有些成果有很大的应用价值,如大家熟悉的正交表,赤池关于模型选择
的AIC准则及田口关于试验设计的工作等,其在应用上普及的程度也肯定属于国际领先
,以至有人估计,在日本战后的“经济奇迹”中,数理统计方法的应用占了5%的份额
。而这也不过经历了二三十年的时间。笔者认为,这些成绩的取得,得力于日本统计学
家在研究工作中的应用取向及优良的外部环境。这后一点指的主要是全社会上下对数理
统计方法的重要意义的认识和接受。这构成了数理统计学科发展 “良性循环”的基础
。下面我们还将回到这个问题上来。
妨碍我国数理统计学发展的主要因素是什么?这是一个在数理统计学界内部常常
议论的问题。有一个论点得到不少人的认同,即认为由于我们把数理统计学看成数学的
一个分支,采用发展纯数学的方法去发展数理统计学,特别是在成果评价方面,宣理论
轻实用。这种“政策导向”使许多数理统计学者对实用问题不感兴趣。研究内容流于空
疏,无补于实际。因此也就难于获得社会的支持。这一切使学科发展的“良性循环”无
法形成。
这个论点言之成理,笔者也是基本上赞同的。但是觉得,我们还应该往深处想一
想:为什么会形成这种局面?如何才能改变这种局面。我觉得,这里面有历史和现实的
原因,并非全是我国数理统计学工作者的责任。但是,也有我们自身的问题。
数理统计学的学科定位问题,对这门科学发展的影响,其实并不如通常所认为的
那么大。数理统计学发达的国家如美国、英国等国,不大议论这个问题,在具体处理上
也是不拘一格的。比如,有的大学统计学科是设在数学系内,也有分立的,纯数学式的
统计研究工作也末受到排斥,而这些并末影响这门学科的健康发展。但这有一个前提:
数理统计学的应用和方法研究上一直占主流的地位,这一点从未引起质疑,数理统计学
的应用价值得到社会广泛的确认。而这又保证了这方面的研究工作得到应有的评价,不
至于发生在我们这里不时提及的,颇带人为性的“评价标准”的问题。笔者觉得,这些
问题在我们这里尚未得到很好的解决,而这是更有实质意义的差距。
有一种观点认为数理统计学是一门 “实验科学”(Experimental Science),即
如物理学、化学等那样,它的成果的确立不是依靠逻辑的推导,而要经受实践的检验,
笔者认为,这是基于数理统计学的下述重要特点:在一般情况下,数理统计学对问题所
提供的解,从应用的标准看,不但没有唯一性,也不存在一种公认为最优的解,你估计
一个参数,检验一个假设,可以有很多方法,它们都可能在某种条件下(如误差符合某
种分布),在某种标准下有优良性,但这种条件在给定的问题中是否满足,所设的优良
性准则在给定的问题中是否恰当,往往有疑问,这使对数理统计工作的评价一般难于在
理论上确立,而必须诉诸实践的考验。这是数理统计学与其他应用数学分支在性质上的
一个重要差别。比如,运筹学是一门应用数学,其中的问题在一般情况下有唯一的解,
明白了这一点,就可以理解为什么无论从当前或从历史上看,获得高度评价的统计学家
和统计工作,没有不是在方法上和应用上作出重大贡献者,也可以明白,为什么无论从
当前或从历史上看,方法和应用(包括交叉学科)方面的研究始终是数理统计学研究工作
中的主流,拿这一点来衡量我国数理统计学研究工作的现状,确实还存在很大的不足之
处。
前面提到学科发展形成“良性循环”的问题。笔者认为,要解决这个问题,固然
与外界环境的改善不无关系,但作为我们数理统计学工作者自身,其应着力的关键之点
,也正在这个地方,即大力加强方法和应用方面的研究,为社会作出实在的贡献,这样
才能增加本门学科的“显示度”,使社会认识这门学科的重要性,从而获得更大的支持
,这就改善了学科发展的外部环境。在市场经济的条件下,像数理统计学这样有很强的
应用性的学科,如果没有一定的“显示度”,仅空洞地呼吁其重要性是不能解决问题的
,经费问题是如此——看看数理统计学发达国家的情况可以明白这一点:充裕的经费支
持了大量的方法和应用研究,也有余力支持一些与应用关系不那么密切的理论研究。就
是成果评价的标准问题,也与这一点有密切的关系。
这就回到了本文开始时提到的那个“机制”问题。确实,我们现在缺乏一个使数
理统计学能得到快速发展的良好机制,研究经费的困难,成果评价标准的不合理,研究
工作取向的偏差和人才流失等,都是这一点的反映。认为造成这一切的一个重要原因,
是把数理统计学当作一个数学分支及由此派生出的一些后果的观点,也有其表面上的合
理性。但笔者坚信,其更深层次的原因,还在于上面谈到的“缺乏显示度”的问题,而
这一点,正是我们中国数理统计学工作者应该致力的方向,当然这里也有一个外界环境
的问题。但如前面所论述的,这外界环境的改善也与我们自己的努力有关,不是可以坐
等得来的。
谈到我国的数理统计学理论研究工作,在此,我们姑且把这种工作定义为既不包
含分析统计数据的方法,也不针对一个特定的应用课题的工作。笔者认为,当前存在的
问题,一是从研究队伍的结构看,这部分占的比重偏大,虽然近年来情况开始有所改善
,但还未得到根本的扭转。这里的问题,当然不是通过什么措施来人为地调整这个结构
,这个状态的形成,有其历史和现实的原因,根本的转变非一朝一夕之功。何况从绝对
数量看,我国从事数理统计理论研究工作的人数与先进国家相比,仍是少得多,调整队
伍结构,应着眼于“增量”而非“存量”,即形成一种机制以引导后来者多投入到方法
和应用的研究中去,这一点在前面已有论及。
当前存在的另一个主要问题,是理论研究工作的质量问题。这个问题当前在我国
表现很突出,且是我们数理统计学者自身能够有所作为而不是很受制于外部环境的方面
,故尤其值得引起我们的重视。
美国著名统计学家Tukey1962年发表了题为“数据分析的未来”的长篇文章,其
中论及对数理统计工作的评价标准。他提出,首先要看其对分析数据工作有无直接或间
接的作用。这“间接的作用”,就包含理论研究工作在内,其大焉者奠定学科的理论框
架,为学科的发展、揭示新的方向或思路,或开辟新的研究分支和领域。费歇尔、奈曼
和瓦尔德这些大师们的彪炳史册的工作,是这方面的典范。如费歇尔在1921年发表的题
为《理论统计学的数学基础》和1925年发表的题为《点估计理论》的文章,虽则并末提
出新的统计方法,但其中所提出的概念和理论框架,主导了以后许多年的数理统计学的
研究思路(如相合性、有效性、“似然”概念等),其影响延续至今,以致上世纪末国际
统计界在回顾20世纪数理统计学发展的历程和展望未来的发展方向时,还有一些人提出
挖掘费歇尔的统计学遗产的问题。这些大师们的顶级工作,不是常有。以此作为标准来
要求,未免是不切合实际。但近来也有不少统计学家提到,当前数理统计学的发展,面
临一个突破的契机。原因是由于科技的发展及人类收集数据能力的提高,给数理统计学
提出了愈来愈复杂的数据处理问题。这种问题,如果仍在现行的数理统计学规范(大致
说,这是指统计方法基于概率理论这种规范)下去处理,多显得力不从心,亟须有新的
思维和新的理论,以建构新的框架,从这种观点看,数理统计学的理论研究工作,仍是
一个大有可为的事业。
Tukey所说的数理统计学理论成果对数据分析的间接的意义,依笔者的理解,大
量的经常性的方面体现在对方法的支撑上,虽然从实用的层面我们不妨把数理统计学看
成一门“实验科学”,一个方法只要在实践中证明了其有用性,就有存在的价值。但这
不应理解为不须对其理论根据进行探讨,如果我们通过理论上的研究阐明了该方法的理
论根据,它的应用条件,优良性,与其它方法的对比以及可能改进的途径,则不仅富有
认识上的意义,也有实用的意义。能在这些方面有所建树的理论研究工作,就是好的工
作。可以举一个具体的例子。设为估计某一参数(向量)β,引进了估计量β,并在一定
条件下证明了其渐近正态性
(此处因为数学符号无法表示省略有关公式)
系数矩阵C(9)依赖于未知参数9,因而上述结果还不能直接用于统计推断。一般的做法
是用取代C(9)中的9,而认为仍成立C(9。)(9。—9)一m(o,1),后一形式就可用于(大
样本)统计推断。这个替代在理论上的合法性,在简单情况下容易证明,对较复杂的情
况有时很麻烦,在文献中多置而不论,然而,这个问题在实用上有意义,不能视为是一
个学究式的问题。
Tukey在他1962年文章中提出,若是一件数理统计学的理论研究工作直接或间接
地都无补于数据分析这一目的,则可以其数学水平去评价它。就是说,能把一个有统计
学背景的数学问题解决得彻底或有本质的推进,有很大的难度。在解决这个问题时方法
有独到和创新之处,这种工作也可以获得一定的评价。Tukey指出:如果一件工作在实
用标准和数学标准上都无可取之处,则这种工作必然很快退出入们的视野而被遗忘。
缺乏实用价值但具有数学美的工作,在统计文献中也不乏其例子,如关于收敛速
度的工作。一般地,收敛速度只能以数量级的形式表出。例如……之类,其中所含常数
无法定出,因而无法据此去了解估计量与其被估计值在一个具体的样本量n之下能达到
多少,但如能够在最弱的条件下定出最优的收敛速度,则仍不失为在数学上有意义的工
作。又如某个结果原来是在“误差有界”的条件下证明的,现把它改进为只要求误差有
某阶矩存在,这项工作,从数据分析的方法角度看,并无多大意义,因为在现实问题中
,误差总是有界的,但如果能证明所定出的矩的阶数已达到最小且具有数学上的深度,
则不失为有意义的工作。
检视一下我国数理统计工作者近几十年来所发表的论著,人们不能不感到,那种
不符合Tukey所提出的两个标准之一的工作,占据了不小的份量。我国数理统计界要提
升自己在国际统计界的地位,这是一个应当努力的主要方面,尤其是要重视统计方法的
研究,看看当前数理统计学方面影响因子最高的几种主流刊物,如JASA,Econometrika
,JASS 和Biometrika之类,所刊载的文章都是以方法研究为重点,就是理论气味最重
的统计刊物——美国的Annals of Statistics,为迎合重视实用、重视方法的潮流,近
年来在风格上也颇有些变化。当然,对一个具体的研究者来说,其研究风格在或大或小
的程度上受制于自己的条件,不是说一定要去迎合这种潮流,但是笔者认为,如果你从
事的是数理统计学的理论研究工作,则不能忽视Tukey所提出的这两条标准。
振兴我国的数理统计学,寄希望于年育一代,因此培养人才的问题值得特别重视
,在这方面有许多值得考虑的问题。
笔者1980年曾在美国一个大学的统计系工作过近2年,就近观察过他们的教学情
况。他们课开的门数比我们多,学生能有机会接触统计学更多的领域,每门课的课时不
多而用的教本并不浅。例如时间序列分析这门课,用的是BrockweU和Davis合著《Time
Series:Theory and Methods》,这本书篇幅大,内容深,即使具有较好的数学和概率
基础的人,要读懂也要费一把劲,但这门课只上15周,每周3学时,因为在课堂上老师
不讲证明推导,而只讲概念和方法。然后布置大量的习题让学生在下面去完成,这些习
题都是来自各种领域的真实的应用课题,附有大量的数据,要使用软件在计算机上完成
。记得当时在该系的几位中国留学生经常在机房工作到清晨一、两点钟,就为完成这些
习题。通过这样一种方式的学习,学生能比较熟练地掌握在实际中常用的一些时间序列
分析方法,并能将其用于解决工作中碰到的问题,这种教学方式比较适合数理统计专业
这样一个特点:其毕业生绝大多数都要到实际部门工作,对于他们,多学会一些方法并
熟悉其应用是首要的,至于理论,基本上要靠学生的自学。在大量的学生中,总会有一
少部分数学和概率基础较好且对理论感兴趣的人,对这种人,如果有一本好的教科书或
参考书,理论部分不难自己补上,这一部分人中相当多的也会进入研究生阶段的学习,
在那里也还有机会补上,他们将来有条件从事数理统计学理论和方法的研究工作,或在
高等学校任教。因此,这种教学方式起了一个“分流”的作用,不是把学生都培养为一
个模式的人。
我们则与此相反,课堂教学务求仔细,要求一切问题都在课堂上解决,但由于授
课时间有限,只好压缩内容,这种教学方式不给学生留下思考的余地,不利于发挥学生
学习的主动性,也不利于培养学生刻苦钻研的精神。求学好比游公园,老师的作用好比
导游,导游指点一个大略,提醒一些值得看的地方,真正的妙处所在,还得自己用心领
略,一切依靠导游,难有真正的收获,这种教学方式还起了一个人为拉平的作用,使资
质好的变成平庸,而平庸的也无所长进。
教材方面问题也很多,主要是老化,跟不上学科的发展。近几十年来数理统计学
有不少有意义的新进展,目前在教材中还很少有所反映,这也与教学方式有关,讲得过
细,要使学生不大费力就能接受,就不可能容纳更多的东西,讲者也习惯于用旧有的教
材和老的方式去讲授,因为这样做更省力。
在研究生培养方面,一个突出的问题是过于重视论文而忽视了学科知识的广度和
深度,造成所谓“硕士不硕,博士不博”。有的统计学先进的国家,硕士不必有论文,
博士虽要求有论文,但不必在答辩前公开发表。在我们这里,博士3年,要求在答辩前
至少在相当级别的刊物上发表论文2篇以上,有的还要求上SCI,这样“急就章”赶出来
的文章,其水平如何,可想而知;更有甚者,不可讳言,如今研究生招生规模急剧扩大
,质量就难以从严要求。有的研究生刚入学时,对本门学科尚未充分入门,这时即要求
他开始写文章,岂非强人所难。有的甚或不能不基本上由导师越chu代庖。由于这方面
要求紧且有时限,只能把主要精力投入这一方面,实际收效不大,而把课程学习荒废了
。所以,在这一点上亟宜有所改进。以上的议论,当然不是放松要求,而是表明笔者对
“学位”的一种看法。笔者认为,不应以成熟学者的标准来要求博士。博士学位,关键
还在于“博”,即能通晓本学科的全貌,打下较深厚的学问根基,初步掌握治学的方法
,不在一时有多少表现,而在于后劲,缺乏后劲,将来就走不远,也就不能真正成才。
本文发表的见解,只是根据笔者所见所闻及历年治学的经验教训,不一定都妥当
,但笔者相信,这些都是值得重视的问题,关系到我国的数理统计学能否健康发展,希
望能引起同行们的关注、批评和讨论。 | g*****o 发帖数: 812 | 2 你眼睛是瞎的么,还是文盲?
陈老前面说统计要加强应用,并不是说要抛弃数学。
而后面提到tukey的说法,是说他看到的很多研究既没有实用性也没有数学性。
你脸真是比地壳还厚,不知道是本来就那么厚,还是自己打脸肿成这么厚的
【在 T*******I 的大作中提到】 : http://www.wuda-alumni.org/forum/A0/p0/html/439.html : zt 贴于2005/10/12 12:23 (武汉大学校友论坛) : (陈希孺,1934年2月11日生于湖南省望城县,1956 年毕业于武汉大学数学系, : 后就职于中国科学院数学研 究所。1961年到中国科技大学从事数理统计教学与研究 工 : 作至今。陈希孺1980年任教授,1981年任博士生导 师,1997年当选为中科院数理学部 : 院士,现担任中国数理统计学会理事长及中国统计学会副会长等职。) : 解放以来特别是改革开放20余年来,我国在发展数理统计学方面取得了很大的成 : 绩。同时我们也很清楚,与先进国家相比,我们仍有一段不小的差距。我们不难列举出 : 这一差距的种种表现。笔者认为,差距的存在不是主要问题。重要的在于“运行机制” : (借用一个流行的经济学术语)。“机制”对了。学科的发展走在正确的道路上,进入“
| T*******I 发帖数: 5138 | 3 Have I ever said "统计要要抛弃数学"?
【在 g*****o 的大作中提到】 : 你眼睛是瞎的么,还是文盲? : 陈老前面说统计要加强应用,并不是说要抛弃数学。 : 而后面提到tukey的说法,是说他看到的很多研究既没有实用性也没有数学性。 : 你脸真是比地壳还厚,不知道是本来就那么厚,还是自己打脸肿成这么厚的
| g*****o 发帖数: 812 | 4 lol
那你就快点滚去学数学,不要在这里捣浆糊
【在 T*******I 的大作中提到】 : Have I ever said "统计要要抛弃数学"?
| T*******I 发帖数: 5138 | 5 我已经拥有了足以完成自己的工作的数学知识。当然, 如果以前可能的话, 我会尽量多
学一点。不过, 我的同事也是个国内数学本科到硕士, 然后来美国读的统计PhD, 前几
天跟我聊数学在统计里的意义时说过一句话: "他妈的, 老子以前学了那么多的数学,
现在在统计领域连1%都用不上。" 我猜如果他是数学PhD, 这个比例可能会更低。
如果用概率论做判断, 他的意思应该就是, tmd, 高等的数学在统计里面的几乎没用。 | g*****o 发帖数: 812 | 6 是啊, 统计只用到数学专业的一小部分, 你就在这里叫喳喳说看不懂也不用看懂
讲真的, 你要不要去检查下, 我怀疑你大脑的连接异于常人
【在 T*******I 的大作中提到】 : 我已经拥有了足以完成自己的工作的数学知识。当然, 如果以前可能的话, 我会尽量多 : 学一点。不过, 我的同事也是个国内数学本科到硕士, 然后来美国读的统计PhD, 前几 : 天跟我聊数学在统计里的意义时说过一句话: "他妈的, 老子以前学了那么多的数学, : 现在在统计领域连1%都用不上。" 我猜如果他是数学PhD, 这个比例可能会更低。 : 如果用概率论做判断, 他的意思应该就是, tmd, 高等的数学在统计里面的几乎没用。
| T*******I 发帖数: 5138 | 7 其实, 皮尔逊们当年搞回归分析, t-test的时候, 不就是用了简单的加减乘除么。那时
还没概率论和数理统计呢。但他们的方法却是流传万世的方法。
所谓的数理统计, 是试图用数学的语言和逻辑等形式化统计学方法论构建实践的一种尝
试而已。没有这类数学语言和逻辑, 统计学不会走向荒谬或死亡。
【在 g*****o 的大作中提到】 : 是啊, 统计只用到数学专业的一小部分, 你就在这里叫喳喳说看不懂也不用看懂 : 讲真的, 你要不要去检查下, 我怀疑你大脑的连接异于常人
| g*****o 发帖数: 812 | 8 你太搞笑了, 你自己去搜搜看gosset推导出t分布的过程吧, 还加减乘除. 还没有概率
论, 那个年代早就有最小二乘法了.
你这个逻辑也特别可笑, 你的意思就是, 反正牛顿发现万有引力的时候也没相对论, 更
没有量子力学, 所以这两者并不重要. 反正没有这两样, 汽车照开就行, 其他的无所谓.
【在 T*******I 的大作中提到】 : 其实, 皮尔逊们当年搞回归分析, t-test的时候, 不就是用了简单的加减乘除么。那时 : 还没概率论和数理统计呢。但他们的方法却是流传万世的方法。 : 所谓的数理统计, 是试图用数学的语言和逻辑等形式化统计学方法论构建实践的一种尝 : 试而已。没有这类数学语言和逻辑, 统计学不会走向荒谬或死亡。
| T*******I 发帖数: 5138 | 9 那可否请你帮个忙把Gossett的t-test的原文发给我看看?我的email chenlgyq@hotmail
.com 或 [email protected]
/* */。我是认真的。谢了。
谓.
【在 g*****o 的大作中提到】 : 你太搞笑了, 你自己去搜搜看gosset推导出t分布的过程吧, 还加减乘除. 还没有概率 : 论, 那个年代早就有最小二乘法了. : 你这个逻辑也特别可笑, 你的意思就是, 反正牛顿发现万有引力的时候也没相对论, 更 : 没有量子力学, 所以这两者并不重要. 反正没有这两样, 汽车照开就行, 其他的无所谓.
| g*****o 发帖数: 812 | 10 你自己不会搜么,我只管灌水,我才懒得取证
hotmail
/* */。我是认真的。谢了。
【在 T*******I 的大作中提到】 : 那可否请你帮个忙把Gossett的t-test的原文发给我看看?我的email chenlgyq@hotmail : .com 或 [email protected] : /* */。我是认真的。谢了。 : : 谓.
| T*******I 发帖数: 5138 | 11 Thanks for letting me know what kind of people you are.
【在 g*****o 的大作中提到】 : 你自己不会搜么,我只管灌水,我才懒得取证 : : hotmail : /* */。我是认真的。谢了。
| n*****n 发帖数: 3123 | |
|