如果你不是孬种数学背景的统计学家，请接受挑战 - Statistics版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - 如果你不是孬种数学背景的统计学家，请接受挑战

相关主题
● Great Confucius	● 陈大师的意思我终于有点领会了
● 陈大师的连续性	● 对goldmember的数据的三分回归分析结果
● 数学家们在统计学领域犯下了几个严重的错误	● 答水泡泡：陈立功是谁教出来的？
● can someone please translate this into english for me?	● 陈大师，　我很好奇
● 统计学的新地平线——陈立功与他的自权重曲线	● 居然还有人试图和陈大师讨论统计问题
● 陈来错地方了	● 关于样本空间，欢迎大家前来讨论
● 临界回归模型的连续性	● 好奇问陈老师一个问题
● 长篇消遣：以科学理性为利剑，以艺术激情为锋芒	● 陈立功语录

相关话题的讨论汇总
话题: 临界点话题: 模型话题: weights话题: 期望话题: cr

进入Statistics版参与讨论

(共1页)

T*******I
发帖数: 5138

这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
握了一点数学技能就在统计学里自命不凡。如果他们不是孬种，就请接受我的以下挑战
，并回答我在最后提出的简单问题。回答不了的，或不敢回答的，就请他/她滚回数学里
去讨饭吃，别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
续为版上添乱，我想请seattleren, ningyan, kaleege等人接受我的挑战。当然，我也欢
迎任何人参与严肃的讨论。不能说出个一二三四的，就请自动回避，免得自讨没趣（我
想对pp65说的是，我对你感到抱歉，因为本段最后的话对你来说说得太晚了）。
给定一个两分法的样本（假定X是自变量而Y是因变量，两段都是简单线性模型，且临界
点是在X上）。现行算法及分段模型组的基本表述如下：
hat\y_1 = a1+b1X if X<=t
hat\y_2 = a2+b2X if X>t
ID X Y M CR
1 x1 y1 m1 cr1
2 x2 y2 m2 cr2
3 x3 y3 m3 cr3
4 x4 y4 m4 cr4
5 x5 y5 m5 cr5
6 x6 y6 m6 cr6
7 x7 y7 m7* cr7 min(.)
8 x8 y8 m8 cr8
9 x9 y9 m9 cr9
0 x0 y0 m0 cr0
其中，M是由分段模型组的系数构成的矩阵，CR是分段模型的合并残差。*表示根据最小
CR选定的分段模型，如果我们有 min(CR)=cr7。
在得到m7后，按照强制连续性假设，对分段模型组7解联立方程组得到关于X上的一个解
Gamma
Gamma = (a1-a2)/(b2-b1) (1)
作为临界点t在样本基础上估计的结果。到此为止就是经典的分段回归分析（classical
piecewise regression or segmented regression）。后来，为了满足模型间连接的平
滑性，人们对连接点处进行了平滑处理，得到了一个现代化的样条模型。这就是现行的
分段回归。这个方法从数学的角度非常的正确，无懈可击。
然而，这样得到的临界点仅仅是一个随机的点测量，没有可信区间，在统计学上根本站
不住脚。尽管后来有人为此付出了努力，但基本上都失败了。直到bootstrap方法出来
后，人们才开始用bootstrap来构建临界点的可信区间。
上述基本分析逻辑构成了现当代统计学领域一个非常重要的基础部分，即最优化和强制
连续性。它们被广泛地使用在很多方法论的构建之中，例如生存分析中的比例风险模型
就是以最大似然估计为准则选定的模型。
现在，我对上述分析逻辑提出了批判。认为它在统计学理论上是一个错误。我的观点是
，首先，临界点在抽样条件下是一个随机变量，两段模型间是否连续是不确定的。它们
在抽样条件下一定存在一个连接变异。这个变异有多大多小谁也不知道，因而需要一个
概率进行推断而不是强制性地主观假设它们之间是exactly连续的。从而，用解联立方
程组估计临界点的方法根本行不通。其次，由于X是随机变量，分段模型组的系数矩阵M
以及合并残差CR在搜索过程中也将是一个随机变量，而且X、M和CR之间相互关联。它们
的随机点测量之间的对应是一个随机对应，从而不能由min(CR)来决定E(M)。最后，在
公式（1）中，Gamma具有不可测的变异性，因为分母（b2-b1）可以趋于甚至等于0。因
此，我对上述方法进行了如下改造：
hat\y_1 = a1+b1X if X<=t_bar (t: Threshold)
hat\y_2 = a2+b2X if X>=t_bar
ID X=T Y R M CR CRR=W
1 x1=t1 y1 r m1 cr1 w1=|r-cr1|/r
2 x2=t2 y2 r m2 cr2 w2=|r-cr2|/r
3 x3=t3 y3 r m3 cr3 w3=|r-cr3|/r
4 x4=t4 y4 r m4 cr4 w4=|r-cr4|/r
5 x5=t5 y5 r m5 cr5 w5=|r-cr5|/r
6 x6=t6 y6 r m6 cr6 w6=|r-cr6|/r
7 x7=t7 y7 r m7 cr7 w7=|r-cr7|/r
8 x8=t8 y8 r m8 cr8 w8=|r-cr8|/r
9 x9=t9 y9 r m9 cr9 w9=|r-cr9|/r
0 x0=t0 y0 r m0 cr0 w0=|r-cr0|/r
这里，R是全域模型的预测残差，根据模型的假定它是一个随机常量（因为样本因而模
型都是随机的，但对于给定的样本和模型来说，R是不变的）。由于临界点被假定在X上
，因而它与X拥有同一个可测空间。在两分法中，对X的每个实测样本点就是随机临界点
的实测样本点。这个搜索过程就是在假定每个实测X点作为临界点时对临界关系的改变
的意义或贡献是怎样的，这由CRR来度量。由于我们不知道临界点在哪里，只能这样假
设并搜索，从而得知每个点都有贡献，因此，由一个简单的加权平均估计就可以得到临
界点的期望估计。由此，临界模型就被建立在这个期望临界点之上，由此，两段模型间
的连接变异就可以在该期望临界点处得到测量，从而有了连续性检验的基础。由于有了
权重，我们可以计算临界点的加权抽样误差，从而可以计算其可信区间。而分段模型在
临界点处的CRR就是比较分段模型与全域模型之间的优劣的一个度量。
由于全域模型已经给定了全空间的基本关系型或模型结构，因此，在搜索临界点的过程
中，每次迭代的分段模型都应该与全域模型保持同一模型结构，从而CR就是一个单纯依
从系数的随机改变而改变的随机变量，因而它们之间的误差仅有抽样误差而没有系统误
差。
然而，两分法是一个特例，即其中的临界点数被arbitarily假定为只有一个。在我看来
，即使是临界点数也是不确定的。如果存在一个，是否存在另一个与它一致或不一致呢
？从而三分法的思想就诞生了。为了找到另一个，我构建了两类三分迭代法（对称的和
非对称的）以便为每个临界点构造一个可测空间，并由此得到对它以及它的权重的随机
测量，进而将每个临界点的估计建立在加权平均上。由于每个临界点都有加权的抽样误
差估计，因而采用一个加权的t-检验就可以推断两个临界点是否一致。从而一个样本空
间里的临界点的个数也在概率论上找到了支持。
请问，我的分析逻辑和算法错在哪？显然，任何一个受过统计学常识训练的人都会赞成
这个分析逻辑和算法。现在，请你们回答以下几个问题：
1）X, M, R, CR以及CRR等是否是随机变量？
2）min(CR)与m7之间的对应是一个随机对应还是一个期望对应？
3）我们可否用最优化来决定临界模型的期望？换句话说，对应于min(CR)的临界模型是
稳定的因而是可以被期望的模型吗？
4）所谓的“概率收敛”在CR上会收敛到min(CR)处吗？
如果你不是傻瓜，你一定会做出回答。

p**5
发帖数: 2544

大家都是孬种，所以没人接受挑战。好了吗？

【在 T*******I 的大作中提到】

: 这几天版上总有人找我茬。相信他们无一不是数学背景出来搞统计的。他们以为自己掌
: 握了一点数学技能就在统计学里自命不凡。如果他们不是孬种，就请接受我的以下挑战
: ，并回答我在最后提出的简单问题。回答不了的，或不敢回答的，就请他/她滚回数学里
: 去讨饭吃，别仗着自己那份高深莫测的数学理论继续在统计学里胡说八道。为了不再继
: 续为版上添乱，我想请seattleren, ningyan, kaleege等人接受我的挑战。当然，我也欢
: 迎任何人参与严肃的讨论。不能说出个一二三四的，就请自动回避，免得自讨没趣（我
: 想对pp65说的是，我对你感到抱歉，因为本段最后的话对你来说说得太晚了）。
: 给定一个两分法的样本（假定X是自变量而Y是因变量，两段都是简单线性模型，且临界
: 点是在X上）。现行算法及分段模型组的基本表述如下：
: hat\y_1 = a1+b1X if X<=t

T*******I
发帖数: 5138

我好像没邀请你。因为从你对我曾发过的言论所体现出来的你的判断能力来看，你似乎不够格。Sorry, 请你回家抱孩子去吧。

【在 p**5 的大作中提到】

: 大家都是孬种，所以没人接受挑战。好了吗？

s*****r
发帖数: 790

you are referring to t as boundary point? if so, I don't know what you mean
t is constant. when you calculating t, it is a function of both X and Y,
which implies that t is a random variable, if either X or Y is.

【在 T*******I 的大作中提到】

T*******I
发帖数: 5138

别忘了回答我在最后提出的那几个问题。这些是统计学里的“是非”问题，非搞清楚不
可。

mean

【在 s*****r 的大作中提到】

: you are referring to t as boundary point? if so, I don't know what you mean
: t is constant. when you calculating t, it is a function of both X and Y,
: which implies that t is a random variable, if either X or Y is.

s*****r
发帖数: 790

people don't answer your questions because your questions are un-answerable
since people don't understand what you are talking about. you have to
translate your questions into the language that is spoken by the statistical
community, if you consider your questions are statistical. apparently you
think your questions are higher than that.
strictly speaking, your specification of the model is not formal.

【在 T*******I 的大作中提到】

: 别忘了回答我在最后提出的那几个问题。这些是统计学里的“是非”问题，非搞清楚不
: 可。
:
: mean

T*******I
发帖数: 5138

我对你所说的感到莫名其妙。我的文本中出现的X, M, CR, CRR等都是在使用现行统计算法对样本进行计算的过程中存在或新产生的某个测量或测量集合（例如M, 它是由分段模型的回归系数构成的一个矩阵）。我只是要大家回答它们是否是随机变量？
如果回答是，那么，现行算法中的最优化就是一个错误；如果回答否，即它们不是随机
变量，那么，就等于在确定性系统里讨论非确定性问题，而这将是一个荒谬。
现在，你却在此说我所说的不在现行统计学的概念系统内。

【在 s*****r 的大作中提到】

: people don't answer your questions because your questions are un-answerable
: since people don't understand what you are talking about. you have to
: translate your questions into the language that is spoken by the statistical
: community, if you consider your questions are statistical. apparently you
: think your questions are higher than that.
: strictly speaking, your specification of the model is not formal.

g********r
发帖数: 8017

我又当苍蝇跳粪坑了。抽自己俩嘴巴先。
老陈。那你先回答我几个问题。给定一组数据，你根据什么选择：
（1）两分还是三分。
（2）如果三分，两组分界点哪一组更好。
（3）如果是三分，你是同时搜索一对分界点，还是顺序搜索？
（4）以上三个问题，你是不是要通过某种损失模型做优化？

T*******I
发帖数: 5138

你似乎没看懂我的三分逻辑。我已经说了，如果是两分，即假定只存在一个未知临界点
，那么，为什么我们不可以假定是否存在另一个与它一致或不一致呢？
为此，我构建了两种三分迭代搜索的方法。对于对称性分布来说，临界点不可能都集中
在分布期望的同一侧，因而我们可以根据对称性同步估计两个临界点；如果是非对称性
分布，则可以先假定如果临界点在左侧（低段），那么，我们就要在其右侧（高段）进
行搜索以确定右侧临界点的期望；然后反过来假设以找到低段临界点的期望估计。一般
说来，当样本量是n时，每个临界点将得到对应于n个原始样本点的n个加权期望估计，
然后由这n个期望的加权期望作为临界点的最终期望估计。这样的搜索对于每个临界点
都是一个完全独立的过程，即一个临界点的获得不以另一个的获得为条件。
由于两个临界点均有n个随机点测量及其相应的n个权重，因此，我们可以检验两个临界
点是否一致。
当然，上述的两类三分迭代都存在着一个可测空间的不一致问题。这是一个需要被解决
的问题，因为可测空间不一致，必然导致两个临界点的随机测量之间存在着系统性差异。
上述回答针对你的第一和第三个问题。顺便提醒一句，按顺序搜索（即找到一个后再以
此为基础找到另一个）从逻辑上是不可能的。这个问题我有思考，但没有在文章里阐述。
现在回答你的第二个问题：两组（我觉得应该是两个）分界点那个更好，这将由分段模
型对全域模型的优度来评估。
至于你的第4个问题，我不懂什么是损失模型。我只知道我可以根据全域模型给定的关
系来构造分段模型的基本结构。而迭代搜索的目的正是为了考察全域模型关系在分段临
界搜索过程中的随机变异性，从而以权重估计临界点的期望所在。
请注意，这里有一个关键的逻辑：分段模型的期望唯一地对应于临界点集合的期望，而
不是任何其它。

【在 g********r 的大作中提到】

: 我又当苍蝇跳粪坑了。抽自己俩嘴巴先。
: 老陈。那你先回答我几个问题。给定一组数据，你根据什么选择：
: （1）两分还是三分。
: （2）如果三分，两组分界点哪一组更好。
: （3）如果是三分，你是同时搜索一对分界点，还是顺序搜索？
: （4）以上三个问题，你是不是要通过某种损失模型做优化？

s*****r
发帖数: 790

I don't know how many people understand you, before you explicitly explain
those statistical terms since you may refer to different things.
as for the uncertainty and certainty, I don't know whether you understand
that a random variable is random but its distribution is fixed. I am not
sure you understand the difference.

计算法对样本进行计算的过程中存在或新产生的某个测量或测量集合（例如M, 它是由
分段模型的回归系数构成的一个矩阵）。我只是要大家回答它们是否是随机变量？

【在 T*******I 的大作中提到】

: 我对你所说的感到莫名其妙。我的文本中出现的X, M, CR, CRR等都是在使用现行统计算法对样本进行计算的过程中存在或新产生的某个测量或测量集合（例如M, 它是由分段模型的回归系数构成的一个矩阵）。我只是要大家回答它们是否是随机变量？
: 如果回答是，那么，现行算法中的最优化就是一个错误；如果回答否，即它们不是随机
: 变量，那么，就等于在确定性系统里讨论非确定性问题，而这将是一个荒谬。
: 现在，你却在此说我所说的不在现行统计学的概念系统内。

相关主题
● 陈来错地方了	● 陈大师的意思我终于有点领会了
● 临界回归模型的连续性	● 对goldmember的数据的三分回归分析结果
● 长篇消遣：以科学理性为利剑，以艺术激情为锋芒	● 答水泡泡：陈立功是谁教出来的？
进入Statistics版参与讨论

g********r
发帖数: 8017

好吧。虽然你云山雾罩的还没回答全。我问你“这将由分段模型对全域模型的优度来评
估”这不是优化是什么？

【在 T*******I 的大作中提到】

: 你似乎没看懂我的三分逻辑。我已经说了，如果是两分，即假定只存在一个未知临界点
: ，那么，为什么我们不可以假定是否存在另一个与它一致或不一致呢？
: 为此，我构建了两种三分迭代搜索的方法。对于对称性分布来说，临界点不可能都集中
: 在分布期望的同一侧，因而我们可以根据对称性同步估计两个临界点；如果是非对称性
: 分布，则可以先假定如果临界点在左侧（低段），那么，我们就要在其右侧（高段）进
: 行搜索以确定右侧临界点的期望；然后反过来假设以找到低段临界点的期望估计。一般
: 说来，当样本量是n时，每个临界点将得到对应于n个原始样本点的n个加权期望估计，
: 然后由这n个期望的加权期望作为临界点的最终期望估计。这样的搜索对于每个临界点
: 都是一个完全独立的过程，即一个临界点的获得不以另一个的获得为条件。
: 由于两个临界点均有n个随机点测量及其相应的n个权重，因此，我们可以检验两个临界

T*******I
发帖数: 5138

我想你已经无法自圆其说了。你们的概念系统中存在逻辑混乱。

【在 s*****r 的大作中提到】

: I don't know how many people understand you, before you explicitly explain
: those statistical terms since you may refer to different things.
: as for the uncertainty and certainty, I don't know whether you understand
: that a random variable is random but its distribution is fixed. I am not
: sure you understand the difference.
:
: 计算法对样本进行计算的过程中存在或新产生的某个测量或测量集合（例如M, 它是由
: 分段模型的回归系数构成的一个矩阵）。我只是要大家回答它们是否是随机变量？

s*****r
发帖数: 790

I see. I don't expect you understand.
last question for you:
in your model, the coefficients a and b are all assumed fixed, why the hell
they have confidence intervals? Every statistician calculates confidence
intervals for those "fixed" coefficients. What is wrong with them?

【在 T*******I 的大作中提到】

: 我想你已经无法自圆其说了。你们的概念系统中存在逻辑混乱。

T*******I
发帖数: 5138

我想你误会了。这里虽然有优化，但却根本没有“最”优化。临界点是在加权基础上的期望估计。因而期望的临界模型就由该期望的临界点分割的临界样本来重建，由此得到了期望临界模型的合并残差。这个残差一般来说会比全域模型的同构模型的残差总量小，也就是说分段模型的预测精度提高了，从而我们可以说它相对于全域模型来说可能“更好或更优”，但却不是“最好或最优”，因为“最好或最优”的临界模型是不可期望的，因为它们极不稳定。

【在 g********r 的大作中提到】

: 好吧。虽然你云山雾罩的还没回答全。我问你“这将由分段模型对全域模型的优度来评
: 估”这不是优化是什么？

T*******I
发帖数: 5138

我的模型中的y是戴了hat的，所以，我将等式右边的随机误差项省略了。我没说那是函
数关系，而是说它是由样本估计的统计回归模型。谁都知道那些系数都是随机常量（按
现行概念系统，它们都是随机变量）。

【在 s*****r 的大作中提到】

: I see. I don't expect you understand.
: last question for you:
: in your model, the coefficients a and b are all assumed fixed, why the hell
: they have confidence intervals? Every statistician calculates confidence
: intervals for those "fixed" coefficients. What is wrong with them?

g********r
发帖数: 8017

好。那回到我第二个问题。
给你两组边界点，哪组更好，怎么判断？
在所有可能的边界点对里面，哪组最好，怎么搜寻？
是不是“最优化”？

的期望估计。因而期望的临界模型就由该期望的临界点分割的临界样本来重建，由此得
到了期望临界模型的合并残差。这个残差一般来说会比全域模型的同构模型的残差总量
小，也就是说分段模型的预测精度提高了，从而我们可以说它相对于全域模型来说可能
“更好或更优”，但却不是“最好或最优”，因为“最好或最优”的临界模型是不可期
望的，因为它们极不稳定。

【在 T*******I 的大作中提到】

: 我想你误会了。这里虽然有优化，但却根本没有“最”优化。临界点是在加权基础上的期望估计。因而期望的临界模型就由该期望的临界点分割的临界样本来重建，由此得到了期望临界模型的合并残差。这个残差一般来说会比全域模型的同构模型的残差总量小，也就是说分段模型的预测精度提高了，从而我们可以说它相对于全域模型来说可能“更好或更优”，但却不是“最好或最优”，因为“最好或最优”的临界模型是不可期望的，因为它们极不稳定。

s*****r
发帖数: 790

I don't think they are random variables in the current system. don't you
assume they are constants? If they are not fixed, what randomness do you
assume for them? What is the difference between the "t" and a,b?

【在 T*******I 的大作中提到】

: 我的模型中的y是戴了hat的，所以，我将等式右边的随机误差项省略了。我没说那是函
: 数关系，而是说它是由样本估计的统计回归模型。谁都知道那些系数都是随机常量（按
: 现行概念系统，它们都是随机变量）。

T*******I
发帖数: 5138

这里没有最优化可言。我们只能测量每一对对临界关系改变的相对贡献，并以该贡献为
权重来估计所有“对”的分布期望。
如果你坚持这里有最优化，那么，我给你一组样本人群的身高和体重的测量结果，你觉
得那一对是最优的组合呢？最高身高所在的那一对？还是最矮身高所在的那一对？或者
最大体重所在的那一对，拟或是最轻体重所在的那一对？
显然，只有期望的身高和期望的体重之间构成了一对稳定的对应关系。其它对应都是不
可期望的。

【在 g********r 的大作中提到】

: 好。那回到我第二个问题。
: 给你两组边界点，哪组更好，怎么判断？
: 在所有可能的边界点对里面，哪组最好，怎么搜寻？
: 是不是“最优化”？
:
: 的期望估计。因而期望的临界模型就由该期望的临界点分割的临界样本来重建，由此得
: 到了期望临界模型的合并残差。这个残差一般来说会比全域模型的同构模型的残差总量
: 小，也就是说分段模型的预测精度提高了，从而我们可以说它相对于全域模型来说可能
: “更好或更优”，但却不是“最好或最优”，因为“最好或最优”的临界模型是不可期
: 望的，因为它们极不稳定。

g********r
发帖数: 8017

就是说你不选择临界点喽？那你怎么总结Y～X的关系，并且用它来预测呢？

【在 T*******I 的大作中提到】

: 这里没有最优化可言。我们只能测量每一对对临界关系改变的相对贡献，并以该贡献为
: 权重来估计所有“对”的分布期望。
: 如果你坚持这里有最优化，那么，我给你一组样本人群的身高和体重的测量结果，你觉
: 得那一对是最优的组合呢？最高身高所在的那一对？还是最矮身高所在的那一对？或者
: 最大体重所在的那一对，拟或是最轻体重所在的那一对？
: 显然，只有期望的身高和期望的体重之间构成了一对稳定的对应关系。其它对应都是不
: 可期望的。

T*******I
发帖数: 5138

我真的无法和你继续讨论了。你的概念系统混乱不堪。

【在 s*****r 的大作中提到】

: I don't think they are random variables in the current system. don't you
: assume they are constants? If they are not fixed, what randomness do you
: assume for them? What is the difference between the "t" and a,b?

相关主题
● 陈大师，　我很好奇	● 好奇问陈老师一个问题
● 居然还有人试图和陈大师讨论统计问题	● 陈立功语录
● 关于样本空间，欢迎大家前来讨论	● [合集] 纺锤型的残差图代表什么意思？
进入Statistics版参与讨论

T*******I
发帖数: 5138

我没有从n个或k对临界点中选择一个“最优的”，而是肯定它们都有意义，只是意义的
大小不同，因而只能用它们的全体来估计一个或一对期望的临界点。由此就可以在各临
界子集中建模型了。因为临界点是期望的估计，这样建立的临界模型当然就是期望的了
。没有比这个“更好”的了，因而它们才是真正的最优估计。

【在 g********r 的大作中提到】

: 就是说你不选择临界点喽？那你怎么总结Y～X的关系，并且用它来预测呢？

g********r
发帖数: 8017

总算从陈大师嘴里套出点能听得懂的话了。
你的意思就是model averaging喽。那页不是什么新鲜东西啊。再问：
你怎么知道你赋给每对临界点的权重是最好的呢？
如果你说你知道，那么你选择权重的过程不又是一个最优化过程么？

的大小不同，因而只能用它们的全体来估计一个或一对期望的临界点。由此就可以在各
临界子集中建模型了。因为临界点是期望的估计，这样建立的临界模型当然就是期望的
了。没有比这个“更好”的了，因而它们才是真正的最优估计。从而你就知道了，哪里
还要做什么CV？简直是画蛇添足，多此一举。

【在 T*******I 的大作中提到】

: 我没有从n个或k对临界点中选择一个“最优的”，而是肯定它们都有意义，只是意义的
: 大小不同，因而只能用它们的全体来估计一个或一对期望的临界点。由此就可以在各临
: 界子集中建模型了。因为临界点是期望的估计，这样建立的临界模型当然就是期望的了
: 。没有比这个“更好”的了，因而它们才是真正的最优估计。

d******e
发帖数: 7844

我觉得陈大师最伟大的发明，就是这个“随机常量”。

【在 T*******I 的大作中提到】

T*******I
发帖数: 5138

在回归分析中，预测误差是构造权重测量或optimizer的一个比较好的选项。几乎所有
的类似方法学都是这样做的。差别只是criterion的选择不同。最优化使用的是最小CR
，而我则用它构造了权重测量，从而将临界点的估计建立了加权期望之上。这是方法学
领域的一个重大差别。它完全抛弃了传统的最优化思维逻辑，转而采用了最原始的统计
期望估计的办法。

【在 g********r 的大作中提到】

: 总算从陈大师嘴里套出点能听得懂的话了。
: 你的意思就是model averaging喽。那页不是什么新鲜东西啊。再问：
: 你怎么知道你赋给每对临界点的权重是最好的呢？
: 如果你说你知道，那么你选择权重的过程不又是一个最优化过程么？
:
: 的大小不同，因而只能用它们的全体来估计一个或一对期望的临界点。由此就可以在各
: 临界子集中建模型了。因为临界点是期望的估计，这样建立的临界模型当然就是期望的
: 了。没有比这个“更好”的了，因而它们才是真正的最优估计。从而你就知道了，哪里
: 还要做什么CV？简直是画蛇添足，多此一举。

T*******I
发帖数: 5138

你需要拥有辩证逻辑才能理解这个概念。遗憾的是，我翻遍了数学大辞典，那里面没有
辩证逻辑的地位，只有演绎逻辑和归纳逻辑。不过，数学是讨论确定性的学科，因而不
需要辩证法，因为这会损害数学的确定性论题；而统计是讨论非确定性的学科，这里不
存在确定性，因而需要辩证法。

【在 d******e 的大作中提到】

: 我觉得陈大师最伟大的发明，就是这个“随机常量”。

g********r
发帖数: 8017

"最优化使用的是最小CR，而我则用它构造了权重测量"
还是要follow优化的东西啦。而且你怎么知道这是最合适的？

CR

【在 T*******I 的大作中提到】

: 在回归分析中，预测误差是构造权重测量或optimizer的一个比较好的选项。几乎所有
: 的类似方法学都是这样做的。差别只是criterion的选择不同。最优化使用的是最小CR
: ，而我则用它构造了权重测量，从而将临界点的估计建立了加权期望之上。这是方法学
: 领域的一个重大差别。它完全抛弃了传统的最优化思维逻辑，转而采用了最原始的统计
: 期望估计的办法。

T*******I
发帖数: 5138

你的错误的或有缺陷的概念系统使得你无法理解权重的意义。这个问题我会在今年的
JSM会议上专门阐述。

【在 g********r 的大作中提到】

: "最优化使用的是最小CR，而我则用它构造了权重测量"
: 还是要follow优化的东西啦。而且你怎么知道这是最合适的？
:
: CR

g********r
发帖数: 8017

回答不出来就说空话。我可是版上很少几个跟你认真讨论的人之一。解释一下你的权重
吧。不要等JSM了。

【在 T*******I 的大作中提到】

: 你的错误的或有缺陷的概念系统使得你无法理解权重的意义。这个问题我会在今年的
: JSM会议上专门阐述。

T*******I
发帖数: 5138

很遗憾，这是个学术秘密。我的所有在网络上公开发表的言论，包括新的统计学方法已
经不是什么秘密，所以可以公开讨论。建议你还是等到年底吧，那时它就公开了。

【在 g********r 的大作中提到】

: 回答不出来就说空话。我可是版上很少几个跟你认真讨论的人之一。解释一下你的权重
: 吧。不要等JSM了。

w****a
发帖数: 114

天啊，你会在这个会上有发言吗？
有日程表了吗？

【在 T*******I 的大作中提到】

: 很遗憾，这是个学术秘密。我的所有在网络上公开发表的言论，包括新的统计学方法已
: 经不是什么秘密，所以可以公开讨论。建议你还是等到年底吧，那时它就公开了。

相关主题
● 问一个Model的问题	● 陈大师的连续性
● SAS问题：SUR之前如何检验同期相关	● 数学家们在统计学领域犯下了几个严重的错误
● Great Confucius	● can someone please translate this into english for me?
进入Statistics版参与讨论

T*******I
发帖数: 5138

准确地说，我从2000年开始就在JSM上发表观点。2007年是关键的一次会议，那次会议
上我提出了一个完整而基本正确的算法，文章被收录在当年的proceedings中；2009年
是一次重要的会议，在这次会议上我从理论上阐述了最优化以及强制连续性等的错误根
源，并进一步改进了2007年会议文章中在算法方面不够完美的地方。尽管2009年的文章
也被收录在proceedings中，但由于版面的限制，我将随即模拟试验、应用实例、讨论
以及绝大部分参考文献都省略了，因为它们都在07年的文章里。
我坚信自己的分析逻辑和算法是几近完美无错的，符合最基本的统计测量的全部逻辑。
在与所有人的面对面的讨论过程中，无一提出异议。

【在 w****a 的大作中提到】

: 天啊，你会在这个会上有发言吗？
: 有日程表了吗？

w****a
发帖数: 114

那你今年什么时候发言？有准确的日程吗？

【在 T*******I 的大作中提到】

: 准确地说，我从2000年开始就在JSM上发表观点。2007年是关键的一次会议，那次会议
: 上我提出了一个完整而基本正确的算法，文章被收录在当年的proceedings中；2009年
: 是一次重要的会议，在这次会议上我从理论上阐述了最优化以及强制连续性等的错误根
: 源，并进一步改进了2007年会议文章中在算法方面不够完美的地方。尽管2009年的文章
: 也被收录在proceedings中，但由于版面的限制，我将随即模拟试验、应用实例、讨论
: 以及绝大部分参考文献都省略了，因为它们都在07年的文章里。
: 我坚信自己的分析逻辑和算法是几近完美无错的，符合最基本的统计测量的全部逻辑。
: 在与所有人的面对面的讨论过程中，无一提出异议。

s*****r
发帖数: 790

＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
does anyone with advanced mathematics knowledge ever seriously discuss your
theory with you?

【在 T*******I 的大作中提到】

a******n
发帖数: 11246

嗯。jsm网站上有。
我打算8月去miami beach一睹大师英姿...

会议
2009年
误根
文章
讨论
辑。

【在 w****a 的大作中提到】

: 那你今年什么时候发言？有准确的日程吗？

y**t
发帖数: 205

I read his 2007 paper and I don't feel the paper is well written. The
definition isn't sophisticated and properties lack proof.

your

【在 s*****r 的大作中提到】

:
: ＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
: does anyone with advanced mathematics knowledge ever seriously discuss your
: theory with you?

g********r
发帖数: 8017

板上肯定好多人去看大师。大师报告以后正好搞个版聚。

【在 a******n 的大作中提到】

: 嗯。jsm网站上有。
: 我打算8月去miami beach一睹大师英姿...
:
: 会议
: 2009年
: 误根
: 文章
: 讨论
: 辑。

t****r
发帖数: 702

It is actually a very good idea but it is definitely not easy to answer any
of following questions.
1. How do you construct weights?
2. How can you show the weights are constructed in a sensible way?
3. In what sense can you consider the weights you constructed is "good"? Pre
diction error?
4. Is there a uniformly best way to construct the weights? And in what sense
it is the best?
5. Is the results subject to things like outliers? For example, say you have
good results using one of your data set, will there be drastic change in th
e weights you previously got by putting in a very strange outlier? I assume
this is not good and is your method can rule out the influence of the outlie
r?
As a matter of fact, this is not actually a very new statistical idea. The w
hole Bayesian predictive theory and model averaging theory are based on this
idea, in other words, constructing weights for each observation or model.
Hope you can shed some lights on these issues.

CR

【在 T*******I 的大作中提到】

T*******I
发帖数: 5138

我的发言时间是7月31日下午。The session number is 43, the section is General
Methodology.
我知道我的概念系统以及统计算法会被那些正统的数学背景出生的统计学同行视为异端
。这也是我为什么宁可选择会议渠道发表自己的观点和方法的缘故。我无视他们的知识
背景。
在现行的分段回归分析的算法中，那些数学背景出来搞统计的人竟然无视Kolmogorov所
创立的概率论中的基本概念！！例如，在抽样条件下，临界点一定是一个随机变量。既
然如此，它就一定有一个可测空间，一定有一个分布，从而一定有唯一的期望存在!!!
那些数学头脑们怎么会搞出那么一个方法论？这实在是统计学领域的一大悲哀。

【在 w****a 的大作中提到】

: 那你今年什么时候发言？有准确的日程吗？

T*******I
发帖数: 5138

你无需问这个问题。如果你受过最基本的统计学理论和方法学训练，你一定可以从本贴
的首贴里发现我所说的是否正确。如果你不能，那么，你就该反思你所学的是否是统计
学。
与我讨论过的人都是真正在统计学领域工作的人们，不是masters，就是PhDs.
最后提醒你一句：1) Statistics =/= Mathematics
2) Statistics 不属于 Mathematics, or The set of Statistics is
not a subset of the set of Mathematics.
它与数学之间是一个交集关系，也就是说，它有一部分内容是无法按照数学模式进行处理的。

【在 s*****r 的大作中提到】

:
: ＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝＝
: does anyone with advanced mathematics knowledge ever seriously discuss your
: theory with you?

T*******I
发帖数: 5138

You are right. 我的背景是医学专业，而我根本没有在美国受教育的经历，所以无论
是专业表述，还是语言方面都存在着很多问题。最主要的问题是几个地方的数学表述不
规范。但这些问题在09年的文章里已经得到几乎完全的纠正。
不论怎么看07年的文章，一个完整而正确的分析逻辑被提了出来，而我所建立的统计算
法也基本正确，但不够完整和完美，所以，2009年做了改进。
至于说到性质的证明，我做了一个，应该说这个证明基本上正确，但在语言叙述上依然
存在改进的空间。这个证明就是关于sample size的两个基本性质的证明（我相信这是
统计学历史上第一个人试图这样做）：
1）它本身是一个权重和；
2）它是在所有其它权重的测量都等于1的条件下的特例。
从而，一切建立在sample size上的常规统计量中的n都可以用权重和来取代。这应该是
一个非常重要的结论。
数学家们所操纵的统计学专业期刊普遍追求一切形式上的严谨性，却忽视了一个个简单
的新思想的出现。这对统计学的进步带来了很大的阻碍。

【在 y**t 的大作中提到】

: I read his 2007 paper and I don't feel the paper is well written. The
: definition isn't sophisticated and properties lack proof.
:
: your

相关主题
● can someone please translate this into english for me?	● 临界回归模型的连续性
● 统计学的新地平线——陈立功与他的自权重曲线	● 长篇消遣：以科学理性为利剑，以艺术激情为锋芒
● 陈来错地方了	● 陈大师的意思我终于有点领会了
进入Statistics版参与讨论

T*******I
发帖数: 5138

你提出这些问题我可能会回答一部分，因为在我的abstract中已经部分地指出了解决的
方向，例如，权重的标准化。
关于权重，在目前的统计学理论和实践中存在很多认识上的误区，是时候予以澄清了。
这里面将出现大量的新概念和新思想以及新算法。其中最重要的就是我提出的自权重的
新定义和新算法。我毫不怀疑它是统计学领域的一道崭新的地平线。它源自一个深刻的
哲学沉思而非任何数学定理和证明。它就是一个计算思想，恰如算术平均数的计算思想
一样，是不需要任何数学定理和证明来支持的。

any
1. How do you construct weights?
2. How can you show the weights are constructed in a sensible way?
3. In what sense can you consider the weights you constructed is "good"? Pre
diction error?
4. Is there a uniformly best way to construct the weights? And in what sense
it is the best?
5. Is the results subject to things like outliers? For example, say you have
good results using one of your data set, will there be drastic change in th
e weights you previously got by putting in a very strange outlier? I assume
this is not good and is your method can rule out the influence of the
outlier?
w
hole Bayesian predictive theory and model averaging theory are based on this
idea, in other words, constructing weights for each observation or model.

【在 t****r 的大作中提到】

: It is actually a very good idea but it is definitely not easy to answer any
: of following questions.
: 1. How do you construct weights?
: 2. How can you show the weights are constructed in a sensible way?
: 3. In what sense can you consider the weights you constructed is "good"? Pre
: diction error?
: 4. Is there a uniformly best way to construct the weights? And in what sense
: it is the best?
: 5. Is the results subject to things like outliers? For example, say you have
: good results using one of your data set, will there be drastic change in th

s*****r
发帖数: 790

我就问你一个基本问题吧。你的新理论是关于统计的，你说统计是关于随机变量的。
那么你至少需要知道什么是随机变量吧? 请问你能理解那些随机变量的定义么？或者你
能完备的定义什么是随机变量，什么是分布么？你能理解你所引用的那些名词么，例
如概率空间什么的。你明白那些词么？
你一直在问这边的人懂不懂你的东西，那么你能回答我上面的那些问题么？如果你不能
明白你自己的理论所基于的基本概念，你怎么明白你自己的结论？

【在 T*******I 的大作中提到】

: 你提出这些问题我可能会回答一部分，因为在我的abstract中已经部分地指出了解决的
: 方向，例如，权重的标准化。
: 关于权重，在目前的统计学理论和实践中存在很多认识上的误区，是时候予以澄清了。
: 这里面将出现大量的新概念和新思想以及新算法。其中最重要的就是我提出的自权重的
: 新定义和新算法。我毫不怀疑它是统计学领域的一道崭新的地平线。它源自一个深刻的
: 哲学沉思而非任何数学定理和证明。它就是一个计算思想，恰如算术平均数的计算思想
: 一样，是不需要任何数学定理和证明来支持的。
:
: any
: 1. How do you construct weights?

A*******s
发帖数: 3942

看我以前的评论
发信人: Actuaries (striving), 信区: Statistics
标题: Re: 统计学的新地平线——陈立功与他的自权重曲线
发信站: BBS 未名空间站 (Mon May 9 01:27:16 2011, 美东)
我琢磨他理解的measure就是用尺来量，random measure就是用尺去量一个random
variable

【在 d******e 的大作中提到】

: 我觉得陈大师最伟大的发明，就是这个“随机常量”。

T*******I
发帖数: 5138

随机变量在概率论中有定义，我基本能理解。但我所理解的随机变量是从哲学的认识论
角度来定义的，且这两个定义之间没有什么本质上的差别，不同之处仅仅是语言表述的
风格不同而已。请参考我在09年文章中的表述。
另外，我对Kolmogorov所定义的样本空间很不赞成。我认为那是一个尺度空间，而非样
本空间。我认为样本空间就是样本本身。这是因为这里的空间是一个广义的概念，它被
一个狭义的概念“样本”所修饰。因此，这个空间拥有样本的全部属性，而一个样本的
全部属性由样本所包含的全部个体的全部属性所决定，因而，一个样本空间就是样本自
己。当然，这里可能存在着统计学中的样本与概率论中所说的样本是不同的概念这个问
题。我对此不能确定。
当然，我的上述表述数学家们是绝对不会赞成的。没关系，他们可以继续用他们所熟悉
的概念系统进行思考和论述。但我不会。我需要新的概念系统来思考，因为现有的概念
系统不能使得我以严谨的、无任何混淆的逻辑进行思考。所以，我必须引入新的概念并
修正现有的概念系统。我可能不成功，因此我只把自己的行为称为是一个尝试。
促使我如此行的一个主要因素是，在我本科和研究生阶段学习的应用统计学中，几乎完
全没有概率论中主要的核心基础概念，例如，样本空间、可测空间、概率空间等。我在
做分段回归分析的方法学研究时，梦寐以求的就是如何得到关于临界点的可测空间和随
机分布，一旦我找到了它们，我就可以得到它的期望估计。所以，我觉得这些基本概念
对于统计学非常的重要，由此我也就发现kolmogorov实在是太伟大了。

【在 s*****r 的大作中提到】

: 我就问你一个基本问题吧。你的新理论是关于统计的，你说统计是关于随机变量的。
: 那么你至少需要知道什么是随机变量吧? 请问你能理解那些随机变量的定义么？或者你
: 能完备的定义什么是随机变量，什么是分布么？你能理解你所引用的那些名词么，例
: 如概率空间什么的。你明白那些词么？
: 你一直在问这边的人懂不懂你的东西，那么你能回答我上面的那些问题么？如果你不能
: 明白你自己的理论所基于的基本概念，你怎么明白你自己的结论？

s*****r
发帖数: 790

你基本能理解还是你能理解？
当你说出那些名词的时候，你也许根本不知道你在说什么，你确定你知道么？
你用这些大家所接受的名词指代你所想指代的东西，但是不是大家所知道的，你怎么让
人明白？
你要觉得那些名词不对，有歧义，可以。你重新定义他们，然后再使用它们。但是你没
有能力去重新定义。

【在 T*******I 的大作中提到】

: 随机变量在概率论中有定义，我基本能理解。但我所理解的随机变量是从哲学的认识论
: 角度来定义的，且这两个定义之间没有什么本质上的差别，不同之处仅仅是语言表述的
: 风格不同而已。请参考我在09年文章中的表述。
: 另外，我对Kolmogorov所定义的样本空间很不赞成。我认为那是一个尺度空间，而非样
: 本空间。我认为样本空间就是样本本身。这是因为这里的空间是一个广义的概念，它被
: 一个狭义的概念“样本”所修饰。因此，这个空间拥有样本的全部属性，而一个样本的
: 全部属性由样本所包含的全部个体的全部属性所决定，因而，一个样本空间就是样本自
: 己。当然，这里可能存在着统计学中的样本与概率论中所说的样本是不同的概念这个问
: 题。我对此不能确定。
: 当然，我的上述表述数学家们是绝对不会赞成的。没关系，他们可以继续用他们所熟悉

T*******I
发帖数: 5138

你可以说我没有足够的数学能力去定义它们，但你不能说我不能回答“这是什么？”的
问题。
任何科学理论都是从回答这个最简单的问题开始的。我在自己的思考、计算和分析的过
程中发现了一些新的东西，因而给它们取个名字，并解释它们的内涵，这应该不是什么
困难的事情。至于我说出了自己的定义后，数学家们怎么去再定义，那是他们的事情，
与我无关。

【在 s*****r 的大作中提到】

: 你基本能理解还是你能理解？
: 当你说出那些名词的时候，你也许根本不知道你在说什么，你确定你知道么？
: 你用这些大家所接受的名词指代你所想指代的东西，但是不是大家所知道的，你怎么让
: 人明白？
: 你要觉得那些名词不对，有歧义，可以。你重新定义他们，然后再使用它们。但是你没
: 有能力去重新定义。

s*****r
发帖数: 790

我认为样本空间就是样本本身。这是因为这里的空间是一个广义的概念，它被
就这些，如果是正常语言的话，说明你是多么无知了。统计从来不是研究“样本所包含
的个体”的属性的，尤其你所说的样本所包含的全部个体。
如果你的样本包含了全部可能性，那就不需要统计了。比如，你要试验一种药在某种病
人身上，看看成功率多少。如果所有病人都试验了，那就只需要一些描述就好了。问题
就是你的样本不可能是全部，这才需要统计做inference.样本的目的就是为了对未知的
做认识。

【在 T*******I 的大作中提到】

: 你可以说我没有足够的数学能力去定义它们，但你不能说我不能回答“这是什么？”的
: 问题。
: 任何科学理论都是从回答这个最简单的问题开始的。我在自己的思考、计算和分析的过
: 程中发现了一些新的东西，因而给它们取个名字，并解释它们的内涵，这应该不是什么
: 困难的事情。至于我说出了自己的定义后，数学家们怎么去再定义，那是他们的事情，
: 与我无关。

T*******I
发帖数: 5138

我完全赞成你的阐述。不过，你显然对我所说的领会有误。
我所谓的“样本空间就是一个样本自己”是源自一个简单的概念定义的逻辑。那么，什
么是样本？什么是空间？什么是样本空间？这个概念的定义所体现的逻辑就如同我们用
“女”和“人”来定义“女人”一样简单。所以，我不认为Kolmogorov所定义的“样本
空间”的概念是严谨的，我认为它可以被定义为一个“尺度空间”。
这就是我的一个基本观点。当然，仅是一家之言。我说了，我可能不正确。

【在 s*****r 的大作中提到】

:
: 我认为样本空间就是样本本身。这是因为这里的空间是一个广义的概念，它被
: 就这些，如果是正常语言的话，说明你是多么无知了。统计从来不是研究“样本所包含
: 的个体”的属性的，尤其你所说的样本所包含的全部个体。
: 如果你的样本包含了全部可能性，那就不需要统计了。比如，你要试验一种药在某种病
: 人身上，看看成功率多少。如果所有病人都试验了，那就只需要一些描述就好了。问题
: 就是你的样本不可能是全部，这才需要统计做inference.样本的目的就是为了对未知的
: 做认识。

s*****r
发帖数: 790

==========================
你先定义一下什么是“尺度空间”吧。这是你承认的名词。不是你首创的也可以。然后
你说说杨本空间是怎样可以被定义为一个“尺度空间”的。我想无非就是满足“尺度空
间”的定义中的条件性质什么的，对吧？
这个应该不难吧？就像我们说的，实轴可以认为是一个一维空间，因为满足空间的定
义，blabla....

【在 T*******I 的大作中提到】

: 我完全赞成你的阐述。不过，你显然对我所说的领会有误。
: 我所谓的“样本空间就是一个样本自己”是源自一个简单的概念定义的逻辑。那么，什
: 么是样本？什么是空间？什么是样本空间？这个概念的定义所体现的逻辑就如同我们用
: “女”和“人”来定义“女人”一样简单。所以，我不认为Kolmogorov所定义的“样本
: 空间”的概念是严谨的，我认为它可以被定义为一个“尺度空间”。
: 这就是我的一个基本观点。当然，仅是一家之言。我说了，我可能不正确。

T*******I
发帖数: 5138

尺度空间的概念已经由Kolmogorov定义为了“样本空间”，何须我重复？

【在 s*****r 的大作中提到】

:
: ==========================
: 你先定义一下什么是“尺度空间”吧。这是你承认的名词。不是你首创的也可以。然后
: 你说说杨本空间是怎样可以被定义为一个“尺度空间”的。我想无非就是满足“尺度空
: 间”的定义中的条件性质什么的，对吧？
: 这个应该不难吧？就像我们说的，实轴可以认为是一个一维空间，因为满足空间的定
: 义，blabla....

相关主题
● 对goldmember的数据的三分回归分析结果	● 居然还有人试图和陈大师讨论统计问题
● 答水泡泡：陈立功是谁教出来的？	● 关于样本空间，欢迎大家前来讨论
● 陈大师，　我很好奇	● 好奇问陈老师一个问题
进入Statistics版参与讨论

s*****r
发帖数: 790

你能重复一遍么？你不是认为不一样么？
你就重复一遍，从网上书上copy也可以，然后再列出样本空间的哪些属性满足尺度空间
的条件从而是一个尺度空间。

【在 T*******I 的大作中提到】

: 尺度空间的概念已经由Kolmogorov定义为了“样本空间”，何须我重复？

t****r
发帖数: 702

oh, come on man! 您这发言怎么跟党领导人的报告似地，太虚了吧。一点实质的内容都
没有。好歹给几个直观点的解释啊，别通篇都是说你的方法有多好。就事论事解决问题
啊

【在 T*******I 的大作中提到】

o**o
发帖数: 3964

I can't understand what lz is trying to say. maybe he's got a point, but
obviously lack of proper basic training. 比如楼主认为不确定的量必然服从概率
分布，既然有分布就必然有期望值，等等。

【在 T*******I 的大作中提到】

y**t
发帖数: 205

I download your paper on 2009 JSM proceeding. I have several concerns
regarding your paper but only listed following two.
I'm interested with the concept of "Random Correspondence" in definition 1.2
, which is actually not a new idea (please check "random function" http://en.wikipedia.org/wiki/Random_function). However your didn't point out whether the "correspondence " between two set is finite or not. In case "correspondence" is not finite, I don't know how can you prove the "unique" correspondence when only one observation for x and y.
Also I think Axiom 1.4 is wrong. You state that "all observations of random
variable X defined on random space constitute a single distribution which
has only one expectation". You should know some distribution does not have
1st moment. Please check stable distribution at http://en.wikipedia.org/wiki/Stable_distribution.

【在 T*******I 的大作中提到】

: You are right. 我的背景是医学专业，而我根本没有在美国受教育的经历，所以无论
: 是专业表述，还是语言方面都存在着很多问题。最主要的问题是几个地方的数学表述不
: 规范。但这些问题在09年的文章里已经得到几乎完全的纠正。
: 不论怎么看07年的文章，一个完整而正确的分析逻辑被提了出来，而我所建立的统计算
: 法也基本正确，但不够完整和完美，所以，2009年做了改进。
: 至于说到性质的证明，我做了一个，应该说这个证明基本上正确，但在语言叙述上依然
: 存在改进的空间。这个证明就是关于sample size的两个基本性质的证明（我相信这是
: 统计学历史上第一个人试图这样做）：
: 1）它本身是一个权重和；
: 2）它是在所有其它权重的测量都等于1的条件下的特例。

l***o
发帖数: 5337

你还真有劲教他。。。我看了看他的东东，发现如果他是我的正常朋友或同事，我要建
议他改正的地
方很多，但他显然不是这种能用正常语言接受知识的人，否则统计101的课本到处都是
，他怎么干了
这么多年，还这么概念混乱，轮到你来教他？
知道现在，他也没弄明白（1）要交流必须有共同的语言概念，如果要提出别人没接触
过的（当然没
接触过）概念要先定义。（2）别人搞过的（甚至是常识性的）东西，不是换了名词就
是自己的，何
况还是把严谨的表述换成了娱乐性的。（3）统计学不是哲学，不是靠嘴说就行（其实
真正的哲学也要
严格自洽才有价值），你要至少构造些scenario，证明自己理论的应用价值。
这些不是和他说的（因为没用），是和关心他的人说的，自己想想该怎么办吧。。。

definition 1.2
http://en.wikipedia.org/wiki/Random_function). However your didn't point
out whether the "correspondence " between two set is finite or not. In
case "correspondence" is not finite, I don't know how can you prove the
"unique" correspondence when only one observation for x and y.
random
which
have
http://en.wikipedia.org/wiki/Stable_distribution.

【在 y**t 的大作中提到】

: I download your paper on 2009 JSM proceeding. I have several concerns
: regarding your paper but only listed following two.
: I'm interested with the concept of "Random Correspondence" in definition 1.2
: , which is actually not a new idea (please check "random function" http://en.wikipedia.org/wiki/Random_function). However your didn't point out whether the "correspondence " between two set is finite or not. In case "correspondence" is not finite, I don't know how can you prove the "unique" correspondence when only one observation for x and y.
: Also I think Axiom 1.4 is wrong. You state that "all observations of random
: variable X defined on random space constitute a single distribution which
: has only one expectation". You should know some distribution does not have
: 1st moment. Please check stable distribution at http://en.wikipedia.org/wiki/Stable_distribution.

y**t
发帖数: 205

我好歹也花了一个多小时去读他的paper，至少得发表下看法...

【在 l***o 的大作中提到】

: 你还真有劲教他。。。我看了看他的东东，发现如果他是我的正常朋友或同事，我要建
: 议他改正的地
: 方很多，但他显然不是这种能用正常语言接受知识的人，否则统计101的课本到处都是
: ，他怎么干了
: 这么多年，还这么概念混乱，轮到你来教他？
: 知道现在，他也没弄明白（1）要交流必须有共同的语言概念，如果要提出别人没接触
: 过的（当然没
: 接触过）概念要先定义。（2）别人搞过的（甚至是常识性的）东西，不是换了名词就
: 是自己的，何
: 况还是把严谨的表述换成了娱乐性的。（3）统计学不是哲学，不是靠嘴说就行（其实

T*******I
发帖数: 5138

你显然不能说我所说的全错。没错，我也不认为我所说的全对。但其中必有很多新的概
念和突破性的新思想。而一个新的思想就是一个新的分析逻辑，从而导致一个新的算法。
请不要用严酷的既定法则去衡量一切新的概念和新的思想。这只会窒息学术生命。

的课
哲学，

【在 l***o 的大作中提到】

(共1页)

进入Statistics版参与讨论

相关主题
● 陈立功语录	● 统计学的新地平线——陈立功与他的自权重曲线
● [合集] 纺锤型的残差图代表什么意思？	● 陈来错地方了
● 问一个Model的问题	● 临界回归模型的连续性
● SAS问题：SUR之前如何检验同期相关	● 长篇消遣：以科学理性为利剑，以艺术激情为锋芒
● Great Confucius	● 陈大师的意思我终于有点领会了
● 陈大师的连续性	● 对goldmember的数据的三分回归分析结果
● 数学家们在统计学领域犯下了几个严重的错误	● 答水泡泡：陈立功是谁教出来的？
● can someone please translate this into english for me?	● 陈大师，　我很好奇

相关话题的讨论汇总
话题: 临界点话题: 模型话题: weights话题: 期望话题: cr

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天