|
|
|
|
|
|
w********e 发帖数: 8594 | 1 版上的朋友估计多半读书读得不错。光死读书不行,要学以致用。光用到自己的专业不
行,还要融汇贯通应用到各种地方。比如说灌水的时候就要应用一些基本的统计学知识
。我来指出贴子里两个常见的统计学问题。
1.你的样本有多大?
很多人把管中窥豹,一叶知秋发挥到了极致。看见一个高菜价,就下结论说全国菜价都
高;看见一处空房,就下结论说全国都是空房;看见一个不诚实的天顶星人,就下结论
说所有的天顶星人都不诚实。
但要明白,运用管中窥豹,一叶知秋的前提是我们已经事先知道了数据产生的机制,而
且数据产生机制中没有扰动项或者扰动项很小。在这种前提下,我们就可以用一个观测
值来推测关于整体参数了。如果数据产生机制里有扰动项,特别是扰动项(方差)比较
大的时候,那我们就需要大量采样,以获得比较准确的估计。
2.你的推测有没有Sample Selection的问题?
也许你的样本不小,但如果它没有代表性的话,那也是不能用来作结论的。要是某人基
于监狱里的经历来大谈特谈美国人多么粗野蛮横无知,大家都会觉得好笑,因为这个样
本太没有代表性啦。
但是并不是所有的Sample Selection的问题都这么显而易见。有些Sample Selection的
问题非常隐蔽,以致于发现它们能让你在顶级杂志上发篇文章。我们在这儿灌水倒用不
着在Sample Selection的问题上花那么大的工夫,但至少不要犯显而易见的错误。尤其
是不要故意用没有代表性的样本来作出自己想要的结论。
如果我们的样本很小也没有代表性,那是不是就不能发贴了呢?当然不是。我们来汇报
一个有意思的观测,至少起到了民间记者的作用,满足了大家八卦的需要。只是我们在
下结论的时候要注意到这些问题,或者干脆让读者自己去下结论(顺便跟美国的报纸学
点宣传技巧)。比如我们可以说“今天我被一个天顶星人骗了”,但不要说“天顶星人
都是骗子。“,我们可以说“Family Dollar里卖的东西太差劲了,”但不要说“美国
的东西太差劲了”。下结论时犯了样本偏小或者Sample Selection的错误时,就会引来
一些不必要的争论。菜市场里两个人因为算账算不对而打起来的话,大家一定会觉得很
好笑,是不是?因为统计学的错误而引起的争论和这个是差不多的。
我倒不是好为人师,只是好心指出两点发贴时应当注意的东西,以使大家避免一些不必
要的争论,以便大家的灌水娱乐更上一个档次。 | T*R 发帖数: 36302 | |
|
|
|
|
|