|
|
|
|
|
|
T********N 发帖数: 2680 | 1 这次美国大选,民意调查出现了较大的误差,而且这个误差很奇怪,从去年以来一直到
大选的前几天,调查结果都是希拉里领先几个百分点,但是最后大选的结果,却是特朗
普胜出,我以为,这需要进行纯学术的研究,为什么民意调查会出现较大误差?
作为世界顶尖级的统计学家,我是相当相信民意调查这种手段的,这在统计学上称之为
抽样检验,这个抽样检验技术,是现在大学本科生的数学教育中是属于概率论与数理统
计课程,就是说,如果你过不了这门课程,你就拿不到毕业证书。此外,这门课程也是
全国硕士研究生的考研数学的必考部分,就是说如果你的关于概率论与数理统计课程掌
握得不精,就别想上硕士。
这个抽样调查的原理可以认为是这样,假设有一袋米中,有百分之三十的黑米,百分之
七十的白米,则你不必将袋子里的所有米都数一遍才知道这个比例,你从中任意地抽取
一千粒米,或者一万粒米,如果其中有百分之三十的黑米,你就可以相信黑米的比例大
致是百分之三十了。而且,只要样本数足够多,你就根本不相信它是不准的。虽然说,
从小概率事件的角度讲,是有可能抽了一万粒米结果有百分之五是黑米,但是这样的机
会基本上是不可能出现的。
而且这个统计抽样我国也是应当重视的。例如有人声称在60年代的大饥荒中饿死了几千
万,那么你随机抽取一万名中国人,问问他家里有没有人饿死,就能够相当准确地得出
这个结论是不是谎言。
但是,这次美国的大选之前的民意调查,不同的调查公司,调查中心,都统计出错误的
数字,这就值得统计学界重视,为什么?
这里可以分为两大类的解释,就是说,两种可能,当然都不一定为真,是欢迎学术批评
的。
第一大类是受众喜欢的,就是阴谋论。这里阴谋又可以有几种。而且,如果是阴谋论,
必然是特朗普的阴谋,而不是希拉里的阴谋。因为,故意制造民意是向着她的虚假,就
是说她明明知道自己不太受欢迎,却要制造虚假数据,倒是不大可能。那不成了自己骗
自己?
所以如果是阴谋论成立,我就认为是特朗普精心策划的阴谋。就是说,虚假数据,就是
希拉里的民意调查是乐观的,这个结论是特朗普精心策划的,为的麻痹对手。这样希拉
里一旦乐观,就不再继续努力,结果上当。
而怎样策划呢?我以为,世界著名的民意调查机构也就是有数的那么几个,包括欧洲的
机构,因此挨个地去行贿或者操纵,也不是什么难事。
但是还有一种阴谋论的方向,就是民意机构并没有被受贿,还是正常的操作。但是,拥
挤特朗普的人,暗中相互传递了一个“麻痹对手”的指令,让他们故意在有机会接受到
民意机构调查的时候,故意假称自己支持希拉里。
但是,我认为,除了这种阴谋论的解释外,还有一个通常的无阴谋论的民意调查误差的
解释,我在这里指出来,也是为的防止我国就一些问题民意调查也出现这种误差,这种
误差是人类首次由强国论坛的数学网友提出,也可以给一个中国人的名字,就是数学的
头两个字母,sx,因此叫sx误差好了。这其实可以写相当正规的充满数学公式的论文的
,只不过我这个人很颓废,懒得写,就让大家抄袭好了。我也可以称之为“疲劳误差”。
这个民意调查误差,完全是新兴的互联网这种特殊媒体造成的。而且就是最近几年的媒
体变化。
不知道大家是不是有这种事情,但是我是有的,就是在改革开放的头二十几年,这种事
情并不普遍,不常见,只是在最近几年,才出现,我的电话铃一响,我一接通,对方就
问:“要不要贷款?”然后我就挂了。你们大家也是这样的吧?
其实,“要不要贷款”,就是一个民意调查,连续访问几万个人,如果其中有几千个人
恰好要贷款,那就能够算出一个需要贷款的人的比例。
但是因为这几年媒体爆发,这个事情不仅中国历史上是没有的,美国历史上也是没有的。
当一个人每天接到一百个电话都在问”要不要贷款“,就会气坏了,一听到这句话就直
接把电话挂了,我说的这个民意调查误差,就是出现在这里。
就是说,凡是一听到”要不要贷款“的电话立即挂了的人,其实是一种对民意调查的拒
绝态度,是民意调查的拒绝者,之所以拒绝,是因为被搞烦了。这样的人不一定就不贷
款,其实会贷的,但是,因为贷款的操作是很正式的,他完全可以不理任何”要不要贷
款“的电话,而是直接找自己信得过的银行。
美国大选的民意调查,我认为也是这样,就是说,民意调查中心随机地打电话或者在街
头随机的拦住一个人调查,会有人拒绝调查的,他们会认为自己忙着呢,没有功夫搭理
你。
在这种情况下,人群就分为两大类,愿意接受调查者,和不愿意接受调查者,这么两类。
美国的大选进行之前,民意调查者也就是会遇到愿意接受调查者和不愿意接受调查者这
么两类人,而他们只是从愿意接受调查者这个群体中,得出结论,希拉里占上风,但是
他们想当然地认为,不愿意接受调查的人群中,比例也是一样的,可能这就错了。
因为这和政见有关系,有可能是,不愿意接受调查的人,可能脾气更大,或者性格上更
倾向于不合作。而这类人可能更加支持特朗普的政见。但是,这些人虽然不愿意接受民
意调查,正规的投票他们是打算参加的,也打定了主意要投谁的票,但是民意调查中心
就无法知道其比例了。
美国大选的策划和组织者,都有这样的传统,就是一定要想办法把大选弄成一个很好玩
的游戏,而游戏的好玩性,在于它的惊险性,刺激性。正如一个好看的故事片,好人要
在最后一刻十分艰难地打败坏蛋,否则这部电影就没人看。
因此美国大选一定要控制两个候选人的支持率差不多。否则的话,一开始支持率就悬殊
,那选民会觉得没有意思,就不投票了。例如俄罗斯大选,普京支持率高达百分之七十
五,所以大选一点都不好玩,反正都是普京,这就导致俄罗斯的投票率不行。但是讲老
实话,本来比赛不惊险应当是常见情况,如果惊险是常见情况,原本也不正常的。
那么美国是怎样控制支持率的差不多的呢?其实是通过投入的金钱来控制的。就是说,
如果一个候选人的支持率低了,就往这个候选人上面多投入宣传资金,直到他的支持率
高到一定程度,就会停止这种投入。金钱操控其实就是这样进行的。
但是,金钱操控本来是有一个测量器就是民意调查的,但是现在民意调查出现了本文指
出的误差,这是值得重视的。这里的课题是,怎样知道拒绝调查者们的真实态度?但是
这个就挺难的,我现在暂时也没有什么好办法,只是简单地指出问题,如何解决,我暂
时没有答案。 | m**c 发帖数: 7349 | 2 Sample出了问题,oversampling,undersampling,biased sampling....... | d****o 发帖数: 32610 | 3 扯那么半天
媒体都承认了strata搞错了
【在 T********N 的大作中提到】 : 这次美国大选,民意调查出现了较大的误差,而且这个误差很奇怪,从去年以来一直到 : 大选的前几天,调查结果都是希拉里领先几个百分点,但是最后大选的结果,却是特朗 : 普胜出,我以为,这需要进行纯学术的研究,为什么民意调查会出现较大误差? : 作为世界顶尖级的统计学家,我是相当相信民意调查这种手段的,这在统计学上称之为 : 抽样检验,这个抽样检验技术,是现在大学本科生的数学教育中是属于概率论与数理统 : 计课程,就是说,如果你过不了这门课程,你就拿不到毕业证书。此外,这门课程也是 : 全国硕士研究生的考研数学的必考部分,就是说如果你的关于概率论与数理统计课程掌 : 握得不精,就别想上硕士。 : 这个抽样调查的原理可以认为是这样,假设有一袋米中,有百分之三十的黑米,百分之 : 七十的白米,则你不必将袋子里的所有米都数一遍才知道这个比例,你从中任意地抽取
| m**c 发帖数: 7349 | 4 Strata错不到哪里,但是各stratum之间的correlation不太好算
: 扯那么半天
: 媒体都承认了strata搞错了
【在 d****o 的大作中提到】 : 扯那么半天 : 媒体都承认了strata搞错了
|
|
|
|
|
|