H****g 发帖数: 14447 | 1 我们先来看一则新闻的标题:“联合早报:胡温过去10年在农民心中享很高威望”。
再来看这个结论如何得出来的,
“我们在中国河南省中部的一个行政村落,进行了一项中国农民“幸福感”的实证调查
。这个村落是一个典型的中国农村,农民收入主要依靠种地和外出务工。为了获得更加
准确的信息,我们选择了实证调查中的访谈法,即以面对面采访、交流的形式进行。我
们平衡了年轻农民(80后、90后农民)、中年农民、老年农民的比例,主要就5个问题
进行了访谈,最终采集到有效样本61份。
在对“这10年,您认为自己是更幸福了,还是更不幸福了?”问题的回答中,有54人明
确回答“更幸福了”,5人明确回答“更不幸福了”,2人回答“说不清楚”。换句话说
,近九成人认为现在更幸福了。”
在对“这10年,您对政府最不满的地方是什么?”问题的访谈中,有60人明确以及近似
的回答是“腐败”,1人选择了不回答。而在对这个问题的深度访谈中,55人认为“中
央是好的,就是县、乡、村太腐败了”,5人认为“从上到下都腐败”。即,绝大部分
农民对中央较信任,对基层尤其是乡级、村级单位极度不信任。“
在“对新一届领导人有何期待和希望?”问题的访谈中,51人明确以及近似回答“给农
民更多实惠,为农民多做好事”,9人回答“减少贫富差距”,1人回答“不知道”。
全文见:
http://www.takungpao.com/news/content/2012-10/12/content_121542
下面就来分析一下这则新闻。首先来说,一个61人的样本,能不能代表中国7亿多农民
呢?(2010年,中国有7.2亿纯农民,就是不包括农民工在内的农民了。http://news.xinhuanet.com/politics/2010-02/24/content_13035879.htm)。
这就是一个概率统计里常见的抽样确定样本规模的问题了。如果是做case study,也就
是深入研究某个群体,就不需要大规模抽样。如果是推断总体情况,那么定量分析时,
一般就需要大规模的样本。因为前者强调特殊性,后者强调代表性。
如果是对农村人口进行1%的抽样调查,那么抽样误差为3%,95%的置信度就需要1067个
样本。如果置信度提高到99%,就需要1849个样本。如果抽样误差降低到2%,95%的置信
度就需要2401个样本,99%置信度就需要4160个样本。 像人民网搞了一个<2011干部新
观念调查报告>,就是"随机抽样调查干部6572人,其中东部地区2310人、中部地区2120
人、西部地区2142人;网友3235人;随机抽样调查普通公众1360人"。
从上面这些分析就可以推论出,联合早报记者的所谓调查,用61个人的杨本来推断全国
7.2亿人,实在是有些莫名其妙,不知道哪里学的调查方法。
当然,即使是人民网的调查,虽然样本规模没有问题,但是也缺乏一个必要的数据,那
就是non-response rate。这个数据反映的是,到底有多少比例的人实际参与了调查。
比如说,你调查了10个人,最终是30个人愿意配合,回答了你的问卷。这么,response
rate就是30%。
为什么这个数据很重要呢?因为这反映出了Nonresponse Bias,也就是说,那些不愿意
接受调查的人,沉默的人,实际上也是一种表态了。联合早报调查的是河南一个村子。
一个村子如果有1000人,最后有61个人接受调查,那就是说,有高达95%的人,根本不
愿意就当前的政府表态。而最终参与调查的人,很可能是村里的干部,积极分子,以及
家属。这些人的态度,却被当作了这个1000人村子的所有人的态度。并且进一步推广到
全国7.2亿农民。不能不说,联合早报记者是文科脑残。 |
l******t 发帖数: 55733 | |
a****l 发帖数: 1696 | 3 你这是无理取闹。
1, “最终采集到有效样本61份”,他们有说全部对1000多个人发出邀请了吗?即使有
,愿意接受采访,但样本被确定无效,最后得到61,也不能用你那个公式计算non
response rate。不要以为别人不懂好不好?
2,人家最后一段承认了研究可能存在的局限性。
“需要说明的是,我们的调查主要反映中西部的传统农村,至于能否反映东部沿海城镇
化程度较高的农村,仍需检验。另外,由于各种因素的制约,我们的样本的数量不够大
,但是这并不妨碍我们此项研究的意义。更重要的是,我们的调查结果,在真实性以及
典型性方面具有很强的说服力。”
你为啥不提?任何调查采样都有这样那样的问题。交代清楚了,不造假,就可以了。
【在 H****g 的大作中提到】 : 我们先来看一则新闻的标题:“联合早报:胡温过去10年在农民心中享很高威望”。 : 再来看这个结论如何得出来的, : “我们在中国河南省中部的一个行政村落,进行了一项中国农民“幸福感”的实证调查 : 。这个村落是一个典型的中国农村,农民收入主要依靠种地和外出务工。为了获得更加 : 准确的信息,我们选择了实证调查中的访谈法,即以面对面采访、交流的形式进行。我 : 们平衡了年轻农民(80后、90后农民)、中年农民、老年农民的比例,主要就5个问题 : 进行了访谈,最终采集到有效样本61份。 : 在对“这10年,您认为自己是更幸福了,还是更不幸福了?”问题的回答中,有54人明 : 确回答“更幸福了”,5人明确回答“更不幸福了”,2人回答“说不清楚”。换句话说 : ,近九成人认为现在更幸福了。”
|
H****g 发帖数: 14447 | 4 一个村子1000人不算多吧。像莫言老家,一个乡51个自然村,4.5万人,平均起来就是
882人/村。
【在 l******t 的大作中提到】 : 那1000人在那呢?你丫这逻辑也够强大的
|
H****g 发帖数: 14447 | 5 无论如何,事实就是,一个村子成百上千人,只有61个人接受了调查。而作者用这个61
人的调查结果,代表了7.2亿农民。
【在 a****l 的大作中提到】 : 你这是无理取闹。 : 1, “最终采集到有效样本61份”,他们有说全部对1000多个人发出邀请了吗?即使有 : ,愿意接受采访,但样本被确定无效,最后得到61,也不能用你那个公式计算non : response rate。不要以为别人不懂好不好? : 2,人家最后一段承认了研究可能存在的局限性。 : “需要说明的是,我们的调查主要反映中西部的传统农村,至于能否反映东部沿海城镇 : 化程度较高的农村,仍需检验。另外,由于各种因素的制约,我们的样本的数量不够大 : ,但是这并不妨碍我们此项研究的意义。更重要的是,我们的调查结果,在真实性以及 : 典型性方面具有很强的说服力。” : 你为啥不提?任何调查采样都有这样那样的问题。交代清楚了,不造假,就可以了。
|
a****l 发帖数: 1696 | 6 调查采访多少人,是一个统计精确性和成本之间权衡的问题。需要多大的样本,取决于
很多因素,这是个专业问题。人家做个调查,一公开,大把的统计专家在那里盯着,根
本轮不到mitbbs上的菜鸟来挑这种毛病。你如果要挑毛病,可以用这种思路。比如,找
出某统计专业人士对该调查的质疑,那样比起你的质疑更有公信力得多。另外,如果有
人发现他们实际采访了100人,然后扔掉39个,而且不加解释,这就违反了基本的统计
工作的职业道德,那么该研究也基本可以扔进垃圾堆了。
61
【在 H****g 的大作中提到】 : 无论如何,事实就是,一个村子成百上千人,只有61个人接受了调查。而作者用这个61 : 人的调查结果,代表了7.2亿农民。
|
H****g 发帖数: 14447 | 7 但是无论如何,也不能根据61人的调查结果得出如下的结论,对不对?
过去10年 胡温在农民心中享很高威望
2012-10-12 12:02:23 联合早报
新加坡《联合早报》日前作了一项关于中国农民过去10年幸福感的问卷调查。调查
显示,近九成中国农民认为过去10年幸福感增多了,享受了诸多优惠的政策。中共领导
人胡锦涛、温家宝在农民心中有很高的威望。
【在 a****l 的大作中提到】 : 调查采访多少人,是一个统计精确性和成本之间权衡的问题。需要多大的样本,取决于 : 很多因素,这是个专业问题。人家做个调查,一公开,大把的统计专家在那里盯着,根 : 本轮不到mitbbs上的菜鸟来挑这种毛病。你如果要挑毛病,可以用这种思路。比如,找 : 出某统计专业人士对该调查的质疑,那样比起你的质疑更有公信力得多。另外,如果有 : 人发现他们实际采访了100人,然后扔掉39个,而且不加解释,这就违反了基本的统计 : 工作的职业道德,那么该研究也基本可以扔进垃圾堆了。 : : 61
|
a****l 发帖数: 1696 | 8 当然可以,除非这61人不具代表性。是否具备代表性,这也是个统计专业问题。你觉得
不能代表,对不起,我不信你,我信专家,而且还要是实名专家,因为那样说话有代价
。统计的前提就是要找到有代表性的样本,手段之一就是随机性。你能质疑他们样本选
择的随机性吗?证据?你自己说一大通是没用的,因为我不信你。你引用实名专家的质
疑,那么我可以考虑阅读该专家的分析。这就是我对待网上信息的态度。
【在 H****g 的大作中提到】 : 但是无论如何,也不能根据61人的调查结果得出如下的结论,对不对? : 过去10年 胡温在农民心中享很高威望 : 2012-10-12 12:02:23 联合早报 : 新加坡《联合早报》日前作了一项关于中国农民过去10年幸福感的问卷调查。调查 : 显示,近九成中国农民认为过去10年幸福感增多了,享受了诸多优惠的政策。中共领导 : 人胡锦涛、温家宝在农民心中有很高的威望。
|
M******a 发帖数: 6723 | 9 这脑残是跟你共记者学的吧。
记得前些年,有个报道说“北京有15%的爸爸在替别人养孩子”,内容是做亲子鉴定的
父亲有15%发现孩子不是自己的。
这明明是“做亲子鉴定的”有15%,你共记者愣是说成所有的爸爸中的15%。
其实这反映的是,怀疑孩子不是自己亲生的,有85%都怀疑错了。 |