D*a 发帖数: 6830 | 1 请问下大家,我想计算类似下面的population的样本量
比如喜欢A的人数占总体的10%,我想知道95%置信区间下需要取多少样本
查了一下,是n= Z*Z (p(1-p))/e^2
其中z=1.96,
我理解p就是0.1了吧,那么我e分别取0.05 0.1 0.2, 得出的样本数是
138.3
34.6
8.6
这个看着还比较符合我的直观经验
不过我想算假如某种情况下喜欢A的占总体的20%了,
那么p=0.2, 算出来的样本数是
245.9
61.5
15.4
那么我想问,如果有20%的人都喜欢A,相对10%的人来说,不是应该取样量减少么?同样的理解,如果变成只有5%的人喜欢A,那么不是更难取到一个准确样本么?应该取样量增大才对呀?
问题很菜,还请各位不吝赐教。。。 |
g********d 发帖数: 2022 | 2 Required sample size increases as variance becomes larger.
If you are interested in proportions, 50% has the highest variance. In your
case, 20% has a variance of 0.2*0.8, while 10% has 0.1*0.9. Therefore, 20%
requires a larger sample size. |
D*a 发帖数: 6830 | 3 不好意思,没看懂。。。
看样子是这么个公式没错了。。。
variance在实际操作上的意义是什么呢?
比如为了调查一个比例,同样是取30个样本,反映一个20% 的比例应该比反映一个10%
的比例更准确才对阿,怎么这个公式算出来样本数反而是降低呢
your
【在 g********d 的大作中提到】 : Required sample size increases as variance becomes larger. : If you are interested in proportions, 50% has the highest variance. In your : case, 20% has a variance of 0.2*0.8, while 10% has 0.1*0.9. Therefore, 20% : requires a larger sample size.
|
q******n 发帖数: 272 | 4 N is a function of p*(1-p). p*(1-p) increases as p increases to 0.5 |
D*a 发帖数: 6830 | 5 but why?
这么说吧,让我代数计算没问题,我不能理解的是为什么它跟直观感觉相反
【在 q******n 的大作中提到】 : N is a function of p*(1-p). p*(1-p) increases as p increases to 0.5
|
l****a 发帖数: 352 | 6 那我这么说吧,取sample是为了exame or approximate a proportion of favor A for
the whole population. 上面那些公式都是based on sampling distribution of
proportion p(A) derived from central limit theory.太理论了?
这么想,如果favor A的sample proportion估计是20%,那么需要更多的sample来估计
整个sampling distribution 你若是只sample了10个,保不定都是favor A的了,还需
要不favor A 来估计整个sampling distribution啊
这么想清楚了些吗?
【在 D*a 的大作中提到】 : but why? : 这么说吧,让我代数计算没问题,我不能理解的是为什么它跟直观感觉相反
|
D*a 发帖数: 6830 | 7 如果favor A的sample proportion估计是20%,那么如果只取10个,不favor A的可能性
更大啊
那如果某种条件下favor A的变成了5%,应该是用更多的sample才能准确预测到啊,怎
么我用上面那个公式,p(1-p)反而小了呢
也就是说,如果是一半一半,p=0.5,应该是最容易取样的时候,为什么n反而有最大值?
for
【在 l****a 的大作中提到】 : 那我这么说吧,取sample是为了exame or approximate a proportion of favor A for : the whole population. 上面那些公式都是based on sampling distribution of : proportion p(A) derived from central limit theory.太理论了? : 这么想,如果favor A的sample proportion估计是20%,那么需要更多的sample来估计 : 整个sampling distribution 你若是只sample了10个,保不定都是favor A的了,还需 : 要不favor A 来估计整个sampling distribution啊 : 这么想清楚了些吗?
|
s*****r 发帖数: 80 | 8 P=0。5的时候,对于一个二值变量来说,是差异最大的时候。因此要求更大的N才可以
保证。
值?
【在 D*a 的大作中提到】 : 如果favor A的sample proportion估计是20%,那么如果只取10个,不favor A的可能性 : 更大啊 : 那如果某种条件下favor A的变成了5%,应该是用更多的sample才能准确预测到啊,怎 : 么我用上面那个公式,p(1-p)反而小了呢 : 也就是说,如果是一半一半,p=0.5,应该是最容易取样的时候,为什么n反而有最大值? : : for
|
l*********s 发帖数: 5409 | 9 Say you have 10 obs, you observe 5:5, you know the true p is close to 0.5,
but how close? 0.4 and 0.6 are all intuitively reasonable. In other words,
your precision is low.
Now, suppose true probability is 0.01,most probably you will observe 0 event
. You cannot conclude the true p is thus 0;but you can guess that it is
unlikely to big than 0.1. Your estimate has a narrower range.
值?
【在 D*a 的大作中提到】 : 如果favor A的sample proportion估计是20%,那么如果只取10个,不favor A的可能性 : 更大啊 : 那如果某种条件下favor A的变成了5%,应该是用更多的sample才能准确预测到啊,怎 : 么我用上面那个公式,p(1-p)反而小了呢 : 也就是说,如果是一半一半,p=0.5,应该是最容易取样的时候,为什么n反而有最大值? : : for
|