由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 菜鸟问个算样本量的问题
相关主题
麻烦问高手们一个弱智问题sample distribution的理解
问个简单的p-value问题请教一个bootstrapping的问题。
问个binomial variance的公式求助:cross-over design within-subject variance
A question about basic statistics, thanks.抽样问题求助
问一个underpower和predictive probability的问题这个应该用什么test?
Google面试问题simulation问题请指教
[求教]文献里的一句话,关于MCMC的spss跟sas有多少不同
包子贴: 求一个思路请教Latin Hypercube Sampling,谢谢!
相关话题的讨论汇总
话题: increases话题: sample话题: favor话题: 20%话题: variance
进入Statistics版参与讨论
1 (共1页)
D*a
发帖数: 6830
1
请问下大家,我想计算类似下面的population的样本量
比如喜欢A的人数占总体的10%,我想知道95%置信区间下需要取多少样本
查了一下,是n= Z*Z (p(1-p))/e^2
其中z=1.96,
我理解p就是0.1了吧,那么我e分别取0.05 0.1 0.2, 得出的样本数是
138.3
34.6
8.6
这个看着还比较符合我的直观经验
不过我想算假如某种情况下喜欢A的占总体的20%了,
那么p=0.2, 算出来的样本数是
245.9
61.5
15.4
那么我想问,如果有20%的人都喜欢A,相对10%的人来说,不是应该取样量减少么?同样的理解,如果变成只有5%的人喜欢A,那么不是更难取到一个准确样本么?应该取样量增大才对呀?
问题很菜,还请各位不吝赐教。。。
g********d
发帖数: 2022
2
Required sample size increases as variance becomes larger.
If you are interested in proportions, 50% has the highest variance. In your
case, 20% has a variance of 0.2*0.8, while 10% has 0.1*0.9. Therefore, 20%
requires a larger sample size.
D*a
发帖数: 6830
3
不好意思,没看懂。。。
看样子是这么个公式没错了。。。
variance在实际操作上的意义是什么呢?
比如为了调查一个比例,同样是取30个样本,反映一个20% 的比例应该比反映一个10%
的比例更准确才对阿,怎么这个公式算出来样本数反而是降低呢

your

【在 g********d 的大作中提到】
: Required sample size increases as variance becomes larger.
: If you are interested in proportions, 50% has the highest variance. In your
: case, 20% has a variance of 0.2*0.8, while 10% has 0.1*0.9. Therefore, 20%
: requires a larger sample size.

q******n
发帖数: 272
4
N is a function of p*(1-p). p*(1-p) increases as p increases to 0.5
D*a
发帖数: 6830
5
but why?
这么说吧,让我代数计算没问题,我不能理解的是为什么它跟直观感觉相反

【在 q******n 的大作中提到】
: N is a function of p*(1-p). p*(1-p) increases as p increases to 0.5
l****a
发帖数: 352
6
那我这么说吧,取sample是为了exame or approximate a proportion of favor A for
the whole population. 上面那些公式都是based on sampling distribution of
proportion p(A) derived from central limit theory.太理论了?
这么想,如果favor A的sample proportion估计是20%,那么需要更多的sample来估计
整个sampling distribution 你若是只sample了10个,保不定都是favor A的了,还需
要不favor A 来估计整个sampling distribution啊
这么想清楚了些吗?

【在 D*a 的大作中提到】
: but why?
: 这么说吧,让我代数计算没问题,我不能理解的是为什么它跟直观感觉相反

D*a
发帖数: 6830
7
如果favor A的sample proportion估计是20%,那么如果只取10个,不favor A的可能性
更大啊
那如果某种条件下favor A的变成了5%,应该是用更多的sample才能准确预测到啊,怎
么我用上面那个公式,p(1-p)反而小了呢
也就是说,如果是一半一半,p=0.5,应该是最容易取样的时候,为什么n反而有最大值?

for

【在 l****a 的大作中提到】
: 那我这么说吧,取sample是为了exame or approximate a proportion of favor A for
: the whole population. 上面那些公式都是based on sampling distribution of
: proportion p(A) derived from central limit theory.太理论了?
: 这么想,如果favor A的sample proportion估计是20%,那么需要更多的sample来估计
: 整个sampling distribution 你若是只sample了10个,保不定都是favor A的了,还需
: 要不favor A 来估计整个sampling distribution啊
: 这么想清楚了些吗?

s*****r
发帖数: 80
8
P=0。5的时候,对于一个二值变量来说,是差异最大的时候。因此要求更大的N才可以
保证。

值?

【在 D*a 的大作中提到】
: 如果favor A的sample proportion估计是20%,那么如果只取10个,不favor A的可能性
: 更大啊
: 那如果某种条件下favor A的变成了5%,应该是用更多的sample才能准确预测到啊,怎
: 么我用上面那个公式,p(1-p)反而小了呢
: 也就是说,如果是一半一半,p=0.5,应该是最容易取样的时候,为什么n反而有最大值?
:
: for

l*********s
发帖数: 5409
9
Say you have 10 obs, you observe 5:5, you know the true p is close to 0.5,
but how close? 0.4 and 0.6 are all intuitively reasonable. In other words,
your precision is low.
Now, suppose true probability is 0.01,most probably you will observe 0 event
. You cannot conclude the true p is thus 0;but you can guess that it is
unlikely to big than 0.1. Your estimate has a narrower range.


值?

【在 D*a 的大作中提到】
: 如果favor A的sample proportion估计是20%,那么如果只取10个,不favor A的可能性
: 更大啊
: 那如果某种条件下favor A的变成了5%,应该是用更多的sample才能准确预测到啊,怎
: 么我用上面那个公式,p(1-p)反而小了呢
: 也就是说,如果是一半一半,p=0.5,应该是最容易取样的时候,为什么n反而有最大值?
:
: for

1 (共1页)
进入Statistics版参与讨论
相关主题
请教Latin Hypercube Sampling,谢谢!问一个underpower和predictive probability的问题
A Sample Size Question (Binomial)Google面试问题
R 问题[求教]文献里的一句话,关于MCMC的
大牛们,帮忙解决个很小的统计问题包子贴: 求一个思路
麻烦问高手们一个弱智问题sample distribution的理解
问个简单的p-value问题请教一个bootstrapping的问题。
问个binomial variance的公式求助:cross-over design within-subject variance
A question about basic statistics, thanks.抽样问题求助
相关话题的讨论汇总
话题: increases话题: sample话题: favor话题: 20%话题: variance