由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 请教一个概率题
相关主题
一道概率问题.数据分层后在不同level做的correlation/regression一样吗?
test count data distribution in SAS大伙儿捧个人场吧
How to test a sample is negative binomial distributionsample distribution的理解
binomial test如何算sample size?A question on Binomial Distribution
Kolmogorov-Smirnov test for discrete distributions如何evaluate对binomial distribution的预测模型
Binomial distribution: what's p exactly?银行面试的一道统计题
multinomial distribution: how to derive the covariance of different variable请教一下混合样本分布的问题?(追问一个beta分布的问题)
请教一道概率题statistical test 问题请教
相关话题的讨论汇总
话题: 60话题: 20话题: 3000话题: common
进入Statistics版参与讨论
1 (共1页)
s*****r
发帖数: 223
1
一组数从1到3000。
试验A: 从1到3000, 任意取出60个数
试验B:从1到3000, 任意取出300个数
问试验A中至少有20个数(共60个)跟试验B中的20个数一样(共300个)的概率是多少?
谢谢
s**r
发帖数: 669
2
随便想了一下,不知对不对:
Hypergeometric distribution, N=3000, n=60,K=300, p=0.1,k=20
近似一下,P(X〉=k)=Normal((np-k+0.5)/sqrt(np(1-p)))=Normal(-5.81)=0
q********i
发帖数: 4290
3
过去有过类似的问题,求了一个学数学的,才弄明白。
p(n,x,y,k)=x!(n􀀀-x)!y!(n-y)!/{n!k!(x-k)!(y-k)!(n-x-y+k)!}
n=3000
x=60
y=300
k=20,21,22,......,59,60

少?

【在 s*****r 的大作中提到】
: 一组数从1到3000。
: 试验A: 从1到3000, 任意取出60个数
: 试验B:从1到3000, 任意取出300个数
: 问试验A中至少有20个数(共60个)跟试验B中的20个数一样(共300个)的概率是多少?
: 谢谢

s*****r
发帖数: 223
4
谢谢两位帮助。
这是我遇到的实际问题

【在 q********i 的大作中提到】
: 过去有过类似的问题,求了一个学数学的,才弄明白。
: p(n,x,y,k)=x!(n􀀀-x)!y!(n-y)!/{n!k!(x-k)!(y-k)!(n-x-y+k)!}
: n=3000
: x=60
: y=300
: k=20,21,22,......,59,60
:
: 少?

q********i
发帖数: 4290
5
觉得这个版和数学版的水平都很烂的。大概都是为了找工作,由生物转统计的。一年前
,问了同样的问题,没人能解答。还是跑到一个附近大学数学系,找了个教授问明白的。

【在 s*****r 的大作中提到】
: 谢谢两位帮助。
: 这是我遇到的实际问题

s*****r
发帖数: 223
6
可能这个问题比较难,但大家跟你一样都还是挺热心的。我在这问了很多问题, 都得
到了解答。
给了我这个生物转统计的很多帮助!

的。

【在 q********i 的大作中提到】
: 觉得这个版和数学版的水平都很烂的。大概都是为了找工作,由生物转统计的。一年前
: ,问了同样的问题,没人能解答。还是跑到一个附近大学数学系,找了个教授问明白的。

c*****y
发帖数: 542
7
我来灌一勺吧……
首先,楼主问题的严格解是
C(60,3000)^-1*[C(20,300)*C(40,2700)+C(21,300)*C(39,2700)+...+C(60,300)*1]
但是显然楼主只要近似解就可以了。这里有几个近似方法:
1. 直接算前几项。前2项就已经可以保证2位有效数字了。
2. 近似成Binomial Distribution。因为60<<3000,可以认为问题是选60个数(可重复
)。 这样就成为p=0.1的binomial distribution。
然后这个问题是求大于20的概率。显然是tail分布(期望是6)。所以直接用normal
distribution近似了算。
如果还需要精确些,可以用Cornish-Fisher。不过我觉得没必要了,呵呵。
我算出来大概是7*10^-7。不知道楼主需要几位有效数字。
对了,不要看不起人,呵呵。虽然我不是生物毕业的也没有转统计。

的。

【在 q********i 的大作中提到】
: 觉得这个版和数学版的水平都很烂的。大概都是为了找工作,由生物转统计的。一年前
: ,问了同样的问题,没人能解答。还是跑到一个附近大学数学系,找了个教授问明白的。

a******1
发帖数: 201
8
Total combinations
C(n, x) * C(n, y)
with at least k common, the combinations are
C(n, k) * C(n-k, x-k) * C(n-k, y-k)
n = 3000, x = 60, y = 300, k = 20 for your case

少?

【在 s*****r 的大作中提到】
: 一组数从1到3000。
: 试验A: 从1到3000, 任意取出60个数
: 试验B:从1到3000, 任意取出300个数
: 问试验A中至少有20个数(共60个)跟试验B中的20个数一样(共300个)的概率是多少?
: 谢谢

d******e
发帖数: 7844
9
... ...基本的排列组合... ...
高中数学水平... ...

的。

【在 q********i 的大作中提到】
: 觉得这个版和数学版的水平都很烂的。大概都是为了找工作,由生物转统计的。一年前
: ,问了同样的问题,没人能解答。还是跑到一个附近大学数学系,找了个教授问明白的。

q********i
发帖数: 4290
10
Total combinations
C(n, x) * C(n, y)
with at least k common, the combinations are
C(n, k) * C(n-k, x-k) * C(n-x, y-k)
你的一个地方是错的,我给你校正过来了。这些整理完,和我给你的结果是一样的。
n = 3000, x = 60, y = 300, k = 20, 21, 22, ..., 59, 60
你问的是至少20个相同的数,就把k = 20到k = 60 带进去,算出41个值,把这41个值
加起来,就是你要的结果。

【在 a******1 的大作中提到】
: Total combinations
: C(n, x) * C(n, y)
: with at least k common, the combinations are
: C(n, k) * C(n-k, x-k) * C(n-k, y-k)
: n = 3000, x = 60, y = 300, k = 20 for your case
:
: 少?

相关主题
Binomial distribution: what's p exactly?数据分层后在不同level做的correlation/regression一样吗?
multinomial distribution: how to derive the covariance of different variable大伙儿捧个人场吧
请教一道概率题sample distribution的理解
进入Statistics版参与讨论
q********i
发帖数: 4290
11
别吹牛了,去年我问了几个数学系的教授,也问了几个高中数学老师,只有一个给我弄
出来了。

【在 d******e 的大作中提到】
: ... ...基本的排列组合... ...
: 高中数学水平... ...
:
: 的。

a******1
发帖数: 201
12
C(n-k, x-k) and C(n-k, y-k) already include cases with more in common.

【在 q********i 的大作中提到】
: Total combinations
: C(n, x) * C(n, y)
: with at least k common, the combinations are
: C(n, k) * C(n-k, x-k) * C(n-x, y-k)
: 你的一个地方是错的,我给你校正过来了。这些整理完,和我给你的结果是一样的。
: n = 3000, x = 60, y = 300, k = 20, 21, 22, ..., 59, 60
: 你问的是至少20个相同的数,就把k = 20到k = 60 带进去,算出41个值,把这41个值
: 加起来,就是你要的结果。

q********i
发帖数: 4290
13
别锵锵,你再好好想想,我肯定我的是对的

【在 a******1 的大作中提到】
: C(n-k, x-k) and C(n-k, y-k) already include cases with more in common.
a******1
发帖数: 201
14
Take common k from both groups: then take x-k from one group of n-k, and y-k
from another group of n-k, these may have common numbers of 0, 1, ..., x-k
( x <= y)

【在 q********i 的大作中提到】
: 别锵锵,你再好好想想,我肯定我的是对的
d******e
发帖数: 7844
15
你选多了,比如x选了1:40,41:60;y选了1:40,61:320。
这种情况,你的查法会重复查。
k个可以是1:40中的任何20个。

【在 a******1 的大作中提到】
: Total combinations
: C(n, x) * C(n, y)
: with at least k common, the combinations are
: C(n, k) * C(n-k, x-k) * C(n-k, y-k)
: n = 3000, x = 60, y = 300, k = 20 for your case
:
: 少?

d******e
发帖数: 7844
16
先选k个,剩下用互斥的方法选,然后按k全加起来就行。

-k
k

【在 a******1 的大作中提到】
: Take common k from both groups: then take x-k from one group of n-k, and y-k
: from another group of n-k, these may have common numbers of 0, 1, ..., x-k
: ( x <= y)

a******1
发帖数: 201
17
You are right:
C(n, k) * C(n-k, x-k) * C(n-x, y-k), and sum of k = 20, 21, .., 60
and I think that is what qinsui meant also.

【在 d******e 的大作中提到】
: 你选多了,比如x选了1:40,41:60;y选了1:40,61:320。
: 这种情况,你的查法会重复查。
: k个可以是1:40中的任何20个。

q********i
发帖数: 4290
18
take x-k from one group of n-k,take y-x from another group of n-k. 第一个组
的x个数,你在第二组都不能取,这里有k个相同的。把k=20到k=40代入,就可算出41个
值,加起来就是他要的结果。

-k
k

【在 a******1 的大作中提到】
: Take common k from both groups: then take x-k from one group of n-k, and y-k
: from another group of n-k, these may have common numbers of 0, 1, ..., x-k
: ( x <= y)

1 (共1页)
进入Statistics版参与讨论
相关主题
statistical test 问题请教Kolmogorov-Smirnov test for discrete distributions
请教一个mixture distribution求mean的问题Binomial distribution: what's p exactly?
bayesian 一道作业题:multinomial distribution: how to derive the covariance of different variable
ANOVA model 中 CELL count 过小到底对model有什么影响请教一道概率题
一道概率问题.数据分层后在不同level做的correlation/regression一样吗?
test count data distribution in SAS大伙儿捧个人场吧
How to test a sample is negative binomial distributionsample distribution的理解
binomial test如何算sample size?A question on Binomial Distribution
相关话题的讨论汇总
话题: 60话题: 20话题: 3000话题: common