G***G 发帖数: 16778 | 1 帮忙考虑这个问题。有包子。
一个学校让学生选数学和物理课和其他课程。允许同时选两门。
假设选数学的有A个人,选物理的有B个人,同时选数学和物理的有C个人
满足什么样的条件,我们可以说:其实喜欢数学和物理的差不多就是原班人马。
换句话说,就是集合A 约等于 集合 B | P****d 发帖数: 564 | 2 C/(A并B) >= cutoff, where (1 - cutoff) == 差“不多”的“不多” | w*******e 发帖数: 63 | 3 我觉得这个是gene enrichment问题的原型。有多种算法。
最简单的chi square test for a 2*2 contingency table,检查independency。假设
总人数是D,2*2 table:
A-C C
D-A-B+C B-C
更复杂的,你可以算尾区概率
出现你描述的情况的可能性为
c(D-B,A-C)*c(B,C)/c(D,A)
其中c(x,y)为从x元素中选y元素的组合数
你可以从C一直算到min(A,B),加在一起,就是p value。 这个是fisher exact test的
基础
当然还有别的算法,看你要干嘛了
【在 G***G 的大作中提到】 : 帮忙考虑这个问题。有包子。 : 一个学校让学生选数学和物理课和其他课程。允许同时选两门。 : 假设选数学的有A个人,选物理的有B个人,同时选数学和物理的有C个人 : 满足什么样的条件,我们可以说:其实喜欢数学和物理的差不多就是原班人马。 : 换句话说,就是集合A 约等于 集合 B
|
|