由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - Re: 请教一个统计学问题,需要多少个SNPs去鉴定一个人 (转载)
相关主题
[合集] 怎样fit 这个 gene-SNP 的mixed model?【R】双层loops
拿到一个intern的电面,affymetrix【OPENING】biometrician
再招个人:biostatistician/bioinformatician怎样generate random number matrix
[合集] 请教如何分析tag SNPs 以找出和疾病相关的Markers【求助】Large Dataset Management
有个biostatistician的opening (转载)请教一下microarray的分析
Biostatistician positions问问各位大佬:SVM和RF在几百个sample几万个variable的情况下
SAS新手问一个做很多次比较的问题QTL mapping
面试:nonlinear regression, predictive modeling, machining learning问什么?也弱问一个SAS里面genotype/SNP variable recoding的问题
相关话题的讨论汇总
话题: dna话题: snps话题: snp话题: 统计学话题: 测定
进入Statistics版参与讨论
1 (共1页)
w**k
发帖数: 6722
1
转到统计老家来问问
原帖在
http://www.mitbbs.com/article_t/Biology/31928741.html
【 以下文字转载自 Biology 讨论区 】
发信人: wxwk (wxwk), 信区: Biology
标 题: Re: 请教一个统计学问题,需要多少个SNPs去鉴定一个人
发信站: BBS 未名空间站 (Wed Dec 10 16:07:15 2014, 美东)
如果测定某个点位,两套染色体上可以是n=10种组合(4 homo and 6 hetero)。也就
是说,如果全世界的人都测定了这个位置,那么全世界的人可以分进这n组中某个组。
具体到SNP,通常某个位置上有个主要的常见的,比如C/C,一个不常见的,比如T/T。
常见的C/C也许是80%,T/T 20%,那就是64% CC,32% CT,4% TT的分布。
我的问题其实是这样的。假定我有某个人(X)的DNA,我还有一个两百万大小DNA数据
库。数据库里面有X的DNA。这两百万的样品都测定了某些SNPs,比如说20个吧。然后X
的DNA也测了这个SNP panel。我需要通过X的SNP panel结果来判定X和数据库里面的X是
不是同一个人。需要考虑的是我的DNA样品有可能是X的,也有可能是X的父母亲的,或
者兄弟姐妹的,或者邻居老王的,甚至不遗传相关的陌生人。我需要设计这么一个SNP
panel,然后我测定X之后,可以在统计学意义上说,样品X和数据库里面的X是同一个人
,其中的错误的可能性小到可以忽略。
h*******n
发帖数: 458
2
我怎么觉得这不是个统计问题。如果你问X是否是n组中某个组,那是个统计问题,问是
否是样本中的某个,似乎不是统计问题。也可能是我没理解。
a*******7
发帖数: 772
3
这个取决于你的数量有多少了,现在NGS这么流行,估计是很大的数据。
那就看你要多少精度了,首先你数据库里的有可能不是某个人的,而是population
average的,那你要把X match上去的话估计会很难。。。
我能想到的只能是用相关性了。。。
1 (共1页)
进入Statistics版参与讨论
相关主题
也弱问一个SAS里面genotype/SNP variable recoding的问题有个biostatistician的opening (转载)
如何画出这样的heatmapBiostatistician positions
R 编程面试题,被弄残废了,在这里求解,钱不多,但会鼎力散财,SAS新手问一个做很多次比较的问题
急问有关SVM,randomforest的问题(gene expression data)面试:nonlinear regression, predictive modeling, machining learning问什么?
[合集] 怎样fit 这个 gene-SNP 的mixed model?【R】双层loops
拿到一个intern的电面,affymetrix【OPENING】biometrician
再招个人:biostatistician/bioinformatician怎样generate random number matrix
[合集] 请教如何分析tag SNPs 以找出和疾病相关的Markers【求助】Large Dataset Management
相关话题的讨论汇总
话题: dna话题: snps话题: snp话题: 统计学话题: 测定