由买买提看人间百态
登录
首页
论坛
未名存档
话题女王
小圈子
马甲追踪
版面排名
流量曲线
水枪排名
发帖量曲线
发帖版面饼图
发帖时间柱图
关于本站
帮助
boards
本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字
访问原贴
Statistics版
- Re: 请教一个统计学问题,需要多少个SNPs去鉴定一个人 (转载)
相关主题
●
[合集] 怎样fit 这个 gene-SNP 的mixed model?
●
【R】双层loops
●
拿到一个intern的电面,affymetrix
●
【OPENING】biometrician
●
再招个人:biostatistician/bioinformatician
●
怎样generate random number matrix
●
[合集] 请教如何分析tag SNPs 以找出和疾病相关的Markers
●
【求助】Large Dataset Management
●
有个biostatistician的opening (转载)
●
请教一下microarray的分析
●
Biostatistician positions
●
问问各位大佬:SVM和RF在几百个sample几万个variable的情况下
●
SAS新手问一个做很多次比较的问题
●
QTL mapping
●
面试:nonlinear regression, predictive modeling, machining learning问什么?
●
也弱问一个SAS里面genotype/SNP variable recoding的问题
相关话题的讨论汇总
话题: dna
话题: snps
话题: snp
话题: 统计学
话题: 测定
进入Statistics版参与讨论
1
(共1页)
w**k
发帖数: 6722
1
转到统计老家来问问
原帖在
http://www.mitbbs.com/article_t/Biology/31928741.html
【 以下文字转载自 Biology 讨论区 】
发信人: wxwk (wxwk), 信区: Biology
标 题: Re: 请教一个统计学问题,需要多少个SNPs去鉴定一个人
发信站: BBS 未名空间站 (Wed Dec 10 16:07:15 2014, 美东)
如果测定某个点位,两套染色体上可以是n=10种组合(4 homo and 6 hetero)。也就
是说,如果全世界的人都测定了这个位置,那么全世界的人可以分进这n组中某个组。
具体到SNP,通常某个位置上有个主要的常见的,比如C/C,一个不常见的,比如T/T。
常见的C/C也许是80%,T/T 20%,那就是64% CC,32% CT,4% TT的分布。
我的问题其实是这样的。假定我有某个人(X)的DNA,我还有一个两百万大小DNA数据
库。数据库里面有X的DNA。这两百万的样品都测定了某些SNPs,比如说20个吧。然后X
的DNA也测了这个SNP panel。我需要通过X的SNP panel结果来判定X和数据库里面的X是
不是同一个人。需要考虑的是我的DNA样品有可能是X的,也有可能是X的父母亲的,或
者兄弟姐妹的,或者邻居老王的,甚至不遗传相关的陌生人。我需要设计这么一个SNP
panel,然后我测定X之后,可以在统计学意义上说,样品X和数据库里面的X是同一个人
,其中的错误的可能性小到可以忽略。
h*******n
发帖数: 458
2
我怎么觉得这不是个统计问题。如果你问X是否是n组中某个组,那是个统计问题,问是
否是样本中的某个,似乎不是统计问题。也可能是我没理解。
a*******7
发帖数: 772
3
这个取决于你的数量有多少了,现在NGS这么流行,估计是很大的数据。
那就看你要多少精度了,首先你数据库里的有可能不是某个人的,而是population
average的,那你要把X match上去的话估计会很难。。。
我能想到的只能是用相关性了。。。
1
(共1页)
进入Statistics版参与讨论
相关主题
●
也弱问一个SAS里面genotype/SNP variable recoding的问题
●
有个biostatistician的opening (转载)
●
如何画出这样的heatmap
●
Biostatistician positions
●
R 编程面试题,被弄残废了,在这里求解,钱不多,但会鼎力散财,
●
SAS新手问一个做很多次比较的问题
●
急问有关SVM,randomforest的问题(gene expression data)
●
面试:nonlinear regression, predictive modeling, machining learning问什么?
●
[合集] 怎样fit 这个 gene-SNP 的mixed model?
●
【R】双层loops
●
拿到一个intern的电面,affymetrix
●
【OPENING】biometrician
●
再招个人:biostatistician/bioinformatician
●
怎样generate random number matrix
●
[合集] 请教如何分析tag SNPs 以找出和疾病相关的Markers
●
【求助】Large Dataset Management
相关话题的讨论汇总
话题: dna
话题: snps
话题: snp
话题: 统计学
话题: 测定
未名新帖统计
// 7月16日
#
版面
帖数(主题数)
-
全站
4871 (796)
1
Military
3777 (569)
2
Stock
341 (51)
3
Joke
117 (17)
4
History
116 (3)
5
Automobile
100 (9)
6
USANews
55 (9)
7
Midlife
45 (1)
8
Headline
41 (41)
9
Dreamer
33 (13)
10
FleaMarket
32 (20)
11
Living
30 (7)
* 这里只显示发帖超过25的版面,努力灌水吧:-)
历史上的今天
faintcat妹妹看进来~~
发表于12年前.
NSC, PD 1/7/2007, EB2, ...
发表于11年前.
[FBA求购]MJVE2 758 MJVM2 ...
发表于6年前.
老生常谈,归与不归
发表于10年前.
【申请】Seattle西雅图 版版主——申请人...
发表于9年前.
宝宝出生,头骨骨折,求祝福
发表于9年前.
求推荐舒缓优美的古典音乐
发表于11年前.
百分之一的北京人上北大 中国网友愤怒(转载)
发表于10年前.
新人带狗狗Bailey来报道
发表于12年前.
全世界最有价值的运动队
发表于10年前.
请问大切诺基的质量如何
发表于6年前.
TNND,军版全是BKC
发表于15年前.
Inception
发表于12年前.
微软的有些家属可真恶心,为了卖保险脸都不要了
发表于10年前.
每周坐高铁的苦逼来说说感受吧!!
发表于9年前.