由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 吵起来了,关于GWAS
相关主题
真心请教SNP跟疾病相关的文章一般发啥杂志应该控制生物新技术的大规模应用
【求推荐】获得SNP information的网页做 Next generation sequencing 这个方向怎么样? (转载)
有奖问答:每个细胞所含的dna是完全一样的吗?说到狗,有人做狗的gwas么?
两个靠近的SNP的transmission是独立的吗?一个GWAS genotype imputation的问题
怎样检测一个基因的变异与疾病的关系求翻译一篇GWAS文章
做线虫的有人试过WGS+SNP的方法一步测序出mutant吗?怎样检测肿瘤样本里单个基因的LOH(loss of heterozygosity)?
Bioinfor postdoctoral position availableR 编程面试题,被弄残废了,在这里求解,钱不多,但会鼎力散财(转载)
大家来聊聊CNV,methylation和gene expression的关系问个基因组的问题
相关话题的讨论汇总
话题: gwas话题: snp话题: qtl话题: marker话题: disease
进入Biology版参与讨论
1 (共1页)
H*********1
发帖数: 56
1
在最近一期的cell上。我对GWAS不是很熟,不过我觉着西雅图的这个老太太Mary-
Claire King 说的有道理,从进化上来看,从大规模病人群体上筛的SNP,应该不是跟
这个疾病最相关的。不过她认为这些GWAS筛出来的SNP,因为不是在基因的编码区,就
说这些SNP没有生物学意义,我觉着这点有些牵强,也是别人反驳她的一个重要攻击点。
圈内的人给说说谁对谁错?
另外,有几个扫盲的小问题:
Mutation和allele 啥区别?
啥叫 rare mutations, common variants?
文章:
McClellan and King, 2010 McClellan, J., and King, M.C. (2010). Cell 141, 210
–217.
http://www.cell.com/fulltext/S0092-8674%2810%2900829-9#bib5
http://www.cell.com/fulltext/S0092-8674%2810%2900830-5
h***e
发帖数: 146
2
同关注 期待大牛来解惑
O******e
发帖数: 4845
3
King力挺全序列分析在疾病研究里面的作用,当然是没错了。但你光知道了序列,你总
得去判断什么是正常什么是不正常吧。GWAS的主要目的不就是要回答什么是不正常这
一部分么。
估计是King顺嘴就这么贬了下别人,别人就受不了了要来吵。其实两个方法都有各自的
缺点,需要改进。
HelloHello1看来就是觉得吵架好玩。Mutation,是指基因组顺序的变化;allele,是
两个或多个同基因座基因基因的一个--等位基因。

点。
210

【在 H*********1 的大作中提到】
: 在最近一期的cell上。我对GWAS不是很熟,不过我觉着西雅图的这个老太太Mary-
: Claire King 说的有道理,从进化上来看,从大规模病人群体上筛的SNP,应该不是跟
: 这个疾病最相关的。不过她认为这些GWAS筛出来的SNP,因为不是在基因的编码区,就
: 说这些SNP没有生物学意义,我觉着这点有些牵强,也是别人反驳她的一个重要攻击点。
: 圈内的人给说说谁对谁错?
: 另外,有几个扫盲的小问题:
: Mutation和allele 啥区别?
: 啥叫 rare mutations, common variants?
: 文章:
: McClellan and King, 2010 McClellan, J., and King, M.C. (2010). Cell 141, 210

H*********1
发帖数: 56
4
谢谢答疑!
我觉着关于这个GWAS是否值得花这么多钱去做,好像很多人在讨论,包括前几个月
Francis Collins (NIH的头)也提到了这个问题,他当然是支持GWAS的。
nature genetics这个刊物几乎成了GWAS专用灌水的了,这几年来几乎一半以上的文章
都是来自GWAS。我记得很多GWAS的文章出来后,后面往往跟着一些response,说在另外
的实验室重复不出来等等。
我个人比较同意king的说法,别光计算出来相关,也用湿实验证明这些SNP跟病相关。
这样才更有说服力。

【在 O******e 的大作中提到】
: King力挺全序列分析在疾病研究里面的作用,当然是没错了。但你光知道了序列,你总
: 得去判断什么是正常什么是不正常吧。GWAS的主要目的不就是要回答什么是不正常这
: 一部分么。
: 估计是King顺嘴就这么贬了下别人,别人就受不了了要来吵。其实两个方法都有各自的
: 缺点,需要改进。
: HelloHello1看来就是觉得吵架好玩。Mutation,是指基因组顺序的变化;allele,是
: 两个或多个同基因座基因基因的一个--等位基因。
:
: 点。
: 210

s*r
发帖数: 2757
5
people were discussing this a few months ago
A****t
发帖数: 141
6
目前GWAS的最大问题是很多相关位点得不到实验验证,而且重复性很差。这里面包括群
体结构,统计方法本身的问题。。。有效应的SNP可能在编码区也可能不在编码区,这
不能说明没有生物学意义,有相当一部份GWAS是把基因表达水平作为性状来研究,不在
编码区的可能是regulatory element

点。
210

【在 H*********1 的大作中提到】
: 在最近一期的cell上。我对GWAS不是很熟,不过我觉着西雅图的这个老太太Mary-
: Claire King 说的有道理,从进化上来看,从大规模病人群体上筛的SNP,应该不是跟
: 这个疾病最相关的。不过她认为这些GWAS筛出来的SNP,因为不是在基因的编码区,就
: 说这些SNP没有生物学意义,我觉着这点有些牵强,也是别人反驳她的一个重要攻击点。
: 圈内的人给说说谁对谁错?
: 另外,有几个扫盲的小问题:
: Mutation和allele 啥区别?
: 啥叫 rare mutations, common variants?
: 文章:
: McClellan and King, 2010 McClellan, J., and King, M.C. (2010). Cell 141, 210

y****2
发帖数: 65
7
我的理解
我们知道定位QTL是不准确的。证明一个QTL存在或是不存在是困难的。
在一个不是非常巨大的群体里估计出来的QTl效应是有偏差的。
为啥不放弃QTL的模型,而是仅仅将所有的markers放在一个模型中,来给每个genotype
一个值的估计?--把所有的marker(SNP在这里)同时放在一个模型中,预测每个
marker allele的对于疾病的效应。所有marker alleles的值总和就是这个genotype的
效应。
总之,我们可能不知道QTL是啥,但是我们可以更加准确地预测每个genotype的值。黑
箱操作。需要对于每个群体都单独分析,因为LD不consistent across populations.LD
啊LD,population structure,genetic architecture这些都是association analysis
极端重要的问题。
两个前提,good phenotyping; 第二 if marker –target gene LD is consistent
across populations.
O******e
发帖数: 4845
8
重复?人类疾病的数据,你怎么重复?怎么个湿实验法?一个一个突变引进到小鼠然后
重复症状?
再说了,重复不出别人的结果,原因很多的。

【在 H*********1 的大作中提到】
: 谢谢答疑!
: 我觉着关于这个GWAS是否值得花这么多钱去做,好像很多人在讨论,包括前几个月
: Francis Collins (NIH的头)也提到了这个问题,他当然是支持GWAS的。
: nature genetics这个刊物几乎成了GWAS专用灌水的了,这几年来几乎一半以上的文章
: 都是来自GWAS。我记得很多GWAS的文章出来后,后面往往跟着一些response,说在另外
: 的实验室重复不出来等等。
: 我个人比较同意king的说法,别光计算出来相关,也用湿实验证明这些SNP跟病相关。
: 这样才更有说服力。

l*****c
发帖数: 17
9
GWAS进行了10几年了,刚开始的时候大家用标记少的原因,后来基因组出来了,说样本
少,现在什么都有了,用统计方法,群体等等无数的可能生物学原因来解释。在Nature
Genetics经常看到文章对同一个疾病有不同的位点,这就是不能重复,然后又用不同
的科学名词来解释。还有,如果大量的群体实验不能重复或者结果只能解释1%的群体,
那研究又有多大价值?
现在我们假设这些结果是对的,那么应该可以快速的应用这些标记去找到或者诊断疾病
了,遗憾的是没有什么进展吧,除了大量的NG文章外。
对于GWAS研究,我们首先做的假定是:人类的基因是由基因引起的,某些类型的突变能
导致疾病。
这个假定对所有的疾病正确吗?比如,人类的肥胖症,有基因引起的吗?把肥胖病人放
到非洲去看看还有没有肥胖症。有人用基因+环境互作来解释,如果基因的影响占不到
10%贡献,那我们为什么有那么的实验室来研究可能存在的不同基因极其互作?人类的
癌症是由单个基因或者几个基因引起的吗?现在NIH的癌症基因组测序了上千个癌症样
本的基因组序列,没有发现有效应的共有的SNP/Haplotype?
还有人提出的个体药物计划,如果每个个体
H*********1
发帖数: 56
10
这些SNP怎么就不能重复呢?
你如果用1000份样本得出的结论,别人在另外的1000份样本得不到同样的SNP,那只能说
明你的结果有
很大的局限性,可能只在少数样本有效.那1000份样本的数据,跟5个样品的数据有啥区别
?别人都不能重
复.而且5个样本花钱还少.
关于湿试验证明这些SNP或者deletion,我记得已经有些这样的文章发表了。

【在 O******e 的大作中提到】
: 重复?人类疾病的数据,你怎么重复?怎么个湿实验法?一个一个突变引进到小鼠然后
: 重复症状?
: 再说了,重复不出别人的结果,原因很多的。

相关主题
做线虫的有人试过WGS+SNP的方法一步测序出mutant吗?应该控制生物新技术的大规模应用
Bioinfor postdoctoral position available做 Next generation sequencing 这个方向怎么样? (转载)
大家来聊聊CNV,methylation和gene expression的关系说到狗,有人做狗的gwas么?
进入Biology版参与讨论
H*********1
发帖数: 56
11
兄弟,你是做数据分析的吧,可惜我是做湿试验的,你说的,我理解不了啊,呵呵

genotype
LD
analysis

【在 y****2 的大作中提到】
: 我的理解
: 我们知道定位QTL是不准确的。证明一个QTL存在或是不存在是困难的。
: 在一个不是非常巨大的群体里估计出来的QTl效应是有偏差的。
: 为啥不放弃QTL的模型,而是仅仅将所有的markers放在一个模型中,来给每个genotype
: 一个值的估计?--把所有的marker(SNP在这里)同时放在一个模型中,预测每个
: marker allele的对于疾病的效应。所有marker alleles的值总和就是这个genotype的
: 效应。
: 总之,我们可能不知道QTL是啥,但是我们可以更加准确地预测每个genotype的值。黑
: 箱操作。需要对于每个群体都单独分析,因为LD不consistent across populations.LD
: 啊LD,population structure,genetic architecture这些都是association analysis

r*****l
发帖数: 457
12
所有marker都放入model,目前的硬件达不到吧。需要很长计算时间

genotype
LD
analysis

【在 y****2 的大作中提到】
: 我的理解
: 我们知道定位QTL是不准确的。证明一个QTL存在或是不存在是困难的。
: 在一个不是非常巨大的群体里估计出来的QTl效应是有偏差的。
: 为啥不放弃QTL的模型,而是仅仅将所有的markers放在一个模型中,来给每个genotype
: 一个值的估计?--把所有的marker(SNP在这里)同时放在一个模型中,预测每个
: marker allele的对于疾病的效应。所有marker alleles的值总和就是这个genotype的
: 效应。
: 总之,我们可能不知道QTL是啥,但是我们可以更加准确地预测每个genotype的值。黑
: 箱操作。需要对于每个群体都单独分析,因为LD不consistent across populations.LD
: 啊LD,population structure,genetic architecture这些都是association analysis

r*****l
发帖数: 457
13
随机挑一个群体以外的个体,对其未来疾病进行预测,
应该也算验证了

【在 O******e 的大作中提到】
: 重复?人类疾病的数据,你怎么重复?怎么个湿实验法?一个一个突变引进到小鼠然后
: 重复症状?
: 再说了,重复不出别人的结果,原因很多的。

y****2
发帖数: 65
14
Genome-wide selection model (mixed model):
Y=u+Xg+e
X includes all markers
g estimates effects of all markers simultaneously.
Get BLUPs for each MARKER ALLELE!
value of a genotype is sum of its marker allele BLUPs
就是一个很简单的模型。。。

【在 r*****l 的大作中提到】
: 所有marker都放入model,目前的硬件达不到吧。需要很长计算时间
:
: genotype
: LD
: analysis

y****2
发帖数: 65
15
那研究又有多大价值?
由主效基因的猜想转变成超多微小效应的位点控制的观点呀。。。
Different QTL segregate in different population 已经是共识了。
肥胖大概是非常复杂的一个病。肥胖是个表型,同一个表型可以由不同的代谢和基因控
制吧,像这种复杂的病目前不能了解也是可以理解。
人类的癌症是由单个基因或者几个基因引起的吗?现在NIH的癌症基因组测序了上千个癌症样
本的基因组序列,没有发现有效应的共有的SNP/Haplotype?
P****d
发帖数: 564
16
multiple test problem -- for every 100 independent mapping studies, by
chance there will be 5 that will find a hit with p <=0.05. These 5 "lucky"
groups will jump ahead to publish.
Not many papers take this (unsuccessful studies by others) into account.
r*****l
发帖数: 457
17
你说的是考虑polygene effect吧,
我以为你要估计每一个marker的effect
百万个marker放到mlm,1k个obs,不是很多计算机能做到的

【在 y****2 的大作中提到】
: Genome-wide selection model (mixed model):
: Y=u+Xg+e
: X includes all markers
: g estimates effects of all markers simultaneously.
: Get BLUPs for each MARKER ALLELE!
: value of a genotype is sum of its marker allele BLUPs
: 就是一个很简单的模型。。。

y****2
发帖数: 65
18
显著性的阈值~!
可以permutation来计算,也有人用family experimental error rate.

"

【在 P****d 的大作中提到】
: multiple test problem -- for every 100 independent mapping studies, by
: chance there will be 5 that will find a hit with p <=0.05. These 5 "lucky"
: groups will jump ahead to publish.
: Not many papers take this (unsuccessful studies by others) into account.

y****2
发帖数: 65
19
确实是估计每一个marker的effect,我只是用我的PC跑过几百个的marker。
计算量大我总觉得不是难题吧。
对于每个marker只是做个ANOVA,然后有显著性的marker才放在一起,在模型里估计每
个marker效应。
几百万个SNP么?不知道哎。。。
模型肯定比计算的难度更重要点儿。

【在 r*****l 的大作中提到】
: 你说的是考虑polygene effect吧,
: 我以为你要估计每一个marker的effect
: 百万个marker放到mlm,1k个obs,不是很多计算机能做到的

y****2
发帖数: 65
20
这个就是功能基因组学家和statistic genetist的根本分歧了。
一个需要生物学意义(分子生物学的机制),最好还能做医学实验做出来;另外一个
不管这么多,只是先关注遗传学意义--也许统计学上显著效应的位点本身没有生物学意义,但是他作为data point和疾病associated (LD很强大)。他们不持生物学家而是遗传学家的观点。
我感觉做生物太累就是这个道理,你还得证明机制。要是孟德尔是生物学家,他就挂了,他得必须告诉人家豌豆变异的生物学原因,但是他貌似只能证明遗传因子的理论上存在和行为特点。。。现在遗传学家就是说明有这个事儿,生物学家你就别总是急吼吼地问到底这个东西怎么起作用了。。。
rare mutations, common variants?
相关主题
一个GWAS genotype imputation的问题R 编程面试题,被弄残废了,在这里求解,钱不多,但会鼎力散财(转载)
求翻译一篇GWAS文章问个基因组的问题
怎样检测肿瘤样本里单个基因的LOH(loss of heterozygosity)?两个只有一个碱基不同的DNA怎么区分?
进入Biology版参与讨论
r*****l
发帖数: 457
21
next next generation sequencing出来以后,瓶颈就在于硬件了
几百个marker做矩阵inverse和百万个做inverse,区别就不说了
GLM也许还可以,MLM估计超级计算机也够呛吧

【在 y****2 的大作中提到】
: 确实是估计每一个marker的effect,我只是用我的PC跑过几百个的marker。
: 计算量大我总觉得不是难题吧。
: 对于每个marker只是做个ANOVA,然后有显著性的marker才放在一起,在模型里估计每
: 个marker效应。
: 几百万个SNP么?不知道哎。。。
: 模型肯定比计算的难度更重要点儿。

O******e
发帖数: 4845
22
兄弟,遗传学家是生物学家的一部分啊

【在 y****2 的大作中提到】
: 这个就是功能基因组学家和statistic genetist的根本分歧了。
: 一个需要生物学意义(分子生物学的机制),最好还能做医学实验做出来;另外一个
: 不管这么多,只是先关注遗传学意义--也许统计学上显著效应的位点本身没有生物学意义,但是他作为data point和疾病associated (LD很强大)。他们不持生物学家而是遗传学家的观点。
: 我感觉做生物太累就是这个道理,你还得证明机制。要是孟德尔是生物学家,他就挂了,他得必须告诉人家豌豆变异的生物学原因,但是他貌似只能证明遗传因子的理论上存在和行为特点。。。现在遗传学家就是说明有这个事儿,生物学家你就别总是急吼吼地问到底这个东西怎么起作用了。。。
: rare mutations, common variants?

O******e
发帖数: 4845
23
你有没有觉得这句“群体内个人差距比群体之间差异大”有逻辑错误么。所谓群体之间
的差异,根本就是在比两个平均值;而个体差异的variation大不是显而易见么。你随便
从群体A拿出一个个体跟群体B的一个个体比,那差距也海了去了。

个癌症样

【在 y****2 的大作中提到】
: 那研究又有多大价值?
: 由主效基因的猜想转变成超多微小效应的位点控制的观点呀。。。
: Different QTL segregate in different population 已经是共识了。
: 肥胖大概是非常复杂的一个病。肥胖是个表型,同一个表型可以由不同的代谢和基因控
: 制吧,像这种复杂的病目前不能了解也是可以理解。
: 人类的癌症是由单个基因或者几个基因引起的吗?现在NIH的癌症基因组测序了上千个癌症样
: 本的基因组序列,没有发现有效应的共有的SNP/Haplotype?

A*****O
发帖数: 394
24
GWAS没有10几年的历史吧,才5年而已。

Nature

【在 l*****c 的大作中提到】
: GWAS进行了10几年了,刚开始的时候大家用标记少的原因,后来基因组出来了,说样本
: 少,现在什么都有了,用统计方法,群体等等无数的可能生物学原因来解释。在Nature
: Genetics经常看到文章对同一个疾病有不同的位点,这就是不能重复,然后又用不同
: 的科学名词来解释。还有,如果大量的群体实验不能重复或者结果只能解释1%的群体,
: 那研究又有多大价值?
: 现在我们假设这些结果是对的,那么应该可以快速的应用这些标记去找到或者诊断疾病
: 了,遗憾的是没有什么进展吧,除了大量的NG文章外。
: 对于GWAS研究,我们首先做的假定是:人类的基因是由基因引起的,某些类型的突变能
: 导致疾病。
: 这个假定对所有的疾病正确吗?比如,人类的肥胖症,有基因引起的吗?把肥胖病人放

a****c
发帖数: 339
25
我绝对见过群体遗传学家说过这句话,好像是智商分布还是什么。
大概是
X1bar - X2bar < 3sigma (X1 or X2)

随便

【在 O******e 的大作中提到】
: 你有没有觉得这句“群体内个人差距比群体之间差异大”有逻辑错误么。所谓群体之间
: 的差异,根本就是在比两个平均值;而个体差异的variation大不是显而易见么。你随便
: 从群体A拿出一个个体跟群体B的一个个体比,那差距也海了去了。
:
: 个癌症样

P****d
发帖数: 564
26
I think the point is not the molecular mechanism, but the evidence for
causality.
And statistical genetics is not all there is to genetics. It's probably
more stat than genetics if you ask me. :)

【在 y****2 的大作中提到】
: 这个就是功能基因组学家和statistic genetist的根本分歧了。
: 一个需要生物学意义(分子生物学的机制),最好还能做医学实验做出来;另外一个
: 不管这么多,只是先关注遗传学意义--也许统计学上显著效应的位点本身没有生物学意义,但是他作为data point和疾病associated (LD很强大)。他们不持生物学家而是遗传学家的观点。
: 我感觉做生物太累就是这个道理,你还得证明机制。要是孟德尔是生物学家,他就挂了,他得必须告诉人家豌豆变异的生物学原因,但是他貌似只能证明遗传因子的理论上存在和行为特点。。。现在遗传学家就是说明有这个事儿,生物学家你就别总是急吼吼地问到底这个东西怎么起作用了。。。
: rare mutations, common variants?

P****d
发帖数: 564
27
Hmm, are we talking about the same multiple test issue?

"

【在 y****2 的大作中提到】
: 显著性的阈值~!
: 可以permutation来计算,也有人用family experimental error rate.
:
: "

w******y
发帖数: 8040
28
这不过是吵架吵了N年的CDCV or CDRV的延续
King在Essay里显然是不负责任的乱说
这么多GWAS的研究, consensus基本已经达成了
1. most of them are true positives (这是King文胡说的地方)
2. most of them have very low RR and low % of explained variations,
which favors CDRV (这是King文鼓吹的,目前倾向于是对的)
3. big gap between marker and biological mechanism
King仅凭猜测就直接说Kai Wang et al.的工作可能是False positive,
换了谁都得怒

点。
210

【在 H*********1 的大作中提到】
: 在最近一期的cell上。我对GWAS不是很熟,不过我觉着西雅图的这个老太太Mary-
: Claire King 说的有道理,从进化上来看,从大规模病人群体上筛的SNP,应该不是跟
: 这个疾病最相关的。不过她认为这些GWAS筛出来的SNP,因为不是在基因的编码区,就
: 说这些SNP没有生物学意义,我觉着这点有些牵强,也是别人反驳她的一个重要攻击点。
: 圈内的人给说说谁对谁错?
: 另外,有几个扫盲的小问题:
: Mutation和allele 啥区别?
: 啥叫 rare mutations, common variants?
: 文章:
: McClellan and King, 2010 McClellan, J., and King, M.C. (2010). Cell 141, 210

w******y
发帖数: 8040
29
遗传学家大多是统计学出身。。。

【在 O******e 的大作中提到】
: 兄弟,遗传学家是生物学家的一部分啊
O******e
发帖数: 4845
30
传统的遗传学家,植物的和微生物的居多。你说的这类统计学出身的,多数是搞纯人类
遗传学的吧。
算了,这些名称上的东西,说也说不清楚,也没多大意义。

【在 w******y 的大作中提到】
: 遗传学家大多是统计学出身。。。
相关主题
SNP 分析请教【求推荐】获得SNP information的网页
NGS数据分析的流程有奖问答:每个细胞所含的dna是完全一样的吗?
真心请教SNP跟疾病相关的文章一般发啥杂志两个靠近的SNP的transmission是独立的吗?
进入Biology版参与讨论
w******y
发帖数: 8040
31
嗯, 看是说遗传学的历史还是现在了
摩尔根他们那些人自然要算生物学家
随后遗传学逐步朝两个方向演化
population/quant genetics 这块是统计为主
molecular genetics, 现在很少用这个词了, 基本就是分子生物学了
所以现代遗传学做方法的基本是统计学分支, 产生动物群体和收集数据的还是生物学家

【在 O******e 的大作中提到】
: 传统的遗传学家,植物的和微生物的居多。你说的这类统计学出身的,多数是搞纯人类
: 遗传学的吧。
: 算了,这些名称上的东西,说也说不清楚,也没多大意义。

b********t
发帖数: 108
32
King 的文章GWAS部分确实不妥吧。
s*r
发帖数: 2757
33
统计学起源于遗传学

【在 w******y 的大作中提到】
: 遗传学家大多是统计学出身。。。
e*n
发帖数: 1511
34
如果marker之间有非线性关系,那你这个模型结果就会出现两个不显著的marker其实是
治病基因之类的结果。

【在 y****2 的大作中提到】
: Genome-wide selection model (mixed model):
: Y=u+Xg+e
: X includes all markers
: g estimates effects of all markers simultaneously.
: Get BLUPs for each MARKER ALLELE!
: value of a genotype is sum of its marker allele BLUPs
: 就是一个很简单的模型。。。

H*********1
发帖数: 56
35
归纳的挺清楚,好!

【在 w******y 的大作中提到】
: 这不过是吵架吵了N年的CDCV or CDRV的延续
: King在Essay里显然是不负责任的乱说
: 这么多GWAS的研究, consensus基本已经达成了
: 1. most of them are true positives (这是King文胡说的地方)
: 2. most of them have very low RR and low % of explained variations,
: which favors CDRV (这是King文鼓吹的,目前倾向于是对的)
: 3. big gap between marker and biological mechanism
: King仅凭猜测就直接说Kai Wang et al.的工作可能是False positive,
: 换了谁都得怒
:

l****y
发帖数: 398
36
As if these studies can match up with Mendel's in terms of reproduciblity
and predicablity

意义,但是他作为data point和疾病associated (LD很强大)。他们不持生物学家而是
遗传学家的观点。
了,他得必须告诉人家豌豆变异的生物学原因,但是他貌似只能证明遗传因子的理论上
存在和行为特点。。。现在遗传学家就是说明有这个事儿,生物学家你就别总是急吼吼
地问到底这个东西怎么起作用了。。。
disease are affacted because they share the same disease susceptibility
alleles.
disease)是由不同并且少数的mutations控制的,比如,胖子A有A,B,C位点的
rare alleles,而胖子B有D,E,F位点的rare alleles。诡谲的是,两个人也许就不共
享rare mutations,但是common in 胖。。。Again, different QTL segragate in
differ

【在 y****2 的大作中提到】
: 这个就是功能基因组学家和statistic genetist的根本分歧了。
: 一个需要生物学意义(分子生物学的机制),最好还能做医学实验做出来;另外一个
: 不管这么多,只是先关注遗传学意义--也许统计学上显著效应的位点本身没有生物学意义,但是他作为data point和疾病associated (LD很强大)。他们不持生物学家而是遗传学家的观点。
: 我感觉做生物太累就是这个道理,你还得证明机制。要是孟德尔是生物学家,他就挂了,他得必须告诉人家豌豆变异的生物学原因,但是他貌似只能证明遗传因子的理论上存在和行为特点。。。现在遗传学家就是说明有这个事儿,生物学家你就别总是急吼吼地问到底这个东西怎么起作用了。。。
: rare mutations, common variants?

s***s
发帖数: 14
37
Mary-Claire King,大人物,膜拜,去年见过一次,1975年就在Science上发review的
s***s
发帖数: 14
38
fst, 量化population differentiation的,很多文章证实这个结论的,

随便

【在 O******e 的大作中提到】
: 你有没有觉得这句“群体内个人差距比群体之间差异大”有逻辑错误么。所谓群体之间
: 的差异,根本就是在比两个平均值;而个体差异的variation大不是显而易见么。你随便
: 从群体A拿出一个个体跟群体B的一个个体比,那差距也海了去了。
:
: 个癌症样

y**s
发帖数: 6809
39
弱弱的问啊,能达到那个计算能力吗?
你最后算不出来还是得假定sparse matrix啊
这不就又回到qtl了

我的理解
我们知道定位QTL是不准确的。证明一个QTL存在或是不存在是困难的。
在一个不是非常巨大的群体里估计出来的QTl效应是有偏差的。
为啥不放弃QTL的模型,而是仅仅将所有的markers放在一个模型中,来给每个genotype
一个值的估计?--把所有的marker(SNP在这里)同时放在一个模型中,预测每个
marker allele的对于疾病的效应。所有marker alleles的值总和就是这个genotype的
效应。
总之,我们可能不知道QTL是啥,但是我们可以更加准确地预测每个genotype的值。黑
箱操作。需要对于每个群体都单独分析,因为LD不consistent across populations.LD
啊LD,population structure,genetic architecture这些都是association analysis
极端重要的问题。
两个前提,good phenotyping; 第二 if marker –target

【在 y****2 的大作中提到】
: 我的理解
: 我们知道定位QTL是不准确的。证明一个QTL存在或是不存在是困难的。
: 在一个不是非常巨大的群体里估计出来的QTl效应是有偏差的。
: 为啥不放弃QTL的模型,而是仅仅将所有的markers放在一个模型中,来给每个genotype
: 一个值的估计?--把所有的marker(SNP在这里)同时放在一个模型中,预测每个
: marker allele的对于疾病的效应。所有marker alleles的值总和就是这个genotype的
: 效应。
: 总之,我们可能不知道QTL是啥,但是我们可以更加准确地预测每个genotype的值。黑
: 箱操作。需要对于每个群体都单独分析,因为LD不consistent across populations.LD
: 啊LD,population structure,genetic architecture这些都是association analysis

x******m
发帖数: 736
40
computation should not be a big issue for million snps if you just run anova
. ppl usually run this on linux cluster. it will be done in couples of hours
.

【在 y****2 的大作中提到】
: 确实是估计每一个marker的effect,我只是用我的PC跑过几百个的marker。
: 计算量大我总觉得不是难题吧。
: 对于每个marker只是做个ANOVA,然后有显著性的marker才放在一起,在模型里估计每
: 个marker效应。
: 几百万个SNP么?不知道哎。。。
: 模型肯定比计算的难度更重要点儿。

相关主题
两个靠近的SNP的transmission是独立的吗?Bioinfor postdoctoral position available
怎样检测一个基因的变异与疾病的关系大家来聊聊CNV,methylation和gene expression的关系
做线虫的有人试过WGS+SNP的方法一步测序出mutant吗?应该控制生物新技术的大规模应用
进入Biology版参与讨论
G********t
发帖数: 334
41
Have you heard of analysis of variance

随便

【在 O******e 的大作中提到】
: 你有没有觉得这句“群体内个人差距比群体之间差异大”有逻辑错误么。所谓群体之间
: 的差异,根本就是在比两个平均值;而个体差异的variation大不是显而易见么。你随便
: 从群体A拿出一个个体跟群体B的一个个体比,那差距也海了去了。
:
: 个癌症样

y****2
发帖数: 65
42
术语叫加性效应,这个是最重要的。
非线性的关系指的的Epistasis,位点间的互相作用需要更复杂的模型来模拟吧。
这个模型是最简单的一个,负责additive effect and dominant effect。

【在 e*n 的大作中提到】
: 如果marker之间有非线性关系,那你这个模型结果就会出现两个不显著的marker其实是
: 治病基因之类的结果。

y****2
发帖数: 65
43
兄弟,我觉得不是啊,分子生物学家多是不懂统计的,遗传学家基本不想管信号通路、
分子机制。但是,也有学贯两端的牛人。

【在 O******e 的大作中提到】
: 兄弟,遗传学家是生物学家的一部分啊
y****2
发帖数: 65
44
Agree.
但是落脚点还是遗传学,利用现代统计学的原理和方法来解决数量遗传问题。

【在 P****d 的大作中提到】
: I think the point is not the molecular mechanism, but the evidence for
: causality.
: And statistical genetics is not all there is to genetics. It's probably
: more stat than genetics if you ask me. :)

y****2
发帖数: 65
45
人类动植物都有啊。拟南芥和玉米做GWAS的非常多,也有很多发现。孟山都在农业应用
研究中是最厉害的,也许并不发文章,但是GWAS已经用在生产育种中了。人类生物医学
当然还是最领先的。

【在 O******e 的大作中提到】
: 传统的遗传学家,植物的和微生物的居多。你说的这类统计学出身的,多数是搞纯人类
: 遗传学的吧。
: 算了,这些名称上的东西,说也说不清楚,也没多大意义。

y****2
发帖数: 65
46
我是觉得并不是对每个hypothesis都用P<0.05。你或是用permutation算出一个阈值(
这样排除你说的统计上偏差),或是family experiment error用0.05,也就是说,比
如在一千个假设测验(family)中,出现一个false positive的概率不超过0.05.

【在 P****d 的大作中提到】
: Hmm, are we talking about the same multiple test issue?
:
: "

m*****i
发帖数: 29
47
GWAS还有一个很fundenmental的assumption是molecular biologist和geneticist都忽
略的问题,就是病人的诊断问题。molecular biologist和geneticist看到的诊断成一种病
的病人其实绝对不是单一病因的同种疾病。4000个GWAS samples 里估计要有1000种不
同的病因。可GWAS找的是他们可能share的那个或那几个。如果lucky,shared病因make
statistical significance cutoff. 但多数时候不会,因为我们就是在找那个不存在
的share factors.前边那个肥胖的例子应该就是一个不错的mission impossible 的
GWAS的例子。
r*****l
发帖数: 457
48
你指的单一病因的同种疾病是指
一个phenotype是由多个small effect的基因引起的。只要sample数目够大,理论上都
可以detect到

种病
make

【在 m*****i 的大作中提到】
: GWAS还有一个很fundenmental的assumption是molecular biologist和geneticist都忽
: 略的问题,就是病人的诊断问题。molecular biologist和geneticist看到的诊断成一种病
: 的病人其实绝对不是单一病因的同种疾病。4000个GWAS samples 里估计要有1000种不
: 同的病因。可GWAS找的是他们可能share的那个或那几个。如果lucky,shared病因make
: statistical significance cutoff. 但多数时候不会,因为我们就是在找那个不存在
: 的share factors.前边那个肥胖的例子应该就是一个不错的mission impossible 的
: GWAS的例子。

O******e
发帖数: 4845
49
搞分子的,不是不懂统计,而是很多实验用不到统计。又不是多深奥的东西,另外一个
工具而已。

【在 y****2 的大作中提到】
: 兄弟,我觉得不是啊,分子生物学家多是不懂统计的,遗传学家基本不想管信号通路、
: 分子机制。但是,也有学贯两端的牛人。

O******e
发帖数: 4845
50
^_^,当我啥都没学过啊。
我的意思是说,那句所谓个体之间差异比群体之间差异大,基本是句废话,不是什么
重要发现。

【在 G********t 的大作中提到】
: Have you heard of analysis of variance
:
: 随便

相关主题
做 Next generation sequencing 这个方向怎么样? (转载)求翻译一篇GWAS文章
说到狗,有人做狗的gwas么?怎样检测肿瘤样本里单个基因的LOH(loss of heterozygosity)?
一个GWAS genotype imputation的问题R 编程面试题,被弄残废了,在这里求解,钱不多,但会鼎力散财(转载)
进入Biology版参与讨论
y****2
发帖数: 65
51
agree!
这个就是数量遗传学分内的任务~

【在 r*****l 的大作中提到】
: 你指的单一病因的同种疾病是指
: 一个phenotype是由多个small effect的基因引起的。只要sample数目够大,理论上都
: 可以detect到
:
: 种病
: make

y**s
发帖数: 6809
52
那句是,群体内个体差异 比 群体间差异大, intrapopulation > interpopulation
两个方差加起来是总差异,就是打乱群体之后个体之间的差异

^_^,当我啥都没学过啊。
我的意思是说,那句所谓个体之间差异比群体之间差异大,基本是句废话,不是什么
重要发现。

【在 O******e 的大作中提到】
: ^_^,当我啥都没学过啊。
: 我的意思是说,那句所谓个体之间差异比群体之间差异大,基本是句废话,不是什么
: 重要发现。

y****2
发帖数: 65
53
群体内个体的差别可能比群体间个人的差别大哦:)
pupulation differenation...
任意一中国人和另一个中国人的差别与任意一个黑人和一个中国人的差别来比。
也就是ls兄弟说的,大多数变异在群体内,而不是群体间。

【在 O******e 的大作中提到】
: ^_^,当我啥都没学过啊。
: 我的意思是说,那句所谓个体之间差异比群体之间差异大,基本是句废话,不是什么
: 重要发现。

H*********1
发帖数: 56
54
关于诊断,是不是还有另外一个问题?
对于肿瘤病人来说,直接检测的就是切下的肿瘤样本,
所以你可以说这些样本里的SNP变化跟这种肿瘤相关。
但如果是测高血压,糖尿病和前面提到的肥胖等,
估计没有特定的组织可以检测,
即使检测到有弱显著性SNP差异(比如说是从病人的血液样品),
没准这些SNP差异主要不是跟这些想检测的病相关,
而是这些病人身上隐藏、未发现的其他病相关。

种病
make

【在 m*****i 的大作中提到】
: GWAS还有一个很fundenmental的assumption是molecular biologist和geneticist都忽
: 略的问题,就是病人的诊断问题。molecular biologist和geneticist看到的诊断成一种病
: 的病人其实绝对不是单一病因的同种疾病。4000个GWAS samples 里估计要有1000种不
: 同的病因。可GWAS找的是他们可能share的那个或那几个。如果lucky,shared病因make
: statistical significance cutoff. 但多数时候不会,因为我们就是在找那个不存在
: 的share factors.前边那个肥胖的例子应该就是一个不错的mission impossible 的
: GWAS的例子。

w******y
发帖数: 8040
55

这个估计值只可能是小于或等于, 等于的情况相当于stratification不存在
oncogene说的没什么错

【在 y****2 的大作中提到】
: 群体内个体的差别可能比群体间个人的差别大哦:)
: pupulation differenation...
: 任意一中国人和另一个中国人的差别与任意一个黑人和一个中国人的差别来比。
: 也就是ls兄弟说的,大多数变异在群体内,而不是群体间。

x******m
发帖数: 736
56
next gen seq 计算的瓶颈在于seq alignment.

【在 r*****l 的大作中提到】
: next next generation sequencing出来以后,瓶颈就在于硬件了
: 几百个marker做矩阵inverse和百万个做inverse,区别就不说了
: GLM也许还可以,MLM估计超级计算机也够呛吧

w******y
发帖数: 8040
57
更根本原因在于read不够长, 错误率高, 价格贵

【在 x******m 的大作中提到】
: next gen seq 计算的瓶颈在于seq alignment.
m***T
发帖数: 11058
58
但现在read长的PacBio的error rate是比二代的还要高

【在 w******y 的大作中提到】
: 更根本原因在于read不够长, 错误率高, 价格贵
w******y
发帖数: 8040
59
你最后去哪里了? PB or AB?

【在 m***T 的大作中提到】
: 但现在read长的PacBio的error rate是比二代的还要高
m***T
发帖数: 11058
60
权衡了半天还是先到AB了。

【在 w******y 的大作中提到】
: 你最后去哪里了? PB or AB?
相关主题
问个基因组的问题NGS数据分析的流程
两个只有一个碱基不同的DNA怎么区分?真心请教SNP跟疾病相关的文章一般发啥杂志
SNP 分析请教【求推荐】获得SNP information的网页
进入Biology版参与讨论
y****2
发帖数: 65
61
谢谢指点。
我又想了一下,你说的意思是,Fst=0时,整个群体处于Hardy-Weinberg Equilibrium
中,因而没有stratification;Fst=1,sub‐populations 是完全地differentiated to
fixation of different alleles-每个小群体内的个体都纯合.
现实情况,Fst处于0-1时,那么,相加小群体间的变异和小群体内的变异是总变异(任
意黑人和中国人的差别)。
我应该是这么表达,中国人群内的变异比中国人和黑人这两个人群之间的变异大。组内
大于组间。

【在 w******y 的大作中提到】
: 你最后去哪里了? PB or AB?
l*****c
发帖数: 17
62
是啊,我们研究遗传学,分子生物学包括搞统计的人,不断的创造新的名词来解释以前
不能解释的现象。每个都合理,最后表示都不合理。现在的GWAS研究,根本不能对超出
QTL范畴的生物学有人和解释。
这又回到了50年前的解释了,把所有(大部分)疾病/表型看成是数量性状,用微效多
基因来解释,既然是微效多基因,那当然是有无穷的组合了,比如有40个基因,每个基
因可能有50个突变,然后加上这些突变的组合,大家计算以下这有多少?从应用的角度
,接近无穷吧。最近的一篇NG文章用新方法来处理以前的数据,发现12万个SNP(我望
了具体的数值,反正很大)能解释56%的疾病表型,那是不是需要1百万的SNPs能解释80
%呢?显然还达不到,因为有环境因素在。那在计算这多大上百万SNPs的组合表型呢?
这还是只从SNP出发来解释。大家在建立简单的BLUP模型的时候,能考虑多少互作?
还有大量的CNV, chromosome rearrangement,methylation......,然后还有这些遗传因
素的组合呢?我们在研究这些生物现象的时候,用了太多的determinism的方法,考虑
太少的stocha
l*****c
发帖数: 17
63
看看BLUP模型是什么时候建立的,在40年前的动物育种中早就有了,有了分子标记后,
早就用在QTL连锁分析了,与现在基因组范围内的SNP比较相比,10多年用的是RFLP,
microsatellite等而已,一点区别都没有。最有名的西红柿的QTL文章发表在10多年前
了。

【在 A*****O 的大作中提到】
: GWAS没有10几年的历史吧,才5年而已。
:
: Nature

y****2
发帖数: 65
64
Steven D. Tanksley我心中的神,也爱吃西红柿,哈哈.

【在 l*****c 的大作中提到】
: 看看BLUP模型是什么时候建立的,在40年前的动物育种中早就有了,有了分子标记后,
: 早就用在QTL连锁分析了,与现在基因组范围内的SNP比较相比,10多年用的是RFLP,
: microsatellite等而已,一点区别都没有。最有名的西红柿的QTL文章发表在10多年前
: 了。

y****2
发帖数: 65
65
嗯,QTL的发展刚刚开始嘛,提出QTL这些概念的人,以后诺奖肯定跑不掉。
主效基因都克隆完了,剩下的都是些碎碎的微小效应就是轮到我们来做鸟~

【在 l*****c 的大作中提到】
: 看看BLUP模型是什么时候建立的,在40年前的动物育种中早就有了,有了分子标记后,
: 早就用在QTL连锁分析了,与现在基因组范围内的SNP比较相比,10多年用的是RFLP,
: microsatellite等而已,一点区别都没有。最有名的西红柿的QTL文章发表在10多年前
: 了。

y****2
发帖数: 65
66
即使有量子力学,牛顿经典力学也不过时。
主效QTL大概是生物学遗传学的"牛顿力学"吧。
全基因组选择肯定会大大发展的。现在测一个人可能就是1,000美元(目标是差不多这
个价钱吧),以后会更便宜,方向上应该没有走错,而且是顺理成章地理论发展,也是
基因组计划的必然产物嘛。
乐观乐观,这个以后肯定牛逼大了。大家根据自己的基因型预防,治疗,然后找对象也
要看看基因型合不合,哈哈。。。

80

【在 l*****c 的大作中提到】
: 是啊,我们研究遗传学,分子生物学包括搞统计的人,不断的创造新的名词来解释以前
: 不能解释的现象。每个都合理,最后表示都不合理。现在的GWAS研究,根本不能对超出
: QTL范畴的生物学有人和解释。
: 这又回到了50年前的解释了,把所有(大部分)疾病/表型看成是数量性状,用微效多
: 基因来解释,既然是微效多基因,那当然是有无穷的组合了,比如有40个基因,每个基
: 因可能有50个突变,然后加上这些突变的组合,大家计算以下这有多少?从应用的角度
: ,接近无穷吧。最近的一篇NG文章用新方法来处理以前的数据,发现12万个SNP(我望
: 了具体的数值,反正很大)能解释56%的疾病表型,那是不是需要1百万的SNPs能解释80
: %呢?显然还达不到,因为有环境因素在。那在计算这多大上百万SNPs的组合表型呢?
: 这还是只从SNP出发来解释。大家在建立简单的BLUP模型的时候,能考虑多少互作?

e*n
发帖数: 1511
67
这个有什么瓶颈?
软件遍地都是了八?

【在 x******m 的大作中提到】
: next gen seq 计算的瓶颈在于seq alignment.
e*n
发帖数: 1511
68
给个reference吧,俺很感兴趣
多谢

80

【在 l*****c 的大作中提到】
: 是啊,我们研究遗传学,分子生物学包括搞统计的人,不断的创造新的名词来解释以前
: 不能解释的现象。每个都合理,最后表示都不合理。现在的GWAS研究,根本不能对超出
: QTL范畴的生物学有人和解释。
: 这又回到了50年前的解释了,把所有(大部分)疾病/表型看成是数量性状,用微效多
: 基因来解释,既然是微效多基因,那当然是有无穷的组合了,比如有40个基因,每个基
: 因可能有50个突变,然后加上这些突变的组合,大家计算以下这有多少?从应用的角度
: ,接近无穷吧。最近的一篇NG文章用新方法来处理以前的数据,发现12万个SNP(我望
: 了具体的数值,反正很大)能解释56%的疾病表型,那是不是需要1百万的SNPs能解释80
: %呢?显然还达不到,因为有环境因素在。那在计算这多大上百万SNPs的组合表型呢?
: 这还是只从SNP出发来解释。大家在建立简单的BLUP模型的时候,能考虑多少互作?

w******y
发帖数: 8040
69
你说的这片NG文章我听说了,interesting
你能不能贴个附件上来? 我想仔细读一下, thanks

80
因控
有价

【在 l*****c 的大作中提到】
: 是啊,我们研究遗传学,分子生物学包括搞统计的人,不断的创造新的名词来解释以前
: 不能解释的现象。每个都合理,最后表示都不合理。现在的GWAS研究,根本不能对超出
: QTL范畴的生物学有人和解释。
: 这又回到了50年前的解释了,把所有(大部分)疾病/表型看成是数量性状,用微效多
: 基因来解释,既然是微效多基因,那当然是有无穷的组合了,比如有40个基因,每个基
: 因可能有50个突变,然后加上这些突变的组合,大家计算以下这有多少?从应用的角度
: ,接近无穷吧。最近的一篇NG文章用新方法来处理以前的数据,发现12万个SNP(我望
: 了具体的数值,反正很大)能解释56%的疾病表型,那是不是需要1百万的SNPs能解释80
: %呢?显然还达不到,因为有环境因素在。那在计算这多大上百万SNPs的组合表型呢?
: 这还是只从SNP出发来解释。大家在建立简单的BLUP模型的时候,能考虑多少互作?

w******y
发帖数: 8040
70
软件遍地都是也没有克服瓶颈
alignable的只占50%-80%

【在 e*n 的大作中提到】
: 这个有什么瓶颈?
: 软件遍地都是了八?

相关主题
【求推荐】获得SNP information的网页怎样检测一个基因的变异与疾病的关系
有奖问答:每个细胞所含的dna是完全一样的吗?做线虫的有人试过WGS+SNP的方法一步测序出mutant吗?
两个靠近的SNP的transmission是独立的吗?Bioinfor postdoctoral position available
进入Biology版参与讨论
e*n
发帖数: 1511
71
那个应该是化学合成系统的噪音吧,跟align没关系。
不知道有没有人研究过。

【在 w******y 的大作中提到】
: 软件遍地都是也没有克服瓶颈
: alignable的只占50%-80%

x******m
发帖数: 736
72
if you have lots of samples for whole genome seq, the computation is very
intensive. i remember some NG paper taking about this. Even for 100 cpu (
newest one), it still take about three days to finish alignment for about 50
genomes. But how many labs have the resources to run on clusters with 100
cpus? not so many!

【在 e*n 的大作中提到】
: 这个有什么瓶颈?
: 软件遍地都是了八?

x******m
发帖数: 736
73
QTL has been carried out for many years. Just because there were not many
markers available, the mapping is not very accurate, even ppl design
interval mapping.

【在 y****2 的大作中提到】
: 嗯,QTL的发展刚刚开始嘛,提出QTL这些概念的人,以后诺奖肯定跑不掉。
: 主效基因都克隆完了,剩下的都是些碎碎的微小效应就是轮到我们来做鸟~

n***i
发帖数: 15
74
是不是这篇?
http://www.nature.com/ng/journal/v42/n7/abs/ng.608.html

【在 w******y 的大作中提到】
: 你说的这片NG文章我听说了,interesting
: 你能不能贴个附件上来? 我想仔细读一下, thanks
:
: 80
: 因控
: 有价

w******y
发帖数: 8040
75
对的
但是请贴全文, 在家没access

【在 n***i 的大作中提到】
: 是不是这篇?
: http://www.nature.com/ng/journal/v42/n7/abs/ng.608.html

x******m
发帖数: 736
76
the problem is the computer programs cannot completely tell it's snp or seq
difference. Some seq is not alignable because there are so many snps,
compared with reference genome.

【在 w******y 的大作中提到】
: 软件遍地都是也没有克服瓶颈
: alignable的只占50%-80%

O******e
发帖数: 4845
77
你觉得凭借个理论得奖?我看玄。

【在 y****2 的大作中提到】
: 嗯,QTL的发展刚刚开始嘛,提出QTL这些概念的人,以后诺奖肯定跑不掉。
: 主效基因都克隆完了,剩下的都是些碎碎的微小效应就是轮到我们来做鸟~

O******e
发帖数: 4845
78
光测个DNA序列,用处有限啊。你这个过于乐观了。

【在 y****2 的大作中提到】
: 即使有量子力学,牛顿经典力学也不过时。
: 主效QTL大概是生物学遗传学的"牛顿力学"吧。
: 全基因组选择肯定会大大发展的。现在测一个人可能就是1,000美元(目标是差不多这
: 个价钱吧),以后会更便宜,方向上应该没有走错,而且是顺理成章地理论发展,也是
: 基因组计划的必然产物嘛。
: 乐观乐观,这个以后肯定牛逼大了。大家根据自己的基因型预防,治疗,然后找对象也
: 要看看基因型合不合,哈哈。。。
:
: 80

p*****m
发帖数: 7030
79
我是觉得只要样本足够大 性状记录的足够多 光光测序就够搞出多少个nobel级别的东
西了。。想想看要是有50亿基因组 外加每一个人从身高体重疾病性格到指甲什么颜色
头发多长喜不喜欢黑色用哪只手指挖鼻屎。。。

【在 O******e 的大作中提到】
: 光测个DNA序列,用处有限啊。你这个过于乐观了。
O******e
发帖数: 4845
80
我想说的,其实很简单:性状的体现,由多层次因素决定,除了基因组顺序,还有mRNA
的表达调控,蛋白质的表达调控,蛋白质的翻译后修饰,DNA分子的修饰。
DNA sequence is only part of the picture.

【在 p*****m 的大作中提到】
: 我是觉得只要样本足够大 性状记录的足够多 光光测序就够搞出多少个nobel级别的东
: 西了。。想想看要是有50亿基因组 外加每一个人从身高体重疾病性格到指甲什么颜色
: 头发多长喜不喜欢黑色用哪只手指挖鼻屎。。。

相关主题
大家来聊聊CNV,methylation和gene expression的关系说到狗,有人做狗的gwas么?
应该控制生物新技术的大规模应用一个GWAS genotype imputation的问题
做 Next generation sequencing 这个方向怎么样? (转载)求翻译一篇GWAS文章
进入Biology版参与讨论
g*****a
发帖数: 204
81
瓶颈当然不是什么sequence alignment 上。it's a minor problem.
最大的瓶颈是每个maker的effect 太小,同时complex disease 又有多个causal
markers. 一个一个snp的测,计算机还可以handle. 你想找出最佳combination 太难了
。需要统计理论上一个重大的突破才可以解决这个问题,或者要有一个super super
super computer 可以一个一个combination 的测(in your lifetime instead of
infinite time). maker的effect 太小同时还导致multiple testing problem, 你可以
用permutation 去control family-wise error rate, but you'll get nothing.
当然common variants 的假设确实不一定正确。
l******u
发帖数: 936
82
正解.

mRNA

【在 O******e 的大作中提到】
: 我想说的,其实很简单:性状的体现,由多层次因素决定,除了基因组顺序,还有mRNA
: 的表达调控,蛋白质的表达调控,蛋白质的翻译后修饰,DNA分子的修饰。
: DNA sequence is only part of the picture.

n***i
发帖数: 15
83
How to 贴全文 in PDF?

【在 w******y 的大作中提到】
: 对的
: 但是请贴全文, 在家没access

s******y
发帖数: 28562
84
有时候我有点迷惑,这个关于基因对比的研究是不是有点过头了?
其实,我想,有些病比方说Alzheimers和基因的关系比较大,癌症嘛,
只能说有关联,但是不绝对,在我的印象中临床上大部分癌症是由于
外因引起的。至于其他病,比方说什么病毒细菌传染病,和基因几乎没有关系。
虽然不同的人对于某些病原体的易感性稍微的不一样,但是研究那个不是
很靠谱吧?或许唯一我能想起的用途就是对于易感人群要赶着他们做vaccine。
除此之外,还有什么么?

点。
210

【在 H*********1 的大作中提到】
: 在最近一期的cell上。我对GWAS不是很熟,不过我觉着西雅图的这个老太太Mary-
: Claire King 说的有道理,从进化上来看,从大规模病人群体上筛的SNP,应该不是跟
: 这个疾病最相关的。不过她认为这些GWAS筛出来的SNP,因为不是在基因的编码区,就
: 说这些SNP没有生物学意义,我觉着这点有些牵强,也是别人反驳她的一个重要攻击点。
: 圈内的人给说说谁对谁错?
: 另外,有几个扫盲的小问题:
: Mutation和allele 啥区别?
: 啥叫 rare mutations, common variants?
: 文章:
: McClellan and King, 2010 McClellan, J., and King, M.C. (2010). Cell 141, 210

l******u
发帖数: 936
85
不会吧, cancer 本质上讲就是个genetics disease ,怎么会是只有
"关联,但是不绝对". 我觉得学界关于cancer和gene的关系的共识早都是非常
明确了. 要不是的话, bob 的 "The Biology of Cancer" 等经典都要重写了.
你说的跟gene 有没有关系的意思是不是只局限于 genome DNA 层次?

【在 s******y 的大作中提到】
: 有时候我有点迷惑,这个关于基因对比的研究是不是有点过头了?
: 其实,我想,有些病比方说Alzheimers和基因的关系比较大,癌症嘛,
: 只能说有关联,但是不绝对,在我的印象中临床上大部分癌症是由于
: 外因引起的。至于其他病,比方说什么病毒细菌传染病,和基因几乎没有关系。
: 虽然不同的人对于某些病原体的易感性稍微的不一样,但是研究那个不是
: 很靠谱吧?或许唯一我能想起的用途就是对于易感人群要赶着他们做vaccine。
: 除此之外,还有什么么?
:
: 点。
: 210

s******y
发帖数: 28562
86

对,我的意思就是引起癌症细胞genetic disorder 的来源一般都不在于人的
genome DNA本身。所以我不知道为什么大家那么热衷于比较不同人的基因和外基因

【在 l******u 的大作中提到】
: 不会吧, cancer 本质上讲就是个genetics disease ,怎么会是只有
: "关联,但是不绝对". 我觉得学界关于cancer和gene的关系的共识早都是非常
: 明确了. 要不是的话, bob 的 "The Biology of Cancer" 等经典都要重写了.
: 你说的跟gene 有没有关系的意思是不是只局限于 genome DNA 层次?

O******e
发帖数: 4845
87
都是关于遗传病的--至少是这么被宣称的,^_^

【在 s******y 的大作中提到】
: 有时候我有点迷惑,这个关于基因对比的研究是不是有点过头了?
: 其实,我想,有些病比方说Alzheimers和基因的关系比较大,癌症嘛,
: 只能说有关联,但是不绝对,在我的印象中临床上大部分癌症是由于
: 外因引起的。至于其他病,比方说什么病毒细菌传染病,和基因几乎没有关系。
: 虽然不同的人对于某些病原体的易感性稍微的不一样,但是研究那个不是
: 很靠谱吧?或许唯一我能想起的用途就是对于易感人群要赶着他们做vaccine。
: 除此之外,还有什么么?
:
: 点。
: 210

O******e
发帖数: 4845
88
Bob的贡献当然巨大,但你不觉得他的理论现在来看比较过时么?

【在 l******u 的大作中提到】
: 不会吧, cancer 本质上讲就是个genetics disease ,怎么会是只有
: "关联,但是不绝对". 我觉得学界关于cancer和gene的关系的共识早都是非常
: 明确了. 要不是的话, bob 的 "The Biology of Cancer" 等经典都要重写了.
: 你说的跟gene 有没有关系的意思是不是只局限于 genome DNA 层次?

l******u
发帖数: 936
89
你觉得现在cancer领域比较fashion的是什么理论? Cancer stem cell?
Cancer immunology 过时了, cancer genomics 在苟延残喘,
cancer virology 总算才搞出了个疫苗.
Bob现在focus 做 EMT 这块, EMT现在被他搞的很热.
个人觉得, 这本书还是写的非常好的.

【在 O******e 的大作中提到】
: Bob的贡献当然巨大,但你不觉得他的理论现在来看比较过时么?
O******e
发帖数: 4845
90
要说时髦的,当然首推cancer stem cell了。但我一直对这个理论不感冒。肿瘤免疫说
过时,但最近又有新的进展,估计又会有一大批人跟进。
其实癌症太复杂,根本就是太多不同的病,所以任何理论想一网打尽,都是不现实的。
EMT了解不多,好像是新东西。你觉得会有大的突破么?

【在 l******u 的大作中提到】
: 你觉得现在cancer领域比较fashion的是什么理论? Cancer stem cell?
: Cancer immunology 过时了, cancer genomics 在苟延残喘,
: cancer virology 总算才搞出了个疫苗.
: Bob现在focus 做 EMT 这块, EMT现在被他搞的很热.
: 个人觉得, 这本书还是写的非常好的.

相关主题
怎样检测肿瘤样本里单个基因的LOH(loss of heterozygosity)?两个只有一个碱基不同的DNA怎么区分?
R 编程面试题,被弄残废了,在这里求解,钱不多,但会鼎力散财(转载)SNP 分析请教
问个基因组的问题NGS数据分析的流程
进入Biology版参与讨论
l******u
发帖数: 936
91
EMT本身不是新东西, 在动物胚胎学领域已经被研究了好几十年了, 现在只是把这个
phenotype 的概念引入到 epithelial tumor 这个领域. 总的来说属于这个东西
属于tumor microenviroment interaction 的范畴, 这个东西有没有突破不好
说啊, 俺没有这个前瞻性. 反正Bob 老先生是review 和重量级的article一片接
一片的发啊.
Cancer Stem Cell 在液态瘤里做的不错啊, 还比较convincing. 其实Cancer Stem
的概念其实也是1937年就有了, 近十年又炒起来了.

【在 O******e 的大作中提到】
: 要说时髦的,当然首推cancer stem cell了。但我一直对这个理论不感冒。肿瘤免疫说
: 过时,但最近又有新的进展,估计又会有一大批人跟进。
: 其实癌症太复杂,根本就是太多不同的病,所以任何理论想一网打尽,都是不现实的。
: EMT了解不多,好像是新东西。你觉得会有大的突破么?

l******u
发帖数: 936
92
比较不同人的基因和外基因
e*n
发帖数: 1511
93
算三天跟算100天差别不大,这个不是所谓瓶颈。

50

【在 x******m 的大作中提到】
: if you have lots of samples for whole genome seq, the computation is very
: intensive. i remember some NG paper taking about this. Even for 100 cpu (
: newest one), it still take about three days to finish alignment for about 50
: genomes. But how many labs have the resources to run on clusters with 100
: cpus? not so many!

s******y
发帖数: 28562
94
many of the research are just trying to associate the variation in genome or
epi-genome to a certain disease and I have huge problem to believe the
significance of those results.

【在 l******u 的大作中提到】
: 比较不同人的基因和外基因
s******y
发帖数: 28562
95
I don't think there are so many true 遗传病

【在 O******e 的大作中提到】
: 都是关于遗传病的--至少是这么被宣称的,^_^
l******u
发帖数: 936
96
国人传统意义上说的 "遗传病" 一般是指inherited disease,
是germ line mutation 之类的造成的. 是从父母本遗传来的.
genetic disease 应该包括inherited disease, 但不全是. cancer 这样的
很多DNA 水平的mutation, 甚至真个染色体缺失或者多余, 绝对可以算
genetic disease. cancer也有inherited的, 但不是大多数.


【在 s******y 的大作中提到】
: I don't think there are so many true 遗传病
O******e
发帖数: 4845
97
不是吧。很多病都是可以遗传的,当然cancer中的大多数都不是遗传的。但是,即便是
不能传给下一代,癌细胞里面的某些突变跟癌症发生是密切相关的,这个你应该不会
否认吧。

【在 s******y 的大作中提到】
: I don't think there are so many true 遗传病
O******e
发帖数: 4845
98
^_^,我刚给写了个简短版,你这已经发出来了

【在 l******u 的大作中提到】
: 国人传统意义上说的 "遗传病" 一般是指inherited disease,
: 是germ line mutation 之类的造成的. 是从父母本遗传来的.
: genetic disease 应该包括inherited disease, 但不全是. cancer 这样的
: 很多DNA 水平的mutation, 甚至真个染色体缺失或者多余, 绝对可以算
: genetic disease. cancer也有inherited的, 但不是大多数.
:

s*******r
发帖数: 181
99
显然有很多病是遗传病,查一查 family history 或 twin study 就清楚了。当然环境
因素起的作用可能更大,不过很难象动物实验那样控制和定量。GWAS 也挺有用的,其
结果也不见得比生物试验更难重复,只不过其主要作用是发现新的致病基因或路径,而
不是预测疾病或personalized medicine. Rare variants or Sequencing 应该对
personalized medicine更有用,但在目前的价格和分析方法情况下,也无法取代GWAS
l******u
发帖数: 936
100
很简单
germ line mutation 的就是可以遗传.
somatic mutation 的就不能遗传.
反正中文这个"遗传病" 定义跟 "genetic disease" 不太一样,
好像翻译成" inherited disease" 更合适.

【在 O******e 的大作中提到】
: 不是吧。很多病都是可以遗传的,当然cancer中的大多数都不是遗传的。但是,即便是
: 不能传给下一代,癌细胞里面的某些突变跟癌症发生是密切相关的,这个你应该不会
: 否认吧。

相关主题
真心请教SNP跟疾病相关的文章一般发啥杂志两个靠近的SNP的transmission是独立的吗?
【求推荐】获得SNP information的网页怎样检测一个基因的变异与疾病的关系
有奖问答:每个细胞所含的dna是完全一样的吗?做线虫的有人试过WGS+SNP的方法一步测序出mutant吗?
进入Biology版参与讨论
s******y
发帖数: 28562
101
Yes, that is exactly my point.
Plus, there are way too many genetic mutations in the cancer cells, but most
of them has nothing to do with the genetics in germ cells

【在 l******u 的大作中提到】
: 很简单
: germ line mutation 的就是可以遗传.
: somatic mutation 的就不能遗传.
: 反正中文这个"遗传病" 定义跟 "genetic disease" 不太一样,
: 好像翻译成" inherited disease" 更合适.

x******m
发帖数: 736
102
don't get it. 算三天跟算100天差别不大??? your boss can wait 3 days, not 100
days. it's based on 100 cpus. do you lab has 100 cpu cluster?

【在 e*n 的大作中提到】
: 算三天跟算100天差别不大,这个不是所谓瓶颈。
:
: 50

k****o
发帖数: 589
103

我有点记不清了,好像光分析系谱就可以知道是不是germ line mutation对吗?

【在 l******u 的大作中提到】
: 很简单
: germ line mutation 的就是可以遗传.
: somatic mutation 的就不能遗传.
: 反正中文这个"遗传病" 定义跟 "genetic disease" 不太一样,
: 好像翻译成" inherited disease" 更合适.

e*n
发帖数: 1511
104
我是说算法上没什么区别,就是耗时长短问题。
100个CPU的cluster是个大学就应该有吧?还是我们这里比较特殊?

100

【在 x******m 的大作中提到】
: don't get it. 算三天跟算100天差别不大??? your boss can wait 3 days, not 100
: days. it's based on 100 cpus. do you lab has 100 cpu cluster?

T***T
发帖数: 107
105
表担心,云计算就要来了,只要有钱多少cpu hr都可以买到.可以和老板说,您老想几天算
完就几天算完,就看您舍得花多少钱了$_$. 不用买下和维护那些nodes,算是租用. 以后
估计计算成本也像生物实验成本一样,需要向老板打报告批准了:)

100

【在 x******m 的大作中提到】
: don't get it. 算三天跟算100天差别不大??? your boss can wait 3 days, not 100
: days. it's based on 100 cpus. do you lab has 100 cpu cluster?

a*****g
发帖数: 543
106
you have to find the gene that makes us believe everything is because of gen
e..:)

【在 s******y 的大作中提到】
: 有时候我有点迷惑,这个关于基因对比的研究是不是有点过头了?
: 其实,我想,有些病比方说Alzheimers和基因的关系比较大,癌症嘛,
: 只能说有关联,但是不绝对,在我的印象中临床上大部分癌症是由于
: 外因引起的。至于其他病,比方说什么病毒细菌传染病,和基因几乎没有关系。
: 虽然不同的人对于某些病原体的易感性稍微的不一样,但是研究那个不是
: 很靠谱吧?或许唯一我能想起的用途就是对于易感人群要赶着他们做vaccine。
: 除此之外,还有什么么?
:
: 点。
: 210

h*****q
发帖数: 176
107
正好我有个问题在这里问下
我前不久看到有CCR5△32缺陷基因的人对艾滋病有天然的抵抗力,这算不算是一种非常
有用的基因突变呢
如果基因突变有巨大意义的话,那么寻找和发现这些基因突变不是也很有意义吗
不管用的是什么技术,只要我们能找到疾病相关的基因改变,不管是先天遗传的,还是
后天造成的,不都是很有意义么
b****r
发帖数: 17995
108
GWAS现在还是有一些被多个group还有功能学证实的东西,当然还只是少数,但是剩下
的大多数,不是说将来也一定会重复不出来,科研本来就是个循序渐进的过程。就好象
研究分子功能,绝大部分分子根本还没有和疾病联系起来,还不是在拼命做。这是个必
由之路而已。
GWAS如果能解释1%的患病群体,如果是高血压这种百分之几十的人都得的病,你能说没
什么意义?
人的肥胖症由基因引起的太多了,google一下再发言吧。放到没饭吃的地方确实没有人
会肥胖,但是现在有几个地方没饭吃?你这个前提就几乎不成立。其他常见病很多也有
明确的遗传因素,这个既有流行病学的证据也有实验室的证据。
SNP和肿瘤的关系,不是特别明白你的意思。每年发表的肿瘤和SNP的文章不说成千上万
,实在也够多了,你可以在ncbi搜一下cancer SNP P53
另外回楼主的问题
mutation和variation主要的区别并不是是否致病,纯遗传学的角度两者的差别只是在
人群中的流行程度。低于1%的叫mutation, 高于的叫variation,两者的区别非常
arbitrary。不是说一个mutation就一定会导致问题,也不是说一个variation就肯定对
健康没有不利影响。如果要划分以1.2%做分界线也没什么不可以,就和P值放在0.05类似
allele说的是每个位点(常指一个基因)不同的序列情况。比如一个基因在某个位置有一串CGG重
复,如果有10个重复,我们可以称之为allele1,11个重复可以称为allele2,以此类推

Nature

【在 l*****c 的大作中提到】
: GWAS进行了10几年了,刚开始的时候大家用标记少的原因,后来基因组出来了,说样本
: 少,现在什么都有了,用统计方法,群体等等无数的可能生物学原因来解释。在Nature
: Genetics经常看到文章对同一个疾病有不同的位点,这就是不能重复,然后又用不同
: 的科学名词来解释。还有,如果大量的群体实验不能重复或者结果只能解释1%的群体,
: 那研究又有多大价值?
: 现在我们假设这些结果是对的,那么应该可以快速的应用这些标记去找到或者诊断疾病
: 了,遗憾的是没有什么进展吧,除了大量的NG文章外。
: 对于GWAS研究,我们首先做的假定是:人类的基因是由基因引起的,某些类型的突变能
: 导致疾病。
: 这个假定对所有的疾病正确吗?比如,人类的肥胖症,有基因引起的吗?把肥胖病人放

w*****i
发帖数: 54
109
我觉得还是一个single gene mutation disease 和complex disease的区别吧。
single gene mutation disease 就是找一个mutation, 一个mutation就可以致病,
犯不着用GWAS
GWAS 本身就是一个association study,用于complex disease才好,大规模样本的
complex disease才好,反正complex disease也没啥好办法研究
1 (共1页)
进入Biology版参与讨论
相关主题
问个基因组的问题怎样检测一个基因的变异与疾病的关系
两个只有一个碱基不同的DNA怎么区分?做线虫的有人试过WGS+SNP的方法一步测序出mutant吗?
SNP 分析请教Bioinfor postdoctoral position available
NGS数据分析的流程大家来聊聊CNV,methylation和gene expression的关系
真心请教SNP跟疾病相关的文章一般发啥杂志应该控制生物新技术的大规模应用
【求推荐】获得SNP information的网页做 Next generation sequencing 这个方向怎么样? (转载)
有奖问答:每个细胞所含的dna是完全一样的吗?说到狗,有人做狗的gwas么?
两个靠近的SNP的transmission是独立的吗?一个GWAS genotype imputation的问题
相关话题的讨论汇总
话题: gwas话题: snp话题: qtl话题: marker话题: disease