由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 没人说说ENCODE数据库发布的事情?
相关主题
请教做单个病人的whole cancer genome 测序的意义问个基因组的问题
请教neurogenomics职业规划大家看看,这TIME上的话,是不是有语法错误?
职业选择问题求教。Obama unveils brain mapping project
请推荐一些人类遗传学的入门书籍和综述论文Pancreatic Cancer genetics求同行(欢迎讨论合作)
Ask a simple question...求教:如果SNP在dbSNP里找不到怎么办
求教生物信息学问题有没有autism exome database?
human genome mutation rate大概是多少, exome区域内呢?Postdoctoral Position in Bioinformatics & Computational Ge
machine learning来对GWAS结果建模bgi的名声
相关话题的讨论汇总
话题: encode话题: genome话题: regulatory话题: consortium话题: hgp
进入Biology版参与讨论
1 (共1页)
C********4
发帖数: 308
1
Encyclopedia of DNA Elements项目大功告成
6 篇Nature
18 篇Genome Research
6 篇Genome Biology
2篇Science
6篇JBC待发表
9年时间,30多个实验室,几百个科学者,仅耗资不到2亿美元,不到一架战斗机的钱。
真心值得,真心牛13啊
有人能说说,准备怎么利用他们的数据吗?
怎么把他们的数据用到自己的科研中去?
Z**********g
发帖数: 222
2
比起HGP如何?
Z**********g
发帖数: 222
3
看来genome仍然是个金库啊,谁还在说垃圾DNA?
w********r
发帖数: 1431
4
这个恐怕是前几天热烈讨论的生物和数学/CS结合的很好的例子了
c*******0
发帖数: 190
5
对这种宏观技术流的项目还是保留谨慎的乐观;HGP完成10年来,除了高通量测序技术
爆炸式的发展使个体测序接近突破1000美刀以外,还看不到其具体为生物医学或临床实
践带来的革命式推动,近30年来疾病谱基本没有太大的改变。以技术为导向的生物学研
究终究还是缺少一点灵魂。ENCODE的框架太大,看上去吓人一跳,实际只是把一些已知
的不成系统的基因调控网络归档化、IT化而已,不知道10年后能创造些什么惊世骇俗的
东东。
g******o
发帖数: 4042
6
没啥意思
c*******0
发帖数: 190
7
再算一笔糊涂账:
ENCODE据报道参与科学家是442人,2个亿,人均500万美刀。
2个亿烧出6篇nature,2篇science,1000多万刀一篇...NIBS笑而不语。
真心不觉得有多牛13啊...
s********n
发帖数: 1124
8
这数学学的。。。
打回去重新计算

【在 c*******0 的大作中提到】
: 再算一笔糊涂账:
: ENCODE据报道参与科学家是442人,2个亿,人均500万美刀。
: 2个亿烧出6篇nature,2篇science,1000多万刀一篇...NIBS笑而不语。
: 真心不觉得有多牛13啊...

M*P
发帖数: 6456
9
认为这些数据只是烧钱发大paper未免目光太短浅了一点。

【在 c*******0 的大作中提到】
: 再算一笔糊涂账:
: ENCODE据报道参与科学家是442人,2个亿,人均500万美刀。
: 2个亿烧出6篇nature,2篇science,1000多万刀一篇...NIBS笑而不语。
: 真心不觉得有多牛13啊...

l**********1
发帖数: 5204
10
Btw,
when Encyclopedia of RNA Elements (including HGP RNA-seq) 项目大功告成哈?
and how much that project will take?
相关主题
求教生物信息学问题问个基因组的问题
human genome mutation rate大概是多少, exome区域内呢?大家看看,这TIME上的话,是不是有语法错误?
machine learning来对GWAS结果建模Obama unveils brain mapping project
进入Biology版参与讨论
l***s
发帖数: 841
11
数据应该不错,但分析起来难度颇大。 Eric Lander 都说数据多得脑袋要炸了(
interviewed by NYT). 我自己的电脑也不够大啊。开来该买新server了。昨天读了几
篇Nature,感觉还有很多东西可挖。
c*******0
发帖数: 190
12
那30篇非NS的paper也要钱啊...

【在 s********n 的大作中提到】
: 这数学学的。。。
: 打回去重新计算

C********4
发帖数: 308
13
是不是只有做bioinformatics的才能分析这些数据。
做wet实验的,怎么能查查这些数据库,看看有没有可能跟自己的课题有关系?

【在 l***s 的大作中提到】
: 数据应该不错,但分析起来难度颇大。 Eric Lander 都说数据多得脑袋要炸了(
: interviewed by NYT). 我自己的电脑也不够大啊。开来该买新server了。昨天读了几
: 篇Nature,感觉还有很多东西可挖。

s******s
发帖数: 13035
14
genome browser总能用吧

【在 C********4 的大作中提到】
: 是不是只有做bioinformatics的才能分析这些数据。
: 做wet实验的,怎么能查查这些数据库,看看有没有可能跟自己的课题有关系?

c*******0
发帖数: 190
15
但是HGP, ENCODE这种项目大比例的数据实际上就是为了烧钱烧进paper里而已,能有1
%的转化为社会价值就得谢天谢地了。HGP完成之前,各种预言其重要性的报道比今天对
ENCODE的有过之而无不及吧。10年过去了,我相信大部分人没从其中得到任何实质性的
益处吧。我不反对我目光短浅,不过对个人来说,一辈子没几个十年。相比曼哈顿、阿
波罗这种大工业项目,我觉得生命科学研究成果的见效时间尺度应该更短一些。况且我
也不认为测序、生物信息学是了解生命与疾病本源的唯一途径。
P.S. 我不是科学愤青,一介穷书生而已,只是觉得大部分时候媒体把有些东西夸大得
有点过了。

【在 M*P 的大作中提到】
: 认为这些数据只是烧钱发大paper未免目光太短浅了一点。
M*P
发帖数: 6456
16
要看你怎么算“实质性益处”了。比如你要是做玉米,估计human genome跟你没关系。
不过其实还是有关系,因为测序玉米也是用了HGP期间发展的算法。要是做疾病相关研
究的人,如果现在还认为HGP没有意义,就好像计算机普及之后还说算盘也可以算一样
。从那些只用过算盘的人的角度看,你的话确实没错。

有1

【在 c*******0 的大作中提到】
: 但是HGP, ENCODE这种项目大比例的数据实际上就是为了烧钱烧进paper里而已,能有1
: %的转化为社会价值就得谢天谢地了。HGP完成之前,各种预言其重要性的报道比今天对
: ENCODE的有过之而无不及吧。10年过去了,我相信大部分人没从其中得到任何实质性的
: 益处吧。我不反对我目光短浅,不过对个人来说,一辈子没几个十年。相比曼哈顿、阿
: 波罗这种大工业项目,我觉得生命科学研究成果的见效时间尺度应该更短一些。况且我
: 也不认为测序、生物信息学是了解生命与疾病本源的唯一途径。
: P.S. 我不是科学愤青,一介穷书生而已,只是觉得大部分时候媒体把有些东西夸大得
: 有点过了。

A*****O
发帖数: 394
17
没人说是唯一途径啊,本来研究就是多线进行时,为什么一定要分出各自的高低呢。这
个东西本身就花钱花得厉害,不是为了烧钱而烧钱,如果有意义,花钱是值得的,就应
该义无反顾。总是把NIBS那样类别的文章和genome文章做比较,而且非要分出高低来,
这本身的逻辑就是有点问题的。

有1

【在 c*******0 的大作中提到】
: 但是HGP, ENCODE这种项目大比例的数据实际上就是为了烧钱烧进paper里而已,能有1
: %的转化为社会价值就得谢天谢地了。HGP完成之前,各种预言其重要性的报道比今天对
: ENCODE的有过之而无不及吧。10年过去了,我相信大部分人没从其中得到任何实质性的
: 益处吧。我不反对我目光短浅,不过对个人来说,一辈子没几个十年。相比曼哈顿、阿
: 波罗这种大工业项目,我觉得生命科学研究成果的见效时间尺度应该更短一些。况且我
: 也不认为测序、生物信息学是了解生命与疾病本源的唯一途径。
: P.S. 我不是科学愤青,一介穷书生而已,只是觉得大部分时候媒体把有些东西夸大得
: 有点过了。

A*****O
发帖数: 394
18
媒体怎么说那是媒体行业的行为习惯,因为基因组这个东西很接近普通老百姓的理解力
,很容易推介出去让民众知道是怎么回事,如果夸大了,那也不是基因组计划本身的错
。科学家应该有自己的专业判断。rare disease study 也是极少数人得到了好处而已
,但是仅仅这么看的话,确实有点短浅了。

有1

【在 c*******0 的大作中提到】
: 但是HGP, ENCODE这种项目大比例的数据实际上就是为了烧钱烧进paper里而已,能有1
: %的转化为社会价值就得谢天谢地了。HGP完成之前,各种预言其重要性的报道比今天对
: ENCODE的有过之而无不及吧。10年过去了,我相信大部分人没从其中得到任何实质性的
: 益处吧。我不反对我目光短浅,不过对个人来说,一辈子没几个十年。相比曼哈顿、阿
: 波罗这种大工业项目,我觉得生命科学研究成果的见效时间尺度应该更短一些。况且我
: 也不认为测序、生物信息学是了解生命与疾病本源的唯一途径。
: P.S. 我不是科学愤青,一介穷书生而已,只是觉得大部分时候媒体把有些东西夸大得
: 有点过了。

B******s
发帖数: 52
19
可挖的东西很多。。。但是要说这个有啥意义 算是终于让生物学家开始意识到 big
data 的重要性了吧
对于生物学研究领域来说算是又迈出了一小步
先不说这个data能有多大用,能提供多少information,单单这个data 如何去分析是最
大的问题。。。。。。
现状是,high dimensional data analysis 一直没有大的进展。。。CS上可提供的技
术支持有一些但是有限。。。但是关键的地方在math和stat那里。。。。
这条路下来,data会越来越多,越来越complex。。。data有好有坏。insight从哪里来
取决于数据的好坏和分析的手段
数据分析的问题是general的不单单是生物行业 IT,金融,社会,管理,产业链,交
通 面
临的是同样的问题。。。
这个领域需要有突破,生物领域的人不应该局限在等别人发展好的分析方法。。。。。
。到最后喝酒吃肉的都是 IT 数学 的
好处是生物的data比起IT 金融的来说 要更条理化,原因是IT 金融的data是系统运
行过程中generate出来的,生物的data是测量出来的,你可以选择测量有利于分析的
data。。。。可以作为一个比较好的出发点。。。很多统计的做生物除了funding多 这
可能也算是一个原因。。。
B******s
发帖数: 52
20
更像是做出来了个巨型机器,可惜没人会开。。。。。。关键技术还不够
况且,这个data的resolution够不够进行更深入的研究还不知道。。。
相关主题
Pancreatic Cancer genetics求同行(欢迎讨论合作)Postdoctoral Position in Bioinformatics & Computational Ge
求教:如果SNP在dbSNP里找不到怎么办bgi的名声
有没有autism exome database?Obama's Budget Proposal Includes NIH Funding Bump, Supports Long-term Plan at NHGRI
进入Biology版参与讨论
A*****O
发帖数: 394
21
说的很好。我个人来说,发展出一套有效处理海量数据的分析方法,这个本身就是极其
令人兴奋的事情,也是功德无量的事情,收益的人和事也是海量的。
非常赞同产业链这个词,看得很全面,事情都不是隔离起来看的。

big

【在 B******s 的大作中提到】
: 可挖的东西很多。。。但是要说这个有啥意义 算是终于让生物学家开始意识到 big
: data 的重要性了吧
: 对于生物学研究领域来说算是又迈出了一小步
: 先不说这个data能有多大用,能提供多少information,单单这个data 如何去分析是最
: 大的问题。。。。。。
: 现状是,high dimensional data analysis 一直没有大的进展。。。CS上可提供的技
: 术支持有一些但是有限。。。但是关键的地方在math和stat那里。。。。
: 这条路下来,data会越来越多,越来越complex。。。data有好有坏。insight从哪里来
: 取决于数据的好坏和分析的手段
: 数据分析的问题是general的不单单是生物行业 IT,金融,社会,管理,产业链,交

b****r
发帖数: 17995
22
我一直做遗传,ENCODE的东西不说天天用,一直还是用得挺多的,还真没听过谁吹
ENCODE有那么重要,感觉比HGP差老鼻子了。这就是个工具吧,但是确实是个非常有必
要的工具,不然对经常搞DNA的人太痛苦了。以前这些genome 水平的data这个做一点那
个做一点,都是乱糟糟的,然后乱糟糟地整合在一起,错误百出,互相之间很多不
match。如果你没有专门玩DNA,可能对这个问题体会没有我们深,take it for
granted了。
再加上encode还加上了很多功能性基因组的东西,比如大量wetlab来源的基因组水平的
ChIP(包括各种细胞内的各种转录因子,histone modification,DNAmethylation等等
),基因表达,已知的基因多态/突变 全部相当准确地整合到了一起,我觉得对于只要
是和DNA有关的研究都会很有帮助的,后续的cancer genome,信号转导,干细胞和分化
等等都会大大受益,更别说我们这些本来就是做遗传的人了。
2个亿,我觉得非常非常值得。

有1

【在 c*******0 的大作中提到】
: 但是HGP, ENCODE这种项目大比例的数据实际上就是为了烧钱烧进paper里而已,能有1
: %的转化为社会价值就得谢天谢地了。HGP完成之前,各种预言其重要性的报道比今天对
: ENCODE的有过之而无不及吧。10年过去了,我相信大部分人没从其中得到任何实质性的
: 益处吧。我不反对我目光短浅,不过对个人来说,一辈子没几个十年。相比曼哈顿、阿
: 波罗这种大工业项目,我觉得生命科学研究成果的见效时间尺度应该更短一些。况且我
: 也不认为测序、生物信息学是了解生命与疾病本源的唯一途径。
: P.S. 我不是科学愤青,一介穷书生而已,只是觉得大部分时候媒体把有些东西夸大得
: 有点过了。

A*****O
发帖数: 394
23
归纳化,IT化,太重要了!

【在 b****r 的大作中提到】
: 我一直做遗传,ENCODE的东西不说天天用,一直还是用得挺多的,还真没听过谁吹
: ENCODE有那么重要,感觉比HGP差老鼻子了。这就是个工具吧,但是确实是个非常有必
: 要的工具,不然对经常搞DNA的人太痛苦了。以前这些genome 水平的data这个做一点那
: 个做一点,都是乱糟糟的,然后乱糟糟地整合在一起,错误百出,互相之间很多不
: match。如果你没有专门玩DNA,可能对这个问题体会没有我们深,take it for
: granted了。
: 再加上encode还加上了很多功能性基因组的东西,比如大量wetlab来源的基因组水平的
: ChIP(包括各种细胞内的各种转录因子,histone modification,DNAmethylation等等
: ),基因表达,已知的基因多态/突变 全部相当准确地整合到了一起,我觉得对于只要
: 是和DNA有关的研究都会很有帮助的,后续的cancer genome,信号转导,干细胞和分化

c*******0
发帖数: 190
24
我很同意您的说法。ENCODE里面表观遗传的信息解析还是有很大的应用价值的,特别是
对于将来的Environmental genetics来说,这个是能对医学起到巨大作用的。可能我对
基础生物学的见解还不够深,我的本意并不是否定ENCODE这个项目,它的存在确实有之
合理性。只是在我看来,对于phenotype的调控研究相较genotype层面的网络描绘更有
意义。ENCODE里太多关于基因层面的空间调控网络的描述,这些东西我想不管多高深的
计算模型都难以模拟,因为能trigger这些调控的外界因素太多太不可预测了,现在的
技术连72小时天气预报都很难准确预测,蝴蝶效应的reaction chain可以说短时间内无
解。我不是纯生物背景出身,本科上的医学院,10几年来国内的医学教材现在该出到第
7版了吧,遗传学的发展体现到疾病谱上的内容依然只限于开头的“致病原因可能与遗
传有关”而已。我想,如果花这2亿去构建一个足够详尽的数据库,关于各种不同内外
理化环境因素对phenotype改变的关联,真正发挥出epigenome的桥梁作用,可能会更有
指导性的价值。太多关注于基因层面的相互影响,很难保遗传学陷入跟高等数学一样的
境地,看似很完美很正确的理论,却找不到用武之地。

【在 b****r 的大作中提到】
: 我一直做遗传,ENCODE的东西不说天天用,一直还是用得挺多的,还真没听过谁吹
: ENCODE有那么重要,感觉比HGP差老鼻子了。这就是个工具吧,但是确实是个非常有必
: 要的工具,不然对经常搞DNA的人太痛苦了。以前这些genome 水平的data这个做一点那
: 个做一点,都是乱糟糟的,然后乱糟糟地整合在一起,错误百出,互相之间很多不
: match。如果你没有专门玩DNA,可能对这个问题体会没有我们深,take it for
: granted了。
: 再加上encode还加上了很多功能性基因组的东西,比如大量wetlab来源的基因组水平的
: ChIP(包括各种细胞内的各种转录因子,histone modification,DNAmethylation等等
: ),基因表达,已知的基因多态/突变 全部相当准确地整合到了一起,我觉得对于只要
: 是和DNA有关的研究都会很有帮助的,后续的cancer genome,信号转导,干细胞和分化

A*****O
发帖数: 394
25
我想,如果花这2亿去构建一个足够详尽的数据库,关于各种不同内外理化环境因素对
phenotype改变的关联,真正发挥出epigenome的桥梁作用,可能会更有指导性的价值。
--- 在目前的认识框架里面,epigenome难道会处于更优先的(更底层的)位置吗?没
有对DNA sequence有一定认识,如何去研究“各种不同内外理化环境因素对phenotype
改变的关联”?

【在 c*******0 的大作中提到】
: 我很同意您的说法。ENCODE里面表观遗传的信息解析还是有很大的应用价值的,特别是
: 对于将来的Environmental genetics来说,这个是能对医学起到巨大作用的。可能我对
: 基础生物学的见解还不够深,我的本意并不是否定ENCODE这个项目,它的存在确实有之
: 合理性。只是在我看来,对于phenotype的调控研究相较genotype层面的网络描绘更有
: 意义。ENCODE里太多关于基因层面的空间调控网络的描述,这些东西我想不管多高深的
: 计算模型都难以模拟,因为能trigger这些调控的外界因素太多太不可预测了,现在的
: 技术连72小时天气预报都很难准确预测,蝴蝶效应的reaction chain可以说短时间内无
: 解。我不是纯生物背景出身,本科上的医学院,10几年来国内的医学教材现在该出到第
: 7版了吧,遗传学的发展体现到疾病谱上的内容依然只限于开头的“致病原因可能与遗
: 传有关”而已。我想,如果花这2亿去构建一个足够详尽的数据库,关于各种不同内外

n******7
发帖数: 12463
26
我正头疼呢
我老板说让我把paper都读了,然后告诉她有什么可以用到我们这个disease project的
然后让我把TFBS都弄出来看看,我只好说这个project出来的TFBS不是一个excel可以搞
定的,把上百个实验的数据整一起也没那么容易,我们还是用genome browser上面
cluster好的吧
就bioinfo的人来说,还是有很多可以挖掘的,我现在脑子里面就有几个想法,不过老
板不会让我做,我只能下班了自己做着玩...
w********r
发帖数: 1431
27
海量的数据出来之后,通过各种分析,可以看到很多以前看不出来的信息,当然这个主
要是bioinfor的人在搞。算法和分析的角度应该挺重要的了
n********k
发帖数: 2818
28
what's your future boss thinking about it? He and the one I posted an Ad for
a while back have been a big part of the program...my own research has and
will surely benefit lot more from the project...one naive concern I have is
about the quality and the commonality of the data from different labs...

【在 w********r 的大作中提到】
: 海量的数据出来之后,通过各种分析,可以看到很多以前看不出来的信息,当然这个主
: 要是bioinfor的人在搞。算法和分析的角度应该挺重要的了

i**y
发帖数: 71
29
Nothing particularly exciting

【在 C********4 的大作中提到】
: 是不是只有做bioinformatics的才能分析这些数据。
: 做wet实验的,怎么能查查这些数据库,看看有没有可能跟自己的课题有关系?

Z******5
发帖数: 435
30
找一些基因,包括miRNA或lncRNA,的promoter,用genome browser看一下,就能猜个
八九不离十了。
相关主题
exome sequencing realighment请教neurogenomics职业规划
生命攸关,请大家帮助我们理解和学习全基因组测序职业选择问题求教。
请教做单个病人的whole cancer genome 测序的意义请推荐一些人类遗传学的入门书籍和综述论文
进入Biology版参与讨论
l**********1
发帖数: 5204
31
要上 R package
pls refer:
van Hijum SA, Medema MH, Kuipers OP. (2009)
Mechanisms and evolution of control logic in prokaryotic transcriptional
regulation.
Microbiol Mol Biol Rev. 73: 481-509
Abstract
A major part of organismal complexity and versatility of prokaryotes resides
in their ability to fine-tune gene expression to adequately respond to
internal and external stimuli. Evolution has been very innovative in
creating intricate mechanisms by which different regulatory signals operate
and interact at promoters to drive gene expression. The regulation of target
gene expression by transcription factors (TFs) is governed by control logic
brought about by the interaction of regulators with TF binding sites (TFBSs
) in cis-regulatory regions. A factor that in large part determines the
strength of the response of a target to a given TF is motif stringency, the
extent to which the TFBS fits the optimal TFBS sequence for a given TF.
Advances in high-throughput technologies and computational genomics allow
reconstruction of transcriptional regulatory networks in silico. To optimize
the prediction of transcriptional regulatory networks, i.e., to separate
direct regulation from indirect regulation, a thorough understanding of the
control logic underlying the regulation of gene expression is required. This
review summarizes the state of the art of the elements that determine the
functionality of TFBSs by focusing on the molecular biological mechanisms
and evolutionary origins of cis-regulatory regions.
link:
//www.ncbi.nlm.nih.gov/pubmed/19721087

【在 n******7 的大作中提到】
: 我正头疼呢
: 我老板说让我把paper都读了,然后告诉她有什么可以用到我们这个disease project的
: 然后让我把TFBS都弄出来看看,我只好说这个project出来的TFBS不是一个excel可以搞
: 定的,把上百个实验的数据整一起也没那么容易,我们还是用genome browser上面
: cluster好的吧
: 就bioinfo的人来说,还是有很多可以挖掘的,我现在脑子里面就有几个想法,不过老
: 板不会让我做,我只能下班了自己做着玩...

M********n
发帖数: 31
32
是12.3亿美元,不是2亿美元
The new data come from the Encyclopedia of DNA Elements project, or ENCODE,
a $123 million endeavor begun by the National Human Genome Research
Institute (NHGRI) in 2003, which includes 442 scientists in 32 labs around
the world.
Read more: http://healthland.time.com/2012/09/06/junk-dna-not-so-useless-after-all/#ixzz25wLTEg49

【在 C********4 的大作中提到】
: 是不是只有做bioinformatics的才能分析这些数据。
: 做wet实验的,怎么能查查这些数据库,看看有没有可能跟自己的课题有关系?

l**********1
发帖数: 5204
33
俺说呢 要是白兔那里NIBS 主干 差不多10.0亿 人刀
要是富士康主干 7.0 亿 人刀 加几十个跳河 跳楼的 技工 也可以凑合搞定啊
所以接下来的 Encyclopedia of miRNA or nc RNA Elements project
还是给鸿海的郭台铭 取得标书 主干吧 哈

,

【在 M********n 的大作中提到】
: 是12.3亿美元,不是2亿美元
: The new data come from the Encyclopedia of DNA Elements project, or ENCODE,
: a $123 million endeavor begun by the National Human Genome Research
: Institute (NHGRI) in 2003, which includes 442 scientists in 32 labs around
: the world.
: Read more: http://healthland.time.com/2012/09/06/junk-dna-not-so-useless-after-all/#ixzz25wLTEg49

S**********l
发帖数: 3835
34
In the whole human history, has there been ANY significant discovery made by
a consortium?
In the whole human history, has there been a SINGLE discovery made by a
consortium?
When can they stop wasting money? Fund some small projects that can change
human history!

,

【在 M********n 的大作中提到】
: 是12.3亿美元,不是2亿美元
: The new data come from the Encyclopedia of DNA Elements project, or ENCODE,
: a $123 million endeavor begun by the National Human Genome Research
: Institute (NHGRI) in 2003, which includes 442 scientists in 32 labs around
: the world.
: Read more: http://healthland.time.com/2012/09/06/junk-dna-not-so-useless-after-all/#ixzz25wLTEg49

p****n
发帖数: 9263
35
$123M is 1.23亿 only

,

【在 M********n 的大作中提到】
: 是12.3亿美元,不是2亿美元
: The new data come from the Encyclopedia of DNA Elements project, or ENCODE,
: a $123 million endeavor begun by the National Human Genome Research
: Institute (NHGRI) in 2003, which includes 442 scientists in 32 labs around
: the world.
: Read more: http://healthland.time.com/2012/09/06/junk-dna-not-so-useless-after-all/#ixzz25wLTEg49

O******e
发帖数: 4845
36
Human Genome Project的提前完成,international consortium功不可没。没有
International Genomics Consortium,TCGA现在不可能做得这么好。
Consortium不是唯一出路,但没有了它,一系列的大工程不可能完成。

by

【在 S**********l 的大作中提到】
: In the whole human history, has there been ANY significant discovery made by
: a consortium?
: In the whole human history, has there been a SINGLE discovery made by a
: consortium?
: When can they stop wasting money? Fund some small projects that can change
: human history!
:
: ,

b****r
发帖数: 17995
37
你这个说法有点搞笑
这种consortium本来就是以service为目的而不是以直接discovery为目的。service在
你看来就是浪费钱。你从来不用你们学校任何core facility的service吗
你应该去问问最近在function genome方面有重大discovery的那些作者,有几个没有用
到过ENCODE的。完全没有用过的我猜想最多到不了50%

by

【在 S**********l 的大作中提到】
: In the whole human history, has there been ANY significant discovery made by
: a consortium?
: In the whole human history, has there been a SINGLE discovery made by a
: consortium?
: When can they stop wasting money? Fund some small projects that can change
: human history!
:
: ,

y****e
发帖数: 23939
38
1000刀就可以测序?是全基因组吗?我们这里测whole exome的报价还是接近8000刀呢
。生意还很好。

【在 c*******0 的大作中提到】
: 对这种宏观技术流的项目还是保留谨慎的乐观;HGP完成10年来,除了高通量测序技术
: 爆炸式的发展使个体测序接近突破1000美刀以外,还看不到其具体为生物医学或临床实
: 践带来的革命式推动,近30年来疾病谱基本没有太大的改变。以技术为导向的生物学研
: 究终究还是缺少一点灵魂。ENCODE的框架太大,看上去吓人一跳,实际只是把一些已知
: 的不成系统的基因调控网络归档化、IT化而已,不知道10年后能创造些什么惊世骇俗的
: 东东。

a*******a
发帖数: 4233
39
没看文章只看了个摘要
似乎ENCODE主要分3大块
一块是tf的binding
一块是组蛋白甲基化修饰的分布
一块是测出来一大批新的none coding RNA
然后再把这三块比来比去看有没有相关性。
不知我有没有抓住关键的点。
我觉得none coding RNA肯定是有用的
在各个肿瘤或者其他疾病里比来比去肯定能找到东西。
组蛋白修饰就不好说了,他们是用chip-seq做的
组蛋白甲基化修饰的抗体特异性很难说
而且随环境和技术影响变化很大,可重复性不好。
当年eric lander不是提出个es全基因组的bivalent domain概念么?
我们也重复过chipseq,不能说我们重复不出来,至少可以说数据差异很大。
组蛋白修饰本来就是会变的,再加上种种实验上的变量,最后能有多大参考价值很难说。
B*********r
发帖数: 19
40
怎么没人提GWAS结合ENCODE的应用呢?之前的大把大把的NG paper,不知道又要出多少
后续的版本了
相关主题
请推荐一些人类遗传学的入门书籍和综述论文human genome mutation rate大概是多少, exome区域内呢?
Ask a simple question...machine learning来对GWAS结果建模
求教生物信息学问题问个基因组的问题
进入Biology版参与讨论
y***i
发帖数: 11639
41
HGP完成10年过去了,我相信大部分人没从其中得到任何实质性的益处吧。
你这说法太搞笑了。
你好比指着美洲大陆说:哥伦布已经发现美洲大陆10年了,我相信世界上大部分人还没
从其中得到任何实质性的益处吧。

有1

【在 c*******0 的大作中提到】
: 但是HGP, ENCODE这种项目大比例的数据实际上就是为了烧钱烧进paper里而已,能有1
: %的转化为社会价值就得谢天谢地了。HGP完成之前,各种预言其重要性的报道比今天对
: ENCODE的有过之而无不及吧。10年过去了,我相信大部分人没从其中得到任何实质性的
: 益处吧。我不反对我目光短浅,不过对个人来说,一辈子没几个十年。相比曼哈顿、阿
: 波罗这种大工业项目,我觉得生命科学研究成果的见效时间尺度应该更短一些。况且我
: 也不认为测序、生物信息学是了解生命与疾病本源的唯一途径。
: P.S. 我不是科学愤青,一介穷书生而已,只是觉得大部分时候媒体把有些东西夸大得
: 有点过了。

G***y
发帖数: 1082
42
同意这个,这种大规模搭架子的工程还真的得consortium来干,别说一个实验室,一个
中心都搞不来。其实就是新闻每次都把consortium的结果吹上天了,和项目本身的目的
差的很远。

【在 b****r 的大作中提到】
: 你这个说法有点搞笑
: 这种consortium本来就是以service为目的而不是以直接discovery为目的。service在
: 你看来就是浪费钱。你从来不用你们学校任何core facility的service吗
: 你应该去问问最近在function genome方面有重大discovery的那些作者,有几个没有用
: 到过ENCODE的。完全没有用过的我猜想最多到不了50%
:
: by

s******s
发帖数: 13035
43
不算人工,不算机器折旧,只算耗材。
好像ion torrent那个已经降到$1000了,最近就在申请那个什么奖,要求
要在多少天之内连续测多少个序就行了

【在 y****e 的大作中提到】
: 1000刀就可以测序?是全基因组吗?我们这里测whole exome的报价还是接近8000刀呢
: 。生意还很好。

c*******0
发帖数: 190
44
我不打嘴仗,每个人都有不同的aspect而已。我等着十年后来挖这个坟,或者你来挖我
的坟。还有你的比喻,打回去重写。

【在 y***i 的大作中提到】
: HGP完成10年过去了,我相信大部分人没从其中得到任何实质性的益处吧。
: 你这说法太搞笑了。
: 你好比指着美洲大陆说:哥伦布已经发现美洲大陆10年了,我相信世界上大部分人还没
: 从其中得到任何实质性的益处吧。
:
: 有1

g*********3
发帖数: 177
45
文章已经提得很清楚了,GWAS和Regulatory region有很大的overlapping,不知道你有
没有看paper~
个人认为ENCODE可以很好的说明GWAS的价值~
当然了GWAS SNP result到底能explain多少,找到的SNP怎样解释,这个不是GWAS的事
情!

【在 B*********r 的大作中提到】
: 怎么没人提GWAS结合ENCODE的应用呢?之前的大把大把的NG paper,不知道又要出多少
: 后续的版本了

g*********3
发帖数: 177
46
我比较同意你说的三大块~ 另外ENCODE稍微做了下和各种SNP的overlapping,另外试着
test了一些很basic的假说~
ENCODE的histone antibody个人认为是可靠的,他们有好几篇paper(包括此前的专门一
篇test antibody的paper)是专门test antibody specificity的,基于WB和MS,QPCR..
.我觉得就差不多了~
我觉得你说的数据差异大,应该是生物学的本质...
另外,我们可能还需要更多的数据来告诉那些combinations of histone marks才是真
正的informative...这个在ENCODE里才刚刚开始~

【在 a*******a 的大作中提到】
: 没看文章只看了个摘要
: 似乎ENCODE主要分3大块
: 一块是tf的binding
: 一块是组蛋白甲基化修饰的分布
: 一块是测出来一大批新的none coding RNA
: 然后再把这三块比来比去看有没有相关性。
: 不知我有没有抓住关键的点。
: 我觉得none coding RNA肯定是有用的
: 在各个肿瘤或者其他疾病里比来比去肯定能找到东西。
: 组蛋白修饰就不好说了,他们是用chip-seq做的

a*******a
发帖数: 4233
47
是这篇么。。 我没细去追这些东西
An assessment of histone-modification antibody quality
Thea A Egelhofer1, 16 Aki Minoda2, 3, 16 R David Hawkins4, 5 Jason D Lieb14,
15
Nature Structural & Molecular Biology
Received 07 June 2010 Accepted 09 November 2010 Published online 05 December
2010
http://www.nature.com/nsmb/journal/v18/n1/full/nsmb.1972.html
还在奇怪为啥会发在这么高的杂志。。

..

【在 g*********3 的大作中提到】
: 我比较同意你说的三大块~ 另外ENCODE稍微做了下和各种SNP的overlapping,另外试着
: test了一些很basic的假说~
: ENCODE的histone antibody个人认为是可靠的,他们有好几篇paper(包括此前的专门一
: 篇test antibody的paper)是专门test antibody specificity的,基于WB和MS,QPCR..
: .我觉得就差不多了~
: 我觉得你说的数据差异大,应该是生物学的本质...
: 另外,我们可能还需要更多的数据来告诉那些combinations of histone marks才是真
: 正的informative...这个在ENCODE里才刚刚开始~

g*********3
发帖数: 177
48
可能确实没啥创新的 估计是看在重要性和牛逼老板的份上让发的吧~ 除了这两篇还有
另外一篇,基本结论就是现在好多用的antibody不合格!crossactivity太严重!

Lieb14,
December

【在 a*******a 的大作中提到】
: 是这篇么。。 我没细去追这些东西
: An assessment of histone-modification antibody quality
: Thea A Egelhofer1, 16 Aki Minoda2, 3, 16 R David Hawkins4, 5 Jason D Lieb14,
: 15
: Nature Structural & Molecular Biology
: Received 07 June 2010 Accepted 09 November 2010 Published online 05 December
: 2010
: http://www.nature.com/nsmb/journal/v18/n1/full/nsmb.1972.html
: 还在奇怪为啥会发在这么高的杂志。。
:

K****n
发帖数: 5970
49
我就不亲自查文献了。。。请问这边讨论的big data是多big?要用hadoop之类的分布
式处理么?
u*********1
发帖数: 2518
50
这个,还是少说点废话空话大话。。。
说个对自己研究最实在的:
我分析exome data,希望寻找可能的disease-causing mutation;目前大家主要关注的
还是exon里面的nonsynonymous mutation,或者frameshift mut (主要还是SNP,然后
加上少数indel);而且还要通过1000G的筛选找到rare mutation,还要根据疾病的模
型进一步筛选。所以筛选到最后,反正我自己的project就是找不到。
那么我就想问,是不是这个ENCODE出来了以后,等于说更多的genome被annotate了?那
我们的寻找disease mutation的眼光就不用只放在exon上了?。。。可能致病位点就是
在那些regulatory sites上呢。。。当然这样就不能仅限于exome测序了。。。。。但
到底多少疾病是因为regulatory region的SNP导致的呢?我看nature genetics上很多
遗传病或者遗传相关的疾病还是exome的突变导致的

【在 C********4 的大作中提到】
: 是不是只有做bioinformatics的才能分析这些数据。
: 做wet实验的,怎么能查查这些数据库,看看有没有可能跟自己的课题有关系?

相关主题
大家看看,这TIME上的话,是不是有语法错误?求教:如果SNP在dbSNP里找不到怎么办
Obama unveils brain mapping project有没有autism exome database?
Pancreatic Cancer genetics求同行(欢迎讨论合作)Postdoctoral Position in Bioinformatics & Computational Ge
进入Biology版参与讨论
u**********d
发帖数: 573
51
选择性地测exome,有什么好处?降低non-exon信号的干扰?降低成本增加depth?感觉
那个富集exon的过程不太好。

【在 u*********1 的大作中提到】
: 这个,还是少说点废话空话大话。。。
: 说个对自己研究最实在的:
: 我分析exome data,希望寻找可能的disease-causing mutation;目前大家主要关注的
: 还是exon里面的nonsynonymous mutation,或者frameshift mut (主要还是SNP,然后
: 加上少数indel);而且还要通过1000G的筛选找到rare mutation,还要根据疾病的模
: 型进一步筛选。所以筛选到最后,反正我自己的project就是找不到。
: 那么我就想问,是不是这个ENCODE出来了以后,等于说更多的genome被annotate了?那
: 我们的寻找disease mutation的眼光就不用只放在exon上了?。。。可能致病位点就是
: 在那些regulatory sites上呢。。。当然这样就不能仅限于exome测序了。。。。。但
: 到底多少疾病是因为regulatory region的SNP导致的呢?我看nature genetics上很多

l********e
发帖数: 415
52
主要是便宜很多 分析也简单 - 氨基酸变异 多好解释 不像non-coding region 说也说
不清

【在 u**********d 的大作中提到】
: 选择性地测exome,有什么好处?降低non-exon信号的干扰?降低成本增加depth?感觉
: 那个富集exon的过程不太好。

l********e
发帖数: 415
53
idea很好 不过就目前用的几个cell line完全不够看(虽然号称用了多少多少个cell
line和tissue)
就像他们自己说的 regulatory sequence的使用是非常dynamic的
除非他们把这东西从受精卵开始 每个stage 每个cell type全做一遍
否则达不到HGP的高度
很简单的实验 看了几个已知enhancer的locus
里面完全没有
http://metatracks.encodenets.gersteinlab.org/

【在 C********4 的大作中提到】
: 是不是只有做bioinformatics的才能分析这些数据。
: 做wet实验的,怎么能查查这些数据库,看看有没有可能跟自己的课题有关系?

u**********d
发帖数: 573
54
那就得先定义每个stage,每个cell type,离不开靠谱的marker组合,如果没有好用的
表面marker来标记每个细胞类型,那么还得想其它办法来办法富集这些细胞。这项工程
看起来比encode要宏伟得多。

【在 l********e 的大作中提到】
: idea很好 不过就目前用的几个cell line完全不够看(虽然号称用了多少多少个cell
: line和tissue)
: 就像他们自己说的 regulatory sequence的使用是非常dynamic的
: 除非他们把这东西从受精卵开始 每个stage 每个cell type全做一遍
: 否则达不到HGP的高度
: 很简单的实验 看了几个已知enhancer的locus
: 里面完全没有
: http://metatracks.encodenets.gersteinlab.org/

1 (共1页)
进入Biology版参与讨论
相关主题
bgi的名声Ask a simple question...
Obama's Budget Proposal Includes NIH Funding Bump, Supports Long-term Plan at NHGRI求教生物信息学问题
exome sequencing realighmenthuman genome mutation rate大概是多少, exome区域内呢?
生命攸关,请大家帮助我们理解和学习全基因组测序machine learning来对GWAS结果建模
请教做单个病人的whole cancer genome 测序的意义问个基因组的问题
请教neurogenomics职业规划大家看看,这TIME上的话,是不是有语法错误?
职业选择问题求教。Obama unveils brain mapping project
请推荐一些人类遗传学的入门书籍和综述论文Pancreatic Cancer genetics求同行(欢迎讨论合作)
相关话题的讨论汇总
话题: encode话题: genome话题: regulatory话题: consortium话题: hgp