问个人基因组测序的问题 - Biology版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Biology版 - 问个人基因组测序的问题

相关主题
● 谁能讲讲de novo assembly？	● 简单介绍 Bioinformatics Tools for NGS 分析
● 现在测序哪家强？能不能找蓝翔啊	● Crowd Sourcing
● 请推荐微生物基因组测序gap closure服务的公司	● 问一个如何确定“Indel"的问题，能用deep sequencing吗？
● 深度测序的精确度会随被测的目的基因改变吗？	● 重复韩春雨的工作，测序也不是标准
● mouse的ChIPseq结果却map到human基因组，咋回事？	● 呼吁仇子龙公开测序数据
● 含有indel的reads怎么比对？	● 有个直接测序crispr-cas9的indel的方法
● 学术问题：另一个我？	● Mitbbs水平挺高的，纯从科学家角度质疑韩春雨
● 【包子求助】call SNPs 有哪些工具？？	● 版上有谁用过或知道Knome这个公司吗?

相关话题的讨论汇总
话题: assembly话题: novo话题: 基因组话题: variation话题: 测序

进入Biology版参与讨论

1

(共1页)

R*********e 发帖数: 53	1 如果病人样品做全基因组测序，是不是都得从头拼接？为什么？谢谢
c*********r 发帖数: 1312	2 这个问题我也很感兴趣，期待版上高人回答。我的理解，人跟人之间的基因组的差异还是有一些，尤其是病人的话，大家肯定想找出差异。如果简单的把序列map到reference genome上边，有些差异比如SNP，小的indel 还是可以找得到，但是很多复杂的差异，大片段的indel、invertion什么的，也许就不太容易找到了。这里有篇很好的2015年的nature review：Genetic variation and the de novo assembly of human genomes “Short-read massively parallel sequencing has revolutionized our ability to discover genetic variation but is insufficient to generate high-quality genome assemblies or resolve most structural variation. Full resolution of variation is only guaranteed by complete de novo assembly of a genome. ” 所以我觉得de novo assembly和长片段的测序会更有优势。
g*****n 发帖数: 250	3 哪是“头”？
r**********e 发帖数: 587	4 de novo assembly,我觉得对于全基因组，很难，计算机运算的耗费太大过去尝试过一下，好像最基础的都需要very big RAM，比如一个node需要256GB的RAM ，这个对于一般学校很难有这样的大型运算cluster 另外，如果reads很短，纵然你做assembly也会很难，因为overlap的区域很短。所以high-quality long reads还是我们要等待的革命性技术。推荐一个很好的assembler-based SV calling： http://cortexassembler.sourceforge.net/ 现在比较实际的是，用其他办法找到的SV或SNP candidate，然后做local assembly来精确breakpioint，计算量大大大大大降低以后long reads出现或者普及，我们就少了很多BWA的那种multiple alignment的麻烦，不管mapping还是assembly都可行当然了，对于novel insertion，这种ref里没有的sequence，当然assembly是王道。目前short reads对于novel big insertion基本是一点办法都没有。 Anyway未来high-quality high-throughput long reads出现，基因组学会有新革命，会迅速产生大量疾病遗传上的新发现当然我也很久很久没接触过assembly，难免信息落后偏颇，希望高人指正 indel to 【在 c*********r 的大作中提到】 : 这个问题我也很感兴趣，期待版上高人回答。 : 我的理解，人跟人之间的基因组的差异还是有一些，尤其是病人的话，大家肯定想找出 : 差异。如果简单的把序列map到reference genome上边，有些差异比如SNP，小的indel : 还是可以找得到，但是很多复杂的差异，大片段的indel、invertion什么的，也许就不 : 太容易找到了。 : 这里有篇很好的2015年的nature review：Genetic variation and the de novo : assembly of human genomes : “Short-read massively parallel sequencing has revolutionized our ability to : discover genetic variation but is insufficient to generate high-quality : genome assemblies or resolve most structural variation. Full resolution of
c*********r 发帖数: 1312	5 是的，de novo assembly对计算要求太高，数据要全部load到内存里，所以特别吃内存，瓶颈不在CPU。要是搞生物信息的和CS的能开发出更快速、准确、对硬件要求低的算法就好了。 RAM 【在 r**********e 的大作中提到】 : de novo assembly,我觉得对于全基因组，很难，计算机运算的耗费太大 : 过去尝试过一下，好像最基础的都需要very big RAM，比如一个node需要256GB的RAM : ，这个对于一般学校很难有这样的大型运算cluster : 另外，如果reads很短，纵然你做assembly也会很难，因为overlap的区域很短。 : 所以high-quality long reads还是我们要等待的革命性技术。 : 推荐一个很好的assembler-based SV calling： http://cortexassembler.sourceforge.net/ : 现在比较实际的是，用其他办法找到的SV或SNP candidate，然后做local assembly来 : 精确breakpioint，计算量大大大大大降低 : 以后long reads出现或者普及，我们就少了很多BWA的那种multiple alignment的麻烦 : ，不管mapping还是assembly都可行

1

(共1页)

进入Biology版参与讨论

相关主题
● 版上有谁用过或知道Knome这个公司吗?	● mouse的ChIPseq结果却map到human基因组，咋回事？
● bioinformatics吐下槽	● 含有indel的reads怎么比对？
● 贡献一个SNP/Indel calling pipeline	● 学术问题：另一个我？
● 有谁谈谈从零开始学NGS数据分析都需要具备什么知识？	● 【包子求助】call SNPs 有哪些工具？？
● 谁能讲讲de novo assembly？	● 简单介绍 Bioinformatics Tools for NGS 分析
● 现在测序哪家强？能不能找蓝翔啊	● Crowd Sourcing
● 请推荐微生物基因组测序gap closure服务的公司	● 问一个如何确定“Indel"的问题，能用deep sequencing吗？
● 深度测序的精确度会随被测的目的基因改变吗？	● 重复韩春雨的工作，测序也不是标准

相关话题的讨论汇总
话题: assembly话题: novo话题: 基因组话题: variation话题: 测序

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)