n******7 发帖数: 12463 | 1 谢谢回复
我目前想看的还没到那么细,我只想看整个gene的deletion/duplication
indel先不考虑,break point在gene内部的也不管
另外,我感觉已有的CNV data中间,大部分还是用的CGH-array检测的,这个自然也不
能对break point的精度有太高要求。而且我个人的感觉是,CNV和SV这两个词虽然很多
时候指同样东西,但是其实跟检测手段有关的。用CGH-array的看到的就是个荧光强度
,所以叫copy number很自然。用sequencing的需要通过alignment的信息来检测,所以
叫structural variation.
我对CNV比较感兴趣是因为它比SNP还是靠谱多了,对disease的贡献很大 |
|
n******7 发帖数: 12463 | 2 谢谢回复,非常有用
搜了一下ISCA,这个data可以在NCBI的dbVar database找到,在特定的几个studyID下
面。以前就浏览过dbVar,随机找到一些结果,发现都是SNP,indel,以为没CNV什么事情
关于DECIPHER,请问如果没有注册,可以有办法download他们的数据吗?我好想只能通
过search获取每个disease相关的信息。 另外很奇怪的是,我搜schizophrenia,居然
没有返回结果,不知道为什么。
OMIM database也有CNV的信息?这个我到还没注意,这就去看看,thanks
Inheritance
loci. |
|
u*********1 发帖数: 2518 | 3 另外随便说一句
比如做过SNP calling的人都知道GATK,就是Broad搞出来的
GATK是SNP calling的terminator;基本上GATK横扫其他所有的软件,他们把SNP/indel
calling的功能不管是深度(比如各种data clean和error-correction model以保证找
到的SNP是非常可信的)还是宽度(满足各种不同project的需求,功能多样化,比如
haplotype inference或者推广到population level)都做到极致,据说都要开始商业
化,不free了
另外包括sequencing library preparation protocol,data storage/processing等等
, 我感觉基本NGS这一块Broad做了太多原创工作,算是sets up a standard
那为什么Broad可以做到?我相信因为他们有足够的funding做sequencing,大量的来自
哈佛的patient samples,懂得计算工程的coding和data processing的人才,以及横扫
生物/计算/... 阅读全帖 |
|
u*********1 发帖数: 2518 | 4 SR methods are definitely the most accurate because it provides the exact
breakpoint; but we're not lucky enough to have reads encompassing
breakpoints all the time even for SV in unique region, not to mention those
complex structural variants involving repeats/duplication.
So till now, SV field or even indel calling, I would say still quite messy
with lots of false positives, and whole field is lagging behind compared
with SNP calling.
If you are interested in repeats, please first define "repe... 阅读全帖 |
|
k********g 发帖数: 56 | 5 多谢,受教了。 我是搞统计出身,现阶段确实是更关心比较长 indel,因为从我们的
角度来看建模比较简单。您提过的几个paper我会仔细研究一下。多谢。
those
you
nucleotids
around |
|
n******7 发帖数: 12463 | 6 你这说的都是expression分析
要做genotyping,microarray跟NGS不可比,NGS搞下来,甭管知道的不知道的,SNP/
indel/SNV,全套都搞定了
就是说expression,我也不明白为什么NGS不好.可能现在成本还高,不像microarray特
定针对一组transcripts。但是价格在迅速下降,通量快速提升,处理方法也在不断改
进。我不觉得microarray可以笑多久
DX, |
|
w****w 发帖数: 521 | 7 http://manuelcorpas.com/tag/exome/
这家伙把家人的测序结果都release到public domain了。
我来做个调查:
1.大家是否能用这些数据想些课题出来?
2.如果有想法,要对这些数据做怎样的处理?自己是否有能力处理?
我主要想知道,除了SNP/INDEL calling之外还有哪些分析可做。
我觉得以后这样的数据会越来越多,想开个提供测序数据处理和其它Customized服务的
网站,不知道是否有市场。
上次问的MiSeq的问题,居然没一人回答,难道这是trade secret? |
|
e**r 发帖数: 1144 | 8 knockout老鼠,只有一两个bp插入或缺失
直接在突变位点设计引物质量不好
有啥别的方便的办法做Genotyping没? |
|
s*********s 发帖数: 110 | 9 T7 assay
位点左右各100bp+300bp
——〉 <----
同样的引物,PCR产物和WT的PCR产物退火,T7 cut
如果担心PCR不纯的话,做两步PCR。 |
|
s******r 发帖数: 1245 | 10 Taqman有测SNP的real time assay
或者pcr片段直接去测序 |
|
|
z*t 发帖数: 863 | 12 can we run page with short PCR product(around 100-200bp)? |
|
a********k 发帖数: 2273 | 13 有real time PCR的话,设计primer做HRM最省事。 |
|
|
m*********y 发帖数: 79 | 15 哦,不好意思 没有看到data 那个确实已经是exome的data了
如果可以trust data的话,那么如果确定排除相关通路的point mutation 和indel
想详尽的话可以测RNA-seq 看看有没有可能的fusion
还可以做下whole genome, 看有没有translocation 和 copy number的variants。
当然如果都做可能花费会高一点,但是我给你提到了TGEN, 他们是non-profit的,可
能一个tech不到2000吧,反正应该肯定比商业的要便宜很多。 |
|
m****c 发帖数: 244 | 16 BCM exome测序对Mendelian疾病的检出率只有25%。small indel,tandem repeat 都
call不好。并且抓exome的时候会丢掉一部分,所以覆盖不全。建议:
1)TCH的检测实验室可以做lipid panel,只抓lipid相关的exome,抓不到的会sanger
测序补上。你可以去试试。
2)做high coverage 的 whole genome sequencing,父母孩子一起做,call de novo
mutation,但这是一个科研问题了。并且可能要做细致的de novo assembly,耗时长,
没有成熟的pipeline。我们在做这方面的研究,但遗憾的是还不能立刻用。
祝福孩子!
MCT
★ 发自iPhone App: ChineseWeb 7.8 |
|
y**********n 发帖数: 478 | 17 看了下报告(Gene info - SLC25A13 on Dec 23, 2013.pdf),里面用的是HGMD数据库
(http://www.hgmd.org/)注释的SLC25A13基因,并没有给出宝宝的SLC25A13基因序列和突变信息。
下面是HGMD数据库的SLC25A13的注释信息:
Mutation type Number of mutations Mutation data by type (register or
log in)
Missense/nonsense 27
Splicing 10
Regulatory 0 No mutations
Small deletions 5
Small insertions 1
Small indels 0 No mutations
Gross deletions 2
Gross insertions/duplications 3
Complex rearrangements 0 No muta... 阅读全帖 |
|
y**********n 发帖数: 478 | 18 Mutations collected by Yuan-Zong Song et al, Plos one, 2013:
"32 missense (including 3 neutral), 18 nonsense, 14 splice-site (including c
.1311C>T), 9 deletion, 3 insertion, 2 duplication, 1 indel (g./c.1610–
1612delTAGinsAT), 1 aberrant transcript (r.16_212dup) with unknown mutation,
and 1 pathogenic SNP (c.2T>C)"
http://www.plosone.org/article/fetchObject.action?uri=info:doi/ |
|
s*****g 发帖数: 87 | 19 Dev Dyn. 2014 Aug 27. doi: 10.1002/dvdy.24183. [Epub ahead of print]
Poly Peak Parser: Method and software for identification of unknown indels
using Sanger sequencing of PCR products.
Hill JT1, Demarest BL, Bisgrove BW, Su YC, Smith M, Yost HJ.
please send to [email protected]
(function(){try{var s,a,i,j,r,c,l,b=document.getElementsByTagName("script");l=b[b.length-1].previousSibling;a=l.getAttribute('data-cfemail');if(a){s='';r=parseInt(a.substr(0,2),16);for(j=2;a.length-j;j+=2){c=parseInt(a.su... 阅读全帖 |
|
m*****z 发帖数: 1451 | 20 off target analysis 是找gRNA引起 的 off target digestion 引入的indels
southdernblot是测donor的random integration
两者不是一个东西。
要求严格的话都要做。 |
|
|
m*****z 发帖数: 1451 | 22 还是有selection的嘛。不过hdr效率会比indels要低得多,很有可能大部分clones会是
你所谓的knockout |
|
j****n 发帖数: 3370 | 23 分析的时候查下indel就行了
★ 发自iPhone App: ChineseWeb 8.7 |
|
y*********u 发帖数: 183 | 24 sorry what is indel? Or do you mean index? |
|
|
c*******e 发帖数: 5818 | 26 MutationSurveyor,这个看起来不错,谁有经验的给说说可靠不。 |
|
s******r 发帖数: 1245 | 27 deep sequencing适合做量大的,几个sample的做划不来,多到几十上百个sample的话
比其他方法都便宜 |
|
|
h****n 发帖数: 333 | 29 我自己就用过呀,不好用不会向你推荐的:)
我做的TALEN alleles都是用这个软件看的
不相信的话手动检查一下,一般都是对的,除非测序结果太难看 |
|
c*******e 发帖数: 5818 | 30 谢谢你,
这个HRMA是high resolution melting analysis吗? |
|
c*******e 发帖数: 5818 | 31 做HRMA, PCR 是不是得gel purification? |
|
|
M***D 发帖数: 117 | 33 本人国内名校本科毕业,
美国癌症细胞生物学博士,癌症细胞生物学的各种实验技术都熟悉
美国计算机硕士,
擅长python编程,
懂Java 和 R 编程
懂常规数据库
对于二代测序的常规流程熟悉并有实际经验。
比如 alignment, assembly, SNP/indel callingk.
由于没有绿卡,
求大学,研究所,医院的工作,
二代数据分析最好,
实验室,测序中心, 数据中心都可以
也可以做部分癌症生物学或者细胞生物学的实验, 但不能超过总时间的一半.
工资要求5万以上.
恳求大家帮忙. |
|
q******o 发帖数: 17 | 34 我们是一家以基因检测分析以及提供长期疗养咨询意见为业务的新兴startup公司,主
要服务于来自中国的客户,由于业务增长需求,该团队现正在招纳新成员加入,成员具
体要求如下:
生物信息:熟悉next-generation sequencing数据与文件格式,有具体whole-exome
sequencing,whole genome sequencing或者RNA-seq分析经验的人才
具体技术:sequence read质量控制,alignment, variant calling(SNPs/indels/
structure variations),其他NGS相关软件包;Linux环境与shell,Perl/Python或C++
/java编程,统计分析。
分子生物学:在遗传学,基因学以及癌症研究方面有经验的人才。
有意者请联系 [email protected]
/* */,并附件发一下自己的CV. 我们会在24小时内联
系您。
谢谢! |
|
m*********D 发帖数: 1727 | 35 是。从single-replacement的“Wildtype"copy情况看,两个guide sequences都起了作
用。之所以加引号,是因为没有真正的wildtype,两个dsb上独有indels.
本意是让想用CRISPR作point-mutation的注意risk,没有筛选的情况下概率太小了一些
。我自己的概率是1 out of 1000左右呢。我看了biotechnique的那篇文章,也差不多
。所以,提醒一下。 |
|
m*********D 发帖数: 1727 | 36 没作过真菌,所以,主意不一定合适。
你三次转化,效率不高,到你挑克隆,这中间有没有筛选--GFP可以用来筛选吗?或带
resistance的基因?
从biotechniques的文章(Zheng,Q.et al, Precise gene deletion and replacement
。。。。)来看,一个guide sequence产生的DBS好像之是直接连回去的多(80%),也
就是没有indels发生。所以,他们用的是两个guide sequences(我也是这么干的),
直接切掉一段DNA。
另外,你要knockout的基因重要吗?会不会knockout后就不长了? |
|
f********e 发帖数: 15 | 37 筛了四五十个,只有一个发生同源重组的是三个同样的突变,其他的突变体都是
heterozygous。我的问题在于,我不只是想把基因全本KO,还想研究基因的dosage效应
,所以还想要筛到只敲掉一个或者两个allele的突变体,难啊。
以前在euploid细胞里做突变的时候,倒是看到一些两个allele一样的突变,但是现在
变成三个allele,indel mutation就没有看到homozygous的情况了,可能allele太多了
吧,呵呵。 |
|
f********e 发帖数: 15 | 38 最大的可能就是发生了同源重组吧 :一条链先发生indel mutation,然后另外一条链
以这个突变的链为模版进行同源重组,然后就是homozygous了。 |
|
i*e 发帖数: 352 | 39 没有啥能100%万无一失的,BatchPD那个估计common SNPs都已经考虑了,rare的不清楚
,不过rare的话碰到的概率也小很多。此外individual个体还可能有未知的rare
variants,这个就更控制不了了。
看你之前所说,感觉是用来做validation不是detection的,所以万一有那么几个
readout不一致,换对引物或者用其他方法再验证一下。
我有可能记错,不错homopolymer和repeats在exons没有在3‘或者5’端频繁,有碰到
再分别单个手工设计引物好了。
我自己那个script,主要针对自己的实验目的,是WGS的variant validation,主要是
SNVs和小的Indels,也不单单是exonic,所以大多数面向exons的predesigned primers
就无用了,再说SNPs也没有被先排除。
设计引物的时候,input是VCF,已知的common和rare SNPs (dbSNP142)都有先
flagged,然后primer3的结果只取第一个output,之后in silico PCR再过一次,没过
的重新滚... 阅读全帖 |
|
s******s 发帖数: 13035 | 40 去google一下就行了。
cancer里面别说是最难的sv呢,就是snp indel各种所谓最好的caller call出来的东西
都有极大的不同。 |
|
发帖数: 1 | 41 内容包括:SNV/INDEL calling from whole-genome, exome, target sequencing; RNA
-sequencing data analysis; Copy number calculation; statistical analysis.可
以独立完成分析并产生可以发表的图片。有兴趣的也可以合作完成科研项目。
有意者请联系:
[email protected]
/* */ |
|
r**********e 发帖数: 587 | 42 de novo assembly,我觉得对于全基因组,很难,计算机运算的耗费太大
过去尝试过一下,好像最基础的都需要very big RAM, 比如一个node需要256GB的RAM
, 这个对于一般学校很难有这样的大型运算cluster
另外,如果reads很短,纵然你做assembly也会很难,因为overlap的区域很短。
所以high-quality long reads还是我们要等待的革命性技术。
推荐一个很好的assembler-based SV calling: http://cortexassembler.sourceforge.net/
现在比较实际的是,用其他办法找到的SV或SNP candidate,然后做local assembly来
精确breakpioint,计算量大大大大大降低
以后long reads出现或者普及,我们就少了很多BWA的那种multiple alignment的麻烦
,不管mapping还是assembly都可行
当然了,对于novel insertion,这种ref里没有的sequence,当然assembly是王道。目
前short ... 阅读全帖 |
|
j******i 发帖数: 939 | 43 不会真的有造假吧
From Google Group
------
Hi,
I tried a couple of transfections with the NgAgo plasmid from Addgene and
the 5'P oligo against GFP from the paper, but I did not see a dramatic
reduction in GFP+ as seen using Cas9 and a GFP sgRNA.
Anybody tried as well and came to the same (dead) end?
Davide
Hi, Davide,
I tried the same plasmid that you used to target DYRK1A, HBA2, GATA4, which
are tested in Han's paper, but I didn't see any indel as they did. It seems
there is something wrong with this sy... 阅读全帖 |
|
发帖数: 1 | 44 Hi, Davide,
I tried the same plasmid that you used to target DYRK1A, HBA2, GATA4, which
are tested in Han's paper, but I didn't see any indel as they did. It seems
there is something wrong with this system.
Kyle |
|
m****a 发帖数: 270 | 45 细胞污染之类的话有谁信?
乐观得讲现在无非是两种可能,一种是韩隐瞒了关键的技巧,为发表声称的 smart 2.0
版争取时间。
第二种就是NgAgo能切质粒但是切割基因组的效率极低(<1%),可能是体内ssDNA 不稳
定,loading 有些tricky,总之完全没达到文章中声称的CRISPR同等水平,以至于需要
用银染才"可能"看到T7E1的条带。
效率太低,导致直接测序或者或者单克隆以后测序看不到indel,很可能需要做deep
sequencing。 |
|
m*********D 发帖数: 1727 | 46 简单地说,就是ZFN和 TALEN利用蛋白质上AA和DNA的Nt的相互作用来识别DNA的序列,一
般识别的长度在9-18bp。它们往往是两个domain--一个用于DNA序列的识别,一个是切
割双链DNA。
CRISPR/Cas是一个蛋白-RNA complex.RNA用配对来识别特定的DNA序列,蛋白用来切割
双链DNA。识别的长度在20Nt。
切割完后,产生double strand break(DBS)。修复都靠细胞里面自己的系统。在有修复
模板(可以人工提供)的情况下,找模板来,你要提供就可以按你的设计引入mutation
等等;没有模板,细胞就自己连接两头,顺便会插入/删掉几个bp(indel),这就导致
reading-fram-shift,基因失活。
CRISPR就目前来看,操作容易,识别的特异性高(长度大)。估计会取代前两个。
你可以详细读这篇:ZFN, TALEN, and CRISPR/Cas-based methods for genome
engineering
http://www.sciencedirect.com/science/article/pii/S... 阅读全帖 |
|
发帖数: 1 | 47 From Google 网上论坛
Michael Wilson
2016-07-15 16:54(1 分钟前)
将帖子翻译为中文
Hello,
We have twice attempted to test the NgAgO addgene plasmid in HEK 293 cells
using lipofectamine transfection and the EGXXFP split reporter assay. As
many are aware, this assay requires DNA cleavage in the EGXXFP plasmid to
restore GFP expression.
We ordered oligos with 5' phosphorylation and transfected directly or PNK-
treated an aliquot prior to transfection, just to ensure 5' phosphorylation;
neither of these methods ... 阅读全帖 |
|
m****a 发帖数: 270 | 48 为啥要刚好切掉3个nt?文章中的target site 在stop前面(Figure 5c,
Supplementary Figure 7)
切割后indel导致 reading frame shift,会有1/3的概率表达GFP
EGFP-linker-mRFP 的FRET效率低于0.1,mRFP的存在对GFP荧光影响不大。
而且同时给两种激发光的情况下,不需要考虑FRET效应。
从理论上说如果11%的细胞表达GFP,那么实际的编辑效率可能高达33%。
就想CK2015所说,这么高的效率插入将近2.5kb的片段,光靠两边15bp的同源臂简直天
方夜谭。除非阿狗会变魔术。 |
|
j******i 发帖数: 939 | 49 这哥们专业个屁 刚开始看到pcr就说very effcient 别人提出其他可能时 他很自信的
说 不可能!现在又自抽耳光了 他的测序应该是sanger测序 3和8可能只是测序质量不
好 否则即使messy也是可以很确定的看出indel的
3
a |
|
发帖数: 1 | 50 你昨天不是说有人可能重复出来韩春雨的结果了吗
又是虚晃一枪啊?
indel |
|