j*********g 发帖数: 463 | 1 如果target是通过结合基因组上的重复区域发挥作用。
做alignment的时候,想专门看repetitive区域,怎么做到;bowtie或者BWA怎么设置。
一般情况都是把重复区域过滤掉了吧? |
z*****e 发帖数: 33 | 2 所谓的repetitive区域其实也还是会有多态性,所以还是会有uniquely mapped reads
。建议直接默认设置做就是了。先做出一个结果,再调整参数。
【在 j*********g 的大作中提到】 : 如果target是通过结合基因组上的重复区域发挥作用。 : 做alignment的时候,想专门看repetitive区域,怎么做到;bowtie或者BWA怎么设置。 : 一般情况都是把重复区域过滤掉了吧?
|
j*********g 发帖数: 463 | 3 这样大量过滤掉了 ,按默认设置没看到多少repetitive regions,特别是SINEs
:所谓的repetitive区域其实也还是会有多态性,所以还是会有uniquely mapped
reads
:。建议直接默认设置做就是了。先做出一个结果,再调整参数。
【在 z*****e 的大作中提到】 : 所谓的repetitive区域其实也还是会有多态性,所以还是会有uniquely mapped reads : 。建议直接默认设置做就是了。先做出一个结果,再调整参数。
|
z*****e 发帖数: 33 | 4 按默认设置没看到多少repetitive regions。你具体是怎么统计的,能说下不? |
y*******1 发帖数: 164 | 5 对repetitive region的研究是ChIP-Seq技术上的瓶颈,或者说是ChIP本身的瓶颈,暂
时可能无法克服。在ChIP的时候sonication后基本上DNA应该平均300bp左右,但是人类
基因组很多repeat都远比这个长,所以从ChIP的角度resolution根本不够。
另外如果从测序的角度来说,除非用MiSeq,read长度300+可能还好一些,能提高一些
mappability。所谓的pair-end 100bp根本对repeat研究没有什么太大的帮助。对绝大
多数alignment软件来说,100+100并不等于200.
最后就是有一些in silico methods,例如跟RSEM类似的CSEM可以使用EM来map ChIP-
seq reads,但是效果并不是很好。
repeat研究任重道远,但是估计研究来研究去,其实还是一堆junk DNA :D |
l**k 发帖数: 22 | 6 像Alu刚好300bp,pair-end seq是不是能看到了?
: 对repetitive region的研究是ChIP-Seq技术上的瓶颈,或者说是ChIP本身的瓶
颈,暂
: 时可能无法克服。在ChIP的时候sonication后基本上DNA应该平均300bp左右,但
是人类
: 基因组很多repeat都远比这个长,所以从ChIP的角度resolution根本不够。
: 另外如果从测序的角度来说,除非用MiSeq,read长度300 可能还好一些,能提
高一些
: mappability。所谓的pair-end 100bp根本对repeat研究没有什么太大的帮助。
对绝大
: 多数alignment软件来说,100 100并不等于200.
: 最后就是有一些in silico methods,例如跟RSEM类似的CSEM可以使用EM来map
ChIP-
: seq reads,但是效果并不是很好。
: repeat研究任重道远,但是估计研究来研究去,其实还是一堆junk DNA :D
【在 y*******1 的大作中提到】 : 对repetitive region的研究是ChIP-Seq技术上的瓶颈,或者说是ChIP本身的瓶颈,暂 : 时可能无法克服。在ChIP的时候sonication后基本上DNA应该平均300bp左右,但是人类 : 基因组很多repeat都远比这个长,所以从ChIP的角度resolution根本不够。 : 另外如果从测序的角度来说,除非用MiSeq,read长度300+可能还好一些,能提高一些 : mappability。所谓的pair-end 100bp根本对repeat研究没有什么太大的帮助。对绝大 : 多数alignment软件来说,100+100并不等于200. : 最后就是有一些in silico methods,例如跟RSEM类似的CSEM可以使用EM来map ChIP- : seq reads,但是效果并不是很好。 : repeat研究任重道远,但是估计研究来研究去,其实还是一堆junk DNA :D
|
y*******1 发帖数: 164 | 7 如果这个repeat是300bp,而测序用的100x2 PE
那可能align之后,default的输出结果可能有几种情况
1)两个read都在repeat区域,那每个read都会输出排名靠前的几个alignment,无法确
认具体是genome里哪个repeat
2)其中一个read能map到repeat边缘的unique区域,那么这个read能输出unique
alignment。另外一个read输出排名靠前的几个alignment,这个可以通过自己写的小脚
本只选择离unique mapped read最近的那个alignment。
3)两个read都是map到unique区域,这个就没有问题了。
根据上面的几种情况,虽然能得到一些uniquely mapped的read,但是也只是这个
repeat附近ChIP的部分信息,还是不能准确估算ChIP的信号强弱。
【在 l**k 的大作中提到】 : 像Alu刚好300bp,pair-end seq是不是能看到了? : : : 对repetitive region的研究是ChIP-Seq技术上的瓶颈,或者说是ChIP本身的瓶 : 颈,暂 : : 时可能无法克服。在ChIP的时候sonication后基本上DNA应该平均300bp左右,但 : 是人类 : : 基因组很多repeat都远比这个长,所以从ChIP的角度resolution根本不够。 : : 另外如果从测序的角度来说,除非用MiSeq,read长度300 可能还好一些,能提 : 高一些 : : mappability。所谓的pair-end 100bp根本对repeat研究没有什么太大的帮助。
|
l**k 发帖数: 22 | 8 Alu属于sine,是散在重复序列,如果片段长度也是300,刚好落在一个元件内部的概率
很低吧,也就是情况2比较多,还是能得到一些信息的。
: 如果这个repeat是300bp,而测序用的100x2 PE
: 那可能align之后,default的输出结果可能有几种情况
: 1)两个read都在repeat区域,那每个read都会输出排名靠前的几个alignment,
无法确
: 认具体是genome里哪个repeat
: 2)其中一个read能map到repeat边缘的unique区域,那么这个read能输出unique
: alignment。另外一个read输出排名靠前的几个alignment,这个可以通过自己写
的小脚
: 本只选择离unique mapped read最近的那个alignment。
: 3)两个read都是map到unique区域,这个就没有问题了。
: 根据上面的几种情况,虽然能得到一些uniquely mapped的read,但是也只是这个
: repeat附近ChIP的部分信息,还是不能准确估算ChIP的信号强弱。
【在 y*******1 的大作中提到】 : 如果这个repeat是300bp,而测序用的100x2 PE : 那可能align之后,default的输出结果可能有几种情况 : 1)两个read都在repeat区域,那每个read都会输出排名靠前的几个alignment,无法确 : 认具体是genome里哪个repeat : 2)其中一个read能map到repeat边缘的unique区域,那么这个read能输出unique : alignment。另外一个read输出排名靠前的几个alignment,这个可以通过自己写的小脚 : 本只选择离unique mapped read最近的那个alignment。 : 3)两个read都是map到unique区域,这个就没有问题了。 : 根据上面的几种情况,虽然能得到一些uniquely mapped的read,但是也只是这个 : repeat附近ChIP的部分信息,还是不能准确估算ChIP的信号强弱。
|
z*****e 发帖数: 33 | 9 再加上shift的话,还是可以考察的。楼主不出来了,楼主在断定不能考察的时候是否
考虑shift的因素了。
[在 lxzk (流浪) 的大作中提到:]
:Alu属于sine,是散在重复序列,如果片段长度也是300,刚好落在一个元件内部的概
率很低吧,也就是情况2比较多,还是能得到一些信息的。
:<br>: 如果这个repeat是300bp,而测序用的100x2 PE
:<br>: 那可能align之后,default的输出结果可能有几种情况
:<br>: 1)两个read都在repeat区域,那每个read都会输出排名靠前的几个
alignment,无法确
:<br>: 认具体是genome里哪个repeat
:<br>: 2)其中一个read能map到repeat边缘的unique区域,那么这个read能
输出unique
:<br>: alignment。另外一个read输出排名靠前的几个alignment,这个可以
通过自己写的小脚
:<br>: 本只选择离unique mapped read最近的那个alignment。
:<br>: 3)两个read都是map到unique区域,这个就没有问题了。
:<br>: 根据上面的几种情况,虽然能得到一些uniquely mapped的read,但是
也只是这个
:.......... |
i*********0 发帖数: 915 | 10 求教各位大神,RNA-seq里面如何看这些重复序列的转录本的丰都? |
y*******1 发帖数: 164 | 11 如果是RNASeq可以用RSEM来map multi-reads
或者使用alignment free method,直接count相似的序列的数量
【在 i*********0 的大作中提到】 : 求教各位大神,RNA-seq里面如何看这些重复序列的转录本的丰都?
|