由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - illumina测序数据分析
相关主题
全基因组数据研究SV/CNV用什么软件深度测序的精确度会随被测的目的基因改变吗?
bgi的名声请教基因测序
版上有谁用过或知道Knome这个公司吗?这儿有人跟华大高层熟么
大家一般都在哪里测序以及如何提高测序产率请教一个统计学问题,需要多少个SNPs去鉴定一个人
华大必死mRNA next gen Illumina 问题请教
华大的钱从哪来的illumina hiseq 2000(2*75PE) 包lane, 最大能够包含几个barcode啊?
ZZ好文:首例生物科技并购还原--华大基因BGI收购CG生物信息学招人要求真高啊,不过工资也高,据说能到5万
RNA seq companies【包子求助】call SNPs 有哪些工具??
相关话题的讨论汇总
话题: 分析话题: bam话题: illumina话题: 测序话题: 软件
进入Biology版参与讨论
1 (共1页)
s********2
发帖数: 138
1
我是分子生物学方向的,现在刚拿到200M reads 的illumina测序结果。我对生物信息
学分析是一头雾水,并且我们实验室也没有可以用于分析的服务器。如果这里有能够提
供生物信息学分析的实验室同胞,能不能联系一下我。我现在真是被这些数据搞得头都
大了,老板还急着要结果。谢谢大家!
B*******t
发帖数: 403
2
chip-seq? RNA-seq? You need a machine with huge memory. Ask somebody locally
, if you don't have machine to analyze.
n********t
发帖数: 1079
3
靠,没法分析为啥要测序?本校或当地找个合作者吧,这东西数据传输都是问题
b*******e
发帖数: 288
4
你们要分析啥呀?
推荐一个软件吧: clc genomics workbench
我只用这个做过很简单的分析,但是见过有人用它做454的assembly和注释等等,挺强
大的,不过不便宜,5000刀。
能试用14天,如果要继续用的话,好像改mac地址还是怎样操作来着,我忘了
比如可以导入你们的原始数据然后assembly,然后各种各样的分析。

【在 s********2 的大作中提到】
: 我是分子生物学方向的,现在刚拿到200M reads 的illumina测序结果。我对生物信息
: 学分析是一头雾水,并且我们实验室也没有可以用于分析的服务器。如果这里有能够提
: 供生物信息学分析的实验室同胞,能不能联系一下我。我现在真是被这些数据搞得头都
: 大了,老板还急着要结果。谢谢大家!

d***y
发帖数: 8536
5
如果你實驗室沒有服務器的話,比較麻煩。如果有服務器,你可以學著自己coding. 免
費得軟件很多的。
e*****t
发帖数: 642
6
i could help you do the analysis. co-first author. deal or not deal?
e****e
发帖数: 3450
7
what info are you trying to get out?

【在 s********2 的大作中提到】
: 我是分子生物学方向的,现在刚拿到200M reads 的illumina测序结果。我对生物信息
: 学分析是一头雾水,并且我们实验室也没有可以用于分析的服务器。如果这里有能够提
: 供生物信息学分析的实验室同胞,能不能联系一下我。我现在真是被这些数据搞得头都
: 大了,老板还急着要结果。谢谢大家!

s******y
发帖数: 137
8
It's actually very simple.
If you have command-line experience (like DOS), try to use Bowtie and
cuffdiff. It only requires less than 2g memory for most genomes.
If not, try Galaxy http://main.g2.bx.psu.edu/. Free and very powerful.
L*******a
发帖数: 293
9
如果完全新手又没有计算资源,找个合作者是最快出结果的方法了。
如果一定要自己搞:
(1)找个靠谱的cloud或其他cluster,把数据传上去。或者花2000多刀买一个work
station。16g内存,8cpu。
(2)找地方参加个workshop。对怎么分析这类数据有个大概的sense。
(3)知道哪些能用公共软件做,哪些需要自己coding,应该从哪些方面入手分析之后
,自己学coding,至少懂两样。perl/python 以及R。
这一套下来半年算很快了。还是在有人能时不时指导下的情况下。
L*******a
发帖数: 293
10
外包也是个方法。
国内有很多做生物信息分析的小公司。
可以帮你用流程跑一下。给钱就行,不要求authorship。
当然流程跑出来的结果只能给你个大概的idea,就是这个数据大概长什么样。
最后还是得有个local或者非local但是能频繁交流的人一起边商量边搞。这个人最好就
是你自己。
相关主题
华大的钱从哪来的深度测序的精确度会随被测的目的基因改变吗?
ZZ好文:首例生物科技并购还原--华大基因BGI收购CG请教基因测序
RNA seq companies这儿有人跟华大高层熟么
进入Biology版参与讨论
s********2
发帖数: 138
11
是RAD——seq,我想找我们大学的做生物学信息分析方面的人,但是他们说他们的服务
器很忙,没空让我们用。所以很悲惨啊。

locally

【在 B*******t 的大作中提到】
: chip-seq? RNA-seq? You need a machine with huge memory. Ask somebody locally
: , if you don't have machine to analyze.

s********2
发帖数: 138
12
其实最终我都得想个解决分析的办法的。本校的实验室一些是不屑于跟我们合作。有些同
意合作的,但是服务器很忙,要等很长时间,我又等不及了。

【在 n********t 的大作中提到】
: 靠,没法分析为啥要测序?本校或当地找个合作者吧,这东西数据传输都是问题
S**********l
发帖数: 3835
13
可以用maq,免费的

【在 s********2 的大作中提到】
: 我是分子生物学方向的,现在刚拿到200M reads 的illumina测序结果。我对生物信息
: 学分析是一头雾水,并且我们实验室也没有可以用于分析的服务器。如果这里有能够提
: 供生物信息学分析的实验室同胞,能不能联系一下我。我现在真是被这些数据搞得头都
: 大了,老板还急着要结果。谢谢大家!

s********2
发帖数: 138
14
谢谢! 我用illumina测序,每个lane里面有好几个个体,个体都加了barcode,我就是
想把这些序列根据barcode分配到不同的个体,然后再将每个个体的序列alignment,看
看有多少个unique的序列,然后再找SNP。目标挺简单的,还有现成的软件。但是现在
限制我的就是服务器的问题。头都大了。

【在 b*******e 的大作中提到】
: 你们要分析啥呀?
: 推荐一个软件吧: clc genomics workbench
: 我只用这个做过很简单的分析,但是见过有人用它做454的assembly和注释等等,挺强
: 大的,不过不便宜,5000刀。
: 能试用14天,如果要继续用的话,好像改mac地址还是怎样操作来着,我忘了
: 比如可以导入你们的原始数据然后assembly,然后各种各样的分析。

s********2
发帖数: 138
15
对呢,现在这个实验室没有服务器,我国内导师的实验室有服务器,我就是想拿到初步
数据,再做实验,再测序,然后将最后的测序结果拿到国内分析就行了,但是现在就卡
在这个初步结果的分析这步上了。并且,我还想赶紧做完,赶紧回国。

【在 d***y 的大作中提到】
: 如果你實驗室沒有服務器的話,比較麻煩。如果有服務器,你可以學著自己coding. 免
: 費得軟件很多的。

s********2
发帖数: 138
16
我用illumina测序,每个lane里面有好几个个体,个体都加了barcode,我就是
想把这些序列根据barcode分配到不同的个体,然后再将每个个体的序列alignment,看
看有多少个unique的序列,然后再找SNP。

【在 e****e 的大作中提到】
: what info are you trying to get out?
L*******a
发帖数: 293
17
数据传回国内服务器,或者硬盘寄回去。
远程ssh到国内服务器上做。
如果是教育网,速度估计还可以。

【在 s********2 的大作中提到】
: 对呢,现在这个实验室没有服务器,我国内导师的实验室有服务器,我就是想拿到初步
: 数据,再做实验,再测序,然后将最后的测序结果拿到国内分析就行了,但是现在就卡
: 在这个初步结果的分析这步上了。并且,我还想赶紧做完,赶紧回国。

s********2
发帖数: 138
18
真的啊?!关于co-first author的问题,我可以跟我们导师申请。

【在 e*****t 的大作中提到】
: i could help you do the analysis. co-first author. deal or not deal?
s********2
发帖数: 138
19
真的啊?!关于co-first author的问题,我可以跟我们导师申请。

【在 e*****t 的大作中提到】
: i could help you do the analysis. co-first author. deal or not deal?
s********2
发帖数: 138
20
是,说的太对了。现在诺大的实验室,只有我自己是搞分子生物学的,遇到问题,就没
得商量的,除了导师。

【在 L*******a 的大作中提到】
: 外包也是个方法。
: 国内有很多做生物信息分析的小公司。
: 可以帮你用流程跑一下。给钱就行,不要求authorship。
: 当然流程跑出来的结果只能给你个大概的idea,就是这个数据大概长什么样。
: 最后还是得有个local或者非local但是能频繁交流的人一起边商量边搞。这个人最好就
: 是你自己。

相关主题
请教一个统计学问题,需要多少个SNPs去鉴定一个人生物信息学招人要求真高啊,不过工资也高,据说能到5万
mRNA next gen Illumina 问题请教【包子求助】call SNPs 有哪些工具??
illumina hiseq 2000(2*75PE) 包lane, 最大能够包含几个barcode啊?菜鸟请教 RNA-seq
进入Biology版参与讨论
s********2
发帖数: 138
21
现在还有个悲剧的问题,就是国内的服务器太繁忙了,好几个人在处理数据,我得等至
少一个月才行。我9月底就要回国了。我还要根据这些结果,在回国前完成一个实验才
行。并且那个实验要有一个月的时间才能完成,还是不出意外的情况。所以我现在是心
急如焚啊。

【在 L*******a 的大作中提到】
: 数据传回国内服务器,或者硬盘寄回去。
: 远程ssh到国内服务器上做。
: 如果是教育网,速度估计还可以。

L*******a
发帖数: 293
22
这么急的话,签协议的外包是最靠铺的了。

【在 s********2 的大作中提到】
: 现在还有个悲剧的问题,就是国内的服务器太繁忙了,好几个人在处理数据,我得等至
: 少一个月才行。我9月底就要回国了。我还要根据这些结果,在回国前完成一个实验才
: 行。并且那个实验要有一个月的时间才能完成,还是不出意外的情况。所以我现在是心
: 急如焚啊。

s********2
发帖数: 138
23
嗯,所以如果有愿意帮忙的同胞,希望能够联系我。

【在 L*******a 的大作中提到】
: 这么急的话,签协议的外包是最靠铺的了。
o********r
发帖数: 775
24
你这个太杯具,还是赶快找一个已经建起pipeline的组合作,要自己做的话2个月都来
不及摸条件的。别以为软件可以直接用就很方便,不同的软件间可能根本不能直接对接
,比如BAM中用不用chr,排序的时候是1,10,11,...,2,20,21,22,3,...,9,X,Y还是1,2,..
.,9,10,11,...,22,X,Y(这几种居然都是常用的)都可能造成程序崩溃,更别提有些莫
名其妙的软件还有特殊的输入格式。。。另外每个软件都有一推各种各样的参数,不合
适的参数结果就是垃圾

【在 s********2 的大作中提到】
: 现在还有个悲剧的问题,就是国内的服务器太繁忙了,好几个人在处理数据,我得等至
: 少一个月才行。我9月底就要回国了。我还要根据这些结果,在回国前完成一个实验才
: 行。并且那个实验要有一个月的时间才能完成,还是不出意外的情况。所以我现在是心
: 急如焚啊。

t*d
发帖数: 1290
25
请推荐几个吧。谢谢!

【在 L*******a 的大作中提到】
: 这么急的话,签协议的外包是最靠铺的了。
e*****t
发帖数: 642
26
这个在linux下几个简单命令就能解决。

1,2,..

【在 o********r 的大作中提到】
: 你这个太杯具,还是赶快找一个已经建起pipeline的组合作,要自己做的话2个月都来
: 不及摸条件的。别以为软件可以直接用就很方便,不同的软件间可能根本不能直接对接
: ,比如BAM中用不用chr,排序的时候是1,10,11,...,2,20,21,22,3,...,9,X,Y还是1,2,..
: .,9,10,11,...,22,X,Y(这几种居然都是常用的)都可能造成程序崩溃,更别提有些莫
: 名其妙的软件还有特殊的输入格式。。。另外每个软件都有一推各种各样的参数,不合
: 适的参数结果就是垃圾

a***e
发帖数: 1010
27
我现在在 ubuntu 和 cygwin 下编译 blat 都通不过, 还每搞定。
o********r
发帖数: 775
28
你可以试试(BAM是binary file)。

【在 e*****t 的大作中提到】
: 这个在linux下几个简单命令就能解决。
:
: 1,2,..

s********2
发帖数: 138
29
是啊,是挺悲剧的,我跟一些公司的人联系过,人家觉得我这分析太简单,不值得去做
,嫌光传数据就麻烦的够呛。我真是哭死了。所以才来像大家求助,看有没有做这方面
的同胞,如果花钱,或者当co-author都可以的。我就是在时间上比较着急。

1,2,..

【在 o********r 的大作中提到】
: 你这个太杯具,还是赶快找一个已经建起pipeline的组合作,要自己做的话2个月都来
: 不及摸条件的。别以为软件可以直接用就很方便,不同的软件间可能根本不能直接对接
: ,比如BAM中用不用chr,排序的时候是1,10,11,...,2,20,21,22,3,...,9,X,Y还是1,2,..
: .,9,10,11,...,22,X,Y(这几种居然都是常用的)都可能造成程序崩溃,更别提有些莫
: 名其妙的软件还有特殊的输入格式。。。另外每个软件都有一推各种各样的参数,不合
: 适的参数结果就是垃圾

s********2
发帖数: 138
30
谢谢ttd,说了我想说的话,呵呵。

【在 t*d 的大作中提到】
: 请推荐几个吧。谢谢!
相关主题
问个RNAseq问题bgi的名声
Molecular Index 一般用什么格式存储?版上有谁用过或知道Knome这个公司吗?
全基因组数据研究SV/CNV用什么软件大家一般都在哪里测序以及如何提高测序产率
进入Biology版参与讨论
s********2
发帖数: 138
31
其实说实话,大家不要笑话我,我都没接触过linux系统呢,所以感觉自己特别失败。

【在 e*****t 的大作中提到】
: 这个在linux下几个简单命令就能解决。
:
: 1,2,..

A*****n
发帖数: 243
32
这个并不难啊,samtools上去+sed就可以了
确实只是几个命令的事,不过楼主最麻烦的是连自己的机器都没有
别人如果要分析的话,数据传输就得一两天时间。

【在 o********r 的大作中提到】
: 你可以试试(BAM是binary file)。
L*******a
发帖数: 293
33
这个不算推荐。只是我知道的。
http://www.miningene.com/index.html

【在 s********2 的大作中提到】
: 谢谢ttd,说了我想说的话,呵呵。
A*****n
发帖数: 243
34
blat可以直接下载他们已经编译好的程序,那个最省事。
不过你要是指望用blat作对,那就得且等着了。

【在 a***e 的大作中提到】
: 我现在在 ubuntu 和 cygwin 下编译 blat 都通不过, 还每搞定。
A*****n
发帖数: 243
35
这个建议最靠谱了。

【在 e*****t 的大作中提到】
: i could help you do the analysis. co-first author. deal or not deal?
o********r
发帖数: 775
36
麻烦不少,每次重做BAM后又得重新sort/index。小的bam可能没啥,100+G的BAM这一步
重做可能就是1个工作日的时间。另外难的是知道为啥程序崩溃,多数软件不会有这么
详细的说明,很多时候需要很长时间的debug才能查到问题是format不对。

【在 A*****n 的大作中提到】
: 这个并不难啊,samtools上去+sed就可以了
: 确实只是几个命令的事,不过楼主最麻烦的是连自己的机器都没有
: 别人如果要分析的话,数据传输就得一两天时间。

A*****n
发帖数: 243
37
-u + 管道还是能省不少IO上的时间的。楼主总共也才200M reads。最后得到的BAM应该
也就在2,30G这个数量级,不会有特别大的麻烦。
顺便问一下,哪些软件这么bt,下次遇到的时候好注意一下。

【在 o********r 的大作中提到】
: 麻烦不少,每次重做BAM后又得重新sort/index。小的bam可能没啥,100+G的BAM这一步
: 重做可能就是1个工作日的时间。另外难的是知道为啥程序崩溃,多数软件不会有这么
: 详细的说明,很多时候需要很长时间的debug才能查到问题是format不对。

o********r
发帖数: 775
38
给你个我遇到过的变态软件:cnver,这家伙用的BAM居然不是coordinates sorted。至
于chr以及排序不同的就太多了,俺遇到过的软件两种格式基本是一半一半

【在 A*****n 的大作中提到】
: -u + 管道还是能省不少IO上的时间的。楼主总共也才200M reads。最后得到的BAM应该
: 也就在2,30G这个数量级,不会有特别大的麻烦。
: 顺便问一下,哪些软件这么bt,下次遇到的时候好注意一下。

A*****n
发帖数: 243
39
看了一下这个东西的readme文件,他要求的BAM格式确实比较怪异,还不如直接用text
format。你不会是试了那十几个作CNV和SV的软件,然后每次改BAM文件吧?

【在 o********r 的大作中提到】
: 给你个我遇到过的变态软件:cnver,这家伙用的BAM居然不是coordinates sorted。至
: 于chr以及排序不同的就太多了,俺遇到过的软件两种格式基本是一半一半

y******8
发帖数: 1764
40
自己撺个12-core, 96G memory, 4TB硬盘的workstation,装illumina自己的Cassava,
免费的。
相关主题
大家一般都在哪里测序以及如何提高测序产率ZZ好文:首例生物科技并购还原--华大基因BGI收购CG
华大必死RNA seq companies
华大的钱从哪来的深度测序的精确度会随被测的目的基因改变吗?
进入Biology版参与讨论
o********r
发帖数: 775
41
差不多,还有个比较古怪的FREEC,居然不支持BAM,每次100G的BAM变成pileup格式就
成了300G,然后它再生成个自己的输入格式,又是一个不小的文件,这些IO很是头疼

text

【在 A*****n 的大作中提到】
: 看了一下这个东西的readme文件,他要求的BAM格式确实比较怪异,还不如直接用text
: format。你不会是试了那十几个作CNV和SV的软件,然后每次改BAM文件吧?

t*d
发帖数: 1290
42
谢谢!
这个好像和 BGI 有关系吧。在 BGI 的老巢,顺义。

【在 L*******a 的大作中提到】
: 这个不算推荐。只是我知道的。
: http://www.miningene.com/index.html

t*d
发帖数: 1290
43
:)不谢。
BTW,如果你在 Boston 的话,也许我可以帮上一点点忙,把我的机器借给你用。

【在 s********2 的大作中提到】
: 谢谢ttd,说了我想说的话,呵呵。
s********2
发帖数: 138
44
谢谢!可惜俺不在啊!真是痛苦!

【在 t*d 的大作中提到】
: :)不谢。
: BTW,如果你在 Boston 的话,也许我可以帮上一点点忙,把我的机器借给你用。

L*******a
发帖数: 293
45
是从BGI早年在北京的生物信息部门离开的一个人自己搞的公司。后来据说又陆续有其
他人加入。
跟BGI没有关系。

【在 t*d 的大作中提到】
: 谢谢!
: 这个好像和 BGI 有关系吧。在 BGI 的老巢,顺义。

l*****a
发帖数: 1431
46
不太明白你说的unique的序列指什么。我们实验室主要就是做human exome target resequencing。软件分析用的是NextGENe里的sequence aligment然后找mutation SNP。我们没试过barcode的sample,不过软件里有这个功能。如果你能把你的data传过来,我可以给你试试,但不知道你具体想要找什么。

【在 s********2 的大作中提到】
: 谢谢! 我用illumina测序,每个lane里面有好几个个体,个体都加了barcode,我就是
: 想把这些序列根据barcode分配到不同的个体,然后再将每个个体的序列alignment,看
: 看有多少个unique的序列,然后再找SNP。目标挺简单的,还有现成的软件。但是现在
: 限制我的就是服务器的问题。头都大了。

f******9
发帖数: 22
47
请问你这个要分析什么结果呢? 做基因组还是转路子,什么应用呢? 可不可以介绍一
下你实验设计的经验?谢谢
1 (共1页)
进入Biology版参与讨论
相关主题
【包子求助】call SNPs 有哪些工具??华大必死
菜鸟请教 RNA-seq华大的钱从哪来的
问个RNAseq问题ZZ好文:首例生物科技并购还原--华大基因BGI收购CG
Molecular Index 一般用什么格式存储?RNA seq companies
全基因组数据研究SV/CNV用什么软件深度测序的精确度会随被测的目的基因改变吗?
bgi的名声请教基因测序
版上有谁用过或知道Knome这个公司吗?这儿有人跟华大高层熟么
大家一般都在哪里测序以及如何提高测序产率请教一个统计学问题,需要多少个SNPs去鉴定一个人
相关话题的讨论汇总
话题: 分析话题: bam话题: illumina话题: 测序话题: 软件