l********k 发帖数: 14844 | 1 【 以下文字转载自 Biology 讨论区 】
发信人: xydotcom (xydotcom), 信区: Biology
标 题: Re: 有谁觉得做bioinformatics 的数据分析 python比R好的?
发信站: BBS 未名空间站 (Thu Jun 26 16:00:30 2014, 美东)
你可以用java c++ 代替python做任何东西。但是在统计分析时,没有什么可以代替R, |
|
S*******C 发帖数: 822 | 2 对于马工工作而言,Hadoop 和Python用于机器学习的数据分析包哪个更值得学习? |
|
T*******x 发帖数: 8565 | 3 python用于机器学习的数据分析包不是要在hadoop上运行的吗?单独学行吗? |
|
S*******C 发帖数: 822 | 4 上研究生课程时很多人都用python的数据分析包做project,他们没有用到hadoop啊
怎么回事 |
|
N******K 发帖数: 10202 | 5 【 以下文字转载自 Faculty 讨论区 】
发信人: NatureOK (IT科学家), 信区: Faculty
标 题: 把数据分析服务放在cloud,用户上传数据,下载结果
发信站: BBS 未名空间站 (Sat Apr 11 20:30:03 2015, 美东)
是不是就成了big data ?
看到了一篇文章
http://www.biomedcentral.com/1471-2105/15/287 |
|
|
f***c 发帖数: 1285 | 7 大家好,我最近申请一个数据分析类的职位,已经面试完了等消息。
hr打电话来进一步follow up,告诉我是manager level。
请问这个level 在pwc内部是怎样的
谢谢 |
|
M****e 发帖数: 178 | 8 准备用NimbleGen-tiled microarrays做DNA methylation. 不知版上是否有前辈做过,
有几个关于数据分析的问题向请教一下。
1. 从机器上得到的原数据是否是每个probe的density?
2. Bioconductor 中有做ACME的package, 似乎可以得到significance (p value) for
each probe/region/promoter. 但这只是针对每个单独样品, 不能做样品之间的比较
。而且,这个p value能否当作quantitative value 来用, 还是选定cut-off p value
后只能得到yes/no for each probe?
3. Bioconductor 还有其他一些packages (Ringo, biomaRt, topGo), 好像也可以分析
DNA microarray data, 还能做样品间比较,但不知对NimbleGen-tiled microarrays
的data 是否适用?
如果有这方面的经验,能告知分析的大致流程,就再好不过。 非常感谢。 |
|
m*********r 发帖数: 2456 | 9 各位同仁,小弟最近做real-time pcr,在数据分析的时候碰到了一些问题,如图所示
,要研究gene在wildtype和mutant中的表达差异,每个样本作3个复孔,所以可以算出
平均值和标准方差std,那么在算delta ct,delta delta ct,以及后面的2-(delta
delta ct)时,这个标准方差如何延续计算?因为涉及后面画图时要加error bar。希望
各位同仁不吝指导~~
谢谢~~~ |
|
B****w 发帖数: 48 | 10 以前的研究已经报道A和B两个基因都同Breast Cancer相关。但是没有报道A和B两个蛋
白有很强的相互作用(我们做出来A和B两个蛋白有很强的相互作用)。求教如何用临床
数据分析来证明A和B两个基因在Breast Cancer中有相互作用。或者能提供一两篇这方
面的文献。谢谢!! |
|
h*********c 发帖数: 78 | 11 RNAseq的数据分析技术本身还不是很成熟,几个大组之间分歧也比较大,确实没有什么
好书值得推荐。。。建议lz去看看那几篇比较有影响力的review吧,按时间看会好一点
。目前比较流行的软件是edgeR和cufflinks/cuffdiff,虽然也是各有各的缺点,但没什
么更好的选择。。。你如果有R的基础用edgeR应该更容易上手。cufflinks需要在linux
环境下运行,用起来还挺顺手的。我最近也在做RNAseq的分析,有时间可以交流下~~ |
|
t****a 发帖数: 1212 | 12 2个礼拜?您老是天才,咱们一般人没办法那么快学会。
linux
想当年我从windows往linux上move用了半年/一年,况且我还是developer出身的。不是
说光学个login,mkdir之类就算linux哈,那样的干不了活。最起码学个vi or emacs编
辑文本,awk/sed处理txt/csv,再学点进程管理,后台任务什么的吧。
programming language
也没那么容易,况且还不是全脱产的学。不是说能写个helloworld就算学会了的。我自
个程序设计语言学了十几种了,要我再学一门语言并且用来干活,没有几个礼拜恐怕我
也干不成,真正到熟练语言特性,各种常用library,我至少得用上一年以上时间。
BWA/samtools是做基本的alignment/pileup之类,R/Bioconductor是用来做后期的统计
/数据分析/绘图。
详细的自个去google。 |
|
l**********1 发帖数: 5204 | 13 RE: LZ
>有谁谈谈从零开始学NGS数据分析都需要具备什么知识?
为了通俗点 各个阶段以古典交响乐的乐章编排作比方:
第一乐章 Sinfonia
please go to online lecture of Univ of Washington
its web link:
http://faculty.washington.edu/kenrice/sisg/
>
********************************************
Module 2: Computing for Statistical Genetics
Instructors: Thomas Lumley and Ken Rice
then if you want to save time for readind
just jump to below chapter:
Session 7; Handling Large Datasets
the free download that power point file (now already converted to PDF format... 阅读全帖 |
|
d******1 发帖数: 709 | 14 无知无畏? 这也太损人了吧,:)
linux作为和windows竞争的通用系统,虽然现在桌面版本的竞争力越来越弱,但还是有
不少人有过一段时间只用linux的经验 (深受free software的毒害)。当然如果讨论
到linux内核深度编译,10台以上linux cluster maintenance,那是需要一段时间,不
过一般NGS分析也用不到。
python作为一种面向对象的高级语言,本来就比vc, vb,汇编等需要编译的语言容易上
手,两个礼拜熟悉一下,上上手,有什么难度的?有同学就直接转码工,但那么无聊的
工作,也不是每个人都喜欢。
NGS数据分析的困难主要是太新了,不仅概念没有一个全的,连一个流程图都没有。
university1就总结的非常好,至少给个流程,有个方向
echowuhao 提供的link也很有用
谢谢! |
|
B****m 发帖数: 63 | 15 同意cooldog的观点。其实上游的分析手段都一样的,也是最快的一步。但是到基因列
表之后,bioinfomatician能做的就很有限了,我们做生物的人要查找文献、围绕自己
关注的课题对结果进行解释,这是最困难的过程。
所以建议楼主先把结果拿到,进行下游的结果分析,等你把文章发表了,可以再回头学
习上游的数据分析技术。
下游的生物学分析,你可能要用的软件和工具:cytoscape(安装ClueGO,reactome
FIs等插件)、KEGG、DAVID等。如果你用excel不能做出你想要的图,这时候你要使用R
来作图。如果你想画出你的模型示意图,应该用inkscape。 |
|
s******9 发帖数: 283 | 16 "转目前比较热门的NGS测序数据分析和软件开发方向"
要有预见能力和具体计划。大家都看得见的或者容易的方向一般都饱和或快饱和了。对
于postdoc而言,programming的能力只是其中一环。 |
|
q****r 发帖数: 26 | 17 你的意思是NGS测序数据分析和软件开发方向很快就饱和了?我现在还看不太出哪个方
向位置更多一点。求指点?
最近看了NGS相关的文献,对这一块基本有了了解。具体转的话应该需要有project做才
行吗,不然根本就不知道怎么下手,如何做规划?
能否再讲的细点,除了programming外,什么方面的能力对博后更重要呢? |
|
q****r 发帖数: 26 | 18 从我的经验来看,做结构算法的需要很强的物理和数学知识,没有多少年的沉淀很难独
立开发新算法和软件。通常大型软件如蛋白结构预测软件rosetta,分子模拟软件amber
都需要多个groups联合开发十几年。最重要的是目前蛋白结构相关软件的精度还太差,
还不能足以指导实验研究,所以用处不大。并且能够再做的新领域不多,因此感觉短期
来看这个方向没有什么大的发展前途了。
测序就不太一样,数据分析是必不可少甚至比本身的实验还重要的一环。感觉做序列分
析的地位要比做结构信息学得高好多。搞结构信息学说实在可有可无,但做序列分析的
却不可缺少。而且测序的应用远远强于做结构,能够直接跟疾病,遗传,发育等关联,
感觉用处很大。目前就是苦于没有办法转到NGS这个领域,主要是没有机会去做这个领
域的东西。所以希望大家能给点建议。 |
|
s******9 发帖数: 283 | 19 "转目前比较热门的NGS测序数据分析和软件开发方向"
要有预见能力和具体计划。大家都看得见的或者容易的方向一般都饱和或快饱和了。对
于postdoc而言,programming的能力只是其中一环。 |
|
q****r 发帖数: 26 | 20 你的意思是NGS测序数据分析和软件开发方向很快就饱和了?我现在还看不太出哪个方
向位置更多一点。求指点?
最近看了NGS相关的文献,对这一块基本有了了解。具体转的话应该需要有project做才
行吗,不然根本就不知道怎么下手,如何做规划?
能否再讲的细点,除了programming外,什么方面的能力对博后更重要呢? |
|
q****r 发帖数: 26 | 21 从我的经验来看,做结构算法的需要很强的物理和数学知识,没有多少年的沉淀很难独
立开发新算法和软件。通常大型软件如蛋白结构预测软件rosetta,分子模拟软件amber
都需要多个groups联合开发十几年。最重要的是目前蛋白结构相关软件的精度还太差,
还不能足以指导实验研究,所以用处不大。并且能够再做的新领域不多,因此感觉短期
来看这个方向没有什么大的发展前途了。
测序就不太一样,数据分析是必不可少甚至比本身的实验还重要的一环。感觉做序列分
析的地位要比做结构信息学得高好多。搞结构信息学说实在可有可无,但做序列分析的
却不可缺少。而且测序的应用远远强于做结构,能够直接跟疾病,遗传,发育等关联,
感觉用处很大。目前就是苦于没有办法转到NGS这个领域,主要是没有机会去做这个领
域的东西。所以希望大家能给点建议。 |
|
j**W 发帖数: 89 | 22 想做RNA Seq,但是听说数据分析需专业人士. 求指点. 多谢! |
|
l****m 发帖数: 751 | 23 我现在在MIT工作就是做RNAseq的数据分析。我们应该可以合作。
可以直接给我发Email:s****[email protected], 回头我们可以电话里聊。 |
|
j**W 发帖数: 89 | 24 找着数据分析的合作者之后,下一步: 哪儿做sequencing + RNASeq library
preparation又好又便宜? 大家有推荐的没? 谢了先! |
|
B****m 发帖数: 63 | 25 老兄,看问题不仔细。
楼主问的是基因芯片(microarray)的数据分析。
我觉得跟deep-sequencing相比,microarray的数据质量差多了。microarray分析简单
些,用bioconductor就行。我用过affimatrix的芯片,很多probe set 根本没有注释,
不知道对应的啥基因。 |
|
P*****6 发帖数: 273 | 26 有谁觉得做bioinformatics 的数据分析python比R好的?处理字符串,web内容的肯定
是python强。 数据处理我用R比较多,不过真心觉得R的Package就是小作坊。在
bioinformatics越来越复杂化,系统化的今天,很难整合,
python不知如何?有大量使用的说说,他的分析模块,特别是针对生物信息的发展的怎
么样了? |
|
m*********u 发帖数: 1491 | 27 It doesn't matter you are using Python or R, the most important thing is:
You are doing 数据分析.
Database analysis skills (NOT R or Python) are widely used in all industries
, as long as you have these skills and know how to talk in job interview,
you can find much better jobs easily.
Your resume will not have gap, you can apply Sr. Job position.
Be confident, many people successfully did it, you can do it too! |
|
|
K**R 发帖数: 193 | 29 我看不同文章用chip qpcr 数据分析,用不同表示,有的用IP 占 多少 %input,
有的用 IP normalized by input 比较相对量。 delta delta T 比如。
还有些看是做和IgG 比的,比较confuse。
不知道选用那个种,特别是最后一种,IgG 应该NC啊, 怎么会这样比?
非常感谢! |
|
d***i 发帖数: 20 | 30 我不是发那个帖子的,但是也可以提供NGS数据分析,可以跟我联系:bioin4geek@
gmail.com |
|
B***v 发帖数: 113 | 31 正着手做CRISPR screening,不知道下游的测序和数据分析怎么做。我们学校的DNA
lab只能做常规测序。谢谢。 |
|
|
发帖数: 1 | 33 这几天陆续收到一些朋友来信询问详情,结果发现很多朋友理解反了。在这里澄清一下
,本人愿意提供part-time数据分析服务。我之前叙述得不是很清楚,再次抱歉。 |
|
|
|
g*********n 发帖数: 808 | 36 求DIFFRACplus Nanofit 软件包?
想做 small angle X-Ray scattering数据分析,求DIFFRACplus NANOFIT。
那位若恰有此软件, 请不吝打包发一份给我。
w****[email protected]
谢谢了 |
|
q*********8 发帖数: 121 | 37 本人国内土博,Industrial Engineering方向。最近刚来美国和老公团聚,想找个事情
做。博士做的方向太理论,主要做建模,用马尔可夫之类的。以前本科学数学,对神经
网络啥的很熟悉。打算换个方向,最近觉得数据分析行业比较火。不知道我这种情况应
该怎么办,适不适合读个的硕士或者博士再找工作?请大家进来说说~~~多谢!!
! |
|
q*********8 发帖数: 121 | 38 本人国内土博,Industrial Engineering方向。最近刚来美国和老公团聚,想找个事情
做。博士做的方向太理论,主要做建模,用马尔可夫之类的。以前本科学数学,对神经
网络啥的很熟悉。打算换个方向,最近觉得数据分析行业比较火。不知道我这种情况应
该怎么办,适不适合读个的硕士或者博士再找工作?请大家进来说说~~~多谢!!
! |
|
m*********e 发帖数: 533 | 39 数据分析, DA,DS,SI需学什编程langugage
sql?
python?
r? |
|
m*********e 发帖数: 533 | 40 数据分析, DA,DS,SI需学什编程langugage
sql?
python?
r? |
|
g*********n 发帖数: 808 | 41 请推荐比较全的关于X射线小角散射(SAXS) 数据分析的文献
Data analysis of Small Angle X-ray Scattering
谢谢了 |
|
g*********n 发帖数: 808 | 42 请推荐比较全的关于X射线小角散射(SAXS) 数据分析的文献
Data analysis of Small Angle X-ray Scattering
谢谢了 |
|
s******n 发帖数: 7 | 43 我们也想借未鸣空间的宝地,公开求贤,寻找DNA芯片数据分析方面的专家,共同创
业。
专业方向:
Gene expression microarray data analysis
Array-based CGH Data Analysis
SNP array data analysis
Exon array data analysis
MicroRNA array data analysis
DNA methylation array data analysis
欢迎有这方面专长的学者来函洽谈。
联系方式:
Email:c*****************[email protected]
联系人:Steve Sun, Ph.D. |
|
|
m***b 发帖数: 11 | 45 哪儿有关于deep sequencing数据分析的tutorials, 像RNA-sequencing, methylation-
sequencing? |
|
B******y 发帖数: 9065 | 46 "提供最专业的数据分析服务".这个“最”是从何而来的? |
|
q*********8 发帖数: 121 | 47 本人国内土博,Industrial Engineering方向。最近刚来美国和老公团聚,想找个事情
做。博士做的方向太理论,主要做建模,用马尔可夫之类的。以前本科学数学,对神经
网络啥的很熟悉。打算换个方向,最近觉得数据分析行业比较火。不知道我这种情况应
该怎么办,适不适合读个统计的硕士或者博士再找工作?请大家进来说说~~~多谢!!
! |
|
q*********8 发帖数: 121 | 48 除了统计还有什么专业会学到比较专业的数据分析吗?有个叫computational Science/
engineering/mathematics之类的专业如何? |
|
s******r 发帖数: 1524 | 49 do not know what mean "专业的数据分析"? You mean data mining? If you mean
some complex algorithm, PHD is must. If you mean how to handle data,
experience will teach you.
Science/ |
|
p******e 发帖数: 677 | 50 在政府和大学做过数据分析,不知道这样的背景能不能去industry找工作?还有哪个行
业前景可能好一些?marketing analyst?或者金融机构的risk analyst? |
|