由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Biology版 - 有谁觉得做bioinformatics 的数据分析 python比R好的?
相关主题
生物千老转Bioinformatics, 怎么弄?How to compare three gene lists, each with expression value or relationship?
博后想转NGS测序数据分析和软件开发,可行吗?学R的书
R&D Information Services Bioinformatics Analyst Position iBioinformatics Position in a Genomics Center in a University in the Southern California
芝加哥大学医学院招聘全职生物信息学程序员,欢迎申请。Bioinformatics Position in a Genomics Center in a University in the Southern California
生物信息 选python or perlBioinformatics Position in a Genomics Center in a University in the Southern California
请教:Bioinformatics 编程入门课程?Bioinformatics Position in a Genomics Center in a University in the Southern California
趁人多问个问题:Python 还是 R ?伊利偌依大学芝加哥分校医学院招聘生物信息专业研究人员
关于DNA methylation 的数据分析Bioinformatics Specialist at USC, Los Angeles, California
相关话题的讨论汇总
话题: python话题: 数据分析话题: matlab话题: package
进入Biology版参与讨论
1 (共1页)
P*****6
发帖数: 273
1
有谁觉得做bioinformatics 的数据分析python比R好的?处理字符串,web内容的肯定
是python强。 数据处理我用R比较多,不过真心觉得R的Package就是小作坊。在
bioinformatics越来越复杂化,系统化的今天,很难整合,
python不知如何?有大量使用的说说,他的分析模块,特别是针对生物信息的发展的怎
么样了?
m*********u
发帖数: 1491
2
Yes, Python is more flexible and more useful for process big data.
l****m
发帖数: 751
3
专注底层的用python,专注统计的用R。
你用python用的多,说明你project里的统计东西少,更bio-而不是更-informatics。
P*****6
发帖数: 273
4
我用R多,就是因为统计的package太好使了,思考起来也直观,就是往大里一扩展就不行

【在 l****m 的大作中提到】
: 专注底层的用python,专注统计的用R。
: 你用python用的多,说明你project里的统计东西少,更bio-而不是更-informatics。

v*******e
发帖数: 11604
5
两者要结合起来用。
w****s
发帖数: 122
6
深有同感!

【在 v*******e 的大作中提到】
: 两者要结合起来用。
P*****6
发帖数: 273
7
我现在就是这么做的,70%-80% R, 20%python,觉得结合的不够流畅,扩展性不好

【在 v*******e 的大作中提到】
: 两者要结合起来用。
k****z
发帖数: 1863
8
just use whatever is good for the task,
it is always easy to put together
I seems you guys need more Linux 功底
Actually I only use script+R, work perfectly

【在 P*****6 的大作中提到】
: 我现在就是这么做的,70%-80% R, 20%python,觉得结合的不够流畅,扩展性不好
x******m
发帖数: 736
9
你可以用java c++ 代替python做任何东西。但是在统计分析时,没有什么可以代替R,
P*****6
发帖数: 273
10
这个有道理,在linux系统上,这些东西整合的好很多。出于一些原因,某些时候我被
stick在windows 上,比较悲剧。

【在 k****z 的大作中提到】
: just use whatever is good for the task,
: it is always easy to put together
: I seems you guys need more Linux 功底
: Actually I only use script+R, work perfectly

相关主题
请教:Bioinformatics 编程入门课程?How to compare three gene lists, each with expression value or relationship?
趁人多问个问题:Python 还是 R ?学R的书
关于DNA methylation 的数据分析Bioinformatics Position in a Genomics Center in a University in the Southern California
进入Biology版参与讨论
s*********x
发帖数: 1923
11
make sense. How about matlab though? I like it better.

【在 x******m 的大作中提到】
: 你可以用java c++ 代替python做任何东西。但是在统计分析时,没有什么可以代替R,
c********e
发帖数: 598
12

matlab有license fee,not many users compared to R.

【在 s*********x 的大作中提到】
: make sense. How about matlab though? I like it better.
N******n
发帖数: 3003
13
R 能像matlab那样track process through subfunction using breakpoint? 好像不行
,不知道每一步怎么运行,怎么算的?

【在 c********e 的大作中提到】
:
: matlab有license fee,not many users compared to R.

t*****z
发帖数: 1598
14
Matlab程序不易发布。

【在 s*********x 的大作中提到】
: make sense. How about matlab though? I like it better.
m*********u
发帖数: 1491
15
It doesn't matter you are using Python or R, the most important thing is:
You are doing 数据分析.
Database analysis skills (NOT R or Python) are widely used in all industries
, as long as you have these skills and know how to talk in job interview,
you can find much better jobs easily.
Your resume will not have gap, you can apply Sr. Job position.
Be confident, many people successfully did it, you can do it too!
l****m
发帖数: 751
16
生物信息这一块,
要是论整合,个人觉得R/bioconductor是做的最好的,没有之一。
bioconductor对各种数据的整合度远超matlab和python。
当然,R毕竟是开源软件,小细节还是做的不好,细节上比matlab差太多。

数据处理我用R比较多,不过真心觉得R的Package就是小作坊。在

【在 P*****6 的大作中提到】
: 这个有道理,在linux系统上,这些东西整合的好很多。出于一些原因,某些时候我被
: stick在windows 上,比较悲剧。

d*****r
发帖数: 2583
17
the trend is everything is slowing moving to Python.
Python statsmodels package is trying to mimick R, but still a long way
to go. They tried to calibrate all every function result to R, but
hardcore statistician still stick to R.
The advantage of Python is Data process, easy Excel interface by Pandas.

【在 c********e 的大作中提到】
:
: matlab有license fee,not many users compared to R.

P*****6
发帖数: 273
18
不是很好 但是debug等还是可以使

【在 N******n 的大作中提到】
: R 能像matlab那样track process through subfunction using breakpoint? 好像不行
: ,不知道每一步怎么运行,怎么算的?

P*****6
发帖数: 273
19
R的编程能力是硬伤 要是就用下package 当然, 但是定制算法和越来越集成化的软件
才有竞争力。 R的S4class 很难使

【在 l****m 的大作中提到】
: 生物信息这一块,
: 要是论整合,个人觉得R/bioconductor是做的最好的,没有之一。
: bioconductor对各种数据的整合度远超matlab和python。
: 当然,R毕竟是开源软件,小细节还是做的不好,细节上比matlab差太多。
:
: 数据处理我用R比较多,不过真心觉得R的Package就是小作坊。在

P*****6
发帖数: 273
20
老兄不是做quant的么?我觉得在开发统计算法上,python没有优势。R更直观,快速。
python的优势用不上。统计专家才不管big data呢。 python只要把常用的统计算法逐
步加进去就可。剩下的弄个wrapper,就行。

【在 d*****r 的大作中提到】
: the trend is everything is slowing moving to Python.
: Python statsmodels package is trying to mimick R, but still a long way
: to go. They tried to calibrate all every function result to R, but
: hardcore statistician still stick to R.
: The advantage of Python is Data process, easy Excel interface by Pandas.

d*****r
发帖数: 2583
21
纯粹的统计专家确实不管big data,不过python是个趋势,越来越多的系统在转向
python。实际工作里面当然什么都要用, Matlab, R, Python,取决于你正在做的
那个项目需要用什么。
现在quant的趋势是最底下系统用C++,这一部分的算法quant来设计,弄好了之后
交给IT部门来implement和维护;上面一层主要用python,可以直接call底下的
C++ library来写数学模型,也可以直接做scripting,好处是trader主要用excel
的话,python的Pandas跟excel的接口非常好用,所以直接support trader的quant
日常工作都在这一层;research quant基本上Matlab, R, Python都用可能用了。

【在 P*****6 的大作中提到】
: 老兄不是做quant的么?我觉得在开发统计算法上,python没有优势。R更直观,快速。
: python的优势用不上。统计专家才不管big data呢。 python只要把常用的统计算法逐
: 步加进去就可。剩下的弄个wrapper,就行。

P*****6
发帖数: 273
22
明白了,我看有些人的讨论,误解quant只要C/C++的,还纳闷不会全去做高频交易吧。
而且还是争那0.01秒的。怎么也得多样化阿。
我同意你的观点,python会用的越来越多。我觉得未来生物信息里面的R的工具,用的
成熟的也得被python/Java等代替。最终占70%-80%。 唯有一种可能,R的平台有革命性
的变化,比如R-revolution确实做得很好。现在就是常用的生物信息R package,处理大
数据的能力,扩展性都有欠缺。 但是作为统计方面的算法原形,R还是有巨大的优势。

【在 d*****r 的大作中提到】
: 纯粹的统计专家确实不管big data,不过python是个趋势,越来越多的系统在转向
: python。实际工作里面当然什么都要用, Matlab, R, Python,取决于你正在做的
: 那个项目需要用什么。
: 现在quant的趋势是最底下系统用C++,这一部分的算法quant来设计,弄好了之后
: 交给IT部门来implement和维护;上面一层主要用python,可以直接call底下的
: C++ library来写数学模型,也可以直接做scripting,好处是trader主要用excel
: 的话,python的Pandas跟excel的接口非常好用,所以直接support trader的quant
: 日常工作都在这一层;research quant基本上Matlab, R, Python都用可能用了。

1 (共1页)
进入Biology版参与讨论
相关主题
Bioinformatics Specialist at USC, Los Angeles, California生物信息 选python or perl
Job: Bioinformatics Specialist at USC, Los Angeles, California, USA请教:Bioinformatics 编程入门课程?
Senior Bioinformatics Scientist, Clinical Molecular Diagnostics in Beijing趁人多问个问题:Python 还是 R ?
跟风, 请教ILLUMINA data analysis关于DNA methylation 的数据分析
生物千老转Bioinformatics, 怎么弄?How to compare three gene lists, each with expression value or relationship?
博后想转NGS测序数据分析和软件开发,可行吗?学R的书
R&D Information Services Bioinformatics Analyst Position iBioinformatics Position in a Genomics Center in a University in the Southern California
芝加哥大学医学院招聘全职生物信息学程序员,欢迎申请。Bioinformatics Position in a Genomics Center in a University in the Southern California
相关话题的讨论汇总
话题: python话题: 数据分析话题: matlab话题: package