m******2 发帖数: 564 | 1 那么多人都说R烂,Python好
依我看似乎半斤八两,R的核心好像管的事比Python还多些
还有pandas这个Python外围包,是用来模仿R的吗?
一上来就Dataframe
那么Python要实现R的功能,是不是得狂用包
panda, scipy, numpy齐上阵之类的。。。 |
z**********e 发帖数: 91 | 2 R不也得library一堆package。。python基本上numpy scipy pandans就够了,machine
learning的基本model再用个sklearn。。 |
d********d 发帖数: 57 | 3 各有千秋,有时候为了方便的实现某些功能,R真是绕不开,python的统计学包还不够多 |
s*******0 发帖数: 3461 | 4 oop 速度快 目前流行 也比较稳定 在machine learning 方向功能强大
所以 python 为主 r为辅比较好 |
w**********y 发帖数: 1691 | 5 速度快慢与oop无关。
script language都慢。 R的解决办法是Rcpp, Python的解决办法是CPython
做大的project,production code 的时候,R的语法结构性的劣势就非常明显了。
adhoc work, R更flexible
【在 s*******0 的大作中提到】 : oop 速度快 目前流行 也比较稳定 在machine learning 方向功能强大 : 所以 python 为主 r为辅比较好
|
L****n 发帖数: 3545 | 6 NB !
【在 w**********y 的大作中提到】 : 速度快慢与oop无关。 : script language都慢。 R的解决办法是Rcpp, Python的解决办法是CPython : 做大的project,production code 的时候,R的语法结构性的劣势就非常明显了。 : adhoc work, R更flexible
|
L****n 发帖数: 3545 | 7 NB !
【在 w**********y 的大作中提到】 : 速度快慢与oop无关。 : script language都慢。 R的解决办法是Rcpp, Python的解决办法是CPython : 做大的project,production code 的时候,R的语法结构性的劣势就非常明显了。 : adhoc work, R更flexible
|
L****n 发帖数: 3545 | 8 NB !
【在 w**********y 的大作中提到】 : 速度快慢与oop无关。 : script language都慢。 R的解决办法是Rcpp, Python的解决办法是CPython : 做大的project,production code 的时候,R的语法结构性的劣势就非常明显了。 : adhoc work, R更flexible
|
L*******t 发帖数: 2385 | 9 重要的事情说四遍?
【在 L****n 的大作中提到】 : NB !
|
v*******e 发帖数: 11604 | 10
是老刑增加流量的诡计
【在 L*******t 的大作中提到】 : 重要的事情说四遍?
|
|
|
k*******d 发帖数: 1340 | 11 R的统计算法多,适合做研究
Python适合做production,如果小心使用速度上和内存占用上可以比R块一些。提高数
值计算速度有各种办法,比如Cython, Numba, Numexpr, numpy/scipy/sklearn/
statmodels则是标准装备 |
m******2 发帖数: 564 | 12 请问多线程是否能改善程序结构?R和Python多线程的包都好用吗?
【在 w**********y 的大作中提到】 : 速度快慢与oop无关。 : script language都慢。 R的解决办法是Rcpp, Python的解决办法是CPython : 做大的project,production code 的时候,R的语法结构性的劣势就非常明显了。 : adhoc work, R更flexible
|
m******2 发帖数: 564 | 13 我到不了换方法如换衣服的程度,也不需要去用我都不懂的算法来赶时髦跑一遍发论文。
你下面提到的那些,能展开讲讲?
还有我听说Ananconda这个库可以整合它们
【在 k*******d 的大作中提到】 : R的统计算法多,适合做研究 : Python适合做production,如果小心使用速度上和内存占用上可以比R块一些。提高数 : 值计算速度有各种办法,比如Cython, Numba, Numexpr, numpy/scipy/sklearn/ : statmodels则是标准装备
|
w**********y 发帖数: 1691 | 14 R多线程我用doParallel,稍微熟悉一下之后挺方便好用。唯一要注意的是每个线程好
像要pre load data比较费时间,好久不用记不太清了。
多线程不改善程序结构。程序结构取决于R code的写法。改善方式是类似于matlab多年
前开始把语法结构往oop语言的方式去改写;R现在有s3, s4 class
然后R里面尽量是避免for loop的,每个loop大概需要多占用0.01s时间。所以R的代码
对于写c++, java的人非常不习惯。这个问题python是一样的。这个是为什么python本
质上提
升不了程序的运行速度。
不过听你的描述,你使用的范围离真正的production code还差老远呢。所以不是什么
大问题
【在 m******2 的大作中提到】 : 请问多线程是否能改善程序结构?R和Python多线程的包都好用吗?
|
w**********y 发帖数: 1691 | 15 小心使用的话,我觉得速度和内存是一样的。完全取决于你对语言的熟悉程度了,因为
库的背后都是C++/java/fortran的代码
【在 k*******d 的大作中提到】 : R的统计算法多,适合做研究 : Python适合做production,如果小心使用速度上和内存占用上可以比R块一些。提高数 : 值计算速度有各种办法,比如Cython, Numba, Numexpr, numpy/scipy/sklearn/ : statmodels则是标准装备
|
L*******t 发帖数: 2385 | 16 大牛功力深厚。。。
【在 w**********y 的大作中提到】 : R多线程我用doParallel,稍微熟悉一下之后挺方便好用。唯一要注意的是每个线程好 : 像要pre load data比较费时间,好久不用记不太清了。 : 多线程不改善程序结构。程序结构取决于R code的写法。改善方式是类似于matlab多年 : 前开始把语法结构往oop语言的方式去改写;R现在有s3, s4 class : 然后R里面尽量是避免for loop的,每个loop大概需要多占用0.01s时间。所以R的代码 : 对于写c++, java的人非常不习惯。这个问题python是一样的。这个是为什么python本 : 质上提 : 升不了程序的运行速度。 : 不过听你的描述,你使用的范围离真正的production code还差老远呢。所以不是什么 : 大问题
|
s*******0 发帖数: 3461 | 17 哈哈 我的每个空格 代表我感觉的一个优点 不是说oop就速度快
【在 w**********y 的大作中提到】 : 速度快慢与oop无关。 : script language都慢。 R的解决办法是Rcpp, Python的解决办法是CPython : 做大的project,production code 的时候,R的语法结构性的劣势就非常明显了。 : adhoc work, R更flexible
|
s*******0 发帖数: 3461 | 18 哈哈 我的每个空格 代表我感觉的一个优点 不是说oop就速度快
【在 w**********y 的大作中提到】 : 速度快慢与oop无关。 : script language都慢。 R的解决办法是Rcpp, Python的解决办法是CPython : 做大的project,production code 的时候,R的语法结构性的劣势就非常明显了。 : adhoc work, R更flexible
|
a*******1 发帖数: 1554 | 19 把复杂的耗时间多的运算放进Rcpp/inline那边处理,比如用sourceCpp来编译,然后R
里面直接调用,正常情况下可以快100倍。 |
k*******d 发帖数: 1340 | 20 numba/Cython/numexpr可以用python的语法写代码,然后生成C代码或者直接生成
machine code,开发起来比较容易,不过一般只对数值计算有好的加速效果 |
|
|
k*******d 发帖数: 1340 | 21 numba/Cython/numexpr可以用python的语法写代码,然后生成C代码或者直接生成
machine code,开发起来比较容易,不过一般只对数值计算有好的加速效果 |
k*******d 发帖数: 1340 | 22 numba/Cython/numexpr可以用python的语法写代码,然后生成C代码或者直接生成
machine code,开发起来比较容易,不过一般只对数值计算有好的加速效果 |
m******2 发帖数: 564 | 23 请问如果我开发一个Python的客户端,客户有些计算必须要联网到我的服务器上来运行
,或者说要我这里给他们建数据库。这种软件用Python怎么优化?能优化到多密的访问
容量?
另外我自己的Production可能会牵扯到做比较多的蒙特卡罗,路径依赖的那种,是否用
多核去跑会很提高效能?
谢谢!
【在 k*******d 的大作中提到】 : numba/Cython/numexpr可以用python的语法写代码,然后生成C代码或者直接生成 : machine code,开发起来比较容易,不过一般只对数值计算有好的加速效果
|
k*******d 发帖数: 1340 | 24 Use async io for network communication
Use multiprocess to use multiple CPU cores to run MC, many packages supports
that |
m******2 发帖数: 564 | 25 Thank you very much!
supports
【在 k*******d 的大作中提到】 : Use async io for network communication : Use multiprocess to use multiple CPU cores to run MC, many packages supports : that
|
f*******2 发帖数: 149 | 26 现在python里面也可以直接call R了吧
【在 m******2 的大作中提到】 : 那么多人都说R烂,Python好 : 依我看似乎半斤八两,R的核心好像管的事比Python还多些 : 还有pandas这个Python外围包,是用来模仿R的吗? : 一上来就Dataframe : 那么Python要实现R的功能,是不是得狂用包 : panda, scipy, numpy齐上阵之类的。。。
|
c*******y 发帖数: 1630 | 27 Python要提高某些模块速度的话,pandas文档后面有optimization的例子。
其实pypy的JIT才是出路,只是业界这么多人用python,pypy几万块募捐几年还没募到
靠几个技术宅的热心撑着,人家也要工作吃饭的。 |