如何在Windows+Anaconda下大幅度提高Python性能？ - Programming版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 如何在Windows+Anaconda下大幅度提高Python性能？

相关主题
● Python vs J2EE	● 哪位大俠能简单解释一下怎麼用pypy么
● cyphon,cpython,numba,julia,pypy,为什么都不是主流	● python并不算google带火的
● 学python要学到什么程度才算professional?	● 我知道为啥ruby这些framework没有用v8引擎原理的原因了
● Anaconda装起来会跟已有的python dist有什么冲突吗？	● 有人上Spark用python API的么
● anaconda是python的超级集合？	● 为什么我认为 Python 3 没有前途？(zz)
● Python pandas 是坑不？	● Python -> Go -> Python (PyPy)
● 发现还是得用R	● 最近在看《python源码剖析》
● 怎样用Python选一部分数据出来	● python转化成exe的能力怎样？

相关话题的讨论汇总
话题: python话题: anaconda话题: windows话题: 大幅度提高话题: c#

进入Programming版参与讨论

(共1页)

d******a
发帖数: 32122

从Github搞到的python程序
在Anaconda下运行了一天
逐句翻译成C#,一个小时完成了
应该不是数据库的问题，python是生成将近一百万个记录，一次性写入sqlite
翻译成C#后，为了省事，每几千个记录写入sql server
我google了一下，说是pypy能大幅度提高性能，但是是另外一个distribution,
Anaconda下的库未必都支持？Anaconda下有个pypy的JIT，但是只支持linux和果子机

m******r
发帖数: 1033

我不懂为啥非要在windows下玩python? 我几年前转行，搞不懂是转R还是转python.
python越来越流行，好在我当时研究一下，大家普遍反映蟒蛇搭配视窗不太好。
所以我就先学R了因为用视窗习惯了。

w********m
发帖数: 1137

我猜你用了pandas
直接用sqlite3试试
https://stackoverflow.com/questions/18219779/bulk-insert-huge-data-into-
sqlite-using-python

g*******u
发帖数: 3948

python怎么不行在win下？没啥大区别啊

【在 m******r 的大作中提到】

: 我不懂为啥非要在windows下玩python? 我几年前转行，搞不懂是转R还是转python.
: python越来越流行，好在我当时研究一下，大家普遍反映蟒蛇搭配视窗不太好。
: 所以我就先学R了因为用视窗习惯了。

m******r
发帖数: 1033

很多人反映不好用。大概意思是说，比如一个package, 在苹果和在视窗是不一样的。
有的版本支持苹果，有的版本支持视窗。
R没这个问题，反正都是慢，我就选学R了。
特别讨厌计算机上倒腾东西。

【在 g*******u 的大作中提到】

: python怎么不行在win下？没啥大区别啊

l******n
发帖数: 9344

python估计是一条一条写的，换成一次写多条，比如1k，估计会快很多
前面有人说的pandas也可能是个问题，直接用numpy, 应该没有问题

【在 d******a 的大作中提到】

: 从Github搞到的python程序
: 在Anaconda下运行了一天
: 逐句翻译成C#,一个小时完成了
: 应该不是数据库的问题，python是生成将近一百万个记录，一次性写入sqlite
: 翻译成C#后，为了省事，每几千个记录写入sql server
: 我google了一下，说是pypy能大幅度提高性能，但是是另外一个distribution,
: Anaconda下的库未必都支持？Anaconda下有个pypy的JIT，但是只支持linux和果子机

g*******u
发帖数: 3948

同一个code 换平台有可能会稍微改改 python

【在 m******r 的大作中提到】

: 很多人反映不好用。大概意思是说，比如一个package, 在苹果和在视窗是不一样的。
: 有的版本支持苹果，有的版本支持视窗。
: R没这个问题，反正都是慢，我就选学R了。
: 特别讨厌计算机上倒腾东西。

m******r
发帖数: 1033

看看debug这些坑多痛苦
https://github.com/zachmayer/caretEnsemble/issues/206
david meyer R里面也是有名的人物，给caret写个续集，很多人用不了，他自己也不能
重复bug. 到最后，有人试出来
“The example I attach will execute fine on Windows 7 but not on CentOS 7.
”（我认为这个人说反了，应该是视窗下无法执行，苹果可以执行）。
2016年出的bug, 一开始作者还参与讨论，连caret作者max kunth都过来讨论了, 后来
大家都不了了之了。

【在 g*******u 的大作中提到】

: 同一个code 换平台有可能会稍微改改 python

m*****n
发帖数: 3575

可能是pandas的锅
换个数据库，直接存试试？

s*****V
发帖数: 21731

一百万个记录为啥写一天，计算量很大么，profile一下看看。

【在 d******a 的大作中提到】

相关主题
● 发现还是得用R	● python并不算google带火的
● 怎样用Python选一部分数据出来	● 我知道为啥ruby这些framework没有用v8引擎原理的原因了
● 哪位大俠能简单解释一下怎麼用pypy么	● 有人上Spark用python API的么
进入Programming版参与讨论

d******a
发帖数: 32122

是从xml文件里parse
我也不知道为什么一天，反正是贼慢
换C#立马搜搜地

【在 s*****V 的大作中提到】

: 一百万个记录为啥写一天，计算量很大么，profile一下看看。

d******a
发帖数: 32122

那位基本没用pandas
就是lxml 操作xml文件

【在 m*****n 的大作中提到】

: 可能是pandas的锅
: 换个数据库，直接存试试？

s*****V
发帖数: 21731

lxml是libxml c lib的python binding，速度应该很快才是。除非你这个xml file巨大
, > 1G..

【在 d******a 的大作中提到】

: 是从xml文件里parse
: 我也不知道为什么一天，反正是贼慢
: 换C#立马搜搜地

l******n
发帖数: 9344

把github post出来大家看看咋回事

【在 d******a 的大作中提到】

: 是从xml文件里parse
: 我也不知道为什么一天，反正是贼慢
: 换C#立马搜搜地

T*******x
发帖数: 8565

这个是对的。用cursor insert many，速度不亚于Java。

【在 l******n 的大作中提到】

: python估计是一条一条写的，换成一次写多条，比如1k，估计会快很多
: 前面有人说的pandas也可能是个问题，直接用numpy, 应该没有问题

d******a
发帖数: 32122

https://github.com/iamlemec/patents/blob/master/parse_grants.py

【在 l******n 的大作中提到】

: 把github post出来大家看看咋回事

l******n
发帖数: 9344

就是一条一条写造成的performance问题
不过有意思的，我也干过从USPTO，欧洲还有其他国家抓专利数据这件事。有个每月公
布的archive,我直接弄到es里边

【在 d******a 的大作中提到】

: https://github.com/iamlemec/patents/blob/master/parse_grants.py

(共1页)

进入Programming版参与讨论

相关主题
● 原来Python有蟒蛇的意思	● anaconda是python的超级集合？
● windows 上安装python package.	● Python pandas 是坑不？
● python performance in linux vs in win	● 发现还是得用R
● 似乎python的anaconda没有超越R啊	● 怎样用Python选一部分数据出来
● Python vs J2EE	● 哪位大俠能简单解释一下怎麼用pypy么
● cyphon,cpython,numba,julia,pypy,为什么都不是主流	● python并不算google带火的
● 学python要学到什么程度才算professional?	● 我知道为啥ruby这些framework没有用v8引擎原理的原因了
● Anaconda装起来会跟已有的python dist有什么冲突吗？	● 有人上Spark用python API的么

相关话题的讨论汇总
话题: python话题: anaconda话题: windows话题: 大幅度提高话题: c#

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天