由买买提看人间百态

topics

全部话题 - 话题: ggplot
1 (共1页)
l******o
发帖数: 3764
1
怎么能弄出个legend来,显示红线和蓝线都是什么?
查了半天也没查到
my code
====================
pl <- ggplot (tab.dat) +
geom_point(data=tab.dat, aes(TAD, DV), colour="#444444", size=3, shape=1
) + #default shape is closed circle
geom_line(data=vpc.dat, aes( (vpc.dat$upper+vpc.dat$lower)/2, vpc.dat[["
X50.sim"]]), size=1.5, colour="#882222") +
geom_line(data=vpc.dat, aes( (vpc.dat$upper+vpc.dat$lower)/2, vpc.dat[["
X5.sim"]]), size=1.5, linetype="dashed", colour="#222288") +
geom_line(data=vpc.dat, aes( (vpc.d... 阅读全帖
s*****n
发帖数: 134
2
来自主题: DataSciences版 - 你们用Python的什么库画图?
http://ggplot.yhathq.com/
用法基本上和R的一致,只是一开始需要
import ggplot, geom_line, facet_wrap, ... from ggplot
s*****n
发帖数: 134
3
来自主题: DataSciences版 - 你们用Python的什么库画图?
http://ggplot.yhathq.com/
用法基本上和R的一致,只是一开始需要
import ggplot, geom_line, facet_wrap, ... from ggplot
m***r
发帖数: 359
4
来自主题: Programming版 - Python 2015年1月楼
Python日报 2015-01-31
@好东西传送门 出品, 过刊见
http://py.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅Python日报
更好看的HTML版
http://py.memect.com/archive/2015-01-31/short.html
1) 【Python中的计算几何】 by @网路冷眼
关键词:数据科学, 计算
【Python中的计算几何】 [1] 计算几何数学的一个领域,寻求开发高效算法来解决用
基本几何对象所描述的问题,又区分为组合计算几何和数值计算几何。一个处理几何对
象的交互,一个处理几何对象的表示。好文章! @2gua @CSDN_CODE @Linux中国 @伯乐
头条 @好东西传送门 @百度技术沙龙
[1] https://blancosilva.github.io/post/2014/10/28/Computational-Geometry-in-
Python.html
2) 【Python日报搜索的测试版】 by @西瓜大丸子汤
关键词:简报
今天更新了... 阅读全帖
n******7
发帖数: 12463
5
我是想自己用C/C++/.etc写一些核心的东西
一般搞搞还是用python r matlab之类的省事
我刚开始一个project,决定正式用python这套东西
numpy scipy pandas scikit-learn matlibplot
这几个都是基于np的数据结构,配合起来很方便
R设计啥的我不介意,就是太慢太慢了,简直比猪还慢
可能就画个图用用
matlibplot用熟练了估计ggplot也不怎么用了
ggplot最蛋疼的就是老改来改去,文档又简陋
每次过段时间不用就忘记了,还不是我一个人这样
R应该还是干不过python,用户基数差太多,最后还是干统计老本行合适
d******c
发帖数: 2407
6
来自主题: Programming版 - python画图是不是还是matplotlib?
估计不会有第二个,或者能做的比matplotlib更好的,没人干这种活
plotly主要是交互,所以搞静态图不是它的目标
居然把matlab的东西当模版,足以证明当初写这东西的人眼界就那么点
ggplot至少有点理论,还是要高明一些的
对了,好像有个模仿ggplot的python版,不过多半做的不全,不知道对你来说是否够用
https://github.com/yhat/ggpy
github太虚荣了,这个东西有476个fork,有多少是真的干活的,还是就是随便一点,
跟看到书就下载但是不看一个道理?
y*j
发帖数: 3139
7
来自主题: Programming版 - python画图是不是还是matplotlib?
当时其实就是现在,Matlab的程序作图非常流行,自己另起炉灶的话,不一定能够很快
地流传开来。


: 估计不会有第二个,或者能做的比matplotlib更好的,没人干这种活

: plotly主要是交互,所以搞静态图不是它的目标

: 居然把matlab的东西当模版,足以证明当初写这东西的人眼界就那么点

: ggplot至少有点理论,还是要高明一些的

: 对了,好像有个模仿ggplot的python版,不过多半做的不全,不知道对你来说是
否够用

: https://github.com/yhat/ggpy

: github太虚荣了,这个东西有476个fork,有多少是真的干活的,还是就是随便
一点,

: 跟看到书就下载但是不看一个道理?

d******c
发帖数: 2407
8
来自主题: Programming版 - python画图是不是还是matplotlib?
它模仿的只是接口,画图的句法,当然有一帮人已经比较熟悉,上手快
ggplot谁也没模仿,有个理论基础,其实上手有点难,有好几个地方反直觉,很容易掉
坑,之前R画图有base plot,有grid plot,功能都足够了,都不影响ggplot迅速火起
来。
n*******y
发帖数: 437
9
来自主题: Statistics版 - 求助 R density plot 出现波纹。。。
hello大家好 我R用了一阵也不是太熟 请问,当数据点少的时候density plot出
现波纹怎么解决? 谢谢!
code:
# show fringes
test = as.data.frame( sample(0:5,10000,replace=T) )
colnames(test) = c('mon')
ggplot(test, aes(x=mon)) + geom_density(binwidth=1, size=1)
# normal
test = as.data.frame( sample(0:20,10000,replace=T) )
colnames(test) = c('mon')
ggplot(test, aes(x=mon)) + geom_density(binwidth=1, size=1)
n*****3
发帖数: 1584
10
来自主题: Military版 - 感觉python的前途堪忧

R is not designed for such task, if you really need to do something like
this,
do it in c++, then use RCPP.
use ggplot/shiny or other packages , it is very easy, actually that is
what R is good at.
D********r
发帖数: 135
11
看看图吧,空难死亡从1984到2017一直在线性下降(R2=0.65),跟1994年枪禁无关。看
在你还想学点统计的份上,从数据到code都给你了,好好研究一下。
Year Deaths incidents
2017 399 101
2016 629 102
2015 898 123
2014 1328 122
2013 459 138
2012 800 156
2011 828 154
2010 1130 162
2009 1108 163
2008 952 189
2007 981 169
2006 1298 192
2005 1463 194
2004 767 178
2003 1233 201
2002 1418 197
2001 1539 210
2000 1586 198
1999 1150 221
1998 1721 225... 阅读全帖
t********k
发帖数: 48
12
Data Analyst
RESPONSIBILITIES
Wrangle, extract, transform, and load data from various databases, formats,
and data sources
Use exploratory data analysis techniques to identify meaningful
relationships, patterns, or trends from complex automotive data sets
Communicate data analysis and findings through effective data visualizations
Design and run pricing experiments
Classify unlabeled data or predict into the future with applied statistics
and machine learning algorithms
QUALIFICATIONS
At least 1... 阅读全帖
b********g
发帖数: 94
13
来自主题: Immigration版 - SRC140 批复状态分布图(兼求祝福
赞ggplot. source data?
l***y
发帖数: 4671
14
c coders 写 r 的最大两个问题,一个是数学功底和数据库功底不够,无法从数学模型
的角度和数据表的框架去思考问题,一个是对 r 的底层实现的理解不够深刻,不知道
该如何优化。写出来的code 不但效率惊人的低,而且冗长,难以维护,bugs 很多。比
如说不敢用循环,而是滥用 apply,是中级用户的一个显著特点。
对于 c coders,就举一个简单的例子:names。r 的原则之一就是万物有名。大量使用
names 来做 indexing,这是哲学上的不同。这也是 c coders 很难真正从理念上理解
和掌握的地方 -- 虽然常用的 tricks 很快就熟悉了。其它的比如说 factor 的使用,
模型的构建,等等,不熟悉的话,连 ggplot 都很难用好,更不用说如何在自己的软件
中正确高效的重载了。
而稍微 intense 一些的 r package 就要用 c 来写一些关键组份了,所以专业的 r
coders 的 c 还是很扎实的。比如说,要充分利用 phi 处理器通过 offload 来提高
openmp 的效率,很多小函数就要用 c 或者 fortran 来写,那... 阅读全帖
n******7
发帖数: 12463
15
LZ要糙快猛,ggplot不行,起码不如r-base的plot
我有次还没多少data,就感觉到update ggplot2的慢了
刚才g了一下,确实如此
http://stackoverflow.com/questions/17615835/continuously-update
n******7
发帖数: 12463
16
LZ要糙快猛,ggplot不行,起码不如r-base的plot
我有次还没多少data,就感觉到update ggplot2的慢了
刚才g了一下,确实如此
http://stackoverflow.com/questions/17615835/continuously-update
m***r
发帖数: 359
17
来自主题: Programming版 - Python日报 2015年3月楼
Python日报 2015-03-10
@好东西传送门 出品, 过刊见
http://py.memect.com
订阅:给 h*[email protected] 发封空信, 标题: 订阅Python日报
更好看的HTML版
http://py.memect.com/archive/2015-03-10/short.html
1) 【概率论与数理统计的Python版剧透第一章】 by @陈振宇NJU
关键词:书籍, 数据科学, Monty Hall, 计算, 蒙提, 视频
[概率论与数理统计的Python版]剧透第一章的三个例子:(1) 蒙提霍尔三门问题(2)蒙
特卡罗方法初步(3)随机测试初步,猛戳 [1] ,高清版访问 @网易云课堂 (3月16日开
课): [2] @统计之都 @好东西传送门 @中国计算机学会软件工程专委会
[1] http://v.youku.com/v_show/id_XOTA4MzUzNTEy.html?f=23541643
[2] http://mooc.study.163.com/course/NJU-1000031001#/info
2) 【基于pandas和go... 阅读全帖
n******7
发帖数: 12463
18
来自主题: Programming版 - 两个我永远都不想碰的语言
断续用了9年的R了,一直不太喜欢
写点简单的东西还好,一旦复杂一点,就麻烦了
首先是debug很头疼
有很多没有documented的东西,需要往往搜来搜去
跑着跑着出错了,看看出错信息也往往不知所谓
R界一统江湖的IDE,Rstudio,直到最近才支持设置断点
之前发过一个帖子,有个分析数据的R脚本本来好好的
加了点功能,就会在有些sample上有问题,但是有些sample又是好的
后来发现,在中间的某一步,如果matrix变成了一行的,会自动转化成vector
纯坑爹
而且各种矢量化操作,比如apply家族,让debug更加困难
其次是performance太差,特别是不得不用loop的情况
基本上比python之类的还要慢一个数量级
数据稍微大点,你就可以先干别的去了
还有就是学习曲线很不友好
我起码算中位数智商吧,用了这么多年R,还是经常要上网搜解决方案
身边的人,除了统计专业的,可能还不如我
加上很多统计的东西在里面,光是一个character <-> factor
估计都困扰了很多初学者
这点最近几年可能好点,因为突然冒出来很多R的书,加上Rstudio的出现
很多R的包也... 阅读全帖
n******7
发帖数: 12463
19
来自主题: Programming版 - 从今天起开始鼓吹R了
一样坑
我都被迫买过ggplot的书
n******7
发帖数: 12463
20
来自主题: Programming版 - 从今天起开始鼓吹R了
一样坑
我都被迫买过ggplot的书
l******n
发帖数: 9344
21
来自主题: Programming版 - python 画图哪个库最好用?
试试ggplot
s*********y
发帖数: 689
22
来自主题: Programming版 - python 画图哪个库最好用?
需要图像缩放的用bokeh, 静态的用ggplot。
k*****u
发帖数: 1688
23
来自主题: Programming版 - python 画图哪个库最好用?
简单的就是matplotlib,使用ggplot theme
svg可以用pygal
动态的就是highcharts/bokeh
n******g
发帖数: 2201
24
来自主题: Programming版 - Python pandas 是坑不?
用了一阵了 觉得和ggplot 一样很多坑 对修炼内功没有帮助 值得深钻吗?
x***4
发帖数: 1815
25
来自主题: Programming版 - Python pandas 是坑不?
我觉得ggplot比较consistent。
s**h
发帖数: 477
26
先拜谢大牛的帮助
我的问题:
刚开始学用python做自动股票交易, 是跟着youtube 上一个视频学的, 但是遇到一个
error, 不知道怎么解决。求帮助
=========================================
import datetime as dt
import matplotlib.pyplot as plt
from matplotlib import style
import pandas as pd
import pandas_datareader.data as web
style.use('ggplot')
start = dt.datetime(2010, 1, 1)
end = dt.datetime(2016, 12, 31)
df = web.DataReader('AAPL', start, end)
print(df.head())
========================================
程序问题
C:UsersXXXAppDataLocalContinuumAnaconda3python.exe... 阅读全帖
n*****3
发帖数: 1584
27
来自主题: Programming版 - r shiny reactive programming
https://shiny.rstudio.com/gallery/
most of the user case are included. it is very productive if you already
knows R, and the client is not picky about the details.
Feel a little like using clojurescript(which I do not use much), make simple
things very fast ,but hard thing(or details updates/modification) very hard.
BTW personaly I think all the new R library like dplyr, ggplot and shiny are
much better than python correspoding
packages,
but sure python has way way bigger Ego system.......
d******c
发帖数: 2407
28
不要套大牛的帽子,纯粹是个人喜好
rstudio,r的package管理上手都很容易,rstudio就什么都有了,帮助,画图,
htmlwidget。
你用python做到同样的事情,需要自己东拼西凑,还到处磕磕碰碰。画个图吧,是从
matlab抄过来的,不如ggplot好用。搞网页交互没有shiny类似的东西,更不能像
htmlwidget一样那么随便把js的东西弄过来用。
自从有了htmlwidget,js的东西几天就可以弄过来一个给R用。
rmarkdown本质是markdown,ipython是基于json的,所以你没法对它用版本管理。
rmarkdown一样支持多种语言,一样可以把结果一直交错显示(notebook格式)。因为
是markdown,你可以在代码中间加各种文档或者笔记,我一般写R都是在rmarkdown里写
,直到最后必须的时候才转成.R
d******g
发帖数: 9
29
来自主题: Statistics版 - want ggplot2 draft books
Does anyone has ggplot2 draft book?
would you e-mail me to d******[email protected]
It was on the ggplot website two days ago and Now it is gone and need to be
purchased.
h******3
发帖数: 190
30
来自主题: Statistics版 - ggplot画图求助
如何在dot plot上加平均值的horizontal line? 谢谢。
a*****3
发帖数: 601
31
来自主题: Statistics版 - ggplot画图求助
有个/href= vref=是加reference line的,不知有没有帮助。
h******3
发帖数: 190
32
来自主题: Statistics版 - ggplot画图求助
geom_hline() works. thanks all the same.
a*****3
发帖数: 601
33
来自主题: Statistics版 - ggplot画图求助
这个不会是几何平均值吧?
h******3
发帖数: 190
34
来自主题: Statistics版 - ggplot画图求助
不好意思。我表达不清,主要想问怎么画横线。
o******n
发帖数: 511
35
来自主题: Statistics版 - 请教一个ggplot的问题
我想复制这个网页答案里的图:
http://stats.stackexchange.com/questions/17842/how-to-make-waff
我用同样的code做图,里面的小格子却是长方形的。
请问怎么让cell是正方形的?我搜到这个类似问题,但好像解决不了我的问题:
https://groups.google.com/forum/#!topic/ggplot2/cmxRegR7tY0
另外请问怎么去掉图里的x,y axis labels和数字?我试过了让theme下的axis.text,
axis.title为空都没用。
谢谢了!
w******n
发帖数: 36
36
来自主题: Statistics版 - 请教一个ggplot的问题
1. change output fig size
2. + labs(x='',y='') + scale_x_continuous(breaks=NA) + scale_y_continuous(
breaks=NA)
o******n
发帖数: 511
37
来自主题: Statistics版 - 请教一个ggplot的问题
谢谢,我去试试
l******o
发帖数: 3764
38
pic
t**i
发帖数: 688
39
scale_color_manual()

L*******R
发帖数: 105
40
来自主题: Statistics版 - R里面survival curve的问题, 包子贴
就是三个time series并列作图么,直接用ggplot包含不同的level不行吗?
L*******R
发帖数: 105
41
来自主题: Statistics版 - R里面survival curve的问题, 包子贴
就是三个time series并列作图吧,用ggplot就可以啊
L*******R
发帖数: 105
42
来自主题: Statistics版 - R里面survival curve的问题, 包子贴
就是三个time series并列作图吧,用ggplot就可以啊
L*******R
发帖数: 105
43
来自主题: Statistics版 - R里面survival curve的问题, 包子贴
就是三个time series并列作图吧,用ggplot就可以啊
L*******R
发帖数: 105
44
来自主题: Statistics版 - R里面survival curve的问题, 包子贴
就是三个time series并列作图吧,用ggplot就可以啊
t********k
发帖数: 48
45
Data Analyst
RESPONSIBILITIES
Wrangle, extract, transform, and load data from various databases, formats,
and data sources
Use exploratory data analysis techniques to identify meaningful
relationships, patterns, or trends from complex automotive data sets
Communicate data analysis and findings through effective data visualizations
Design and run pricing experiments
Classify unlabeled data or predict into the future with applied statistics
and machine learning algorithms
QUALIFICATIONS
At least 1... 阅读全帖
w******H
发帖数: 53
46
猎头发给我的,分享给感兴趣的同学。声明一下这份工作&猎头和我本人没有任何利益
相关。
职位是在GA,一家非盈利性医院,新成立的data science组。薪水只在12万左右。大牛
们肯定看不上,不过渴望找份工作的同学们可以联系猎头。
Title: Lead Data Scientist
Location: Macon, GA or Remote
Job Responsibilities:
• The data scientist will collaborate with departments across the
system to provide actionable, data-driven insights through research and
analysis of data sources and development of statistical, mathematical and
predictive models.
• This key position will ensure the organization makes... 阅读全帖
E**********e
发帖数: 1736
47
exactly. sas 就是不好用。 主要问题是sas 没有灵活性。
至于python 和 r,就看个人喜好了。 现在python的支持也越来越多, 感觉python在
未来的两三年内超过r 也不是问题。 至于很多人推荐的r的ggplot, 感觉没有pytyon
里的matlabplot 好。 个人喜好python, 比R快, 界面也干净,清爽。
b*****s
发帖数: 11267
48
未必比r快把,r需要赶紧把for loop的效率解决下,我不知道这里面有什么困难的地方
。。。
[在 ExpressoLove (MoneyForNothing) 的大作中提到:]
:exactly. sas 就是不好用。 主要问题是sas 没有灵活性。
:至于python 和 r,就看个人喜好了。 现在python的支持也越来越多, 感觉python在
:未来的两三年内超过r 也不是问题。 至于很多人推荐的r的ggplot, 感觉没有pytyon
:里的matlabplot 好。 个人喜好python, 比R快, 界面也干净,清爽。
E**********e
发帖数: 1736
49
exactly. sas 就是不好用。 主要问题是sas 没有灵活性。
至于python 和 r,就看个人喜好了。 现在python的支持也越来越多, 感觉python在
未来的两三年内超过r 也不是问题。 至于很多人推荐的r的ggplot, 感觉没有pytyon
里的matlabplot 好。 个人喜好python, 比R快, 界面也干净,清爽。
b*****s
发帖数: 11267
50
未必比r快把,r需要赶紧把for loop的效率解决下,我不知道这里面有什么困难的地方
。。。
[在 ExpressoLove (MoneyForNothing) 的大作中提到:]
:exactly. sas 就是不好用。 主要问题是sas 没有灵活性。
:至于python 和 r,就看个人喜好了。 现在python的支持也越来越多, 感觉python在
:未来的两三年内超过r 也不是问题。 至于很多人推荐的r的ggplot, 感觉没有pytyon
:里的matlabplot 好。 个人喜好python, 比R快, 界面也干净,清爽。
1 (共1页)