l******o 发帖数: 3764 | 1 怎么能弄出个legend来,显示红线和蓝线都是什么?
查了半天也没查到
my code
====================
pl <- ggplot (tab.dat) +
geom_point(data=tab.dat, aes(TAD, DV), colour="#444444", size=3, shape=1
) + #default shape is closed circle
geom_line(data=vpc.dat, aes( (vpc.dat$upper+vpc.dat$lower)/2, vpc.dat[["
X50.sim"]]), size=1.5, colour="#882222") +
geom_line(data=vpc.dat, aes( (vpc.dat$upper+vpc.dat$lower)/2, vpc.dat[["
X5.sim"]]), size=1.5, linetype="dashed", colour="#222288") +
geom_line(data=vpc.dat, aes( (vpc.d... 阅读全帖 |
|
|
|
|
n******7 发帖数: 12463 | 5 我是想自己用C/C++/.etc写一些核心的东西
一般搞搞还是用python r matlab之类的省事
我刚开始一个project,决定正式用python这套东西
numpy scipy pandas scikit-learn matlibplot
这几个都是基于np的数据结构,配合起来很方便
R设计啥的我不介意,就是太慢太慢了,简直比猪还慢
可能就画个图用用
matlibplot用熟练了估计ggplot也不怎么用了
ggplot最蛋疼的就是老改来改去,文档又简陋
每次过段时间不用就忘记了,还不是我一个人这样
R应该还是干不过python,用户基数差太多,最后还是干统计老本行合适 |
|
d******c 发帖数: 2407 | 6 估计不会有第二个,或者能做的比matplotlib更好的,没人干这种活
plotly主要是交互,所以搞静态图不是它的目标
居然把matlab的东西当模版,足以证明当初写这东西的人眼界就那么点
ggplot至少有点理论,还是要高明一些的
对了,好像有个模仿ggplot的python版,不过多半做的不全,不知道对你来说是否够用
https://github.com/yhat/ggpy
github太虚荣了,这个东西有476个fork,有多少是真的干活的,还是就是随便一点,
跟看到书就下载但是不看一个道理? |
|
y*j 发帖数: 3139 | 7 当时其实就是现在,Matlab的程序作图非常流行,自己另起炉灶的话,不一定能够很快
地流传开来。
: 估计不会有第二个,或者能做的比matplotlib更好的,没人干这种活
: plotly主要是交互,所以搞静态图不是它的目标
: 居然把matlab的东西当模版,足以证明当初写这东西的人眼界就那么点
: ggplot至少有点理论,还是要高明一些的
: 对了,好像有个模仿ggplot的python版,不过多半做的不全,不知道对你来说是
否够用
: https://github.com/yhat/ggpy
: github太虚荣了,这个东西有476个fork,有多少是真的干活的,还是就是随便
一点,
: 跟看到书就下载但是不看一个道理?
|
|
d******c 发帖数: 2407 | 8 它模仿的只是接口,画图的句法,当然有一帮人已经比较熟悉,上手快
ggplot谁也没模仿,有个理论基础,其实上手有点难,有好几个地方反直觉,很容易掉
坑,之前R画图有base plot,有grid plot,功能都足够了,都不影响ggplot迅速火起
来。 |
|
n*******y 发帖数: 437 | 9 hello大家好 我R用了一阵也不是太熟 请问,当数据点少的时候density plot出
现波纹怎么解决? 谢谢!
code:
# show fringes
test = as.data.frame( sample(0:5,10000,replace=T) )
colnames(test) = c('mon')
ggplot(test, aes(x=mon)) + geom_density(binwidth=1, size=1)
# normal
test = as.data.frame( sample(0:20,10000,replace=T) )
colnames(test) = c('mon')
ggplot(test, aes(x=mon)) + geom_density(binwidth=1, size=1) |
|
n*****3 发帖数: 1584 | 10
R is not designed for such task, if you really need to do something like
this,
do it in c++, then use RCPP.
use ggplot/shiny or other packages , it is very easy, actually that is
what R is good at. |
|
D********r 发帖数: 135 | 11 看看图吧,空难死亡从1984到2017一直在线性下降(R2=0.65),跟1994年枪禁无关。看
在你还想学点统计的份上,从数据到code都给你了,好好研究一下。
Year Deaths incidents
2017 399 101
2016 629 102
2015 898 123
2014 1328 122
2013 459 138
2012 800 156
2011 828 154
2010 1130 162
2009 1108 163
2008 952 189
2007 981 169
2006 1298 192
2005 1463 194
2004 767 178
2003 1233 201
2002 1418 197
2001 1539 210
2000 1586 198
1999 1150 221
1998 1721 225... 阅读全帖 |
|
t********k 发帖数: 48 | 12 Data Analyst
RESPONSIBILITIES
Wrangle, extract, transform, and load data from various databases, formats,
and data sources
Use exploratory data analysis techniques to identify meaningful
relationships, patterns, or trends from complex automotive data sets
Communicate data analysis and findings through effective data visualizations
Design and run pricing experiments
Classify unlabeled data or predict into the future with applied statistics
and machine learning algorithms
QUALIFICATIONS
At least 1... 阅读全帖 |
|
|
l***y 发帖数: 4671 | 14 c coders 写 r 的最大两个问题,一个是数学功底和数据库功底不够,无法从数学模型
的角度和数据表的框架去思考问题,一个是对 r 的底层实现的理解不够深刻,不知道
该如何优化。写出来的code 不但效率惊人的低,而且冗长,难以维护,bugs 很多。比
如说不敢用循环,而是滥用 apply,是中级用户的一个显著特点。
对于 c coders,就举一个简单的例子:names。r 的原则之一就是万物有名。大量使用
names 来做 indexing,这是哲学上的不同。这也是 c coders 很难真正从理念上理解
和掌握的地方 -- 虽然常用的 tricks 很快就熟悉了。其它的比如说 factor 的使用,
模型的构建,等等,不熟悉的话,连 ggplot 都很难用好,更不用说如何在自己的软件
中正确高效的重载了。
而稍微 intense 一些的 r package 就要用 c 来写一些关键组份了,所以专业的 r
coders 的 c 还是很扎实的。比如说,要充分利用 phi 处理器通过 offload 来提高
openmp 的效率,很多小函数就要用 c 或者 fortran 来写,那... 阅读全帖 |
|
|
|
|
n******7 发帖数: 12463 | 18 断续用了9年的R了,一直不太喜欢
写点简单的东西还好,一旦复杂一点,就麻烦了
首先是debug很头疼
有很多没有documented的东西,需要往往搜来搜去
跑着跑着出错了,看看出错信息也往往不知所谓
R界一统江湖的IDE,Rstudio,直到最近才支持设置断点
之前发过一个帖子,有个分析数据的R脚本本来好好的
加了点功能,就会在有些sample上有问题,但是有些sample又是好的
后来发现,在中间的某一步,如果matrix变成了一行的,会自动转化成vector
纯坑爹
而且各种矢量化操作,比如apply家族,让debug更加困难
其次是performance太差,特别是不得不用loop的情况
基本上比python之类的还要慢一个数量级
数据稍微大点,你就可以先干别的去了
还有就是学习曲线很不友好
我起码算中位数智商吧,用了这么多年R,还是经常要上网搜解决方案
身边的人,除了统计专业的,可能还不如我
加上很多统计的东西在里面,光是一个character <-> factor
估计都困扰了很多初学者
这点最近几年可能好点,因为突然冒出来很多R的书,加上Rstudio的出现
很多R的包也... 阅读全帖 |
|
|
|
|
s*********y 发帖数: 689 | 22 需要图像缩放的用bokeh, 静态的用ggplot。 |
|
k*****u 发帖数: 1688 | 23 简单的就是matplotlib,使用ggplot theme
svg可以用pygal
动态的就是highcharts/bokeh |
|
n******g 发帖数: 2201 | 24 用了一阵了 觉得和ggplot 一样很多坑 对修炼内功没有帮助 值得深钻吗? |
|
|
s**h 发帖数: 477 | 26 先拜谢大牛的帮助
我的问题:
刚开始学用python做自动股票交易, 是跟着youtube 上一个视频学的, 但是遇到一个
error, 不知道怎么解决。求帮助
=========================================
import datetime as dt
import matplotlib.pyplot as plt
from matplotlib import style
import pandas as pd
import pandas_datareader.data as web
style.use('ggplot')
start = dt.datetime(2010, 1, 1)
end = dt.datetime(2016, 12, 31)
df = web.DataReader('AAPL', start, end)
print(df.head())
========================================
程序问题
C:UsersXXXAppDataLocalContinuumAnaconda3python.exe... 阅读全帖 |
|
n*****3 发帖数: 1584 | 27 https://shiny.rstudio.com/gallery/
most of the user case are included. it is very productive if you already
knows R, and the client is not picky about the details.
Feel a little like using clojurescript(which I do not use much), make simple
things very fast ,but hard thing(or details updates/modification) very hard.
BTW personaly I think all the new R library like dplyr, ggplot and shiny are
much better than python correspoding
packages,
but sure python has way way bigger Ego system....... |
|
d******c 发帖数: 2407 | 28 不要套大牛的帽子,纯粹是个人喜好
rstudio,r的package管理上手都很容易,rstudio就什么都有了,帮助,画图,
htmlwidget。
你用python做到同样的事情,需要自己东拼西凑,还到处磕磕碰碰。画个图吧,是从
matlab抄过来的,不如ggplot好用。搞网页交互没有shiny类似的东西,更不能像
htmlwidget一样那么随便把js的东西弄过来用。
自从有了htmlwidget,js的东西几天就可以弄过来一个给R用。
rmarkdown本质是markdown,ipython是基于json的,所以你没法对它用版本管理。
rmarkdown一样支持多种语言,一样可以把结果一直交错显示(notebook格式)。因为
是markdown,你可以在代码中间加各种文档或者笔记,我一般写R都是在rmarkdown里写
,直到最后必须的时候才转成.R |
|
d******g 发帖数: 9 | 29 Does anyone has ggplot2 draft book?
would you e-mail me to d******[email protected]
It was on the ggplot website two days ago and Now it is gone and need to be
purchased. |
|
h******3 发帖数: 190 | 30 如何在dot plot上加平均值的horizontal line? 谢谢。 |
|
a*****3 发帖数: 601 | 31 有个/href= vref=是加reference line的,不知有没有帮助。 |
|
h******3 发帖数: 190 | 32 geom_hline() works. thanks all the same. |
|
|
|
|
w******n 发帖数: 36 | 36 1. change output fig size
2. + labs(x='',y='') + scale_x_continuous(breaks=NA) + scale_y_continuous(
breaks=NA) |
|
|
|
|
L*******R 发帖数: 105 | 40 就是三个time series并列作图么,直接用ggplot包含不同的level不行吗? |
|
L*******R 发帖数: 105 | 41 就是三个time series并列作图吧,用ggplot就可以啊 |
|
L*******R 发帖数: 105 | 42 就是三个time series并列作图吧,用ggplot就可以啊 |
|
L*******R 发帖数: 105 | 43 就是三个time series并列作图吧,用ggplot就可以啊 |
|
L*******R 发帖数: 105 | 44 就是三个time series并列作图吧,用ggplot就可以啊 |
|
t********k 发帖数: 48 | 45 Data Analyst
RESPONSIBILITIES
Wrangle, extract, transform, and load data from various databases, formats,
and data sources
Use exploratory data analysis techniques to identify meaningful
relationships, patterns, or trends from complex automotive data sets
Communicate data analysis and findings through effective data visualizations
Design and run pricing experiments
Classify unlabeled data or predict into the future with applied statistics
and machine learning algorithms
QUALIFICATIONS
At least 1... 阅读全帖 |
|
w******H 发帖数: 53 | 46 猎头发给我的,分享给感兴趣的同学。声明一下这份工作&猎头和我本人没有任何利益
相关。
职位是在GA,一家非盈利性医院,新成立的data science组。薪水只在12万左右。大牛
们肯定看不上,不过渴望找份工作的同学们可以联系猎头。
Title: Lead Data Scientist
Location: Macon, GA or Remote
Job Responsibilities:
• The data scientist will collaborate with departments across the
system to provide actionable, data-driven insights through research and
analysis of data sources and development of statistical, mathematical and
predictive models.
• This key position will ensure the organization makes... 阅读全帖 |
|
E**********e 发帖数: 1736 | 47 exactly. sas 就是不好用。 主要问题是sas 没有灵活性。
至于python 和 r,就看个人喜好了。 现在python的支持也越来越多, 感觉python在
未来的两三年内超过r 也不是问题。 至于很多人推荐的r的ggplot, 感觉没有pytyon
里的matlabplot 好。 个人喜好python, 比R快, 界面也干净,清爽。 |
|
b*****s 发帖数: 11267 | 48 未必比r快把,r需要赶紧把for loop的效率解决下,我不知道这里面有什么困难的地方
。。。
[在 ExpressoLove (MoneyForNothing) 的大作中提到:]
:exactly. sas 就是不好用。 主要问题是sas 没有灵活性。
:至于python 和 r,就看个人喜好了。 现在python的支持也越来越多, 感觉python在
:未来的两三年内超过r 也不是问题。 至于很多人推荐的r的ggplot, 感觉没有pytyon
:里的matlabplot 好。 个人喜好python, 比R快, 界面也干净,清爽。 |
|
E**********e 发帖数: 1736 | 49 exactly. sas 就是不好用。 主要问题是sas 没有灵活性。
至于python 和 r,就看个人喜好了。 现在python的支持也越来越多, 感觉python在
未来的两三年内超过r 也不是问题。 至于很多人推荐的r的ggplot, 感觉没有pytyon
里的matlabplot 好。 个人喜好python, 比R快, 界面也干净,清爽。 |
|
b*****s 发帖数: 11267 | 50 未必比r快把,r需要赶紧把for loop的效率解决下,我不知道这里面有什么困难的地方
。。。
[在 ExpressoLove (MoneyForNothing) 的大作中提到:]
:exactly. sas 就是不好用。 主要问题是sas 没有灵活性。
:至于python 和 r,就看个人喜好了。 现在python的支持也越来越多, 感觉python在
:未来的两三年内超过r 也不是问题。 至于很多人推荐的r的ggplot, 感觉没有pytyon
:里的matlabplot 好。 个人喜好python, 比R快, 界面也干净,清爽。 |
|