d******a 发帖数: 32122 | 1 数据处理,直接SQL就解决了
什么dplyr data.table 根本就不用学 |
m******r 发帖数: 1033 | 2 我不太推荐, 我日常主要的工作之一就是试验各种软件包。 dplyr/data.table学习周
期长,功能强大。 sqldf我记得当时看了看文档,就觉得这个东西不行, 忘了具体理
由。
类似的还有stringr, lubridater之类。 我认为R base/ stat处理字符串,日期已经够
用了, (反正够我用了), 没必要再学新的。 |
l***k 发帖数: 1153 | 3 为啥不行,挺好一个package。对熟悉sql的人根本不用学
【在 m******r 的大作中提到】 : 我不太推荐, 我日常主要的工作之一就是试验各种软件包。 dplyr/data.table学习周 : 期长,功能强大。 sqldf我记得当时看了看文档,就觉得这个东西不行, 忘了具体理 : 由。 : 类似的还有stringr, lubridater之类。 我认为R base/ stat处理字符串,日期已经够 : 用了, (反正够我用了), 没必要再学新的。
|
d******a 发帖数: 32122 | 4 sql在几十年里久经考验,是工业标准,同时非常灵活强大
dplyr/data.table属于某个个人拍脑瓜搞出来的,通用性欠佳
https://www.mitbbs.com/article/Programming/31530989_3.html
【在 m******r 的大作中提到】 : 我不太推荐, 我日常主要的工作之一就是试验各种软件包。 dplyr/data.table学习周 : 期长,功能强大。 sqldf我记得当时看了看文档,就觉得这个东西不行, 忘了具体理 : 由。 : 类似的还有stringr, lubridater之类。 我认为R base/ stat处理字符串,日期已经够 : 用了, (反正够我用了), 没必要再学新的。
|
m******r 发帖数: 1033 | 5 sql是generic term, 类似于感冒药,消炎药, 磺胺类药物一样。
sql 66 or 56 是 ieee定的标准。 然后各大厂商, oracle/teradata/mysql...按照
该标准实现自己的产品。 对了还有sas. sas 实现了很少一部分,严格讲根本不能算
sql, 不过大家心知肚明, 一个统计软件,能把sql做成这样, 相当不错了。
后来不知道哪个2货在R里面也号称做了个sql, 我看了一眼,笑笑走开了。 网上对所谓
r/sql评论得都很少。 根本就是玩具里的玩具。 大家普遍用dplyr or data.table.
R里面垃圾我见多了 。 信专家的话吧, 得永生。
另外, 的确dplyr , data.table是一个人拍脑袋拍出来的, 这也恰恰给海老师‘二人
论’ ( 我管它叫二人转)提供了实例。
另外, R 是从S演变来, S的作者公认是三个人, 贝尔实验室的。
SAS的作者,三个人,似乎是两男一女, 其中一个中途退出。
随机森林作者, 一个人, 斯坦福教授,前两年被minitab买了。
【在 d******a 的大作中提到】 : sql在几十年里久经考验,是工业标准,同时非常灵活强大 : dplyr/data.table属于某个个人拍脑瓜搞出来的,通用性欠佳 : https://www.mitbbs.com/article/Programming/31530989_3.html
|
d******a 发帖数: 32122 | 6 各大厂商的sql的确有差异,但是主体是一致的。无非就是美国北方口音和南方口音的
区别。
的确大家普遍用dplyr or data.table,这可能跟用R的学统计的居多,而这些人不学
sql有关。
但是那些长期用sql的,用sqldf处理数据就是信手拈来。
dplyr实际也是根据SQL草创的,但是草创的时候想简单了,导致字段名不能加引号,也
就失去了动态灵活。估计学统计的人也不用动态决定字段名。后来打了补丁,但是很不
好看。
【在 m******r 的大作中提到】 : sql是generic term, 类似于感冒药,消炎药, 磺胺类药物一样。 : sql 66 or 56 是 ieee定的标准。 然后各大厂商, oracle/teradata/mysql...按照 : 该标准实现自己的产品。 对了还有sas. sas 实现了很少一部分,严格讲根本不能算 : sql, 不过大家心知肚明, 一个统计软件,能把sql做成这样, 相当不错了。 : 后来不知道哪个2货在R里面也号称做了个sql, 我看了一眼,笑笑走开了。 网上对所谓 : r/sql评论得都很少。 根本就是玩具里的玩具。 大家普遍用dplyr or data.table. : R里面垃圾我见多了 。 信专家的话吧, 得永生。 : 另外, 的确dplyr , data.table是一个人拍脑袋拍出来的, 这也恰恰给海老师‘二人 : 论’ ( 我管它叫二人转)提供了实例。 : 另外, R 是从S演变来, S的作者公认是三个人, 贝尔实验室的。
|
h**********9 发帖数: 1 | 7 DPLYR is good for small datatables, but more native to R environment and so
more flexible.
SQLDF is good for large database, but it is a wrapper so may have issues
difficult to debug.
Both are good in their preferred scenarios. Like python vs java for ds. |