p****a 发帖数: 38 | 1 【 以下文字转载自 DataSciences 讨论区 】
发信人: ptapta (ptapta), 信区: DataSciences
标 题: 请问SAS用什么做Big Data
发信站: BBS 未名空间站 (Thu Apr 9 17:57:21 2015, 美东)
SAS有自己的做Big Data的语言和工具吗?还是只要装了普通的SAS和Hadoop就可以处理
大数据文件了?要买普通SAS之外的模块吗?
多谢! |
s*********h 发帖数: 6288 | 2 SAS 9.4支持。
【在 p****a 的大作中提到】 : 【 以下文字转载自 DataSciences 讨论区 】 : 发信人: ptapta (ptapta), 信区: DataSciences : 标 题: 请问SAS用什么做Big Data : 发信站: BBS 未名空间站 (Thu Apr 9 17:57:21 2015, 美东) : SAS有自己的做Big Data的语言和工具吗?还是只要装了普通的SAS和Hadoop就可以处理 : 大数据文件了?要买普通SAS之外的模块吗? : 多谢!
|
p****a 发帖数: 38 | 3 谢谢回复。那么这个方面(big data,multiple computer processing),SAS9.4的新
功能,是否会有很多新的SAS语句来做,上手快吗(对于会SAS9.3的人来说)?
【在 s*********h 的大作中提到】 : SAS 9.4支持。
|
s*********h 发帖数: 6288 | 4 SAS9.4的很多并行运算是通过新的proc来实现的。
基本上syntax都差不多,但是不一定能原样复制运行,所以需要稍微调整一下。
proc logistic -> proc hplogistic
至于SAS和hadoop的接口,我还没试过。 |
p****a 发帖数: 38 | 5 多谢。能再问一下吗,如果SAS9.4的high performance procdures已经能够做big data
和distributed computing了,那为什么SAS还要和Hadoop接口呢?
【在 s*********h 的大作中提到】 : SAS9.4的很多并行运算是通过新的proc来实现的。 : 基本上syntax都差不多,但是不一定能原样复制运行,所以需要稍微调整一下。 : proc logistic -> proc hplogistic : 至于SAS和hadoop的接口,我还没试过。
|
s*********h 发帖数: 6288 | 6 因为 SAS sucks。
哈哈
其实是因为无论SAS怎么使用并行计算,他还是使用自己的service 的多个CPU计算,
而不是把任务分配到不同node计算。
百万美刀的server怎么也拼不过Hadoop价廉物美易扩展。
data
【在 p****a 的大作中提到】 : 多谢。能再问一下吗,如果SAS9.4的high performance procdures已经能够做big data : 和distributed computing了,那为什么SAS还要和Hadoop接口呢?
|
S******y 发帖数: 1123 | 7 当年SAS何等辉煌
The train has left the station |
D**u 发帖数: 288 | 8 high performance SAS is going nowhere.
【在 p****a 的大作中提到】 : 多谢。能再问一下吗,如果SAS9.4的high performance procdures已经能够做big data : 和distributed computing了,那为什么SAS还要和Hadoop接口呢?
|
o****o 发帖数: 8077 | 9 SAS的这套高性能计算跟业界比真的是落后很多
【在 s*********h 的大作中提到】 : 因为 SAS sucks。 : 哈哈 : 其实是因为无论SAS怎么使用并行计算,他还是使用自己的service 的多个CPU计算, : 而不是把任务分配到不同node计算。 : 百万美刀的server怎么也拼不过Hadoop价廉物美易扩展。 : : data
|
s*********h 发帖数: 6288 | 10 这帮家伙知道data step 太二逼了。但是没法改。于是弄出来个新的方案ds2还是叫什
么的。我看都懒得看。
【在 o****o 的大作中提到】 : SAS的这套高性能计算跟业界比真的是落后很多
|