r****s 发帖数: 1025 | 1 MapReduce就是扯淡,你只要用过就知道,慢的要死,而且复杂得很。
这里面居然一句都不提Hive,很明显都是菜鸟。没有Hive的MapReduce简直不可想象(
知道我在说啥吗?)。Hive慢得要死,简单的一个select4 * from,4行的小文件,要
10秒。不过最终还是可以给你算出来。
Impala就是一个joke,内存总量不能小于table join的intermediate step,一看就是
把内存版的MapReduce。Storm/Stream MapReduce好像有点戏。
现在玩的就是怎么代替MapReduce。
这里面的最大的玩家是Impala(Cloudera)和Apache Drill(MapR)。Apache Drill抄的
是Google的Dremel。Apache Drill基本上比Impala要滞后两个季度左右的进度。
Spring/EJB之类的连Joke都算不上。现在谁还用EJB? Spring和大数据一点点关系都没
有,属于胡搅蛮缠凑热闹的。
另外说一句,Hive是Facebook的东西,Dremel是Google的,两公司差距不小。 |
|
c********e 发帖数: 62 | 2 请问下在select section的时候是一次4门全选好呢,还是一次选一个比较好?因为NTS是
要在9个月内考这些考试吧.如果4门全select了,那么就要在9个月内全考了,是不是?不
然就白交考试费了. |
|
f****k 发帖数: 61 | 3
9 months? I am wondering it is 6 months.
For pushing yourself and saving money, I did select four parts together.
Finished all and passed three&waiting for the last score released.
Good luck. |
|
|
d******a 发帖数: 234 | 5 如果时间还可以,就4个吧,我刚给把4个都选了,呵呵 |
|