z****e 发帖数: 54598 | 1 没有用hive的?
如果是码农出身的话,尤其是以前做dba之类的
用hive可能会更容易上手点,可能不需要你搞pytho这些 |
z****e 发帖数: 54598 | 2 我一般都是用hive建data mart
然后交给pig去查询,效率明显提升
当然空间要求也多了不少 |
B*****g 发帖数: 34098 | 3 靠,老赵也是DS了
【在 z****e 的大作中提到】 : 没有用hive的? : 如果是码农出身的话,尤其是以前做dba之类的 : 用hive可能会更容易上手点,可能不需要你搞pytho这些
|
r*****d 发帖数: 346 | 4 data management组就有一个是dba出身的,他用hive不用pig.
我感觉管理数据“新陈代谢”的整个流程跟business report,
hive都能有效完成任务,不用pig没关系,
不过管理数据确实要用cassandra等。。
但如果需要non-vanilla计算,数据挖掘,就要用pig.
【在 z****e 的大作中提到】 : 没有用hive的? : 如果是码农出身的话,尤其是以前做dba之类的 : 用hive可能会更容易上手点,可能不需要你搞pytho这些
|
h********3 发帖数: 2075 | 5 同意楼主的观点。hive其实挺好的。关系数据模式本来就很成熟了,实在没有必要搞怪
莫怪样的pig出来。但是实际问题是,据说hive的开发问题和bug不少,除非有个像
Oracle或者Mysql一样一个成熟的商业公司来维护才可靠。 |
m*********u 发帖数: 1491 | 6 Pig do what Pig need to do.
Hive do what Hive can do.
Two different tools. |