Hadoop运行时是不是用命令行执行的？Hadoop和Java有什么联系？ - Programming版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - Hadoop运行时是不是用命令行执行的？Hadoop和Java有什么联系？

相关主题
● 搞不懂为什么大牛说Hbase不如C*?	● Hadoop 和Python的数据分析包哪个更值得学习？
● Hadoop/HBase/HDFS三驾马车过时了吗？	● 一个Hadoop Cluster升级的问题
● 感觉flink出来之后，hadoop就显得不怎么再需要了	● 能不能在hadoop中用open mpi?
● MapReduce 的思想是怎么发明的？	● 大牛能不能讨论下cassandra， Hbase， MongoDB的对比
● big data,菜凉?	● 转行做data warehouse的问个学习大数据的问题
● Spark + C*	● Flink Sparks Next Wave of Distributed Data Processing
● coltzhao的公司还在用mongo吗？	● 试了下spark，不过如此啊
● 关于 SPARK, 问二爷peking2 和其他大牛一问题	● 学Hadoop还是spark

相关话题的讨论汇总
话题: hadoop话题: java话题: 命令行话题: mapreduce话题: 执行

进入Programming版参与讨论

1

(共1页)

s****y 发帖数: 503	1 我这两天装了一下Hadoop2.2的集群，用了Yarn和Zookeeper，执行Mapreduce的时候都是用命令行，比如hadoop jar mapreduceExample.jar /user/root/data/source.txt / user/root/output/result 当然我估计实际使用的时候还会用到Flume、HBase等技术，但是实际的Hadoop系统是什么样的？都是用命令行人工执行的？还有Hadoop和Java的关系是不是就是用Java写Mapreduce的程序，然后把jar部署到 Hadoop中运行，Hadoop和Java的联系是不是就这些？
d*******r 发帖数: 3299	2 请问 Flume 你是怎么在使用 / 【在 s****y 的大作中提到】 : 我这两天装了一下Hadoop2.2的集群，用了Yarn和Zookeeper，执行Mapreduce的时候都 : 是用命令行，比如hadoop jar mapreduceExample.jar /user/root/data/source.txt / : user/root/output/result : 当然我估计实际使用的时候还会用到Flume、HBase等技术，但是实际的Hadoop系统是什 : 么样的？都是用命令行人工执行的？ : 还有Hadoop和Java的关系是不是就是用Java写Mapreduce的程序，然后把jar部署到 : Hadoop中运行，Hadoop和Java的联系是不是就这些？
s****y 发帖数: 503	3 我Flume还没用过，我现在只写了一些Mapreduce的程序。【在 d*******r 的大作中提到】 : 请问 Flume 你是怎么在使用 : : /
m******e 发帖数: 201	4 一般有个job scheduler，比如很多用java的公司会用oozie，每天固定时间跑一次 Hadoop jobs。可以有任意多个job，互相之间也可以有依赖关系。跑完的结果可以存 HBase，RDBMS(MySQL,Oracle...，一般aggregated data)，或者直接就是HDFS里。用 Java裸写Hadoop程序的已经越来越少。都是Hive/Pig生成的。还有很多ac-hoc query一般就是用Hive。 / 【在 s****y 的大作中提到】 : 我这两天装了一下Hadoop2.2的集群，用了Yarn和Zookeeper，执行Mapreduce的时候都 : 是用命令行，比如hadoop jar mapreduceExample.jar /user/root/data/source.txt / : user/root/output/result : 当然我估计实际使用的时候还会用到Flume、HBase等技术，但是实际的Hadoop系统是什 : 么样的？都是用命令行人工执行的？ : 还有Hadoop和Java的关系是不是就是用Java写Mapreduce的程序，然后把jar部署到 : Hadoop中运行，Hadoop和Java的联系是不是就这些？
s****y 发帖数: 503	5 这种情况是不是连Java都用不到了？【在 m******e 的大作中提到】 : 一般有个job scheduler，比如很多用java的公司会用oozie，每天固定时间跑一次 : Hadoop jobs。可以有任意多个job，互相之间也可以有依赖关系。跑完的结果可以存 : HBase，RDBMS(MySQL,Oracle...，一般aggregated data)，或者直接就是HDFS里。用 : Java裸写Hadoop程序的已经越来越少。都是Hive/Pig生成的。还有很多ac-hoc query一 : 般就是用Hive。 : : /
m******e 发帖数: 201	6 一个完整的服务要收集数据，做etl，还要经常把data搬来搬去，得到结果后业务逻辑，建web services，都需要java或其他语言实现还有要看懂Hive/Hadoop，oozie出错的log，也要有扎实的Java基础。

1

(共1页)

进入Programming版参与讨论

相关主题
● 学Hadoop还是spark	● big data,菜凉?
● 掏钱买support的的确都是脑子进水的	● Spark + C*
● mesos 用得多吗？	● coltzhao的公司还在用mongo吗？
● C++缺少了哪些开源的轮子?	● 关于 SPARK, 问二爷peking2 和其他大牛一问题
● 搞不懂为什么大牛说Hbase不如C*?	● Hadoop 和Python的数据分析包哪个更值得学习？
● Hadoop/HBase/HDFS三驾马车过时了吗？	● 一个Hadoop Cluster升级的问题
● 感觉flink出来之后，hadoop就显得不怎么再需要了	● 能不能在hadoop中用open mpi?
● MapReduce 的思想是怎么发明的？	● 大牛能不能讨论下cassandra， Hbase， MongoDB的对比

相关话题的讨论汇总
话题: hadoop话题: java话题: 命令行话题: mapreduce话题: 执行

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)