由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 请问怎样才能很好的学习hadoop (转载)
相关主题
MapR Technologies continue hiring a lot of positions有大牛用Storm吗?
Hadoop Spark 学习小结[2014版]Cloudera这个公司怎么样
hadoop面试和学习总结后Hadoop时代的大数据架构
请教下目前这些东东面试时更高可能被问到请科普一下Web service的架构! 谢谢
面试犯2了现在去做hadoop的公司工作还有前途吗?
有人收到过docker的offer么?湾区startup Hortonworks招聘信息
BigData Senior Data Engineer @Endurance/ConstantContact around Boston areaPinterest Software Engineer position for Data/Hadoop
[hortonworks面经] senior hadoop engineerbig data software engineer或者data scientist 工作机会推荐
相关话题的讨论汇总
话题: hadoop话题: 请问话题: 怎样才能话题: 学习话题: 机器
进入JobHunting版参与讨论
1 (共1页)
w******u
发帖数: 219
1
【 以下文字转载自 Programming 讨论区 】
发信人: withtaku (bugua), 信区: Programming
标 题: 请问怎样才能很好的学习hadoop
发信站: BBS 未名空间站 (Tue Jun 9 13:04:58 2015, 美东)
新手,想学习hadoop
首先准备看一下书,比如hadoop: the definitive guide
但是最好有可以上手的机会,比如处理有一定规模的数据。请问大家知道哪里有相关的
project和教程吗?是否非得需要好多台机器?个人感觉没有这个条件。还是一台机器
弄好多台虚拟节点就可以了呢?谢谢!
S*******3
发帖数: 4
2
同问,谢谢
i*******6
发帖数: 107
a********5
发帖数: 1631
4
单机可以跑,配置也不麻烦。

【在 w******u 的大作中提到】
: 【 以下文字转载自 Programming 讨论区 】
: 发信人: withtaku (bugua), 信区: Programming
: 标 题: 请问怎样才能很好的学习hadoop
: 发信站: BBS 未名空间站 (Tue Jun 9 13:04:58 2015, 美东)
: 新手,想学习hadoop
: 首先准备看一下书,比如hadoop: the definitive guide
: 但是最好有可以上手的机会,比如处理有一定规模的数据。请问大家知道哪里有相关的
: project和教程吗?是否非得需要好多台机器?个人感觉没有这个条件。还是一台机器
: 弄好多台虚拟节点就可以了呢?谢谢!

w******u
发帖数: 219
5
谢谢,请问具体有什么资料教程吗,还有哪儿有比较好的dataset
需要单机配置比较好吗

【在 a********5 的大作中提到】
: 单机可以跑,配置也不麻烦。
a********5
发帖数: 1631
6
单机只能跑单机模式,如果你不需要任何特别的distribution的话,官网就有教程,大
概一下午就可以配好。
我记得不太清楚了,没记错的话单机模式只能跑最多3(?)个REDUCER。
DATASET当然是看你自己的需求去找,然后灌进去

【在 w******u 的大作中提到】
: 谢谢,请问具体有什么资料教程吗,还有哪儿有比较好的dataset
: 需要单机配置比较好吗

n******r
发帖数: 147
7


【在 i*******6 的大作中提到】
: This is a good start with sandbox:
: http://hortonworks.com/hadoop-tutorial/hello-world-an-introduct
: Try "QuickStart VMs" here
: http://www.cloudera.com/content/cloudera/en/downloads.html

h*********p
发帖数: 13
8
个人建议一开始不要用Cloudera和Hortonworks的VM,这都是配置好的环境,不利于了
解Hadoop的底层构造。
从Apache Hadoop开始,手动安Zookeeper,Hive,Pig,Sqoop,Oozie,Hue等组件。
这样你就对最基本的administration和HDFS/YARN架构有个粗浅了解。
然后去看Definitive Guide那本书,了解基本的MapReduce,不用看太细,现在没人直
接写这个
这样你就有了理解Hive和Pig的基础
剩下的HBase,Zookeeper,Sqoop根据需要看。
w******u
发帖数: 219
9
谢谢
请问你说的手动安的这些东西,都是一起只用一台机器就可以搞定,还是得好多台机器?
还有Zookeeper,Hive,Pig这些的安装就是看看他们的document吗,有没有什么资料指
导如何把它们都在一台机器上如何搭好的?

【在 h*********p 的大作中提到】
: 个人建议一开始不要用Cloudera和Hortonworks的VM,这都是配置好的环境,不利于了
: 解Hadoop的底层构造。
: 从Apache Hadoop开始,手动安Zookeeper,Hive,Pig,Sqoop,Oozie,Hue等组件。
: 这样你就对最基本的administration和HDFS/YARN架构有个粗浅了解。
: 然后去看Definitive Guide那本书,了解基本的MapReduce,不用看太细,现在没人直
: 接写这个
: 这样你就有了理解Hive和Pig的基础
: 剩下的HBase,Zookeeper,Sqoop根据需要看。

l****x
发帖数: 365
10
great!
h*****2
发帖数: 2070
11
一台就可以了。
我不建议直接用VM(不知道谁想的馊主意),也不建议从apache装。你装一个distro就
可以了。你不是system admin,完全从头开始其实是本末倒置。

器?

【在 w******u 的大作中提到】
: 谢谢
: 请问你说的手动安的这些东西,都是一起只用一台机器就可以搞定,还是得好多台机器?
: 还有Zookeeper,Hive,Pig这些的安装就是看看他们的document吗,有没有什么资料指
: 导如何把它们都在一台机器上如何搭好的?

1 (共1页)
进入JobHunting版参与讨论
相关主题
big data software engineer或者data scientist 工作机会推荐面试犯2了
还有一周onsite,怎么看Hadoop.The.Definitive.Guide效率最高?有人收到过docker的offer么?
要不要跟风搞搞big data?BigData Senior Data Engineer @Endurance/ConstantContact around Boston area
想想马工真可粘,听说Hadoop 2.0转型以后大家的知识都陈旧了[hortonworks面经] senior hadoop engineer
MapR Technologies continue hiring a lot of positions有大牛用Storm吗?
Hadoop Spark 学习小结[2014版]Cloudera这个公司怎么样
hadoop面试和学习总结后Hadoop时代的大数据架构
请教下目前这些东东面试时更高可能被问到请科普一下Web service的架构! 谢谢
相关话题的讨论汇总
话题: hadoop话题: 请问话题: 怎样才能话题: 学习话题: 机器