由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 电面被问到hadoop了
相关主题
想学学Hadoop,从wordcount开始F家onsite面经
如何用hadoop 析取各种数据?请教可以在线练习 map reduce 的地方?
hadoop的combiner和partitioner的顺序是什么呢?关于mahout的一些问题
职位和 candidate 数量的关系mapreduce 初级问题,请各位大牛指点
有人推荐过bigdata的读物求问一道用新语言写wordcount的题
请问怎样才能很好的学习hadoop (转载)最近面的两道题,求解答
电话面试一个design问题,看看怎么做median of N^2 numbers across N machines
请教MapReduce怎么找median问一个大数据 处理问题
相关话题的讨论汇总
话题: reducer话题: mapper话题: hadoop话题: console话题: wordcount
进入JobHunting版参与讨论
1 (共1页)
b******y
发帖数: 660
1
一门户网站的电面
用hadoop做wordcount,输入是一个很大的文件,#distinct term小于100,最后的结果
不写到HDFS,要print到console。
mapper就跟wordcount例子一样啦。我说用1个reducer,用LOG.info 将count print到
console,他说这个可能只print在reducer的console,而这个reducer在哪个node无法确
定。
他提示到在mapper用counter,不过没有什么头绪。希望各位指点一下。
q****x
发帖数: 7404
2
do you put hadoop as resume keyword?

【在 b******y 的大作中提到】
: 一门户网站的电面
: 用hadoop做wordcount,输入是一个很大的文件,#distinct term小于100,最后的结果
: 不写到HDFS,要print到console。
: mapper就跟wordcount例子一样啦。我说用1个reducer,用LOG.info 将count print到
: console,他说这个可能只print在reducer的console,而这个reducer在哪个node无法确
: 定。
: 他提示到在mapper用counter,不过没有什么头绪。希望各位指点一下。

b******y
发帖数: 660
3
是的。
现在搞明白了,在mapper把每一个不同的term当作一个counter来用就好了。
可以参考这个教程
http://philippeadjiman.com/blog/2010/01/07/hadoop-tutorial-seri
b******y
发帖数: 660
4
一门户网站的电面
用hadoop做wordcount,输入是一个很大的文件,#distinct term小于100,最后的结果
不写到HDFS,要print到console。
mapper就跟wordcount例子一样啦。我说用1个reducer,用LOG.info 将count print到
console,他说这个可能只print在reducer的console,而这个reducer在哪个node无法确
定。
他提示到在mapper用counter,不过没有什么头绪。希望各位指点一下。
q****x
发帖数: 7404
5
do you put hadoop as resume keyword?

【在 b******y 的大作中提到】
: 一门户网站的电面
: 用hadoop做wordcount,输入是一个很大的文件,#distinct term小于100,最后的结果
: 不写到HDFS,要print到console。
: mapper就跟wordcount例子一样啦。我说用1个reducer,用LOG.info 将count print到
: console,他说这个可能只print在reducer的console,而这个reducer在哪个node无法确
: 定。
: 他提示到在mapper用counter,不过没有什么头绪。希望各位指点一下。

b******y
发帖数: 660
6
是的。
现在搞明白了,在mapper把每一个不同的term当作一个counter来用就好了。
可以参考这个教程
http://philippeadjiman.com/blog/2010/01/07/hadoop-tutorial-seri
1 (共1页)
进入JobHunting版参与讨论
相关主题
问一个大数据 处理问题有人推荐过bigdata的读物
写一段如何准备large-scale system design的面试吧请问怎样才能很好的学习hadoop (转载)
发苹果电面面经攒人品电话面试一个design问题,看看怎么做
一道大数据题,求最优解。请教MapReduce怎么找median
想学学Hadoop,从wordcount开始F家onsite面经
如何用hadoop 析取各种数据?请教可以在线练习 map reduce 的地方?
hadoop的combiner和partitioner的顺序是什么呢?关于mahout的一些问题
职位和 candidate 数量的关系mapreduce 初级问题,请各位大牛指点
相关话题的讨论汇总
话题: reducer话题: mapper话题: hadoop话题: console话题: wordcount