要玩big data平台的不需要VM - Programming版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 要玩big data平台的不需要VM

相关主题
● Hadoop 和Python的数据分析包哪个更值得学习？	● 这个bigdata的学习路线图不错啊
● cs这几个方向，哪个现在和未来的状况最好？	● Scala会不会把Java搞成第二个C++
● c++程序员不要把头埋在沙子里了	● Intro to Hadoop and MapReduce @ ucadicy 有人学过么？ 199块 (转载)
● 现在的云计算技术，比如hadoop，和数据挖掘data mining有联系吗？	● 关于 SPARK, 问二爷peking2 和其他大牛一问题
● spark 到底牛在什么地方？	● Cassandra 真是狗屎
● 学scala和spark需要什么pre req?	● 想写一个machine learning的平台
● 试了下spark，不过如此啊	● Spark入门，想用Spark写个小项目
● mapreduce, hadoop还能火几年？	● mahout现在还有人用不？

相关话题的讨论汇总
话题: hadoop话题: spark话题: vm话题: 虚拟话题: dataset

进入Programming版参与讨论

(共1页)

w***g
发帖数: 5958

玩hadoop, spark啥的，把台式机/笔记本装成linux，然后直接上single node系统就行。
当然只能处理一些toy dataset。Hadoop的话几个G几十个G的，Spark的话几百M的，单
节点跑没啥问题。基本上就可以看看猪跑了。要吃猪肉的话没有别的办法，只能加入
个需要搞大数据的公司。你就是出钱租了100台机器，一时半会也搞不到那么大的
dataset。
千万别虚拟出几个node跑cluster。Hadoop/Spark是真对物理机器优化的，不是针对虚拟
机优化的。那些啥乱七八糟的软件，单节点都是可以跑的。

l**********n
发帖数: 8443

学习了

行。
虚拟

【在 w***g 的大作中提到】

: 玩hadoop, spark啥的，把台式机/笔记本装成linux，然后直接上single node系统就行。
: 当然只能处理一些toy dataset。Hadoop的话几个G几十个G的，Spark的话几百M的，单
: 节点跑没啥问题。基本上就可以看看猪跑了。要吃猪肉的话没有别的办法，只能加入
: 个需要搞大数据的公司。你就是出钱租了100台机器，一时半会也搞不到那么大的
: dataset。
: 千万别虚拟出几个node跑cluster。Hadoop/Spark是真对物理机器优化的，不是针对虚拟
: 机优化的。那些啥乱七八糟的软件，单节点都是可以跑的。

(共1页)

进入Programming版参与讨论

相关主题
● mahout现在还有人用不？	● spark 到底牛在什么地方？
● 大牛讲讲mongoDB这种开源的怎么赚钱？	● 学scala和spark需要什么pre req?
● Spark已经out了，能跳船的赶快	● 试了下spark，不过如此啊
● 天天嚷嚷这个 out 那个out的真是有病	● mapreduce, hadoop还能火几年？
● Hadoop 和Python的数据分析包哪个更值得学习？	● 这个bigdata的学习路线图不错啊
● cs这几个方向，哪个现在和未来的状况最好？	● Scala会不会把Java搞成第二个C++
● c++程序员不要把头埋在沙子里了	● Intro to Hadoop and MapReduce @ ucadicy 有人学过么？ 199块 (转载)
● 现在的云计算技术，比如hadoop，和数据挖掘data mining有联系吗？	● 关于 SPARK, 问二爷peking2 和其他大牛一问题

相关话题的讨论汇总
话题: hadoop话题: spark话题: vm话题: 虚拟话题: dataset

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天