由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 要玩big data平台的不需要VM
相关主题
Hadoop 和Python的数据分析包哪个更值得学习?这个bigdata的学习路线图不错啊
cs这几个方向,哪个现在和未来的状况最好?Scala会不会把Java搞成第二个C++
c++程序员不要把头埋在沙子里了Intro to Hadoop and MapReduce @ ucadicy 有人学过么? 199块 (转载)
现在的云计算技术,比如hadoop,和数据挖掘data mining有联系吗?关于 SPARK, 问二爷peking2 和其他大牛一问题
spark 到底牛在什么地方?Cassandra 真是狗屎
学scala和spark需要什么pre req?想写一个machine learning的平台
试了下spark,不过如此啊Spark入门,想用Spark写个小项目
mapreduce, hadoop还能火几年?mahout现在还有人用不?
相关话题的讨论汇总
话题: hadoop话题: spark话题: vm话题: 虚拟话题: dataset
进入Programming版参与讨论
1 (共1页)
w***g
发帖数: 5958
1
玩hadoop, spark啥的,把台式机/笔记本装成linux,然后直接上single node系统就行。
当然只能处理一些toy dataset。Hadoop的话几个G几十个G的,Spark的话几百M的,单
节点跑没啥问题。基本上就可以看看猪跑了。要吃猪肉的话没有别的办法,只能加入
个需要搞大数据的公司。你就是出钱租了100台机器,一时半会也搞不到那么大的
dataset。
千万别虚拟出几个node跑cluster。Hadoop/Spark是真对物理机器优化的,不是针对虚拟
机优化的。那些啥乱七八糟的软件,单节点都是可以跑的。
l**********n
发帖数: 8443
2
学习了

行。
虚拟

【在 w***g 的大作中提到】
: 玩hadoop, spark啥的,把台式机/笔记本装成linux,然后直接上single node系统就行。
: 当然只能处理一些toy dataset。Hadoop的话几个G几十个G的,Spark的话几百M的,单
: 节点跑没啥问题。基本上就可以看看猪跑了。要吃猪肉的话没有别的办法,只能加入
: 个需要搞大数据的公司。你就是出钱租了100台机器,一时半会也搞不到那么大的
: dataset。
: 千万别虚拟出几个node跑cluster。Hadoop/Spark是真对物理机器优化的,不是针对虚拟
: 机优化的。那些啥乱七八糟的软件,单节点都是可以跑的。

1 (共1页)
进入Programming版参与讨论
相关主题
mahout现在还有人用不?spark 到底牛在什么地方?
大牛讲讲mongoDB这种开源的怎么赚钱?学scala和spark需要什么pre req?
Spark已经out了,能跳船的赶快试了下spark,不过如此啊
天天嚷嚷这个 out 那个out的真是有病mapreduce, hadoop还能火几年?
Hadoop 和Python的数据分析包哪个更值得学习?这个bigdata的学习路线图不错啊
cs这几个方向,哪个现在和未来的状况最好?Scala会不会把Java搞成第二个C++
c++程序员不要把头埋在沙子里了Intro to Hadoop and MapReduce @ ucadicy 有人学过么? 199块 (转载)
现在的云计算技术,比如hadoop,和数据挖掘data mining有联系吗?关于 SPARK, 问二爷peking2 和其他大牛一问题
相关话题的讨论汇总
话题: hadoop话题: spark话题: vm话题: 虚拟话题: dataset