p****a 发帖数: 38 | 1 希望一天半就能学个大概,能弄懂主要原理,有什么好的教程吗,网站,视频,电子书
都可以。急,多谢了! |
g*******o 发帖数: 156 | 2 看一下rdd的paper,然后跑几个简单的应用。
会scala上手比较快,只会java问题也不大。
【在 p****a 的大作中提到】 : 希望一天半就能学个大概,能弄懂主要原理,有什么好的教程吗,网站,视频,电子书 : 都可以。急,多谢了!
|
p****a 发帖数: 38 | 3 rdd的paper, which paper?
【在 g*******o 的大作中提到】 : 看一下rdd的paper,然后跑几个简单的应用。 : 会scala上手比较快,只会java问题也不大。
|
g*******o 发帖数: 156 | 4 https://www.cs.berkeley.edu/~matei/papers/2012/nsdi_spark.pdf
【在 g*******o 的大作中提到】 : 看一下rdd的paper,然后跑几个简单的应用。 : 会scala上手比较快,只会java问题也不大。
|
n*****3 发帖数: 1584 | |
B********r 发帖数: 397 | 6 没那么可怕,去aws 或者digital ocean 开个账号,自己按照官方文档跑个cluster基
本就明白很多 |
n*****3 发帖数: 1584 | 7 基本 is easy, but if you want to do some serious work;
man , you have to understand scala better.
BTW the debug/ test is almost impossible; log/print seems to be your only
friend.
【在 B********r 的大作中提到】 : 没那么可怕,去aws 或者digital ocean 开个账号,自己按照官方文档跑个cluster基 : 本就明白很多
|
c******o 发帖数: 1277 | 8 mostly is not about scala, it is more about the whole rdd implementation.
major work are all about how to design your work flow, and optimize it. |
B********r 发帖数: 397 | 9
确实,我也想找书看看不过目前最好的就是文档了
【在 n*****3 的大作中提到】 : 基本 is easy, but if you want to do some serious work; : man , you have to understand scala better. : BTW the debug/ test is almost impossible; log/print seems to be your only : friend.
|