T******7 发帖数: 1419 | 1 这里 大大牛多久学会spark? 感觉东西很多阿。 |
z*******3 发帖数: 13709 | 2 定义学会
spark api没啥好学的
你对java熟悉的话,就是看看javadoc, sparkdoc之后
自己做几个就上手的东西
但是mllib里面那些theory,那可不是什么摸摸api就能明白的
虽然用起来不是那么难,但是总归需要明白到底是咋回事 |
B*****g 发帖数: 34098 | 3 现在有多少人用java写spark?
【在 z*******3 的大作中提到】 : 定义学会 : spark api没啥好学的 : 你对java熟悉的话,就是看看javadoc, sparkdoc之后 : 自己做几个就上手的东西 : 但是mllib里面那些theory,那可不是什么摸摸api就能明白的 : 虽然用起来不是那么难,但是总归需要明白到底是咋回事
|
i**********g 发帖数: 758 | 4 should use scala
【在 B*****g 的大作中提到】 : 现在有多少人用java写spark?
|
z*******3 发帖数: 13709 | 5
说明你们还没到给其他人擦屁股的时候
到擦屁股时候就开始骂了,就像qxc他们一样
【在 B*****g 的大作中提到】 : 现在有多少人用java写spark?
|
d******e 发帖数: 2265 | 6 t家的Scala真心不行看网上教程就是拿着Scala写java如果还是oop那套真的不如直接写
java了
【在 z*******3 的大作中提到】 : : 说明你们还没到给其他人擦屁股的时候 : 到擦屁股时候就开始骂了,就像qxc他们一样
|
p*****2 发帖数: 21240 | 7
怪不得
【在 d******e 的大作中提到】 : t家的Scala真心不行看网上教程就是拿着Scala写java如果还是oop那套真的不如直接写 : java了
|
z*******3 发帖数: 13709 | 8
目前能够提供比较reliable的,适合streaming处理的datasource只有kafka
其他都不行,要自己对付丢包等问题,hdfs等persistence基本上batch够用了
streaming主要来自living server提供的数据,比如网络,bus这种publish的data
【在 d******e 的大作中提到】 : t家的Scala真心不行看网上教程就是拿着Scala写java如果还是oop那套真的不如直接写 : java了
|