由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 如何解决big data follow up
相关主题
请教bloomberg 问题, 有关sorting电面之后多久给消息?
google拒人,不解释一下原因吗?面经附上Thank you letter无回复
new grad google, facebook电话面试面经我这种情况如何follow up?
topological sorting BFS和DFS都要会吗?估计悲剧了
被一个公司拒了,需要follow up么?onsite10天以后,HM要打电话follow up,会是什么内容呀?
onsite回来,迷茫中,各位请帮忙看这是什么情况?需要followup吗?
Follow up 不回信是不是就没戏了?现在data工作市场已经过了顶峰期了吧?
Onsite 后等消息Instagram is hiring data scientist
相关话题的讨论汇总
话题: data话题: knn话题: 如何话题: nn话题: kd
进入JobHunting版参与讨论
1 (共1页)
l*********r
发帖数: 122
1
面试碰到过好几回,问一个基本算法,答出来之后就被followup问如果data size超大
概如何处理。。。
sorting相关的基本上就往MR上靠,不知道还有没有其他思路?
刚刚被问了一个KNN如何处理大数据,这个该怎么答呢? 谢谢!
S*******y
发帖数: 55
2
真实经历,一次和三哥面试官聊了好久他都不满意,最后结束了问他你怎么办,他说你
可以random sample只用一小部分数据,心里顿时一万头草泥马奔过

【在 l*********r 的大作中提到】
: 面试碰到过好几回,问一个基本算法,答出来之后就被followup问如果data size超大
: 概如何处理。。。
: sorting相关的基本上就往MR上靠,不知道还有没有其他思路?
: 刚刚被问了一个KNN如何处理大数据,这个该怎么答呢? 谢谢!

m******e
发帖数: 82
3
具体场景具体分析,LZ给一个场景呗
r*****s
发帖数: 1815
4
hot keyword或者url是这样的。。。


: 真实经历,一次和三哥面试官聊了好久他都不满意,最后结束了问他你怎么办,
他说你

: 可以random sample只用一小部分数据,心里顿时一万头草泥马奔过



【在 S*******y 的大作中提到】
: 真实经历,一次和三哥面试官聊了好久他都不满意,最后结束了问他你怎么办,他说你
: 可以random sample只用一小部分数据,心里顿时一万头草泥马奔过

z*******h
发帖数: 346
5
Data points一多,KNN会巨慢。要是我就这么说,first ask if the data has high
dimensionality. If they say no, well, we can use KD-tree to speed up K-NN.
If they say yes, I'd say you cannot use the original K-NN, you will have to
cut corners. for example, instead of using all data points, only pick the
most important ones (close to decision boundary). see https://link.springer.
com/article/10.1023%2FA%3A1007626913721?LI=true

【在 l*********r 的大作中提到】
: 面试碰到过好几回,问一个基本算法,答出来之后就被followup问如果data size超大
: 概如何处理。。。
: sorting相关的基本上就往MR上靠,不知道还有没有其他思路?
: 刚刚被问了一个KNN如何处理大数据,这个该怎么答呢? 谢谢!

D**********0
发帖数: 1022
6
那这个真是太厉害了。

【在 S*******y 的大作中提到】
: 真实经历,一次和三哥面试官聊了好久他都不满意,最后结束了问他你怎么办,他说你
: 可以random sample只用一小部分数据,心里顿时一万头草泥马奔过

l*********r
发帖数: 122
7
关键是我上来就答了用KD tree做KNN,然后被追问数据量大该怎么办 。。。

to
springer.

【在 z*******h 的大作中提到】
: Data points一多,KNN会巨慢。要是我就这么说,first ask if the data has high
: dimensionality. If they say no, well, we can use KD-tree to speed up K-NN.
: If they say yes, I'd say you cannot use the original K-NN, you will have to
: cut corners. for example, instead of using all data points, only pick the
: most important ones (close to decision boundary). see https://link.springer.
: com/article/10.1023%2FA%3A1007626913721?LI=true

l*********r
发帖数: 122
8
难道讨论的是GD?

【在 S*******y 的大作中提到】
: 真实经历,一次和三哥面试官聊了好久他都不满意,最后结束了问他你怎么办,他说你
: 可以random sample只用一小部分数据,心里顿时一万头草泥马奔过

1 (共1页)
进入JobHunting版参与讨论
相关主题
Instagram is hiring data scientist被一个公司拒了,需要follow up么?
A家面试题onsite回来,迷茫中,各位请帮忙看这是什么情况?
一个NxN矩阵每行每列都sort好,如何排序?Follow up 不回信是不是就没戏了?
一个特别的inplace merge two sorted arraysOnsite 后等消息
请教bloomberg 问题, 有关sorting电面之后多久给消息?
google拒人,不解释一下原因吗?面经附上Thank you letter无回复
new grad google, facebook电话面试面经我这种情况如何follow up?
topological sorting BFS和DFS都要会吗?估计悲剧了
相关话题的讨论汇总
话题: data话题: knn话题: 如何话题: nn话题: kd