由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - Facebook 加面 Design 题
相关主题
面G 遇到一个设计题目,没有任何想法当时,求大牛给分析分析get Top 1million most frequent entries in past 24 hour
Amazon试题算法问个snapchat的设计题
SQL 面试问题请教一下palindrome partitioning用memoization的问题
PayPal User & on Boarding组 staff 1面经问一道算法题
求教machinelearning方面recommendation system的tech blogProgramming Pearl上的3way partition好像不work
PageRank简单问题google老题:Find kth largest of sum of elements in 2 sorted array
请教前辈fb的infra相关的面试和普通面试有什么区别。问个google面试题
f家面经请问G一题
相关话题的讨论汇总
话题: design话题: facebook话题: 加面话题: page话题: 算法
进入JobHunting版参与讨论
1 (共1页)
e****t
发帖数: 11
1
page ranking 算法
完全没有idea, completely lost.
大牛们说说,该怎么答?
h*******0
发帖数: 270
2
能详细说说题目要求吗?

【在 e****t 的大作中提到】
: page ranking 算法
: 完全没有idea, completely lost.
: 大牛们说说,该怎么答?

t****i
发帖数: 88
3
是把page rank做成distributed的算法么? 我见过用MR写的版本
e****t
发帖数: 11
4

先是问 sparse matrix product 算法。然后就是要做成distributed,问怎么
partition, 怎么算。 大概思路是?

【在 t****i 的大作中提到】
: 是把page rank做成distributed的算法么? 我见过用MR写的版本
A*******e
发帖数: 2419
5
不是page ranking吗?怎么又稀疏矩阵了

【在 e****t 的大作中提到】
:
: 先是问 sparse matrix product 算法。然后就是要做成distributed,问怎么
: partition, 怎么算。 大概思路是?

b*****n
发帖数: 618
6
看面试官问的角度是什么,答案可能会差别很大。
从系统的角度上来讲,这个其实仍然是pub-sub system
design可以完全参照feed system的,要想distributed无非就是对doc做sharding,
但是sharding的key可以选择,比如
如果doc A -> doc B
可以用A做key也可以用B做key,不同情况下各有优缺点。
e****t
发帖数: 11
7

自己顶一下,请各位大牛一起参谋一下这个到底是怎么算的。
具体一些。
Page Ranking,具面试官说,就是稀疏矩阵相乘(线性代数 的 乘法)。 当n 是 10
的 10 次方时,当然就需要 Partition, 我就卡在这里,怎么Partition, 怎么算?

【在 h*******0 的大作中提到】
: 能详细说说题目要求吗?
e****t
发帖数: 11
8

和这个可能关系不大,不过你说的还是有点启发的。我当时懵了,就完全Stuck了。

【在 b*****n 的大作中提到】
: 看面试官问的角度是什么,答案可能会差别很大。
: 从系统的角度上来讲,这个其实仍然是pub-sub system
: design可以完全参照feed system的,要想distributed无非就是对doc做sharding,
: 但是sharding的key可以选择,比如
: 如果doc A -> doc B
: 可以用A做key也可以用B做key,不同情况下各有优缺点。

H******7
发帖数: 1728
9
http://arxiv.org/abs/1208.3071
人家有专门论文研究这个的。
Fast Distributed PageRank Computation
Atish Das Sarma, Anisur Rahaman Molla, Gopal Pandurangan, Eli Upfal
楼主被黑了无疑。。。
e****t
发帖数: 11
10
谢谢,我看看。
黑就黑吧 ..... :(

【在 H******7 的大作中提到】
: http://arxiv.org/abs/1208.3071
: 人家有专门论文研究这个的。
: Fast Distributed PageRank Computation
: Atish Das Sarma, Anisur Rahaman Molla, Gopal Pandurangan, Eli Upfal
: 楼主被黑了无疑。。。

r***r
发帖数: 39
11
Page Ranking其实就是网页链接矩阵的特征向量(显然,网页链接矩阵是个稀疏矩阵)
。学过矩阵计算或数值分析或者所谓科学计算的话,会知道怎么弄,算是简单题。
很多职位,其实有数值计算算法背景更合拍(Machine Learning等需要)
。过去一味的只考非数值算法其实是走了岔路。

【在 e****t 的大作中提到】
: page ranking 算法
: 完全没有idea, completely lost.
: 大牛们说说,该怎么答?

d******e
发帖数: 2265
12
pagerank就是图的flooding迭代。
至于并行算法,都是经典的example了。
不认为sparse matrix是最佳算法。

【在 e****t 的大作中提到】
: page ranking 算法
: 完全没有idea, completely lost.
: 大牛们说说,该怎么答?

1 (共1页)
进入JobHunting版参与讨论
相关主题
请问G一题求教machinelearning方面recommendation system的tech blog
请教一个Palindrome Partition问题PageRank简单问题
leetcode Palindrome Partitioning请教前辈fb的infra相关的面试和普通面试有什么区别。
Partition List的例子对吗?f家面经
面G 遇到一个设计题目,没有任何想法当时,求大牛给分析分析get Top 1million most frequent entries in past 24 hour
Amazon试题算法问个snapchat的设计题
SQL 面试问题请教一下palindrome partitioning用memoization的问题
PayPal User & on Boarding组 staff 1面经问一道算法题
相关话题的讨论汇总
话题: design话题: facebook话题: 加面话题: page话题: 算法