由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 请教一道FB的面试题
相关主题
LD大人去Amazon面试onsite了两回一道C面试题
弱弱的苹果家面经大家看看这几道google面试题怎么做?
求牛人 解答 一个Amazon 设计问题分享面试题
mapreduce 初级问题,请各位大牛指点一道面试题
SQL 面试问题算法面试题
C++问题3贡献一道twitter的面试题
关于MySQL和NoSQL的一道面试题onsite面试题一道
Adobe面试题, 怎么能把很多文件读到Memory ?面试题
相关话题的讨论汇总
话题: fb话题: 用户话题: 联系话题: 分组话题: 面试题
进入JobHunting版参与讨论
1 (共1页)
C*****n
发帖数: 1049
1
有200M个用户,现在让你进行分组,将他们分成大概20个组,每个组里大概有10M的用
户,尽量让用户interaction多的在一起。
只想到也许能用Clustering coefficient来衡量用户之间的联系程度,但是分组还是没
什么概念。
l****u
发帖数: 1764
2
用merge?先随机选取几个用户当组,然后一个个处理incoming user,如果跟现存的所
有组都没联系或者联系很小,就再创个组,否则加入到那个组之中,处理完后对所有的
组再进行merge直到剩下20个组
感觉没有标准答案啊
C*****n
发帖数: 1049
3
这样有很大的问题就是联系小的有很大的概率被放在一组,因为最开始选组的信息很少
,会误以为已经选到联系大的组了

【在 l****u 的大作中提到】
: 用merge?先随机选取几个用户当组,然后一个个处理incoming user,如果跟现存的所
: 有组都没联系或者联系很小,就再创个组,否则加入到那个组之中,处理完后对所有的
: 组再进行merge直到剩下20个组
: 感觉没有标准答案啊

l****u
发帖数: 1764
4
那就分完之后再scan一遍,再把每个组里类似outlier的人拎出来重新assign一遍?

:这样有很大的问题就是联系小的有很大的概率被放在一组,因为最开始选组的信息很
少,会误以为已经选到联系大的组了
:你再低调也没有用,你那拉风的头像、扎势的ID都深深的出卖了你

【在 C*****n 的大作中提到】
: 这样有很大的问题就是联系小的有很大的概率被放在一组,因为最开始选组的信息很少
: ,会误以为已经选到联系大的组了

z*********n
发帖数: 1451
5
用一些聚类算法可以吧,距离就用interaction 程度。
U***A
发帖数: 849
6
这是系统设计的题目?
r***s
发帖数: 737
7
在一个无向图里求 min cut?

【在 C*****n 的大作中提到】
: 有200M个用户,现在让你进行分组,将他们分成大概20个组,每个组里大概有10M的用
: 户,尽量让用户interaction多的在一起。
: 只想到也许能用Clustering coefficient来衡量用户之间的联系程度,但是分组还是没
: 什么概念。

g*********e
发帖数: 14401
8
典型的community sharding
有不少关于这方面的paper

【在 C*****n 的大作中提到】
: 有200M个用户,现在让你进行分组,将他们分成大概20个组,每个组里大概有10M的用
: 户,尽量让用户interaction多的在一起。
: 只想到也许能用Clustering coefficient来衡量用户之间的联系程度,但是分组还是没
: 什么概念。

1 (共1页)
进入JobHunting版参与讨论
相关主题
面试题SQL 面试问题
面试题请教:一个矩阵,里面的值是0或1,找出最大子矩阵,此子矩阵的值全为1C++问题3
G面试题求解关于MySQL和NoSQL的一道面试题
讨论几个面试题Adobe面试题, 怎么能把很多文件读到Memory ?
LD大人去Amazon面试onsite了两回一道C面试题
弱弱的苹果家面经大家看看这几道google面试题怎么做?
求牛人 解答 一个Amazon 设计问题分享面试题
mapreduce 初级问题,请各位大牛指点一道面试题
相关话题的讨论汇总
话题: fb话题: 用户话题: 联系话题: 分组话题: 面试题