由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - maintain top frequencies for stream data
相关主题
求问关于qualcomm的 export licenseMarvell电话面试题+问题请教
这是神马一种情况?High Frequency Trading Firm 是干嘛的啊?
电面后被拒,帮忙看看谁会做>??????????????????????????????????????
Looking for C# programmersbloomberg面经
we are looking for a c# developer问个统计的小概念
请教F家和T家最近的一道常见题请教offer选择问题(Google vs iBank)
这种Design类型的题目怎么练,求指教!Display average for the last 10 minutes请教一题
storm和spark, maprduce比有什么优势?Is this normal
相关话题的讨论汇总
话题: top话题: search话题: display话题: terms话题: stream
进入JobHunting版参与讨论
1 (共1页)
m*****P
发帖数: 1331
1
这貌似是经典题
大概什么思路?
You have been asked to design some software to continuously display the top
10 search terms on Google. You are given access to a feed that provides an
endless real-time stream of search terms currently being searched on Google.
Describe what algorithm and data structures you would use to implement this
. You are to design two variations: (i) Display the top 10 search terms of
all time (i.e. since you started reading the feed). (ii) Display only the
top 10 search terms for the past month, updated hourly. You can use an
approximation to obtain the top 10 list, but you must justify your choices.
c*****r
发帖数: 108
2
我今天恰好也在向这个题目 下面是我的想法。
MapReduce 把每个search term发送到不同的peer服务器上。这样每个服务器负责累加
一系列的search term。同时每个服务器上maintain一个大顶堆负责记录本服务器上最
frequent的terms。堆的大小为该服务器所负责的search term数量。
时事的发送堆顶的10个search term给一个masternode。masternode负责筛选各个机器
上发来的单词 更具frequency再选出10个display
m****i
发帖数: 650
3
第二题有什么好方法
f*****e
发帖数: 2992
4
1,2,2,4,8,8,16,16,.... 误差50%

【在 m****i 的大作中提到】
: 第二题有什么好方法
m*****P
发帖数: 1331
5
你这个主要是用了distribution的思想
我想这个题目应该也考察infinite stream这个东西
因为再怎么distribute 资源都是有限的
也许需要某种approximation的方法?

【在 c*****r 的大作中提到】
: 我今天恰好也在向这个题目 下面是我的想法。
: MapReduce 把每个search term发送到不同的peer服务器上。这样每个服务器负责累加
: 一系列的search term。同时每个服务器上maintain一个大顶堆负责记录本服务器上最
: frequent的terms。堆的大小为该服务器所负责的search term数量。
: 时事的发送堆顶的10个search term给一个masternode。masternode负责筛选各个机器
: 上发来的单词 更具frequency再选出10个display

1 (共1页)
进入JobHunting版参与讨论
相关主题
Is this normalwe are looking for a c# developer
CS algorithm question请教F家和T家最近的一道常见题
诚心请教两个offer的选择 (转载)这种Design类型的题目怎么练,求指教!Display average for the last 10 minutes
How to find 10 most frequent strings in 10 billion string list?storm和spark, maprduce比有什么优势?
求问关于qualcomm的 export licenseMarvell电话面试题+问题请教
这是神马一种情况?High Frequency Trading Firm 是干嘛的啊?
电面后被拒,帮忙看看谁会做>??????????????????????????????????????
Looking for C# programmersbloomberg面经
相关话题的讨论汇总
话题: top话题: search话题: display话题: terms话题: stream