b*******a 发帖数: 68 | 1 Given constant incoming requests, each associated with a unique key,
estimate the total amount of unique requests within a period of time. The
number of keys explodes the memory. Do not touch the disk. Rough estimation
is O.K
首先说明,这个题目不是很清楚。如果只是要找给定时间的统计,hash table +
counter (其实counter都不用)就好了。可是,如果是要求任意给定的时间呢?譬如,
过去1分钟,过去5分钟,过去1小时,1:00AM -- 1:30AM 等等。这类动态数据流统计一般用什么方法解决
?需要 Count-Min Sketch 变形吗? 谢谢 |
|