s******r 发帖数: 21 | 1 用bloom filter可能能解决这个问题。
预处理,每一个广告单词hash后建立bloom filter,例如广告130 new york对应的bloom
filter可能是
10001001
145对应的是
11011111
查询时
把query string里面的每个单词hash后建立一个bloom filter的表格,例如是
10011111
比较10001001 和10011111,可以看出广告130每个单词都极可能在query string里面出
现。
广告145不符合要求,因为第二位的bit是1,而query第二位是0 |
|