l**d 发帖数: 746 | 1 Given an infinite input of strings, how do you randomly sample 1,000 strings
at any given point?
如果是infinite,应该不是所有的string都存了吧?那应该怎么取呢? |
c********e 发帖数: 186 | |
l**d 发帖数: 746 | 3 Reservoir Sampling我倒是知道,不过这种infinite string也是一样?怎么存储呢?
【在 c********e 的大作中提到】 : Reservoir Sampling
|
z*********8 发帖数: 2070 | 4 你只需要记住当前选择的1000个string以及处理的string总数
【在 l**d 的大作中提到】 : Reservoir Sampling我倒是知道,不过这种infinite string也是一样?怎么存储呢?
|
a********9 发帖数: 129 | 5 先把前1000个string放到一个array里,之后对第N个string做如下处理:
if (i = random(n)) < 1000 就把这个string放到array[i]里 |
o*****n 发帖数: 189 | 6 用Python的generator, 可以解决存储问题. |