d*******r 发帖数: 806 | 1 一本书,得全部过一遍挑出期中的词(全部词,无所谓关键字)和词所在页数,如同所有的技术书后的索
引,列出所有出现的页数。
比如
constant 12, 233, 476
如何做比较高效?如果遍历此书数据需要多线程同时操作,怎么保证读数据
和写入数据结构的同步问题?
不知有何简单方法? |
d*******r 发帖数: 806 | 2 ding...
【在 d*******r 的大作中提到】 : 一本书,得全部过一遍挑出期中的词(全部词,无所谓关键字)和词所在页数,如同所有的技术书后的索 : 引,列出所有出现的页数。 : 比如 : constant 12, 233, 476 : 如何做比较高效?如果遍历此书数据需要多线程同时操作,怎么保证读数据 : 和写入数据结构的同步问题? : 不知有何简单方法?
|
d*******r 发帖数: 806 | |
x***i 发帖数: 23 | |
q****x 发帖数: 7404 | 5 assume the book is access page by page?
use lock-free queue?
有的技术书后的索
【在 d*******r 的大作中提到】 : 一本书,得全部过一遍挑出期中的词(全部词,无所谓关键字)和词所在页数,如同所有的技术书后的索 : 引,列出所有出现的页数。 : 比如 : constant 12, 233, 476 : 如何做比较高效?如果遍历此书数据需要多线程同时操作,怎么保证读数据 : 和写入数据结构的同步问题? : 不知有何简单方法?
|
d*******r 发帖数: 806 | 6 谢谢各位
其实不需要page by page
可以多线程读入
但是得考虑资源优化
而且最终的结果是单词尾随所有页数 |
q****x 发帖数: 7404 | 7 what do you mean by mt reading? the read element is page, or words?
【在 d*******r 的大作中提到】 : 谢谢各位 : 其实不需要page by page : 可以多线程读入 : 但是得考虑资源优化 : 而且最终的结果是单词尾随所有页数
|
d*******r 发帖数: 806 | 8 无所谓,可以自行设计
一个线程读所有的page也可以
但是这样绝对费时了吧
【在 q****x 的大作中提到】 : what do you mean by mt reading? the read element is page, or words?
|
q****x 发帖数: 7404 | 9 open question.
【在 d*******r 的大作中提到】 : 无所谓,可以自行设计 : 一个线程读所有的page也可以 : 但是这样绝对费时了吧
|
d*******r 发帖数: 806 | 10 如果将<单词,页数>对装入map
可是这样同一页上的这样的数据对上的页数都一样了,多占用了大量空间。好像不是best practice
当然这样sort比较方便
【在 d*******r 的大作中提到】 : 无所谓,可以自行设计 : 一个线程读所有的page也可以 : 但是这样绝对费时了吧
|
d*******r 发帖数: 806 | 11 对的
灵活度很高
【在 q****x 的大作中提到】 : open question.
|