b*****u 发帖数: 648 | 1 翻版上面经时经常看到这题,没有多少解答。
这题是考什么知识点啊? DFS? |
p*****2 发帖数: 21240 | 2 现在只做OO design和system design的题。搬个板凳。
先说一下这个属于系统设计,不属于算法吧。因此DFS应该不是重点。 |
f*****e 发帖数: 2992 | 3 应该很简单,网上有本书讲php webbot的。
【在 p*****2 的大作中提到】 : 现在只做OO design和system design的题。搬个板凳。 : 先说一下这个属于系统设计,不属于算法吧。因此DFS应该不是重点。
|
Z**********4 发帖数: 528 | 4 网页爬下来以后如何存储? 应该是一个考点。
还有就是怎么爬的时候爬多深?应该是从一个主页开始,然后找里面所有链接,然后对
于没有visit过的链接再爬。我怎么觉得像是BFS。。。所以得有个hash存已经爬过的网
页吧。 |
p*****2 发帖数: 21240 | |
b*****u 发帖数: 648 | 6 怪不得我没见过,我用的cc150是电子版,不全。
半本九阴真经害死人啊
【在 p*****2 的大作中提到】 : LZ请看CC150 11.5
|
p*****2 发帖数: 21240 | 7
花钱买本吧。虽然错误很多,还是值的。至少我不懂的部分,还没找出错误来。
【在 b*****u 的大作中提到】 : 怪不得我没见过,我用的cc150是电子版,不全。 : 半本九阴真经害死人啊
|
c***s 发帖数: 192 | 8 建议参考DataBase System Implementation (second edition) 1143 -- 1145页
里面讲了怎么做Web Crawlers, 包括单机版和多机版,以及怎么选择重要网页(在后面
几页)。
这本书网上有电子版,是Stanford大牛写的经典教材。
【在 b*****u 的大作中提到】 : 翻版上面经时经常看到这题,没有多少解答。 : 这题是考什么知识点啊? DFS?
|
c********w 发帖数: 2438 | |
h******d 发帖数: 6 | 10 我被考过这道题。
我主要答的是怎么开线程,线程之间怎么同步,怎么上锁保护公用的资源,如果线程突
然挂了怎么处理,这些
再加上一些bfs的比如防止loop之类
interviewer似乎还比较满意 |
p*****2 发帖数: 21240 | 11
没有考虑distributed吗?
【在 h******d 的大作中提到】 : 我被考过这道题。 : 我主要答的是怎么开线程,线程之间怎么同步,怎么上锁保护公用的资源,如果线程突 : 然挂了怎么处理,这些 : 再加上一些bfs的比如防止loop之类 : interviewer似乎还比较满意
|
b*******n 发帖数: 847 | |