由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
EmergingNetworking版 - zz baidu分词算法分析之一 by 张俊林
相关主题
问个google cache页的问题?laptop可以搜索到无线网络,但是就是连不上!
有人和我一起创业做搜索引擎优化吗?问个特种搜索引擎的问题
网 内App Cache的问题white hat Vs. black hat
2006年IT业八大预测 zz对搜索引擎的理解
Anti-SPAM product comparision浅析搜索引擎的情报功能 (转载)
Venice - 2GB per day (转载)新搜索引擎谷姐網成立 (转载)
寻找IT技术背景合作伙伴做网站狗日的共匪,终于要搞百度了 (转载)
google cache 还能用么?谷歌搜索不被中国认可真相?可不止一个原因
相关话题的讨论汇总
话题: 搜索引擎话题: 分词话题: 查询处理话题: 黑盒话题: 张俊
进入EmergingNetworking版参与讨论
1 (共1页)
d********l
发帖数: 161
1
查询处理以及分词技术
随着搜索经济的崛起,人们开始越加关注全球各大搜索引擎的性能、技术和日流量。作
为企业,会根据搜索引擎的知名度以及日流量来选择是否要投放广告等;作为普通网民
,会根据搜索引擎的性能和技术来选择自己喜欢的引擎查找资料;作为技术人员,会把
有代表性的搜索引擎作为研究对象. 搜索引擎经济的崛起,又一次向人们证明了网络所
蕴藏的巨大商机。网络离开了搜索将只剩下空洞杂乱的数据,以及大量等待去费力挖掘
的金矿。
但是,如何设计一个高效的搜索引擎?我们可以以百度所采取的技术手段来探讨如何设计
一个实用的搜索引擎.搜索引擎涉及到许多技术点,比如查询处理,排序算法,页面抓取算
法,CACHE机制,ANTI-SPAM等等.这些技术细节,作为商业公司的搜索引擎服务提供商比如
百度,GOOGLE等是不会公之于众的.我们可以将现有的搜索引擎看作一个黑盒,通过向黑
盒提交输入,判断黑盒返回的输出大致判断黑盒里面不为人知的技术细节.
查询处理与分词是一个中文搜索引擎必不可少的工作,而百度作为一个典型的中文搜索
引擎一直强调其”中文处理”方面具有其它搜索引擎所不具有的关键技术和优势.那么
我们就来
1 (共1页)
进入EmergingNetworking版参与讨论
相关主题
谷歌搜索不被中国认可真相?可不止一个原因Anti-SPAM product comparision
论“Google中国事件”的影响Venice - 2GB per day (转载)
“谷姐”开挖谷歌员工 我们将主攻搜索引擎寻找IT技术背景合作伙伴做网站
官方推出“人民搜索”引擎 百度成为新的批判对象google cache 还能用么?
问个google cache页的问题?laptop可以搜索到无线网络,但是就是连不上!
有人和我一起创业做搜索引擎优化吗?问个特种搜索引擎的问题
网 内App Cache的问题white hat Vs. black hat
2006年IT业八大预测 zz对搜索引擎的理解
相关话题的讨论汇总
话题: 搜索引擎话题: 分词话题: 查询处理话题: 黑盒话题: 张俊