由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - mongobd中的text search速度问题
相关主题
搜索系统设计如何智能化合并数据库中属于相关objects的各种属性到一个object下?
算法求教如何将相似字符串更加准确地找出来?
请教一个跟search中用到的auto suggestion问题solr shared index file solution (转载)
请问有什么好的开源中英文搜索引擎?你们能scale out的都是有福的
与其无意义的争论,不如干点实事请教下本地搜索
一个网站里的search功能,是在search这个网站的database,还是象IDE里面的search workspace?怎么做个文件的 index, 比如archive 这样的
请大牛来谈谈对Solr的看法StackOverflow的架构
架构设计问题,请各位大神指点Index PDF和doc 是elasticsearch还是solr
相关话题的讨论汇总
话题: text话题: mongobd话题: 问题话题: search话题: 速度
进入Programming版参与讨论
1 (共1页)
M****z
发帖数: 1058
1
我在mongodb中有一块collection是储存纯文本的。如果需要创建一个新的纪录会需要
首先检查该文本的唯一性。现在的问题是,每次拿着任意一个text去数据库中查找完全
匹配的text是否已经存在,这样的操作的效率如何,我很担心。还请各位支招。有其他
技术可以采用的话,也没问题。
谢过了先
h****r
发帖数: 2056
2
md5

【在 M****z 的大作中提到】
: 我在mongodb中有一块collection是储存纯文本的。如果需要创建一个新的纪录会需要
: 首先检查该文本的唯一性。现在的问题是,每次拿着任意一个text去数据库中查找完全
: 匹配的text是否已经存在,这样的操作的效率如何,我很担心。还请各位支招。有其他
: 技术可以采用的话,也没问题。
: 谢过了先

M****z
发帖数: 1058
3
不好意思,菜鸟俺不明白是啥意思啊,这东西不是加密的时候用的吗?

【在 h****r 的大作中提到】
: md5
w**z
发帖数: 8232
4
用做checksum

【在 M****z 的大作中提到】
: 不好意思,菜鸟俺不明白是啥意思啊,这东西不是加密的时候用的吗?
M****z
发帖数: 1058
5
多谢回复

【在 w**z 的大作中提到】
: 用做checksum
M****z
发帖数: 1058
6
上wiki看了下,那如果我的text可能会有500字这样子性能也没问题吗? 因为草草看了
下,好像都是用来做短的text的。那如果这样的话,是不是就是每个数据库中的text,
我都生成一个md5,存好,然后新入库的就转成md5后用这个来和已有的比?

【在 w**z 的大作中提到】
: 用做checksum
M****z
发帖数: 1058
7
是不是和这个有些类似?
String to unique integer hashing
http://stackoverflow.com/questions/16521148/string-to-unique-in
k**********g
发帖数: 989
8

lucene solr?

【在 M****z 的大作中提到】
: 我在mongodb中有一块collection是储存纯文本的。如果需要创建一个新的纪录会需要
: 首先检查该文本的唯一性。现在的问题是,每次拿着任意一个text去数据库中查找完全
: 匹配的text是否已经存在,这样的操作的效率如何,我很担心。还请各位支招。有其他
: 技术可以采用的话,也没问题。
: 谢过了先

M****z
发帖数: 1058
9
嗯,这个看过,这东西用在我这种用途是不是大材小用了? 所以我才跑上来问问。

【在 k**********g 的大作中提到】
:
: lucene solr?

1 (共1页)
进入Programming版参与讨论
相关主题
Index PDF和doc 是elasticsearch还是solr与其无意义的争论,不如干点实事
有没有直接对pdf或者doc简历进行分析的开源软件?一个网站里的search功能,是在search这个网站的database,还是象IDE里面的search workspace?
搜索 lucene 之类是不是不流行了?请大牛来谈谈对Solr的看法
如何评价google的Cloud AutoML架构设计问题,请各位大神指点
搜索系统设计如何智能化合并数据库中属于相关objects的各种属性到一个object下?
算法求教如何将相似字符串更加准确地找出来?
请教一个跟search中用到的auto suggestion问题solr shared index file solution (转载)
请问有什么好的开源中英文搜索引擎?你们能scale out的都是有福的
相关话题的讨论汇总
话题: text话题: mongobd话题: 问题话题: search话题: 速度