由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 搜索系统设计
相关主题
搜索 lucene 之类是不是不流行了?求推荐带 cluster 模式的类 Redis DB
连续变化的地理位置的query架构设计问题,请各位大神指点
mongobd中的text search速度问题MongoDB快超过Postgres了
如何将相似字符串更加准确地找出来?与其无意义的争论,不如干点实事
mongo dB vs Cassandra请大牛来谈谈对Solr的看法
大家做ElasticSearch或Solr的project都host在哪里?如何智能化合并数据库中属于相关objects的各种属性到一个object下?
有没支持million concurrent queries per second的数据系统SQL/NoSQLtop 10% on StackOverflow this year!
Index PDF和doc 是elasticsearch还是solr一个技术问题
相关话题的讨论汇总
话题: 系统话题: db话题: hadoop话题: elastic
进入Programming版参与讨论
1 (共1页)
l******n
发帖数: 9344
1
正在建立一个搜索系统,系统的每个文件包含文本,pdf,图片还有音频,而且文本还
是多语言的,有中,英,日等语言。这种系统一般是什么构架,文件是直接放在db还是
用hadoop?效率差有多大?
ET
发帖数: 10701
2
文件放硬盘,db建索引。
hadoop是啥?kidding

【在 l******n 的大作中提到】
: 正在建立一个搜索系统,系统的每个文件包含文本,pdf,图片还有音频,而且文本还
: 是多语言的,有中,英,日等语言。这种系统一般是什么构架,文件是直接放在db还是
: 用hadoop?效率差有多大?

l******n
发帖数: 9344
3
现在主要考虑要不要把数据放在一个数据库,然后index建在另外一个数据库还是用
elasticsearch,这样数据和index算合在一起。不知道实际那种速度快,维护更容易

【在 ET 的大作中提到】
: 文件放硬盘,db建索引。
: hadoop是啥?kidding

d*******r
发帖数: 3299
4
用 ES, hadoop 不适合做这个吧...
l******n
发帖数: 9344
5
es更新很快,插件跟不上

【在 d*******r 的大作中提到】
: 用 ES, hadoop 不适合做这个吧...
w**z
发帖数: 8232
6
elastic search

【在 l******n 的大作中提到】
: 正在建立一个搜索系统,系统的每个文件包含文本,pdf,图片还有音频,而且文本还
: 是多语言的,有中,英,日等语言。这种系统一般是什么构架,文件是直接放在db还是
: 用hadoop?效率差有多大?

d*******r
发帖数: 3299
7
我说的是 ElasticSearch

【在 l******n 的大作中提到】
: es更新很快,插件跟不上
j**********3
发帖数: 3211
8
mark mark
l******n
发帖数: 9344
9
我就是说的elasticsearch
好多的列子都run不了,比如导入数据自动产生的mapping就出错,现在一直没有fix

【在 d*******r 的大作中提到】
: 我说的是 ElasticSearch
d*******r
发帖数: 3299
10
你从哪里导入,啥例子?

【在 l******n 的大作中提到】
: 我就是说的elasticsearch
: 好多的列子都run不了,比如导入数据自动产生的mapping就出错,现在一直没有fix

w********m
发帖数: 1137
11
保存binary的数据,elastic search这样的文件系统比较好。
实在要上DB的话,mongoDB的gridFS也不错。
l******n
发帖数: 9344
12
我搞混了,是solr的问题
正在try elasticsearch的icu和中文分词,你用过没有?如果要用自己的分词器,怎么
配置?

【在 d*******r 的大作中提到】
: 你从哪里导入,啥例子?
d*******r
发帖数: 3299
13
我没搞过中文的分词器

【在 l******n 的大作中提到】
: 我搞混了,是solr的问题
: 正在try elasticsearch的icu和中文分词,你用过没有?如果要用自己的分词器,怎么
: 配置?

1 (共1页)
进入Programming版参与讨论
相关主题
一个技术问题mongo dB vs Cassandra
请教下本地搜索大家做ElasticSearch或Solr的project都host在哪里?
请教一下我的这个问题适合用NoSQL吗?有没支持million concurrent queries per second的数据系统SQL/NoSQL
solr vs elasticIndex PDF和doc 是elasticsearch还是solr
搜索 lucene 之类是不是不流行了?求推荐带 cluster 模式的类 Redis DB
连续变化的地理位置的query架构设计问题,请各位大神指点
mongobd中的text search速度问题MongoDB快超过Postgres了
如何将相似字符串更加准确地找出来?与其无意义的争论,不如干点实事
相关话题的讨论汇总
话题: 系统话题: db话题: hadoop话题: elastic