由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 请教如何build knowledge system
相关主题
算法求教如何将相似字符串更加准确地找出来?
请教一个跟search中用到的auto suggestion问题mongobd中的text search速度问题
请问有什么好的开源中英文搜索引擎?solr shared index file solution (转载)
与其无意义的争论,不如干点实事你们能scale out的都是有福的
一个网站里的search功能,是在search这个网站的database,还是象IDE里面的search workspace?请教下本地搜索
请大牛来谈谈对Solr的看法怎么做个文件的 index, 比如archive 这样的
架构设计问题,请各位大神指点StackOverflow的架构
如何智能化合并数据库中属于相关objects的各种属性到一个object下?Index PDF和doc 是elasticsearch还是solr
相关话题的讨论汇总
话题: knowledge话题: system话题: build话题: ai话题: lucene
进入Programming版参与讨论
1 (共1页)
s*****w
发帖数: 1527
1
是这样的,一堆乱七八糟的文档,跟专业相关。
现在希望用AI整理一下,这样新学生有问题,可以先搜索这个knowledge management
system。
请多展展。
s******e
发帖数: 3
2
用AI搞这个,目前玩具性质居多。不如弄个全文索引靠谱。直接用confluence等,建立
页面结构,上传文档,它自动给索引。

【在 s*****w 的大作中提到】
: 是这样的,一堆乱七八糟的文档,跟专业相关。
: 现在希望用AI整理一下,这样新学生有问题,可以先搜索这个knowledge management
: system。
: 请多展展。

s*****w
发帖数: 1527
3
每个文档要人工加入tag吗?不懂“自动给索引”。

【在 s******e 的大作中提到】
: 用AI搞这个,目前玩具性质居多。不如弄个全文索引靠谱。直接用confluence等,建立
: 页面结构,上传文档,它自动给索引。

r****t
发帖数: 10904
4
读一下Lucene,全文索引。现在多用ELK搭,
但也有AI based search不懂是怎么回事
很多中国人做这方面,比如 gnes.ai, jina.ai
大牛们给个简介?

【在 s*****w 的大作中提到】
: 每个文档要人工加入tag吗?不懂“自动给索引”。
s******e
发帖数: 3
5
全文索引不需要Tag。英文没有特殊设置,中文要做分词。
confluence 有很多开源替代品,比如redmine。
自己用Lucene做要累死的,直接用个现成的产品吧。
我很早以前用lucene做mail archive/discovery产品,后来用 solr(基于lucene),
后来有了elastic search,又转过去。现在不折腾了,全部现成产品。

【在 s*****w 的大作中提到】
: 每个文档要人工加入tag吗?不懂“自动给索引”。
s*****w
发帖数: 1527
6
make sense

【在 s******e 的大作中提到】
: 全文索引不需要Tag。英文没有特殊设置,中文要做分词。
: confluence 有很多开源替代品,比如redmine。
: 自己用Lucene做要累死的,直接用个现成的产品吧。
: 我很早以前用lucene做mail archive/discovery产品,后来用 solr(基于lucene),
: 后来有了elastic search,又转过去。现在不折腾了,全部现成产品。

t*******r
发帖数: 364
7
同请教,confluence上传文档,能给内容自动建索引?需要macro吗?

【在 s*****w 的大作中提到】
: 每个文档要人工加入tag吗?不懂“自动给索引”。
s******e
发帖数: 3
8
不需要啊。我公司里上传的excel word 都可以。不要加密就成。自己写的也一样。
M**********n
发帖数: 59
9
How about Neo4j?

【在 s******e 的大作中提到】
: 不需要啊。我公司里上传的excel word 都可以。不要加密就成。自己写的也一样。
s******e
发帖数: 3
10
Neo4j是图数据库,两码事。
图数据库我推荐arangodb。用过,性能一流,开发公司是德国的。
用图数据库处理社交等特定类型数据要方便多了
m*********g
发帖数: 8
11
Hello,哈哈

【在 s*****w 的大作中提到】
: 是这样的,一堆乱七八糟的文档,跟专业相关。
: 现在希望用AI整理一下,这样新学生有问题,可以先搜索这个knowledge management
: system。
: 请多展展。

s*********y
发帖数: 6151
12
Semantic search
很多公司有这个需求
做好了不容易。
s******e
发帖数: 3
13
有阵子研究过这东西,我还是觉得一个全文搜索可以解决90%的问题。semantic search
,最后都是autonomy之类的产品,贵而无用

【在 s*********y 的大作中提到】
: Semantic search
: 很多公司有这个需求
: 做好了不容易。

1 (共1页)
进入Programming版参与讨论
相关主题
有没有直接对pdf或者doc简历进行分析的开源软件?一个网站里的search功能,是在search这个网站的database,还是象IDE里面的search workspace?
搜索 lucene 之类是不是不流行了?请大牛来谈谈对Solr的看法
如何评价google的Cloud AutoML架构设计问题,请各位大神指点
大家做ElasticSearch或Solr的project都host在哪里?如何智能化合并数据库中属于相关objects的各种属性到一个object下?
算法求教如何将相似字符串更加准确地找出来?
请教一个跟search中用到的auto suggestion问题mongobd中的text search速度问题
请问有什么好的开源中英文搜索引擎?solr shared index file solution (转载)
与其无意义的争论,不如干点实事你们能scale out的都是有福的
相关话题的讨论汇总
话题: knowledge话题: system话题: build话题: ai话题: lucene