由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
CS版 - 比bag-of-words或N-gram 更好的方法
相关主题
graphical model, n-gram, HMM...各位大牛们救救小弟吧...
这个属于哪个领域Interview Questions
PRM中Bayesian Parameter Estimation的问题很多算法题如果以前没看过,更本做不出。。。
有没有懂LDA(Blei)model得大侠给解释一下问个问题。。a N-gram 还是 an N-gram?
[合集] 请问sigir和kdd怎么比?请教“期望协方差”expected covariance的定义
多维空间角概念请教一个多维遍历问题
[合集] 问个人工智能的问题请问让电脑自我学习是CS的范畴么?
请教一算法问题suffix tree和suffix array看什么书比较好啊?
相关话题的讨论汇总
话题: gram话题: bag话题: words话题: 方法
进入CS版参与讨论
1 (共1页)
m**********r
发帖数: 122
1
作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。
D***r
发帖数: 7511
2
what's the purpose?
Document classification? Topic extraction?

【在 m**********r 的大作中提到】
: 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
: 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。

l**********e
发帖数: 336
3
这种提取特征的东东,还是要看具体的应用问题背景

【在 m**********r 的大作中提到】
: 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
: 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。

m**********r
发帖数: 122
4
classification

【在 D***r 的大作中提到】
: what's the purpose?
: Document classification? Topic extraction?

f*****u
发帖数: 308
5
我刚好也想问这个问题。BoW忽略了所有序列信息。对于N-Gram,这里的Gram是指
Letter还是Word,N-Gram的方法我在文献里面看的有点糊涂,有的Gram是指Letter,有
的是Word。我现在想用Suffix Tree来建造一个Bag of Subsequences或者类似的模型,
靠谱么?
L*****k
发帖数: 327
6
其实BoW忽略了的信息太多了~~

【在 f*****u 的大作中提到】
: 我刚好也想问这个问题。BoW忽略了所有序列信息。对于N-Gram,这里的Gram是指
: Letter还是Word,N-Gram的方法我在文献里面看的有点糊涂,有的Gram是指Letter,有
: 的是Word。我现在想用Suffix Tree来建造一个Bag of Subsequences或者类似的模型,
: 靠谱么?

m**********r
发帖数: 122
7
作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。
D***r
发帖数: 7511
8
what's the purpose?
Document classification? Topic extraction?

【在 m**********r 的大作中提到】
: 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
: 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。

l**********e
发帖数: 336
9
这种提取特征的东东,还是要看具体的应用问题背景

【在 m**********r 的大作中提到】
: 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
: 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。

m**********r
发帖数: 122
10
classification

【在 D***r 的大作中提到】
: what's the purpose?
: Document classification? Topic extraction?

f*****u
发帖数: 308
11
我刚好也想问这个问题。BoW忽略了所有序列信息。对于N-Gram,这里的Gram是指
Letter还是Word,N-Gram的方法我在文献里面看的有点糊涂,有的Gram是指Letter,有
的是Word。我现在想用Suffix Tree来建造一个Bag of Subsequences或者类似的模型,
靠谱么?
L*****k
发帖数: 327
12
其实BoW忽略了的信息太多了~~

【在 f*****u 的大作中提到】
: 我刚好也想问这个问题。BoW忽略了所有序列信息。对于N-Gram,这里的Gram是指
: Letter还是Word,N-Gram的方法我在文献里面看的有点糊涂,有的Gram是指Letter,有
: 的是Word。我现在想用Suffix Tree来建造一个Bag of Subsequences或者类似的模型,
: 靠谱么?

l*******s
发帖数: 1258
13
不妨试试pos的ngram
d*l
发帖数: 400
14
Latent Dirichlet Allocation?

【在 m**********r 的大作中提到】
: 作text mining的时候,对文章提取特征向量。最普通的是bag-of-words或N-gram, 请
: 问还有哪些方法能够抓住词与词之间的关系,并基于这些关系建立特征向量。

1 (共1页)
进入CS版参与讨论
相关主题
suffix tree和suffix array看什么书比较好啊?[合集] 请问sigir和kdd怎么比?
求算法推荐多维空间角概念
请教大牛们一个问题[合集] 问个人工智能的问题
一个机器学习的问题请教一算法问题
graphical model, n-gram, HMM...各位大牛们救救小弟吧...
这个属于哪个领域Interview Questions
PRM中Bayesian Parameter Estimation的问题很多算法题如果以前没看过,更本做不出。。。
有没有懂LDA(Blei)model得大侠给解释一下问个问题。。a N-gram 还是 an N-gram?
相关话题的讨论汇总
话题: gram话题: bag话题: words话题: 方法