由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
CS版 - 这里有熟悉 spectral clustering 的吗?
相关主题
有没有啥好点的DAG的clustering 的算法啊?做过搜索结果排序算法的,咨询下。。。
请教一个聚类的问题请问怎么计算两种clustering之间的差异
数学 算法有人做fuzzy clustering的么? (转载)
来个比较Challenging的学术问题请教!关于clustering,可否实现这个?
谁能帮我下载一篇文章 (ICDM 2011)?[合集] fuzzy clustering, soft clustering 区别?
请问比较实用的face recognition 算法?有没有 这样 的 clustering 算法 ?
问个在图中删除边和点的算法问题 (转载)how to find a cluster
求助关于聚类问题请问这样的distance怎么计算?
相关话题的讨论汇总
话题: spectral话题: clustering话题: 熟悉话题: 算法话题: 这里
进入CS版参与讨论
1 (共1页)
k**o
发帖数: 8
1
想了解一下目前哪个算法最快,哪个算法能算最大
的数据(比如最大多少个点)。
非常感谢。
w***g
发帖数: 5958
2
Spectral clustering算法的瓶颈在于算NxN的相似性矩阵O(N^2)以及对其作特征值分解
。提高速度的关键就是对NxN的矩阵进行稀疏化。可以对每个点算其K-nearest
neighbor,然后矩阵只存K-NN对应的那些值,剩余的全都置0。 然后对稀疏矩阵用迭代
法进行特征值分解。对所有点在所有点上求K-NN (K-NN graph)可以用我在WWW'11上发
表的方法进行加速。

【在 k**o 的大作中提到】
: 想了解一下目前哪个算法最快,哪个算法能算最大
: 的数据(比如最大多少个点)。
: 非常感谢。

k**o
发帖数: 8
3
兄弟居然还搞实名制啊,你做得不错啊。
目前有哪些作者用了你的knn 算法作spectral clustering 啊?
速度以及内存消耗跟michael jordan 一伙人2009年提出的算法比较怎么样?

【在 w***g 的大作中提到】
: Spectral clustering算法的瓶颈在于算NxN的相似性矩阵O(N^2)以及对其作特征值分解
: 。提高速度的关键就是对NxN的矩阵进行稀疏化。可以对每个点算其K-nearest
: neighbor,然后矩阵只存K-NN对应的那些值,剩余的全都置0。 然后对稀疏矩阵用迭代
: 法进行特征值分解。对所有点在所有点上求K-NN (K-NN graph)可以用我在WWW'11上发
: 表的方法进行加速。

w***g
发帖数: 5958
4
看了眼那paper,极水。文中先假设了欧式空间,先做k-means (或者k-d tree),然后
对cluster center做spectral cluttering。如果数据真的非常大,那确实得这么做。
但这方法也太显然了,需要发paper吗?
然后spectral clustering最大的好处就是可以处理非欧式空间的数据,甚至都不需要
测度,只要相似度就可以。假设了欧式空间就把spectral clustering这个好处给去掉
了。那还不如直接就k-means得了。
我说的方法目前没人用过。你要有兴趣可以evaluate一下,好的话你可以自己写paper。
注意要写paper的话选dataset的时候一定要选一些非欧式空间的数据,比如我paper中
用的那个EMD。

【在 k**o 的大作中提到】
: 兄弟居然还搞实名制啊,你做得不错啊。
: 目前有哪些作者用了你的knn 算法作spectral clustering 啊?
: 速度以及内存消耗跟michael jordan 一伙人2009年提出的算法比较怎么样?

k**o
发帖数: 8
5
你说的方法现在肯定有人在搞,没有发出来而已,
要搞的话撞车机率很大。
michael jordan他们的方法确实简单直白得气死人。
不过很多有名的算法,比如所谓的二十世纪十大算法中有几个不是很直白的。
有个家伙还无耻地说很多人觉得简单是因为以目前的认识水平还不可能意识到
其中蕴含的深刻性。
兄弟你肯定从老板公司分得了无数多的股票吧,爽死了。

paper。

【在 w***g 的大作中提到】
: 看了眼那paper,极水。文中先假设了欧式空间,先做k-means (或者k-d tree),然后
: 对cluster center做spectral cluttering。如果数据真的非常大,那确实得这么做。
: 但这方法也太显然了,需要发paper吗?
: 然后spectral clustering最大的好处就是可以处理非欧式空间的数据,甚至都不需要
: 测度,只要相似度就可以。假设了欧式空间就把spectral clustering这个好处给去掉
: 了。那还不如直接就k-means得了。
: 我说的方法目前没人用过。你要有兴趣可以evaluate一下,好的话你可以自己写paper。
: 注意要写paper的话选dataset的时候一定要选一些非欧式空间的数据,比如我paper中
: 用的那个EMD。

w***g
发帖数: 5958
6

---------------------------
一点都没有。老板是教本事的,不是分股票的。大家都是靠劳动吃饭,没什么爽的。

【在 k**o 的大作中提到】
: 你说的方法现在肯定有人在搞,没有发出来而已,
: 要搞的话撞车机率很大。
: michael jordan他们的方法确实简单直白得气死人。
: 不过很多有名的算法,比如所谓的二十世纪十大算法中有几个不是很直白的。
: 有个家伙还无耻地说很多人觉得简单是因为以目前的认识水平还不可能意识到
: 其中蕴含的深刻性。
: 兄弟你肯定从老板公司分得了无数多的股票吧,爽死了。
:
: paper。

D*****k
发帖数: 176
7
I don't think sparsigying the similarity matrix is a mainstream approach to
scale up spectral clustering. Low rank approximation like nystrom method
looks much more promising

【在 w***g 的大作中提到】
: Spectral clustering算法的瓶颈在于算NxN的相似性矩阵O(N^2)以及对其作特征值分解
: 。提高速度的关键就是对NxN的矩阵进行稀疏化。可以对每个点算其K-nearest
: neighbor,然后矩阵只存K-NN对应的那些值,剩余的全都置0。 然后对稀疏矩阵用迭代
: 法进行特征值分解。对所有点在所有点上求K-NN (K-NN graph)可以用我在WWW'11上发
: 表的方法进行加速。

1 (共1页)
进入CS版参与讨论
相关主题
请问这样的distance怎么计算?谁能帮我下载一篇文章 (ICDM 2011)?
k-means怎样改进能使cluster大小大致一样请问比较实用的face recognition 算法?
有没有人自己买几个服务器或者电脑组装个multiple clusters来跑hadoop?问个在图中删除边和点的算法问题 (转载)
An algorihmic question求助关于聚类问题
有没有啥好点的DAG的clustering 的算法啊?做过搜索结果排序算法的,咨询下。。。
请教一个聚类的问题请问怎么计算两种clustering之间的差异
数学 算法有人做fuzzy clustering的么? (转载)
来个比较Challenging的学术问题请教!关于clustering,可否实现这个?
相关话题的讨论汇总
话题: spectral话题: clustering话题: 熟悉话题: 算法话题: 这里