k**o 发帖数: 8 | 1 想了解一下目前哪个算法最快,哪个算法能算最大
的数据(比如最大多少个点)。
非常感谢。 |
w***g 发帖数: 5958 | 2 Spectral clustering算法的瓶颈在于算NxN的相似性矩阵O(N^2)以及对其作特征值分解
。提高速度的关键就是对NxN的矩阵进行稀疏化。可以对每个点算其K-nearest
neighbor,然后矩阵只存K-NN对应的那些值,剩余的全都置0。 然后对稀疏矩阵用迭代
法进行特征值分解。对所有点在所有点上求K-NN (K-NN graph)可以用我在WWW'11上发
表的方法进行加速。
【在 k**o 的大作中提到】 : 想了解一下目前哪个算法最快,哪个算法能算最大 : 的数据(比如最大多少个点)。 : 非常感谢。
|
k**o 发帖数: 8 | 3 兄弟居然还搞实名制啊,你做得不错啊。
目前有哪些作者用了你的knn 算法作spectral clustering 啊?
速度以及内存消耗跟michael jordan 一伙人2009年提出的算法比较怎么样?
【在 w***g 的大作中提到】 : Spectral clustering算法的瓶颈在于算NxN的相似性矩阵O(N^2)以及对其作特征值分解 : 。提高速度的关键就是对NxN的矩阵进行稀疏化。可以对每个点算其K-nearest : neighbor,然后矩阵只存K-NN对应的那些值,剩余的全都置0。 然后对稀疏矩阵用迭代 : 法进行特征值分解。对所有点在所有点上求K-NN (K-NN graph)可以用我在WWW'11上发 : 表的方法进行加速。
|
w***g 发帖数: 5958 | 4 看了眼那paper,极水。文中先假设了欧式空间,先做k-means (或者k-d tree),然后
对cluster center做spectral cluttering。如果数据真的非常大,那确实得这么做。
但这方法也太显然了,需要发paper吗?
然后spectral clustering最大的好处就是可以处理非欧式空间的数据,甚至都不需要
测度,只要相似度就可以。假设了欧式空间就把spectral clustering这个好处给去掉
了。那还不如直接就k-means得了。
我说的方法目前没人用过。你要有兴趣可以evaluate一下,好的话你可以自己写paper。
注意要写paper的话选dataset的时候一定要选一些非欧式空间的数据,比如我paper中
用的那个EMD。
【在 k**o 的大作中提到】 : 兄弟居然还搞实名制啊,你做得不错啊。 : 目前有哪些作者用了你的knn 算法作spectral clustering 啊? : 速度以及内存消耗跟michael jordan 一伙人2009年提出的算法比较怎么样?
|
k**o 发帖数: 8 | 5 你说的方法现在肯定有人在搞,没有发出来而已,
要搞的话撞车机率很大。
michael jordan他们的方法确实简单直白得气死人。
不过很多有名的算法,比如所谓的二十世纪十大算法中有几个不是很直白的。
有个家伙还无耻地说很多人觉得简单是因为以目前的认识水平还不可能意识到
其中蕴含的深刻性。
兄弟你肯定从老板公司分得了无数多的股票吧,爽死了。
paper。
【在 w***g 的大作中提到】 : 看了眼那paper,极水。文中先假设了欧式空间,先做k-means (或者k-d tree),然后 : 对cluster center做spectral cluttering。如果数据真的非常大,那确实得这么做。 : 但这方法也太显然了,需要发paper吗? : 然后spectral clustering最大的好处就是可以处理非欧式空间的数据,甚至都不需要 : 测度,只要相似度就可以。假设了欧式空间就把spectral clustering这个好处给去掉 : 了。那还不如直接就k-means得了。 : 我说的方法目前没人用过。你要有兴趣可以evaluate一下,好的话你可以自己写paper。 : 注意要写paper的话选dataset的时候一定要选一些非欧式空间的数据,比如我paper中 : 用的那个EMD。
|
w***g 发帖数: 5958 | 6
---------------------------
一点都没有。老板是教本事的,不是分股票的。大家都是靠劳动吃饭,没什么爽的。
【在 k**o 的大作中提到】 : 你说的方法现在肯定有人在搞,没有发出来而已, : 要搞的话撞车机率很大。 : michael jordan他们的方法确实简单直白得气死人。 : 不过很多有名的算法,比如所谓的二十世纪十大算法中有几个不是很直白的。 : 有个家伙还无耻地说很多人觉得简单是因为以目前的认识水平还不可能意识到 : 其中蕴含的深刻性。 : 兄弟你肯定从老板公司分得了无数多的股票吧,爽死了。 : : paper。
|
D*****k 发帖数: 176 | 7 I don't think sparsigying the similarity matrix is a mainstream approach to
scale up spectral clustering. Low rank approximation like nystrom method
looks much more promising
【在 w***g 的大作中提到】 : Spectral clustering算法的瓶颈在于算NxN的相似性矩阵O(N^2)以及对其作特征值分解 : 。提高速度的关键就是对NxN的矩阵进行稀疏化。可以对每个点算其K-nearest : neighbor,然后矩阵只存K-NN对应的那些值,剩余的全都置0。 然后对稀疏矩阵用迭代 : 法进行特征值分解。对所有点在所有点上求K-NN (K-NN graph)可以用我在WWW'11上发 : 表的方法进行加速。
|