由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 讨论一下:几种clustering方法的特点,区别,长处各是什么?
相关主题
聚类问题请教Science杂志一篇关于clustering的新文章 (转载)
only average statistics我有大概80000~100000个左右的时间序列,希望对他们进行分类。
请推荐生物界认可的Clustering Analysis的免费软件有没有谁自己买服务器组建几个clusters跑hadoop大数据的?
[Data Science Project] Location data qualityRegression中噪音项是一个AR(1),如何做MLE或者其它Fit?
谁能推荐几本DS的书?机器学习日报2015年2月楼
请问常考的cluster algorithm有哪些新手诚心请教一个deep learning的问题
有关clustering怎么处理categorical variable有很多个level的
问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?Optimal tier segementation怎么做?
相关话题的讨论汇总
话题: clustering话题: 讨论一下话题: gmm话题: spectral
进入DataSciences版参与讨论
1 (共1页)
C*******a
发帖数: 448
1
clustering:
K-means:
hierarchical clustering:
GMM:
Spectral clustering:
讨论一下吧,基本功。
d*****n
发帖数: 754
2
基于密度的DBSCAN, MDS, 流型学习,deep learning 里的auto encoder

【在 C*******a 的大作中提到】
: clustering:
: K-means:
: hierarchical clustering:
: GMM:
: Spectral clustering:
: 讨论一下吧,基本功。

G****o
发帖数: 229
3
K-mean: 简单,大样本,分类数目不多,每个分类的样本数差不多
hierarchical clustering: 树结构,大样本,多分类,可以限制数据点间的连接关系。
GMM: 好处:快,缺点:不稳定。
Spectral cluster: 通过映射到低维处理图像相关问题,处理比较少的类别
DBSCAN: 寻找高密度区域。大数据,适中的分类数目
manifold learning: 将数据映射到低维
想看中文的详细介绍,我在翻译scikit-learn的文档。
可以check out https://github.com/jiayiliu/scikit-learn 编译一下doc_sc 里面的
文档
希望能有朋友一起完成
c***z
发帖数: 6348
4
赞大牛

系。

【在 G****o 的大作中提到】
: K-mean: 简单,大样本,分类数目不多,每个分类的样本数差不多
: hierarchical clustering: 树结构,大样本,多分类,可以限制数据点间的连接关系。
: GMM: 好处:快,缺点:不稳定。
: Spectral cluster: 通过映射到低维处理图像相关问题,处理比较少的类别
: DBSCAN: 寻找高密度区域。大数据,适中的分类数目
: manifold learning: 将数据映射到低维
: 想看中文的详细介绍,我在翻译scikit-learn的文档。
: 可以check out https://github.com/jiayiliu/scikit-learn 编译一下doc_sc 里面的
: 文档
: 希望能有朋友一起完成

1 (共1页)
进入DataSciences版参与讨论
相关主题
Optimal tier segementation怎么做?谁能推荐几本DS的书?
一道面试题,向本版求教一下。请问常考的cluster algorithm有哪些
[Data Science Project Case] Fuzzy matching on names有关clustering
有没有人想报Cloudera的Data Scientist Certificate的问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?
聚类问题请教Science杂志一篇关于clustering的新文章 (转载)
only average statistics我有大概80000~100000个左右的时间序列,希望对他们进行分类。
请推荐生物界认可的Clustering Analysis的免费软件有没有谁自己买服务器组建几个clusters跑hadoop大数据的?
[Data Science Project] Location data qualityRegression中噪音项是一个AR(1),如何做MLE或者其它Fit?
相关话题的讨论汇总
话题: clustering话题: 讨论一下话题: gmm话题: spectral