s****h 发帖数: 3979 | 1 问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering?
假如一个cluster是一个圆,要求找 不相交/或少许相交的一些圆(例如top100),这
些圆内weight值最大。
多谢。 |
s****h 发帖数: 3979 | 2 对了,给定的半径不同,这样的cluster/圆也会不同。
每个点和其最近N个neighbor的平均值是d,1M点的d的平均值是D。
对应不同的N,D不同。
假设给定一个N,求top(M)的圆,咋弄? |
s****h 发帖数: 3979 | |
T*****u 发帖数: 7103 | 4 我没太看明白题。weight是做啥的,根据啥cluster啊 |
s****h 发帖数: 3979 | 5 比如说,给你一个地图,刑事案件发生的地点和严重程度。
严重程度就是weight
或者说是商品销售的目的地,货物类型/数量/价格,这个数量/价格和运输费用就是
weight |
t******g 发帖数: 2253 | 6 这个有点意思。这种点有权重的以前没接触过。不过感觉还是有不少实际应用价值。 |
T*****u 发帖数: 7103 | 7 是类似于二维地图的hotmap吗?是给点做cluster还是给二维地图做segmentation?
【在 s****h 的大作中提到】 : 比如说,给你一个地图,刑事案件发生的地点和严重程度。 : 严重程度就是weight : 或者说是商品销售的目的地,货物类型/数量/价格,这个数量/价格和运输费用就是 : weight
|
T*****u 发帖数: 7103 | 8 如果是后者的话,我用mixture of gaussians做过一个类似的,数据的前期整理比较麻
烦;后来有些不规则形状分布的,我的做法是每一个点当作一个rbf, weight当做
function的amplitude,train to get width matrix(can be location dependent)
,然后地图上任意一点的值都可以算,得到一个hot map,然后再做segmentation。其实
就是一堆点用rbf smooth成一个面,然后用这个面作为估计。
非专业人士的非专业做法,仅供参考。 |
c***z 发帖数: 6348 | 9 heatmap?
【在 s****h 的大作中提到】 : 比如说,给你一个地图,刑事案件发生的地点和严重程度。 : 严重程度就是weight : 或者说是商品销售的目的地,货物类型/数量/价格,这个数量/价格和运输费用就是 : weight
|
w******e 发帖数: 1621 | 10 你圈圈大小要是给定的,来个K-means应该可以,EM块, E step 注意用weighted mean
,
开始也想说GMM,但是1M行的话,谨慎表示不客观,用gibbs fit过 GMM, 到50K就受不了了
而且企业里用K-MEANs可能性大,
另求内推DS,SDE。本人主业stat phd, data visualization和machine learning 方向。
副业主刷c++ 和副刷java。
【在 s****h 的大作中提到】 : 问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering? : 假如一个cluster是一个圆,要求找 不相交/或少许相交的一些圆(例如top100),这 : 些圆内weight值最大。 : 多谢。
|
h*****7 发帖数: 6781 | 11 想耍酷,在黎曼空间定义distance
想绕晕,拟合weight,套贝叶斯
想忽悠,直接上MDS
【在 s****h 的大作中提到】 : 问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering? : 假如一个cluster是一个圆,要求找 不相交/或少许相交的一些圆(例如top100),这 : 些圆内weight值最大。 : 多谢。
|
y*****d 发帖数: 82 | 12 简单? 把weight看成第3维(每个点的高度),在3维空间中做K-means, K-medoids 或其他
算法.
【在 s****h 的大作中提到】 : 问个问题:一堆(1M)二维座标系的点,每个点有weight,怎么做clustering? : 假如一个cluster是一个圆,要求找 不相交/或少许相交的一些圆(例如top100),这 : 些圆内weight值最大。 : 多谢。
|