b******v 发帖数: 1493 | 1 这个目标函数和这k个数的方差只相差一个常系数
所以就是要找k个数方差最小
这k个数应该越接近越好吧,
所以我感觉是不是只用考虑相邻的k个数?
请统计牛人出面解答一下?
distances |
D******n 发帖数: 2836 | 2 原题是怎么样的
【在 b******v 的大作中提到】 : 这个目标函数和这k个数的方差只相差一个常系数 : 所以就是要找k个数方差最小 : 这k个数应该越接近越好吧, : 所以我感觉是不是只用考虑相邻的k个数? : 请统计牛人出面解答一下? : : distances
|
b******v 发帖数: 1493 | 3 原题在这里:
在real line上给出n个数,找出k个数,such that the sum of squares of
distances is minimized。例如,assume c是
这k个数的几何中心。c = (n1+...+nk)/k 。 Then 目标函数就是: (n1-
c)^2+...+(nk-c)^2
distances
【在 D******n 的大作中提到】 : 原题是怎么样的
|
D******n 发帖数: 2836 | 4 o, the sample variance times k.
你可以假设找到一个不相邻解,然后总能找到一个相邻解比这个解优。
【在 b******v 的大作中提到】 : 原题在这里: : 在real line上给出n个数,找出k个数,such that the sum of squares of : distances is minimized。例如,assume c是 : 这k个数的几何中心。c = (n1+...+nk)/k 。 Then 目标函数就是: (n1- : c)^2+...+(nk-c)^2 : : distances
|
b******v 发帖数: 1493 | 5 那么只用考虑相邻解是对的喽?
【在 D******n 的大作中提到】 : o, the sample variance times k. : 你可以假设找到一个不相邻解,然后总能找到一个相邻解比这个解优。
|
D******n 发帖数: 2836 | 6 我没想,只是觉得可以那样想。应该跟统计没有多大关系吧,都是数学跟算法层面上的
东西了。
【在 b******v 的大作中提到】 : 那么只用考虑相邻解是对的喽?
|
D*******a 发帖数: 207 | 7 这个我想可以这样做:先从n个点里去掉一个,然后再去掉一个,。。。直至剩下k个。
去掉一个怎么去?必然是去掉两端两个点里的一个。假定这样两个点是a和b。
先算平均值。假定为x。除掉a后的平均值为xa,除掉b后的平均值为xb。
|x-xa|>|x-xb|就去掉a,否则去掉b。相当于找出对平均值影响大的点。算outlier吧。
如此重复直到剩下k个数即可。
想要完整的证明我想也不难。 |
b********n 发帖数: 95 | 8 no, some special case, for example:n=100, and k=4, you have 4 1 and then 101
,102,103..... so 1 would be ourlier, and 1 would be remove immediately. i
think the best way is considering the continuing combination one by one.
【在 D*******a 的大作中提到】 : 这个我想可以这样做:先从n个点里去掉一个,然后再去掉一个,。。。直至剩下k个。 : 去掉一个怎么去?必然是去掉两端两个点里的一个。假定这样两个点是a和b。 : 先算平均值。假定为x。除掉a后的平均值为xa,除掉b后的平均值为xb。 : |x-xa|>|x-xb|就去掉a,否则去掉b。相当于找出对平均值影响大的点。算outlier吧。 : 如此重复直到剩下k个数即可。 : 想要完整的证明我想也不难。
|
D*******a 发帖数: 207 | 9
101
你说得对,我想错了。
【在 b********n 的大作中提到】 : no, some special case, for example:n=100, and k=4, you have 4 1 and then 101 : ,102,103..... so 1 would be ourlier, and 1 would be remove immediately. i : think the best way is considering the continuing combination one by one.
|