由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 问一个和统计相关的算法面试题 (转载)
相关主题
[合集] 问一个和统计相关的算法面试题 (转载)请教 怎么计算一组平均数之和的方差
问一个regression的弱问题如何在离散程度里加上数据的绝对值?
做linear reg怎么去掉outlier?如何在离散程度里加上数据的绝对值?
R: distance matrixApple 电话面试 面经
标准方差一定小于算术平均值么?求大牛们一道题啊,给点思路哈
如何算多个数据的总的标准偏差急:急:请教如何用统计说明这个问题
求助问个统计方法的问题。怎么样才能提高R SQUARE的值--using SPSS?
请教一个工程上统计问题interview 问题请教
相关话题的讨论汇总
话题: 个数话题: 统计话题: distances话题: 面试题话题: 算法
进入Statistics版参与讨论
1 (共1页)
b******v
发帖数: 1493
1
这个目标函数和这k个数的方差只相差一个常系数
所以就是要找k个数方差最小
这k个数应该越接近越好吧,
所以我感觉是不是只用考虑相邻的k个数?
请统计牛人出面解答一下?

distances
D******n
发帖数: 2836
2
原题是怎么样的

【在 b******v 的大作中提到】
: 这个目标函数和这k个数的方差只相差一个常系数
: 所以就是要找k个数方差最小
: 这k个数应该越接近越好吧,
: 所以我感觉是不是只用考虑相邻的k个数?
: 请统计牛人出面解答一下?
:
: distances

b******v
发帖数: 1493
3
原题在这里:
在real line上给出n个数,找出k个数,such that the sum of squares of
distances is minimized。例如,assume c是
这k个数的几何中心。c = (n1+...+nk)/k 。 Then 目标函数就是: (n1-
c)^2+...+(nk-c)^2

distances

【在 D******n 的大作中提到】
: 原题是怎么样的
D******n
发帖数: 2836
4
o, the sample variance times k.
你可以假设找到一个不相邻解,然后总能找到一个相邻解比这个解优。

【在 b******v 的大作中提到】
: 原题在这里:
: 在real line上给出n个数,找出k个数,such that the sum of squares of
: distances is minimized。例如,assume c是
: 这k个数的几何中心。c = (n1+...+nk)/k 。 Then 目标函数就是: (n1-
: c)^2+...+(nk-c)^2
:
: distances

b******v
发帖数: 1493
5
那么只用考虑相邻解是对的喽?

【在 D******n 的大作中提到】
: o, the sample variance times k.
: 你可以假设找到一个不相邻解,然后总能找到一个相邻解比这个解优。

D******n
发帖数: 2836
6
我没想,只是觉得可以那样想。应该跟统计没有多大关系吧,都是数学跟算法层面上的
东西了。

【在 b******v 的大作中提到】
: 那么只用考虑相邻解是对的喽?
D*******a
发帖数: 207
7
这个我想可以这样做:先从n个点里去掉一个,然后再去掉一个,。。。直至剩下k个。
去掉一个怎么去?必然是去掉两端两个点里的一个。假定这样两个点是a和b。
先算平均值。假定为x。除掉a后的平均值为xa,除掉b后的平均值为xb。
|x-xa|>|x-xb|就去掉a,否则去掉b。相当于找出对平均值影响大的点。算outlier吧。
如此重复直到剩下k个数即可。
想要完整的证明我想也不难。
b********n
发帖数: 95
8
no, some special case, for example:n=100, and k=4, you have 4 1 and then 101
,102,103..... so 1 would be ourlier, and 1 would be remove immediately. i
think the best way is considering the continuing combination one by one.

【在 D*******a 的大作中提到】
: 这个我想可以这样做:先从n个点里去掉一个,然后再去掉一个,。。。直至剩下k个。
: 去掉一个怎么去?必然是去掉两端两个点里的一个。假定这样两个点是a和b。
: 先算平均值。假定为x。除掉a后的平均值为xa,除掉b后的平均值为xb。
: |x-xa|>|x-xb|就去掉a,否则去掉b。相当于找出对平均值影响大的点。算outlier吧。
: 如此重复直到剩下k个数即可。
: 想要完整的证明我想也不难。

D*******a
发帖数: 207
9

101
你说得对,我想错了。

【在 b********n 的大作中提到】
: no, some special case, for example:n=100, and k=4, you have 4 1 and then 101
: ,102,103..... so 1 would be ourlier, and 1 would be remove immediately. i
: think the best way is considering the continuing combination one by one.

1 (共1页)
进入Statistics版参与讨论
相关主题
interview 问题请教标准方差一定小于算术平均值么?
求答案, 多谢!如何算多个数据的总的标准偏差
讨论一道面试题求助问个统计方法的问题。
F***Book interview请教一个工程上统计问题
[合集] 问一个和统计相关的算法面试题 (转载)请教 怎么计算一组平均数之和的方差
问一个regression的弱问题如何在离散程度里加上数据的绝对值?
做linear reg怎么去掉outlier?如何在离散程度里加上数据的绝对值?
R: distance matrixApple 电话面试 面经
相关话题的讨论汇总
话题: 个数话题: 统计话题: distances话题: 面试题话题: 算法