p*****n 发帖数: 265 | 1 谢谢weiwei和其他朋友的回答,我看了下wiki,这个test(paired)主要是查whether
their population mean ranks differ 也就是medina是不是一样。
但是我之前的问题是说,两组数据的分布是不是不同,这个和比较median好像不太一样
吧?虽然有overlap,但是不能划等号吧?K-S test倒是两个datasets分布是否差别很
大。
谢谢啦 |
w*******9 发帖数: 1433 | 2 Just my two cents: K-S比较两个分布,这是个无穷维的问题,MW比较两个mean/median
,是个一维问题,比较一维的东西更容易,也就是说MW对检测某类问题(更具体点,平
移)power更大。但是如果不是平移那么K-S的power更大,但也只是相对的大,实际上
也是蛮低的。这是为什么大家平时数据不够大的时候不太用k-s的原因。以我有限的知
识来看,统计里比较两个无穷维的东西,绝大多数的统计量都是简化成比较两个有限维
的东西,就是为了追求更大的power。通常有很多方法转化成低维,所以同一个问题会
有好多测试方法,如何运用取决于你对自己的data 认识多少,对不同的test认识多少
。本质上来说K-S 是纯nonparametric, MW是semi-parametric,取舍就看你的model
assumption 对你的data适用不适用。 |
p*****n 发帖数: 265 | 3 weiwei同学,谢谢你的解释,恩
我现在对两种test更明白一些了。我想两个test都试一下好了,反正命令很简单,在R
里面运行很快。
我需要在R里面随机把whole data分两份,然后做两种test。这样进行10次,如果每次p
value都很大(也就是两部分分布差不多),是不是可以说,这组数据的分布没有必要
分组呢?
我希望得出的结论是没有必要分组,就用whole data来得出分布。
谢谢啦!
median
【在 w*******9 的大作中提到】 : Just my two cents: K-S比较两个分布,这是个无穷维的问题,MW比较两个mean/median : ,是个一维问题,比较一维的东西更容易,也就是说MW对检测某类问题(更具体点,平 : 移)power更大。但是如果不是平移那么K-S的power更大,但也只是相对的大,实际上 : 也是蛮低的。这是为什么大家平时数据不够大的时候不太用k-s的原因。以我有限的知 : 识来看,统计里比较两个无穷维的东西,绝大多数的统计量都是简化成比较两个有限维 : 的东西,就是为了追求更大的power。通常有很多方法转化成低维,所以同一个问题会 : 有好多测试方法,如何运用取决于你对自己的data 认识多少,对不同的test认识多少 : 。本质上来说K-S 是纯nonparametric, MW是semi-parametric,取舍就看你的model : assumption 对你的data适用不适用。
|
w*******9 发帖数: 1433 | 4 If you divide a whole dataset into 2 groups entirely randomly, these two
groups will always have the same distribution.
R
次p
【在 p*****n 的大作中提到】 : weiwei同学,谢谢你的解释,恩 : 我现在对两种test更明白一些了。我想两个test都试一下好了,反正命令很简单,在R : 里面运行很快。 : 我需要在R里面随机把whole data分两份,然后做两种test。这样进行10次,如果每次p : value都很大(也就是两部分分布差不多),是不是可以说,这组数据的分布没有必要 : 分组呢? : 我希望得出的结论是没有必要分组,就用whole data来得出分布。 : 谢谢啦! : : median
|
p*****n 发帖数: 265 | 5 Hi, weiwei,我现在想做的test是dataset没有必要分成若干组,不管按什么attribute
,所以我想做的是,分组后的数据没有显著的不同,比如我按时间分为两组,按
attribute分组,和原来whole dataset比没有太大的分布差异。
你觉得我这么做make sense吗?谢谢
是的,我现在发现确实绝大多数p value close to 1,也就是没有太大差异,我这么做
的问题是什么呢?》谢谢
【在 w*******9 的大作中提到】 : If you divide a whole dataset into 2 groups entirely randomly, these two : groups will always have the same distribution. : : R : 次p
|