由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 关于rank sum test(Mann-Whitney test)
相关主题
请问如何把SAS dataset转到R里?SAS Question
求问一道SAS adv 题Dataset merge的一个问题
请问:query about checking consistency (转载)请教如何写这个sas代码?
学习R的过程还是挺痛苦的!如何强行合并两个datasets?
请教:用Mann-whitney U test 还是T test?[提问]怎样sort这个dataset?
请教一sas programmm[SAS]怎么快捷地删除Macro 里创建的临时dataset和macro variab
从大data 产生多个小data 的方法请教一个UNIX下面用SAS的弱智问题
发包子求大牛解SAS问题,急问一个data subset的问题
相关话题的讨论汇总
话题: test话题: 分布话题: mann话题: whitney话题: dataset
进入Statistics版参与讨论
1 (共1页)
p*****n
发帖数: 265
1
谢谢weiwei和其他朋友的回答,我看了下wiki,这个test(paired)主要是查whether
their population mean ranks differ 也就是medina是不是一样。
但是我之前的问题是说,两组数据的分布是不是不同,这个和比较median好像不太一样
吧?虽然有overlap,但是不能划等号吧?K-S test倒是两个datasets分布是否差别很
大。
谢谢啦
w*******9
发帖数: 1433
2
Just my two cents: K-S比较两个分布,这是个无穷维的问题,MW比较两个mean/median
,是个一维问题,比较一维的东西更容易,也就是说MW对检测某类问题(更具体点,平
移)power更大。但是如果不是平移那么K-S的power更大,但也只是相对的大,实际上
也是蛮低的。这是为什么大家平时数据不够大的时候不太用k-s的原因。以我有限的知
识来看,统计里比较两个无穷维的东西,绝大多数的统计量都是简化成比较两个有限维
的东西,就是为了追求更大的power。通常有很多方法转化成低维,所以同一个问题会
有好多测试方法,如何运用取决于你对自己的data 认识多少,对不同的test认识多少
。本质上来说K-S 是纯nonparametric, MW是semi-parametric,取舍就看你的model
assumption 对你的data适用不适用。
p*****n
发帖数: 265
3
weiwei同学,谢谢你的解释,恩
我现在对两种test更明白一些了。我想两个test都试一下好了,反正命令很简单,在R
里面运行很快。
我需要在R里面随机把whole data分两份,然后做两种test。这样进行10次,如果每次p
value都很大(也就是两部分分布差不多),是不是可以说,这组数据的分布没有必要
分组呢?
我希望得出的结论是没有必要分组,就用whole data来得出分布。
谢谢啦!

median

【在 w*******9 的大作中提到】
: Just my two cents: K-S比较两个分布,这是个无穷维的问题,MW比较两个mean/median
: ,是个一维问题,比较一维的东西更容易,也就是说MW对检测某类问题(更具体点,平
: 移)power更大。但是如果不是平移那么K-S的power更大,但也只是相对的大,实际上
: 也是蛮低的。这是为什么大家平时数据不够大的时候不太用k-s的原因。以我有限的知
: 识来看,统计里比较两个无穷维的东西,绝大多数的统计量都是简化成比较两个有限维
: 的东西,就是为了追求更大的power。通常有很多方法转化成低维,所以同一个问题会
: 有好多测试方法,如何运用取决于你对自己的data 认识多少,对不同的test认识多少
: 。本质上来说K-S 是纯nonparametric, MW是semi-parametric,取舍就看你的model
: assumption 对你的data适用不适用。

w*******9
发帖数: 1433
4
If you divide a whole dataset into 2 groups entirely randomly, these two
groups will always have the same distribution.

R
次p

【在 p*****n 的大作中提到】
: weiwei同学,谢谢你的解释,恩
: 我现在对两种test更明白一些了。我想两个test都试一下好了,反正命令很简单,在R
: 里面运行很快。
: 我需要在R里面随机把whole data分两份,然后做两种test。这样进行10次,如果每次p
: value都很大(也就是两部分分布差不多),是不是可以说,这组数据的分布没有必要
: 分组呢?
: 我希望得出的结论是没有必要分组,就用whole data来得出分布。
: 谢谢啦!
:
: median

p*****n
发帖数: 265
5
Hi, weiwei,我现在想做的test是dataset没有必要分成若干组,不管按什么attribute
,所以我想做的是,分组后的数据没有显著的不同,比如我按时间分为两组,按
attribute分组,和原来whole dataset比没有太大的分布差异。
你觉得我这么做make sense吗?谢谢
是的,我现在发现确实绝大多数p value close to 1,也就是没有太大差异,我这么做
的问题是什么呢?》谢谢

【在 w*******9 的大作中提到】
: If you divide a whole dataset into 2 groups entirely randomly, these two
: groups will always have the same distribution.
:
: R
: 次p

1 (共1页)
进入Statistics版参与讨论
相关主题
问一个data subset的问题请教:用Mann-whitney U test 还是T test?
[help]10个包子求KDD cup 2009 的orange公司dataset请教一sas programmm
Where could I get testing dataset?从大data 产生多个小data 的方法
问个效率问题 SQL vs data step,大数据量发包子求大牛解SAS问题,急
请问如何把SAS dataset转到R里?SAS Question
求问一道SAS adv 题Dataset merge的一个问题
请问:query about checking consistency (转载)请教如何写这个sas代码?
学习R的过程还是挺痛苦的!如何强行合并两个datasets?
相关话题的讨论汇总
话题: test话题: 分布话题: mann话题: whitney话题: dataset