关于rank sum test（Mann-Whitney test） - Statistics版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - 关于rank sum test（Mann-Whitney test）

相关主题
● 请问如何把SAS dataset转到R里？	● SAS Question
● 求问一道SAS adv 题	● Dataset merge的一个问题
● 请问:query about checking consistency (转载)	● 请教如何写这个sas代码？
● 学习R的过程还是挺痛苦的！	● 如何强行合并两个datasets？
● 请教：用Mann-whitney U test 还是T test?	● [提问]怎样sort这个dataset?
● 请教一sas programmm	● [SAS]怎么快捷地删除Macro 里创建的临时dataset和macro variab
● 从大data 产生多个小data 的方法	● 请教一个UNIX下面用SAS的弱智问题
● 发包子求大牛解SAS问题，急	● 问一个data subset的问题

相关话题的讨论汇总
话题: test话题: 分布话题: mann话题: whitney话题: dataset

进入Statistics版参与讨论

1

(共1页)

p*****n 发帖数: 265	1 谢谢weiwei和其他朋友的回答，我看了下wiki，这个test（paired)主要是查whether their population mean ranks differ 也就是medina是不是一样。但是我之前的问题是说，两组数据的分布是不是不同，这个和比较median好像不太一样吧？虽然有overlap，但是不能划等号吧？K-S test倒是两个datasets分布是否差别很大。谢谢啦
w*******9 发帖数: 1433	2 Just my two cents: K-S比较两个分布,这是个无穷维的问题，MW比较两个mean/median ,是个一维问题，比较一维的东西更容易，也就是说MW对检测某类问题（更具体点，平移）power更大。但是如果不是平移那么K-S的power更大，但也只是相对的大，实际上也是蛮低的。这是为什么大家平时数据不够大的时候不太用k-s的原因。以我有限的知识来看，统计里比较两个无穷维的东西，绝大多数的统计量都是简化成比较两个有限维的东西，就是为了追求更大的power。通常有很多方法转化成低维，所以同一个问题会有好多测试方法，如何运用取决于你对自己的data 认识多少，对不同的test认识多少。本质上来说K-S 是纯nonparametric, MW是semi-parametric，取舍就看你的model assumption 对你的data适用不适用。
p*****n 发帖数: 265	3 weiwei同学，谢谢你的解释，恩我现在对两种test更明白一些了。我想两个test都试一下好了，反正命令很简单，在R 里面运行很快。我需要在R里面随机把whole data分两份，然后做两种test。这样进行10次，如果每次p value都很大（也就是两部分分布差不多），是不是可以说，这组数据的分布没有必要分组呢？我希望得出的结论是没有必要分组，就用whole data来得出分布。谢谢啦！ median 【在 w*******9 的大作中提到】 : Just my two cents: K-S比较两个分布,这是个无穷维的问题，MW比较两个mean/median : ,是个一维问题，比较一维的东西更容易，也就是说MW对检测某类问题（更具体点，平 : 移）power更大。但是如果不是平移那么K-S的power更大，但也只是相对的大，实际上 : 也是蛮低的。这是为什么大家平时数据不够大的时候不太用k-s的原因。以我有限的知 : 识来看，统计里比较两个无穷维的东西，绝大多数的统计量都是简化成比较两个有限维 : 的东西，就是为了追求更大的power。通常有很多方法转化成低维，所以同一个问题会 : 有好多测试方法，如何运用取决于你对自己的data 认识多少，对不同的test认识多少 : 。本质上来说K-S 是纯nonparametric, MW是semi-parametric，取舍就看你的model : assumption 对你的data适用不适用。
w*******9 发帖数: 1433	4 If you divide a whole dataset into 2 groups entirely randomly, these two groups will always have the same distribution. R 次p 【在 p*****n 的大作中提到】 : weiwei同学，谢谢你的解释，恩 : 我现在对两种test更明白一些了。我想两个test都试一下好了，反正命令很简单，在R : 里面运行很快。 : 我需要在R里面随机把whole data分两份，然后做两种test。这样进行10次，如果每次p : value都很大（也就是两部分分布差不多），是不是可以说，这组数据的分布没有必要 : 分组呢？ : 我希望得出的结论是没有必要分组，就用whole data来得出分布。 : 谢谢啦！ : : median
p*****n 发帖数: 265	5 Hi, weiwei，我现在想做的test是dataset没有必要分成若干组，不管按什么attribute ，所以我想做的是，分组后的数据没有显著的不同，比如我按时间分为两组，按 attribute分组，和原来whole dataset比没有太大的分布差异。你觉得我这么做make sense吗？谢谢是的，我现在发现确实绝大多数p value close to 1，也就是没有太大差异，我这么做的问题是什么呢？》谢谢【在 w*******9 的大作中提到】 : If you divide a whole dataset into 2 groups entirely randomly, these two : groups will always have the same distribution. : : R : 次p

1

(共1页)

进入Statistics版参与讨论

相关主题
● 问一个data subset的问题	● 请教：用Mann-whitney U test 还是T test?
● [help]10个包子求KDD cup 2009 的orange公司dataset	● 请教一sas programmm
● Where could I get testing dataset?	● 从大data 产生多个小data 的方法
● 问个效率问题 SQL vs data step，大数据量	● 发包子求大牛解SAS问题，急
● 请问如何把SAS dataset转到R里？	● SAS Question
● 求问一道SAS adv 题	● Dataset merge的一个问题
● 请问:query about checking consistency (转载)	● 请教如何写这个sas代码？
● 学习R的过程还是挺痛苦的！	● 如何强行合并两个datasets？

相关话题的讨论汇总
话题: test话题: 分布话题: mann话题: whitney话题: dataset

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)