由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 两个数列,评价他们是否吻合用啥方法最好
相关主题
Paired T-test Assumption not Satisfied请问R里面有什么package来算wilcoxon signed rank test的sample size 么?
update 市场统计问题,sales/K讨教一下,Wilconxon test
is there a software calculate multi-rater Cohen's kappa急!菜鸟问一个统计知识,大家勿打击啊!
请教:multi-rater weighted kappa请教一格anova检验的问题
像 kappa-test 这种,什么书上会讲?请教F test和t test区别?
请教一个inter rater reliability 的问题请教大家一个关于check normality的问题
[合集] 问个test的问题a sample size calculation
请教个简单的统计问题(包子)请教一个关于student's t test的问题
相关话题的讨论汇总
话题: test话题: agreement话题: group话题: two话题: raters
进入Statistics版参与讨论
1 (共1页)
k***g
发帖数: 4904
1
有一组照片,每张里面有若干点(多少不一),张三数了一遍,给了一个数列,李四数
了一遍,给了另一个数列。为了看张三李四数的结果是否一致,用啥分析方法最好呢?
我想能不能简单的把它们当成x,y两列坐标,算算R方,再看看拟合斜率是否接近1。这
只是我纯外行的想法。比较严谨的,规范的方法是什么呢?谢谢!!
g*****o
发帖数: 812
2
ks检验可以试一试

【在 k***g 的大作中提到】
: 有一组照片,每张里面有若干点(多少不一),张三数了一遍,给了一个数列,李四数
: 了一遍,给了另一个数列。为了看张三李四数的结果是否一致,用啥分析方法最好呢?
: 我想能不能简单的把它们当成x,y两列坐标,算算R方,再看看拟合斜率是否接近1。这
: 只是我纯外行的想法。比较严谨的,规范的方法是什么呢?谢谢!!

m***w
发帖数: 69
3
两个相减,检验差的均值是不是零
k***g
发帖数: 4904
4
这和我测拟合斜率是不是1不是一样吗。而且这个也看不出来是不是随机偏差很大吧

【在 m***w 的大作中提到】
: 两个相减,检验差的均值是不是零
k***g
发帖数: 4904
5
谢谢回复,不过我是外行不太明白您的回答,K-S检验我查了一下,好像是分析一组数
据是否符合某种统计分布,比如正态分布之类的,也就是说要拿某个理论分布模型作为
检验标准,可是我这个就是两组有序的数,想看看它们偏差大不大,(请见原帖),如
何使用K-S检验呢?

【在 g*****o 的大作中提到】
: ks检验可以试一试
Y******Y
发帖数: 8753
6
intraclass correlation coefficient?
q******n
发帖数: 272
7
ks.test(y[group=="a", y[group=="b"])
ks test can answer whether two sample distribution are the same or not.
q******n
发帖数: 272
8
ks.test(y[group=="a", y[group=="b"])
ks test can answer whether two sample distribution are the same or not.
k***g
发帖数: 4904
9
谢谢回复!请问您这个是针对distribution,还是针对(x,y)这样的数对?
我再改一下,明确一下问题:
有一组照片,每张里面有若干点(多少不一),张三数了一遍,给了一个数列,比如a=
1,b=5,c=3,d=9,e=7 (a-e是照片序号)。李四数了一遍,给了另一组结果,比如a
=2,b=4,c=4,d=8,e=6。为了看张三李四数的结果是否一致,用啥分析方法最好呢?
我想能不能简单的把它们当成x,y两列坐标,算算R方,再看看拟合斜率是否接近1。这
只是我纯外行的想法。比较严谨的,规范的方法是什么呢?谢谢!!
补充:我们的目的就是想验证我们的方法是不是reliable,也即是说无论张三还是李四
用这种方法,得到的结果是非常相近的。但是这不同于T-test那种给出两组无序的数,
看看是否分布重合。我们这个是有序的,不能只从数值的分布来评价。

【在 q******n 的大作中提到】
: ks.test(y[group=="a", y[group=="b"])
: ks test can answer whether two sample distribution are the same or not.

h***i
发帖数: 3844
10
如果你是序列,那ks是没有用的。 做回归就行了。

a=
如a

【在 k***g 的大作中提到】
: 谢谢回复!请问您这个是针对distribution,还是针对(x,y)这样的数对?
: 我再改一下,明确一下问题:
: 有一组照片,每张里面有若干点(多少不一),张三数了一遍,给了一个数列,比如a=
: 1,b=5,c=3,d=9,e=7 (a-e是照片序号)。李四数了一遍,给了另一组结果,比如a
: =2,b=4,c=4,d=8,e=6。为了看张三李四数的结果是否一致,用啥分析方法最好呢?
: 我想能不能简单的把它们当成x,y两列坐标,算算R方,再看看拟合斜率是否接近1。这
: 只是我纯外行的想法。比较严谨的,规范的方法是什么呢?谢谢!!
: 补充:我们的目的就是想验证我们的方法是不是reliable,也即是说无论张三还是李四
: 用这种方法,得到的结果是非常相近的。但是这不同于T-test那种给出两组无序的数,
: 看看是否分布重合。我们这个是有序的,不能只从数值的分布来评价。

相关主题
请教一个inter rater reliability 的问题请问R里面有什么package来算wilcoxon signed rank test的sample size 么?
[合集] 问个test的问题讨教一下,Wilconxon test
请教个简单的统计问题(包子)急!菜鸟问一个统计知识,大家勿打击啊!
进入Statistics版参与讨论
k***g
发帖数: 4904
11
那看来我就做回归就对了,谢谢啊

【在 h***i 的大作中提到】
: 如果你是序列,那ks是没有用的。 做回归就行了。
:
: a=
: 如a

T*******I
发帖数: 5138
12
这个应该适合lz的问题。其实就是二次重复测量的一致性检验的问题。简单的线性回归
法被认为不适合这类相关性判断。

【在 Y******Y 的大作中提到】
: intraclass correlation coefficient?
k***g
发帖数: 4904
13
谢谢!!那我再学习一下这个怎么弄。

【在 T*******I 的大作中提到】
: 这个应该适合lz的问题。其实就是二次重复测量的一致性检验的问题。简单的线性回归
: 法被认为不适合这类相关性判断。

R*****0
发帖数: 146
14
请LZ查一下"paired t-test"和"Wilcoxon signed rank test",感觉这两个应该是解决
你问题的经典方法。大概就是把对应项做差,前者假设差值服从正态分布N(0,sigma^2)
,后者不要求参数化的模型,直接假设差值服从一个对称的分布F。
回归要注意的问题就是不能仅看R^2,因为如果俩人数出来的对应有线性关系(未必相
等)也会有很大的R^2。所以额外地检验"斜率是否为1"同时"截距是否为0"很重要,这
是一个simultaneous inference。而一般软件的standard output都是检验"斜率是否为
0"的。所以我不认为这种情况下regression会很方便。
k***g
发帖数: 4904
15
谢谢热心回复!!我贴个图吧,看看这个算是什么情况,是不是直接就可以用了

2)

【在 R*****0 的大作中提到】
: 请LZ查一下"paired t-test"和"Wilcoxon signed rank test",感觉这两个应该是解决
: 你问题的经典方法。大概就是把对应项做差,前者假设差值服从正态分布N(0,sigma^2)
: ,后者不要求参数化的模型,直接假设差值服从一个对称的分布F。
: 回归要注意的问题就是不能仅看R^2,因为如果俩人数出来的对应有线性关系(未必相
: 等)也会有很大的R^2。所以额外地检验"斜率是否为1"同时"截距是否为0"很重要,这
: 是一个simultaneous inference。而一般软件的standard output都是检验"斜率是否为
: 0"的。所以我不认为这种情况下regression会很方便。

Y******Y
发帖数: 8753
16
都说了。。。这就是个raters agreement的问题, 用intraclass correlation
coefficient ....
http://en.wikipedia.org/wiki/Intraclass_correlation
k***g
发帖数: 4904
17
谢谢,这个对我来讲太难了,没有SPSS不知道怎么算

【在 Y******Y 的大作中提到】
: 都说了。。。这就是个raters agreement的问题, 用intraclass correlation
: coefficient ....
: http://en.wikipedia.org/wiki/Intraclass_correlation

k***g
发帖数: 4904
18
这是一组数据的例子。。哪位能帮忙给算一下吗?。。
Group A
54
30
32
62
37
39
59
35
36
29
44
45
26
41
39
33
49
47
28
42
43
25
38
40
33
46
47
Group B
60
28
28
63
38
33
52
36
36
25
36
34
22
41
39
33
47
46
28
39
38
21
33
35
33
52
42

【在 k***g 的大作中提到】
: 谢谢,这个对我来讲太难了,没有SPSS不知道怎么算
Y******Y
发帖数: 8753
19
this can be easily done by using information from an ANOVA table
example:
http://www.real-statistics.com/reliability/intraclass-correlati

【在 k***g 的大作中提到】
: 谢谢,这个对我来讲太难了,没有SPSS不知道怎么算
k***g
发帖数: 4904
20
哦,好像这个很简单,我试试

【在 Y******Y 的大作中提到】
: this can be easily done by using information from an ANOVA table
: example:
: http://www.real-statistics.com/reliability/intraclass-correlati

相关主题
请教一格anova检验的问题a sample size calculation
请教F test和t test区别?请教一个关于student's t test的问题
请教大家一个关于check normality的问题请问这种数据怎么分析?
进入Statistics版参与讨论
R*****0
发帖数: 146
21
你regression的图就说明一些问题,slope很接近1,SE也很小,基本上符合预期,但说
明不了问题。因为此时决定A和B是否有差异在于intercept和0的距离,这里估计值和SE
在数量上差不多,你直接看不出来。还要做个intercept?=0的检验。
至于你后来的数据,B组 - A组之后是
6 -2 -4 1 1 -6 -7 1 0 -4 -8 -11 -4 0 0 0 -2 -1 0 -
3 -5 -4 -5 -5 0 6 -5
你觉得这些差值正的多还是负的多,正的程度大还是负的程度大?你怎么看?
实际上paired t-test和Wilcoxon rank test的结果跟你的看法一样。

【在 k***g 的大作中提到】
: 谢谢热心回复!!我贴个图吧,看看这个算是什么情况,是不是直接就可以用了
:
: 2)

k***g
发帖数: 4904
22
谢谢!
我以后再学习paired T-test

SE
-

【在 R*****0 的大作中提到】
: 你regression的图就说明一些问题,slope很接近1,SE也很小,基本上符合预期,但说
: 明不了问题。因为此时决定A和B是否有差异在于intercept和0的距离,这里估计值和SE
: 在数量上差不多,你直接看不出来。还要做个intercept?=0的检验。
: 至于你后来的数据,B组 - A组之后是
: 6 -2 -4 1 1 -6 -7 1 0 -4 -8 -11 -4 0 0 0 -2 -1 0 -
: 3 -5 -4 -5 -5 0 6 -5
: 你觉得这些差值正的多还是负的多,正的程度大还是负的程度大?你怎么看?
: 实际上paired t-test和Wilcoxon rank test的结果跟你的看法一样。

k***g
发帖数: 4904
23
刚才学着网页做了个anova的ICC,结果是0.955,是不是还行

【在 Y******Y 的大作中提到】
: this can be easily done by using information from an ANOVA table
: example:
: http://www.real-statistics.com/reliability/intraclass-correlati

Y******Y
发帖数: 8753
24
you should get the approximated 95% confidence interval for your ICC as well.
an ICC value of 0.955 shows a high degree of agreement between 张三 and 李四
Y******Y
发帖数: 8753
25
I also want to comment on your initial approach of fitting a simple linear
regression and evaluate the R2. This is essentially calculating the square
of Pearson's correlation coefficient(PCC). However, in your case, PCC is not
a suitable measure for assessing agreement. Even if you can show the two
raters have 'perfect' linear relationship when PCC=1. It doesn't mean the
two raters have perfect agreement on every score.
k***g
发帖数: 4904
26
这个没太看明白,如果slope=1,R2=1,intercept=0,还能不是每个点都刚好两人一致


not

【在 Y******Y 的大作中提到】
: I also want to comment on your initial approach of fitting a simple linear
: regression and evaluate the R2. This is essentially calculating the square
: of Pearson's correlation coefficient(PCC). However, in your case, PCC is not
: a suitable measure for assessing agreement. Even if you can show the two
: raters have 'perfect' linear relationship when PCC=1. It doesn't mean the
: two raters have perfect agreement on every score.

w*******n
发帖数: 469
27
kappa啊,这么明显
a*z
发帖数: 294
28
second Kappa!
q******n
发帖数: 272
29
No significant difference between group A and B in terms of their
distribution.
Two-sample Kolmogorov-Smirnov test
data: y[group == "A"] and y[group == "B"]
D = 0.256, p-value = 0.3212
alternative hypothesis: two-sided

【在 k***g 的大作中提到】
: 这是一组数据的例子。。哪位能帮忙给算一下吗?。。
: Group A
: 54
: 30
: 32
: 62
: 37
: 39
: 59
: 35

u*h
发帖数: 397
30
Use paired-t test:
total 27 number: (A-B)
{
-6 2 4 -1 -1 6 7 -1 0 4 8 11 4 0 0
0 2 1 0 3 5 4 5 5 0 -6 5
}
average = 2.26,
std dev = 3.87.
Student's t-test: t-value = 3.03, p-value = 0.0054.
REJECT.
A and B are different.
PS: qq-plot shows that the 27 numbers are normal distributed.

【在 k***g 的大作中提到】
: 这是一组数据的例子。。哪位能帮忙给算一下吗?。。
: Group A
: 54
: 30
: 32
: 62
: 37
: 39
: 59
: 35

相关主题
请教:Wilcoxon Rank Sum Test在SAS里面怎么运行?update 市场统计问题,sales/K
请牛人帮帮忙is there a software calculate multi-rater Cohen's kappa
Paired T-test Assumption not Satisfied请教:multi-rater weighted kappa
进入Statistics版参与讨论
y**3
发帖数: 267
31
Kappa may work as well
Y******Y
发帖数: 8753
32
同学们,kappa是给categorical data的。。。。
m***c
发帖数: 118
33
我就借LZ宝地想问个问题:
如果想做一个predictive model 的validation, 是不是也可以把预测值和实际值用ICC
或KAPPA来做,而并不需要做cross validation 或其他的validation?
谢谢!
F8
发帖数: 348
34
Can you point it out
how high of icc is considered as high agreement? how would you interpret the
value of icc? for example, 0.7.
How to assess the agreement for binary response with multiple raters? what
method would you prefer
I am not very clear ...

well.

【在 Y******Y 的大作中提到】
: you should get the approximated 95% confidence interval for your ICC as well.
: an ICC value of 0.955 shows a high degree of agreement between 张三 and 李四

F8
发帖数: 348
35
It is hard to deal with the convergence issues when taking more random
effects, for example, random rater and random time effects

the

【在 F8 的大作中提到】
: Can you point it out
: how high of icc is considered as high agreement? how would you interpret the
: value of icc? for example, 0.7.
: How to assess the agreement for binary response with multiple raters? what
: method would you prefer
: I am not very clear ...
:
: well.

s*r
发帖数: 2757
36
degree of agreement
one of the most-cited statistics papers ever:Bland & Altman (1986)
Statistical methods for assessing agreement between two methods of clinical
measurement: 27,181
k***g
发帖数: 4904
37
Thanks a lot!
This is very helpful!

clinical

【在 s*r 的大作中提到】
: degree of agreement
: one of the most-cited statistics papers ever:Bland & Altman (1986)
: Statistical methods for assessing agreement between two methods of clinical
: measurement: 27,181

1 (共1页)
进入Statistics版参与讨论
相关主题
请教一个关于student's t test的问题像 kappa-test 这种,什么书上会讲?
请问这种数据怎么分析?请教一个inter rater reliability 的问题
请教:Wilcoxon Rank Sum Test在SAS里面怎么运行?[合集] 问个test的问题
请牛人帮帮忙请教个简单的统计问题(包子)
Paired T-test Assumption not Satisfied请问R里面有什么package来算wilcoxon signed rank test的sample size 么?
update 市场统计问题,sales/K讨教一下,Wilconxon test
is there a software calculate multi-rater Cohen's kappa急!菜鸟问一个统计知识,大家勿打击啊!
请教:multi-rater weighted kappa请教一格anova检验的问题
相关话题的讨论汇总
话题: test话题: agreement话题: group话题: two话题: raters