m***c 发帖数: 118 | 1 一个数据有三个变量pct1,pct2,pct3,均是工人工作完成率0 - 1,obs大概有1500个,
pct2和pct3分别有10多个missing values。已经检测过这三个变量均不是normal。
data a;
input pct1 pct2 pct3;
cards;
0.2345 0.2657 0.3410
0.8009 0.7011 0.6945
1.0000 0.5699 0.8940
0.7109 . 0.6945
0.5470 0.9999 1.0000
0.8901 0.5557 .
0.4522 0.9672 0.6012
。。。。。
;
run;
问题:
1. 一把情况下,如何比较pct1,pct2,pct3是不是significantly same or different?
2.如果后2个变量oct2,pct3的工人是通过第一个pct1的工人PSM(propensity score
matching)找出的结果, 比如,用工人1的年龄技术经验,,来找到匹配的工人2(工
人1和工人2具有很高的相似性),工人2的完成率就是pct2,同样以工人1再找到工人3
,得到pct3,以此类推,一直把1500*3个工人的完成率全部得到,请问在这种情况下,
又该如何test这三个完成率是不是一样,或者pct1和pct2,pct1和pct3是不是一样?
谢谢! |
|