W**********E 发帖数: 242 | 1 本想按下列步骤做一个关于PROPENSITY SCORE的SIMULATION,但有问题,不知道哪位高
手能指点一下?
1) LP=B0+B1*X1+B2*X2+。。。。。+B10*X10+
RAND("NOMRAL",0,1)*0。3;
2) P=EXP(LP)/(1+EXP(LP));
3) GENERATE 0/1 DUMMY TREATMENT GRP USING BERNOULLI(P)
4) GENERATE OUTCOME
Y=C0+C1*X1+C2*X2+C3*X3+。。。。+BETA*GROUP;
然后根据上面SIMULATED的数据,做分析
5)先用PROC LOGISTIC;
MODEL TRT=X1 X2 X3 。。。。X10;
输出PREDICATED PROBABILITY(PROPENSITY SCORE)。
6) 然后做模型;
模型1)
Y=GROUP PROPENSITY;
模型2)
Y=GROUP X1 X2 X3。。。。X10;
两个模型的GROUP的系数差太多,模型1)差的很大,和PROPENSITY SCORE的作用想反
。我感 |
b**********i 发帖数: 1059 | 2 propensity score 不是就应该跟 treatment variable相关吗?
【在 W**********E 的大作中提到】 : 本想按下列步骤做一个关于PROPENSITY SCORE的SIMULATION,但有问题,不知道哪位高 : 手能指点一下? : 1) LP=B0+B1*X1+B2*X2+。。。。。+B10*X10+ : RAND("NOMRAL",0,1)*0。3; : 2) P=EXP(LP)/(1+EXP(LP)); : 3) GENERATE 0/1 DUMMY TREATMENT GRP USING BERNOULLI(P) : 4) GENERATE OUTCOME : Y=C0+C1*X1+C2*X2+C3*X3+。。。。+BETA*GROUP; : 然后根据上面SIMULATED的数据,做分析 : 5)先用PROC LOGISTIC;
|
W**********E 发帖数: 242 | 3 是,但是模拟中加了PROPENSITY SCORE,TRT GROUP的系数变的非常离谱,本来是应该
REDUCE BIAS才对。所以非常费解,只能往HIGH COLLINEARITY上想.
【在 b**********i 的大作中提到】 : propensity score 不是就应该跟 treatment variable相关吗?
|
b**********i 发帖数: 1059 | 4 propensity model 玩了很久,不过一直不求甚解。你这个model还算是简单的。x1-x10
都是什么的样的variable?
【在 W**********E 的大作中提到】 : 是,但是模拟中加了PROPENSITY SCORE,TRT GROUP的系数变的非常离谱,本来是应该 : REDUCE BIAS才对。所以非常费解,只能往HIGH COLLINEARITY上想.
|
W**********E 发帖数: 242 | 5 data sim;
do i=1 to 200;
/***generate x covariates****/;
x1=rand("normal",50,10);
x2=rand("normal",30,6);
x3=RAND('POISSON',10);
/***generate treatment***/;
lp=.5+0.65*x1-0.5*x2-0.8*x3+rand("normal",0,1);
p=exp(lp)/(1+exp(lp));
grp=RAND('BINOMIAL',p,1) ;
/***geenrate outcome***/;
y=5.9+1.2*x1-0.9*x2-0.9*x3-0.8*grp+rand("normal",0,0.8);
output;
end;
run;
proc logistic data=sim descending;
mo
【在 b**********i 的大作中提到】 : propensity model 玩了很久,不过一直不求甚解。你这个model还算是简单的。x1-x10 : 都是什么的样的variable?
|
s*r 发帖数: 2757 | 6 change this
4) GENERATE OUTCOME
Y=C0+C1*X1+C2*X2+C3*X3+。。。。+BETA*GROUP;
into
y = beta* group |
W**********E 发帖数: 242 | 7 No, I need covariates X to simulate outcome Y because Y are also associated
with Xs plus treatment group. The settings are common for propensity score
modeling.
There are no problem with model Y=Xs Group. The estimates for X and Groups
are very close to true parameters.
There are problems with model Y=group propensity. So I think it might be
something wrong with the way I generate group and propensity.
奇怪的就是很多文章都是说PROPENSITY SCORE ADJUSTED模型会好,估计的系数会有更小偏差
【在 s*r 的大作中提到】 : change this : 4) GENERATE OUTCOME : Y=C0+C1*X1+C2*X2+C3*X3+。。。。+BETA*GROUP; : into : y = beta* group
|
y*****5 发帖数: 62 | 8
associated
更小偏差
【在 W**********E 的大作中提到】 : No, I need covariates X to simulate outcome Y because Y are also associated : with Xs plus treatment group. The settings are common for propensity score : modeling. : There are no problem with model Y=Xs Group. The estimates for X and Groups : are very close to true parameters. : There are problems with model Y=group propensity. So I think it might be : something wrong with the way I generate group and propensity. : 奇怪的就是很多文章都是说PROPENSITY SCORE ADJUSTED模型会好,估计的系数会有更小偏差
|
y*****5 发帖数: 62 | 9 are you sure PROPENSITY SCORE ADJUSTED模型 means include propensity score as
a covariate in the model?
I usually use propensity score to weight outcome, then have smaller bias.
associated
更小偏差
【在 W**********E 的大作中提到】 : No, I need covariates X to simulate outcome Y because Y are also associated : with Xs plus treatment group. The settings are common for propensity score : modeling. : There are no problem with model Y=Xs Group. The estimates for X and Groups : are very close to true parameters. : There are problems with model Y=group propensity. So I think it might be : something wrong with the way I generate group and propensity. : 奇怪的就是很多文章都是说PROPENSITY SCORE ADJUSTED模型会好,估计的系数会有更小偏差
|
W**********E 发帖数: 242 | 10 Yes. weighting is one way. adjusting it as covariate is another way. or
matching etc.
as
【在 y*****5 的大作中提到】 : are you sure PROPENSITY SCORE ADJUSTED模型 means include propensity score as : a covariate in the model? : I usually use propensity score to weight outcome, then have smaller bias. : : associated : 更小偏差
|
|
|
b**********i 发帖数: 1059 | 11 用propensity score的方法有: 1)as covariate; 2) quintile stratification and
pooling later on; 3). matching; 4). inverse probability weighting.
【在 W**********E 的大作中提到】 : Yes. weighting is one way. adjusting it as covariate is another way. or : matching etc. : : as
|
W**********E 发帖数: 242 | 12 问题不是模型复杂与否,我只是给了个例子。问题是调整PROPENSITY SCORE后,竟然
TREATMENT的系数估计会有更大的偏差,这和其他文献的发现相反,所以想知道哪里出
了偏差。可是我看不少文献就是一样的方法做SIMULATION
x10
【在 b**********i 的大作中提到】 : propensity model 玩了很久,不过一直不求甚解。你这个model还算是简单的。x1-x10 : 都是什么的样的variable?
|
b**********i 发帖数: 1059 | 13 #simulation =200 太小,先调到 2000看看
【在 W**********E 的大作中提到】 : 问题不是模型复杂与否,我只是给了个例子。问题是调整PROPENSITY SCORE后,竟然 : TREATMENT的系数估计会有更大的偏差,这和其他文献的发现相反,所以想知道哪里出 : 了偏差。可是我看不少文献就是一样的方法做SIMULATION : : x10
|
b**********i 发帖数: 1059 | 14 照我下面的做,你给个包子吧。
在loop外面加个loop,1000/500都随你。然后求个group effect 的mean。 monticarlo
simulation parameter estimate 也是random的不是。 您老就搞一个dataset就想歪
诗大街啊。 |
s*r 发帖数: 2757 | 15 you really like this cofounding
associated
更小偏差
【在 W**********E 的大作中提到】 : No, I need covariates X to simulate outcome Y because Y are also associated : with Xs plus treatment group. The settings are common for propensity score : modeling. : There are no problem with model Y=Xs Group. The estimates for X and Groups : are very close to true parameters. : There are problems with model Y=group propensity. So I think it might be : something wrong with the way I generate group and propensity. : 奇怪的就是很多文章都是说PROPENSITY SCORE ADJUSTED模型会好,估计的系数会有更小偏差
|
s*r 发帖数: 2757 | 16 感觉应该大多数data都应该是这样
monticarlo
【在 b**********i 的大作中提到】 : 照我下面的做,你给个包子吧。 : 在loop外面加个loop,1000/500都随你。然后求个group effect 的mean。 monticarlo : simulation parameter estimate 也是random的不是。 您老就搞一个dataset就想歪 : 诗大街啊。
|
W**********E 发帖数: 242 | 17 我只是给个SAS例子。原来的SIMULATION我在R里做了2000次,不过是算TYPE I
ERROR RATE 和POWER。TREATMENT GROUP的P-VALUE ON AVERAGE两个模型(adjusting
ALL covariates vs adjusting for PROPENSITY SCORE)差很多,adjusting for
propensity score的POWER低很多. 我才仔细看单个数据的ESTIMATE,发现很多次同一
个数据两个模型TREATMENT GROUP的结果很不一样,这让我觉得很费解。实际分析数据
中我觉得调整ALL X或PROPENSITY SCORE差别是有但不会太大。就算PROPENSITY SCORE
的ESTIMATE结果 on average 接近TRUE PARAMETER,但POWER比ADJUSTING ALL X还低很多,还是很难
理解。
如果没人觉得我产生GROUPING的方法有问题,那到好了。包子给你,多谢帮忙
monticarlo
【在 b**********i 的大作中提到】 : 照我下面的做,你给个包子吧。 : 在loop外面加个loop,1000/500都随你。然后求个group effect 的mean。 monticarlo : simulation parameter estimate 也是random的不是。 您老就搞一个dataset就想歪 : 诗大街啊。
|
s*r 发帖数: 2757 | 18 要不你做quantile stratification
把数据分组之后,在每个组里运行
proc glm ;
model y=grp x1 x2 x3;
run;
看grp effect的average是不是要比在所有data里面运行同样model的估计值更接近true
value
感觉这样的comparison比较公平 |
b**********i 发帖数: 1059 | 19 不好意思,本事没有学人家要包子,哈哈。也不知道有什么用。 |
s*r 发帖数: 2757 | 20 求电子书用
【在 b**********i 的大作中提到】 : 不好意思,本事没有学人家要包子,哈哈。也不知道有什么用。
|