z**********i 发帖数: 12276 | 1 医院level的race DATA,比如,white, 85%, no-white, 15%.
2004, race, 74% missing. 比如, 200个医院, only 52个医院有RACE的信息,其他148个医
院没有.
2005, race, 50% missing
2006, race, 14% missing
2007-2009, race, no missing
2004-2006的DATA是否可用,常用什么imputation method?
多谢回复!! | z**********i 发帖数: 12276 | 2 原来读过2片missing data的文章,实在是只知道皮毛.
【在 z**********i 的大作中提到】 : 医院level的race DATA,比如,white, 85%, no-white, 15%. : 2004, race, 74% missing. 比如, 200个医院, only 52个医院有RACE的信息,其他148个医 : 院没有. : 2005, race, 50% missing : 2006, race, 14% missing : 2007-2009, race, no missing : 2004-2006的DATA是否可用,常用什么imputation method? : 多谢回复!!
| m******u 发帖数: 277 | 3 LOCF
propensity score
predictive mean matching
^_^ | d******9 发帖数: 134 | 4 lz这些data是做什么用的呢?
我最近做的一个project,用来match patients的若干covariates中有些也有missing
data. 我的advisor说用mean imputation既可,我有几个covariates有大约25%的
missing,他说这样的比例不能用imputation了。具体的threshold或者其他详细的
guideline我也不清楚,等其他人来解释吧。 | z**********i 发帖数: 12276 | 5 想做点disparity的分析。
race在最初2年,很多missing,后来,好了很多.
有2篇文章介绍,geocoding和surname来填补missing,可能以后会试试。
basic imputation methods: case complete,locf,mean.
后来,有hot deck imputation, multiple imputation.
我也没有经验,具体在实际中该用什么,不太清楚。
【在 d******9 的大作中提到】 : lz这些data是做什么用的呢? : 我最近做的一个project,用来match patients的若干covariates中有些也有missing : data. 我的advisor说用mean imputation既可,我有几个covariates有大约25%的 : missing,他说这样的比例不能用imputation了。具体的threshold或者其他详细的 : guideline我也不清楚,等其他人来解释吧。
| z**********i 发帖数: 12276 | 6 多谢回复!
【在 m******u 的大作中提到】 : LOCF : propensity score : predictive mean matching : ^_^
| z**********i 发帖数: 12276 | 7 http://support.sas.com/documentation/cdl/en/statug/63033/HTML/d
race 是nominal,是不是该用Discriminant Function Method?
而不是propensity score?
完全是门外汉。
【在 m******u 的大作中提到】 : LOCF : propensity score : predictive mean matching : ^_^
| c********d 发帖数: 253 | 8 Propensity score will create large bias when data is not monotone missing.So
I don't recommend that approach. A lot of methods can be used in your case
if you only have one missing variable, such as hot-deck, predictive mean
matching using a logistic model. You can also use multivariate probit model
for your case since race is nominal. By using multivariate probit model, it'
s easy to develop MCMC algorithm to do multiple imputation. | z**********i 发帖数: 12276 | 9 多谢回复!
我看到有的用hot deck,hot deck multiple imputation.感觉,他们是不同的。
没坐果的,就是莫不着头脑。
So
case
model
it'
【在 c********d 的大作中提到】 : Propensity score will create large bias when data is not monotone missing.So : I don't recommend that approach. A lot of methods can be used in your case : if you only have one missing variable, such as hot-deck, predictive mean : matching using a logistic model. You can also use multivariate probit model : for your case since race is nominal. By using multivariate probit model, it' : s easy to develop MCMC algorithm to do multiple imputation.
| c********d 发帖数: 253 | 10 hot deck是multiple imputation的一种,当然你也可以用hot deck做single
imputation,不过不推荐。 | z**********i 发帖数: 12276 | 11 记得哪个地方比较hot deck 和 multiple imputation?
有的地方说hot deck multiple imputation.
把我搞糊涂拉.
多谢回复!
【在 c********d 的大作中提到】 : hot deck是multiple imputation的一种,当然你也可以用hot deck做single : imputation,不过不推荐。
|
|