b*******t 发帖数: 390 | 1 用的SAS 中的Proc logistic,selection=stepwise 筛选变量。
加进去有8个左右变量,有4个有显著性差异,还有两个有interaction。
Goodness-of-fit test P value 远大于0.05,是好的。
但是有个问题ROC曲线中AUC只有0.61,不是太好。
用的data, sample size比较大(30k以上),大部分的variables是categorical变量。
试了很多变量,AUC总是0.60-0.61左右,加入的变量多点,好像会稍微高点。
本来以为是因为有些变量的某些Group sample size太小,会有影响,所以干脆把一些
group何并了。但是发现好像还是差不多。
现在不知道该怎么办了,所以来请教大家。谢谢! |
b*******t 发帖数: 390 | 2 怎么没人回复?自己顶!
【在 b*******t 的大作中提到】 : 用的SAS 中的Proc logistic,selection=stepwise 筛选变量。 : 加进去有8个左右变量,有4个有显著性差异,还有两个有interaction。 : Goodness-of-fit test P value 远大于0.05,是好的。 : 但是有个问题ROC曲线中AUC只有0.61,不是太好。 : 用的data, sample size比较大(30k以上),大部分的variables是categorical变量。 : 试了很多变量,AUC总是0.60-0.61左右,加入的变量多点,好像会稍微高点。 : 本来以为是因为有些变量的某些Group sample size太小,会有影响,所以干脆把一些 : group何并了。但是发现好像还是差不多。 : 现在不知道该怎么办了,所以来请教大家。谢谢!
|
t*****a 发帖数: 459 | 3 这个要知道更多的背景情况才可以讨论啊。如果只有8个predicting variable,有没有
可能有其他重大影响因素没有包括在model里呢?如果涵盖不全,那只调整现有的
variable效果也有限。有显著性差异的,odds ratio是多少呢?同一领域的研究,多高
的AUC是公认的好?
有interaction的情况,有时候可以做一个index,把几个variable的效果综合起来。不
过这个还是得看具体情况。 |
b*******t 发帖数: 390 | 4 谢谢你的回复。
确实有可能有其他影响因素没有包括在内。
Odds ratio 有些变量有1.5,还是比较高的。
做过诊断图后,我现在发现可能主要是因为有比较多的outliers,或者influence
values。
但是这个好像不好调整,因为sample size挺大的。
【在 t*****a 的大作中提到】 : 这个要知道更多的背景情况才可以讨论啊。如果只有8个predicting variable,有没有 : 可能有其他重大影响因素没有包括在model里呢?如果涵盖不全,那只调整现有的 : variable效果也有限。有显著性差异的,odds ratio是多少呢?同一领域的研究,多高 : 的AUC是公认的好? : 有interaction的情况,有时候可以做一个index,把几个variable的效果综合起来。不 : 过这个还是得看具体情况。
|