由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - Logistic model中 ROC曲线里面AUC 值太低怎么办?
相关主题
紧急求助一个LOGISTIC REGRESSION 问题.如何做ordinal logistic regression的validation?
梦想公司onsite,壮烈牺牲.发面经ROC curve可以用来比较变量吗
R-square of logistic regressionlogistic, overfit了怎么办?
proc logistic: how to build 2 X 2 classification table请教,ROC曲线可以应用于那些研究?
How to test the difference between two C statistics (want the P请问dummy variable in stepwise怎么看significance啊?
How to express cut-off value怎么看那个categorica 变量对y的解释更给力?
问个logistic model的面试问题data science 面试求教
老板总问:C很好 为啥gain chart的夹区面积那么小[合集] odds ratio >999.99
相关话题的讨论汇总
话题: auc话题: 变量话题: roc话题: logistic话题: 曲线
进入Statistics版参与讨论
1 (共1页)
b*******t
发帖数: 390
1
用的SAS 中的Proc logistic,selection=stepwise 筛选变量。
加进去有8个左右变量,有4个有显著性差异,还有两个有interaction。
Goodness-of-fit test P value 远大于0.05,是好的。
但是有个问题ROC曲线中AUC只有0.61,不是太好。
用的data, sample size比较大(30k以上),大部分的variables是categorical变量。
试了很多变量,AUC总是0.60-0.61左右,加入的变量多点,好像会稍微高点。
本来以为是因为有些变量的某些Group sample size太小,会有影响,所以干脆把一些
group何并了。但是发现好像还是差不多。
现在不知道该怎么办了,所以来请教大家。谢谢!
b*******t
发帖数: 390
2
怎么没人回复?自己顶!

【在 b*******t 的大作中提到】
: 用的SAS 中的Proc logistic,selection=stepwise 筛选变量。
: 加进去有8个左右变量,有4个有显著性差异,还有两个有interaction。
: Goodness-of-fit test P value 远大于0.05,是好的。
: 但是有个问题ROC曲线中AUC只有0.61,不是太好。
: 用的data, sample size比较大(30k以上),大部分的variables是categorical变量。
: 试了很多变量,AUC总是0.60-0.61左右,加入的变量多点,好像会稍微高点。
: 本来以为是因为有些变量的某些Group sample size太小,会有影响,所以干脆把一些
: group何并了。但是发现好像还是差不多。
: 现在不知道该怎么办了,所以来请教大家。谢谢!

t*****a
发帖数: 459
3
这个要知道更多的背景情况才可以讨论啊。如果只有8个predicting variable,有没有
可能有其他重大影响因素没有包括在model里呢?如果涵盖不全,那只调整现有的
variable效果也有限。有显著性差异的,odds ratio是多少呢?同一领域的研究,多高
的AUC是公认的好?
有interaction的情况,有时候可以做一个index,把几个variable的效果综合起来。不
过这个还是得看具体情况。
b*******t
发帖数: 390
4
谢谢你的回复。
确实有可能有其他影响因素没有包括在内。
Odds ratio 有些变量有1.5,还是比较高的。
做过诊断图后,我现在发现可能主要是因为有比较多的outliers,或者influence
values。
但是这个好像不好调整,因为sample size挺大的。

【在 t*****a 的大作中提到】
: 这个要知道更多的背景情况才可以讨论啊。如果只有8个predicting variable,有没有
: 可能有其他重大影响因素没有包括在model里呢?如果涵盖不全,那只调整现有的
: variable效果也有限。有显著性差异的,odds ratio是多少呢?同一领域的研究,多高
: 的AUC是公认的好?
: 有interaction的情况,有时候可以做一个index,把几个variable的效果综合起来。不
: 过这个还是得看具体情况。

1 (共1页)
进入Statistics版参与讨论
相关主题
[合集] odds ratio >999.99How to test the difference between two C statistics (want the P
[合集] 多变量回归How to express cut-off value
请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD问个logistic model的面试问题
[R] ROC curve怎么指定cutoffs?老板总问:C很好 为啥gain chart的夹区面积那么小
紧急求助一个LOGISTIC REGRESSION 问题.如何做ordinal logistic regression的validation?
梦想公司onsite,壮烈牺牲.发面经ROC curve可以用来比较变量吗
R-square of logistic regressionlogistic, overfit了怎么办?
proc logistic: how to build 2 X 2 classification table请教,ROC曲线可以应用于那些研究?
相关话题的讨论汇总
话题: auc话题: 变量话题: roc话题: logistic话题: 曲线