由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 老板总问:C很好 为啥gain chart的夹区面积那么小
相关主题
[R] ROC curve怎么指定cutoffs?如何做ordinal logistic regression的validation?
roc curve in RLogistic model中 ROC曲线里面AUC 值太低怎么办?
R-square of logistic regression请教SAS IML调用DATA step数据的问题
proc logistic: how to build 2 X 2 classification tablehow do you deal with sparse data?
Logistic regression,一个validation 的问题想问一个关于评价prediction performance的问题
How to test the difference between two C statistics (want the P急需帮助,关于比较ROC的问题。
How to express cut-off value123love@
问个logistic model的面试问题报两个offer-updated-附面试心得 (转载)
相关话题的讨论汇总
话题: chart话题: gain话题: curve话题: 面积话题: model
进入Statistics版参与讨论
1 (共1页)
h*******d
发帖数: 272
1
大家好
建了一个LOGISTIC 的MODEL, C=0.7。在我们的MODEL 中算是挺高的啦。 但是gain
chart的面积,就是accumulative response% 和random response 两条线的面积不大,
或者说accum response的那个curve比较FLAT 不是C=0.7应有的bell形状。老板咬定肯
定是哪错了!
实在搞不明白 问题出在哪了? 可能是 sample size 比较小? N=5K
或是resp rate=43% 接近一半了。但老板咬定说 不管怎样 你的C=0.7那么大 GAIN
CHART的curve应该比较凸的, 一定是哪错了!!
求 指点 谢谢大家。
t*****w
发帖数: 254
2
gain chart的夹区面积还可以。 看起来小是因为图太长了。弄成正方图应该看起来大
一些。
h*******d
发帖数: 272
3
谢谢回复
我试了下 调成正方形还是很小, 的确跟以前C=0.65 的model比起来更FLAT。

【在 t*****w 的大作中提到】
: gain chart的夹区面积还可以。 看起来小是因为图太长了。弄成正方图应该看起来大
: 一些。

s*********e
发帖数: 1051
4
你的cumu. distribution上的不够快

【在 h*******d 的大作中提到】
: 大家好
: 建了一个LOGISTIC 的MODEL, C=0.7。在我们的MODEL 中算是挺高的啦。 但是gain
: chart的面积,就是accumulative response% 和random response 两条线的面积不大,
: 或者说accum response的那个curve比较FLAT 不是C=0.7应有的bell形状。老板咬定肯
: 定是哪错了!
: 实在搞不明白 问题出在哪了? 可能是 sample size 比较小? N=5K
: 或是resp rate=43% 接近一半了。但老板咬定说 不管怎样 你的C=0.7那么大 GAIN
: CHART的curve应该比较凸的, 一定是哪错了!!
: 求 指点 谢谢大家。

D******n
发帖数: 2836
5
你这个又不是roc curve当然不等。
试想,在score 50% percentile的时候 对应 一个response%, 也就是roc里面的TPR
假设这个值是 t50, 那么这个点在你的curve上是 (0.5,t50)
下面让我们来看看,这个点换成ROC会在哪里。
假设你的score比较好,response都push到前面,所以导致FPR在你这个score 50%的时
候小于0.5 (因为TP过多挤在前面)。
所以这点就变成 (<0.5, t50)
看,这点到左边了,所以整条ROC应该是会包住你的这个curve,所以ROC的AUC一定大于
你这个curve的AUC。

【在 h*******d 的大作中提到】
: 大家好
: 建了一个LOGISTIC 的MODEL, C=0.7。在我们的MODEL 中算是挺高的啦。 但是gain
: chart的面积,就是accumulative response% 和random response 两条线的面积不大,
: 或者说accum response的那个curve比较FLAT 不是C=0.7应有的bell形状。老板咬定肯
: 定是哪错了!
: 实在搞不明白 问题出在哪了? 可能是 sample size 比较小? N=5K
: 或是resp rate=43% 接近一半了。但老板咬定说 不管怎样 你的C=0.7那么大 GAIN
: CHART的curve应该比较凸的, 一定是哪错了!!
: 求 指点 谢谢大家。

1 (共1页)
进入Statistics版参与讨论
相关主题
报两个offer-updated-附面试心得 (转载)Logistic regression,一个validation 的问题
梦想公司onsite,壮烈牺牲.发面经How to test the difference between two C statistics (want the P
请教一个R里的survivalROC问题!How to express cut-off value
请问一个ROC AUC 问题?问个logistic model的面试问题
[R] ROC curve怎么指定cutoffs?如何做ordinal logistic regression的validation?
roc curve in RLogistic model中 ROC曲线里面AUC 值太低怎么办?
R-square of logistic regression请教SAS IML调用DATA step数据的问题
proc logistic: how to build 2 X 2 classification tablehow do you deal with sparse data?
相关话题的讨论汇总
话题: chart话题: gain话题: curve话题: 面积话题: model