想问一个关于评价prediction performance的问题 - Statistics版

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - 想问一个关于评价prediction performance的问题

相关主题
● 建模型，最后一步发现classification table不均匀，和解？	● 报两个offer-updated-附面试心得 (转载)
● 谁来解释解释c-statistic为什么等于AUC	● sensitivity and specificity
● How to express cut-off value	● 紧急求助一个LOGISTIC REGRESSION 问题.
● sensitivity and specificity	● Help：ROC from R
● how do you deal with sparse data?	● 请问这句话什么意思？
● 请问一个ROC AUC 问题？	● Random forests on imbalanced data (转载)
● proc logistic: how to build 2 X 2 classification table	● [R] ROC curve怎么指定cutoffs?
● 急需帮助，关于比较ROC的问题。	● R-square of logistic regression

相关话题的讨论汇总
话题: auc话题: data话题: positive话题: imbalanced

进入Statistics版参与讨论

(共1页)

R******d
发帖数: 1436

现在想做一个predictor，用来预测人群中的某种不常见的疾病，发病率不到1%。
training data是
非常imbalanced的，positive data points很少，绝大部分都是negative data points
。我
没有直接用这样的training data，而是人为地构建了balanced data。简单的说，就是
保持
positive data points不变，随机选同样sample size的negative data points。重复
训练
若干次，最后的训练结果是这么多次结果的汇总。
因为发病率确实很低，所以我取的specificity很高，比如99.9%。相应来说
sensitivity就很低
了，2%不到。换算成Positive Predictive Value（好像有人更看重这个），也低，大
概10%不
到。
我现在的问题是：
1，请问对于这样非常imbalanced的数据，AUC，specificity和Positive Predictive
Value
这三个指标哪个更重要？如果要做一个有意义的predictor，他们各自的threshold是多
少？
2，因为原始的数据是imbalanced，而我用来train的数据是balanced。在计算Positive
Predictive Value这个指标的时候，是应该按balanced还是imbalanced的来算？如果按
balanced的来算，specificity 99.9%对应的PPV是很高的。但是按总体来看，PPV就不
高了，因
为总的training data中negative data point太多了。
多谢（不知道发对版了没有，呵呵）。

d*******o
发帖数: 493

不太懂你这个领域的建模。像你这样的binary model评价应该是sensitivity和
specificity的平衡，比如AUC。像Kdd cup2009的AUC baseline是0.6-0.7，获奖的队在
AUC都在0.85左右。
你balance的目地是想牺牲sensitivity换specificity吧？最好构建一个weight matrix
，用profit lift去评价模型。
话说回来，2%的sensitivity也太低了，false negative rate=0.98，这样的模型似乎
很难用。

R******d
发帖数: 1436

我balance的目的是，试了不同的ratio，balance的performance最好。
我是故意要很高的specificity的，sensitivity和specificity可以通过设定不同的
prediction score threshold来实现。一般都是报道两者加和最大时候的值吧？AUC这
个指标和数
据是balance和imbalanced的无关。我的AUC在0.88
我的目的是只要找到就行，不需要都找到，所以把specificity调得很高。对于我的处
理方法，算ppv
是应该按balance还是imbalance的来算？
profit lift怎么用？

matrix

【在 d*******o 的大作中提到】

: 不太懂你这个领域的建模。像你这样的binary model评价应该是sensitivity和
: specificity的平衡，比如AUC。像Kdd cup2009的AUC baseline是0.6-0.7，获奖的队在
: AUC都在0.85左右。
: 你balance的目地是想牺牲sensitivity换specificity吧？最好构建一个weight matrix
: ，用profit lift去评价模型。
: 话说回来，2%的sensitivity也太低了，false negative rate=0.98，这样的模型似乎
: 很难用。

D******n
发帖数: 2836

AUC好像还是受skewed data影响的。
该问的问题不是要用哪个metrics，而是你想要什么，一般就是一个objective function。

【在 R******d 的大作中提到】

: 我balance的目的是，试了不同的ratio，balance的performance最好。
: 我是故意要很高的specificity的，sensitivity和specificity可以通过设定不同的
: prediction score threshold来实现。一般都是报道两者加和最大时候的值吧？AUC这
: 个指标和数
: 据是balance和imbalanced的无关。我的AUC在0.88
: 我的目的是只要找到就行，不需要都找到，所以把specificity调得很高。对于我的处
: 理方法，算ppv
: 是应该按balance还是imbalance的来算？
: profit lift怎么用？
:

a*****3
发帖数: 601

你这胖猫头像也太bt了，贱妾pharm看了怕是要做噩梦,还是那个鲨鱼牙看上去比较自然
些。

在: AUC都在0.85左右。: 你balance的目地是想牺牲sensitivity换specificity吧？最
好构建一个weight matrix: ，用profit lift去评价模型。
乎: 很难用。

【在 d*******o 的大作中提到】

d*******o
发帖数: 493

猫当然是越胖越好玩，俺就喜欢胖猫，哈哈

【在 a*****3 的大作中提到】

: 你这胖猫头像也太bt了，贱妾pharm看了怕是要做噩梦,还是那个鲨鱼牙看上去比较自然
: 些。
:
: 在: AUC都在0.85左右。: 你balance的目地是想牺牲sensitivity换specificity吧？最
: 好构建一个weight matrix: ，用profit lift去评价模型。
: 乎: 很难用。

s*r
发帖数: 2757

2%是低，不过如果原来的prevalence只有0.001呢，
那可是提高20倍呢,不一定肯定没有用

matrix

【在 d*******o 的大作中提到】

d*******o
发帖数: 493

Skewed interval outcome还可以做transformation. Unbalanced binary outcome好像
也没什么办法。我估计，楼主balance的后果是增加了positive outcome的权重。线性
模型估计影响很大，非线性模型影响还好。
我好奇楼主是怎么把”多次结果汇总的“。另外，楼主的AUC是validation时候的AUC吗？

d*******o
发帖数: 493

有道理，长见识了，谢谢郎先生。
我原来想100个癌症患者只能找出2个，咋就这么低了。

【在 s*r 的大作中提到】

: 2%是低，不过如果原来的prevalence只有0.001呢，
: 那可是提高20倍呢,不一定肯定没有用
:
: matrix

p********i
发帖数: 1963

好厉害啊．．能用就可以了．．

points

【在 R******d 的大作中提到】

: 现在想做一个predictor，用来预测人群中的某种不常见的疾病，发病率不到1%。
: training data是
: 非常imbalanced的，positive data points很少，绝大部分都是negative data points
: 。我
: 没有直接用这样的training data，而是人为地构建了balanced data。简单的说，就是
: 保持
: positive data points不变，随机选同样sample size的negative data points。重复
: 训练
: 若干次，最后的训练结果是这么多次结果的汇总。
: 因为发病率确实很低，所以我取的specificity很高，比如99.9%。相应来说

相关主题
● 请问一个ROC AUC 问题？	● 报两个offer-updated-附面试心得 (转载)
● proc logistic: how to build 2 X 2 classification table	● sensitivity and specificity
● 急需帮助，关于比较ROC的问题。	● 紧急求助一个LOGISTIC REGRESSION 问题.
进入Statistics版参与讨论

g********r
发帖数: 8017

unbalanced就该改loss function了吧？就是false positive和false negative的惩罚
不一样。最后的结果就是像你做的specificity很高，sensitivity相对低。但看起来好
看点。

points

【在 R******d 的大作中提到】

R******d
发帖数: 1436

做100次prediction就有100个prediction score，平均起来。AUC就是根据这个100个值
的平均
值来算的。
AUC好像还是受skewed data影响的。
这个有出处么，俺的印象中都是AUC和sensitivity和specificity的组合有关, is not
sensitive to imbalances in the data

像
吗？

【在 d*******o 的大作中提到】

: Skewed interval outcome还可以做transformation. Unbalanced binary outcome好像
: 也没什么办法。我估计，楼主balance的后果是增加了positive outcome的权重。线性
: 模型估计影响很大，非线性模型影响还好。
: 我好奇楼主是怎么把”多次结果汇总的“。另外，楼主的AUC是validation时候的AUC吗？

D******n
发帖数: 2836

For example:
"Area under the curve is most appropriate when each
curve dominates another. However, researchers have
proposed analyses for when curves cross (Provost &
Fawcett, 2001). There are also analyses for when only
a portion of the roc curve is of interest (McClish,
1989; Woods et al., 1997) and when analyzing more
than two decisions (Swets & Pickett, 1982; Mossman,
1999; Hand & Till, 2001)"

not

【在 R******d 的大作中提到】

: 做100次prediction就有100个prediction score，平均起来。AUC就是根据这个100个值
: 的平均
: 值来算的。
: AUC好像还是受skewed data影响的。
: 这个有出处么，俺的印象中都是AUC和sensitivity和specificity的组合有关, is not
: sensitive to imbalances in the data
:
: 像
: 吗？

R******d
发帖数: 1436

没说AUC和data imbalance有关啊。

【在 D******n 的大作中提到】

: For example:
: "Area under the curve is most appropriate when each
: curve dominates another. However, researchers have
: proposed analyses for when curves cross (Provost &
: Fawcett, 2001). There are also analyses for when only
: a portion of the roc curve is of interest (McClish,
: 1989; Woods et al., 1997) and when analyzing more
: than two decisions (Swets & Pickett, 1982; Mossman,
: 1999; Hand & Till, 2001)"
:

A*******s
发帖数: 3942

要是我没记错和理解错的话，dashagen给出的那篇文章(Provost & Fawcett, 2001)就
说了怎么根据cost/class distribution划出iso-performance lines去切ROC。如果你
要比较两个model的好坏，我觉得用这个定义说得通。如果两个model的ROC是相交的，
那么不同的threshold的设定可能就会有不同的优劣比较。如果ROC不相交的话，那么自
然是AUC越大越好了。

points

【在 R******d 的大作中提到】

P****D
发帖数: 11146

没事，贱妾就喜欢胖的。

【在 a*****3 的大作中提到】

(共1页)

进入Statistics版参与讨论

相关主题
● R-square of logistic regression	● how do you deal with sparse data?
● roc curve in R	● 请问一个ROC AUC 问题？
● 梦想公司onsite,壮烈牺牲.发面经	● proc logistic: how to build 2 X 2 classification table
● 请教一个R里的survivalROC问题！	● 急需帮助，关于比较ROC的问题。
● 建模型，最后一步发现classification table不均匀，和解？	● 报两个offer-updated-附面试心得 (转载)
● 谁来解释解释c-statistic为什么等于AUC	● sensitivity and specificity
● How to express cut-off value	● 紧急求助一个LOGISTIC REGRESSION 问题.
● sensitivity and specificity	● Help：ROC from R

相关话题的讨论汇总
话题: auc话题: data话题: positive话题: imbalanced

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

boards

未名新帖统计// 7月16日

历史上的今天