由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 紧急求助一个LOGISTIC REGRESSION 问题.
相关主题
再问个SAS LOGISTIC REGRESSION的问题。问个logistic regression的问题。
Logistic model中 ROC曲线里面AUC 值太低怎么办?logistic regression结果释疑,解读
proc logistic: how to build 2 X 2 classification table有什么variable selection的方法可以用在Logistic regression上?
Q on logistic model问题:用VIF做feature selection
请牛人帮帮忙logistic, overfit了怎么办?
关于lasso的variable selection问题想问一个关于评价prediction performance的问题
bagging 用于logistic regression because of unbalance dataLinear regression model 问题请教
请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD请教Logistic regression的问题
相关话题的讨论汇总
话题: logistic话题: regression话题: 紧急话题: sas话题: model
进入Statistics版参与讨论
1 (共1页)
y**i
发帖数: 1050
1
紧急求助一个LOGISTIC REGRESSION 问题.
请问大家一个问题,我打算做一个LOGISTIC REGRESSION MODEL, Y=1 或者0
但是我的Y=1只占 1%的比例,绝大部分是Y=0
可以用来做LOGISTIC REGRESSION吗?
我用SAS出来的结果非常差, GOODNESS OF FIT倒是可以,但是ROC 估计很差.
大家有什么办法吗, 对于这种SKEWED Y 有什么好的办法来做LOGISTIC REGRESSION不?
或者说其他的MODEL来PREDICT 0,1的吗?
在做LOGISTIC REGRESSION之前需要对数据做什么处理吗? 比如需要NORMALIZED DATA
吗,我的X, 有的X是1.0-2.0的LEVEL,有的是1000,2000,3000, 不知道是不是可以呢? 因
为我用SAS PROC LOGISTIC STEPWISE SELECTION X,不知道需要提前对数据做如何处理
呢?
谢谢
s*********h
发帖数: 6288
2
1%不是大问题,问题是样本总数是多少?
1000个里面10个和1m里面1000个差别太大了。
m***c
发帖数: 118
3
首先sampling,多选1,让1和0比例相差的不太离谱,然后proc lgistic,得到结果后再
按照前后1和0的比例差进行矫正。
l******n
发帖数: 9344
4
oversampling

【在 m***c 的大作中提到】
: 首先sampling,多选1,让1和0比例相差的不太离谱,然后proc lgistic,得到结果后再
: 按照前后1和0的比例差进行矫正。

b********8
发帖数: 3059
5
or downsampling
t********m
发帖数: 939
6
顶一下,也很想知道这个问题的答案,不知道还有没有大牛能说的更详细一些。如果按
照楼上说的按1和0差不多比例来sampling然后做logistic,这样不是会丢失很多信息么
?比如说如果我有1000条样本,y=1的只有10个,那sampling以后岂不是只有20条数据
了?
c***z
发帖数: 6348
7
one way is rare event logit, just google the name
another is resampling (e.g. bootstrapping)

?

【在 y**i 的大作中提到】
: 紧急求助一个LOGISTIC REGRESSION 问题.
: 请问大家一个问题,我打算做一个LOGISTIC REGRESSION MODEL, Y=1 或者0
: 但是我的Y=1只占 1%的比例,绝大部分是Y=0
: 可以用来做LOGISTIC REGRESSION吗?
: 我用SAS出来的结果非常差, GOODNESS OF FIT倒是可以,但是ROC 估计很差.
: 大家有什么办法吗, 对于这种SKEWED Y 有什么好的办法来做LOGISTIC REGRESSION不?
: 或者说其他的MODEL来PREDICT 0,1的吗?
: 在做LOGISTIC REGRESSION之前需要对数据做什么处理吗? 比如需要NORMALIZED DATA
: 吗,我的X, 有的X是1.0-2.0的LEVEL,有的是1000,2000,3000, 不知道是不是可以呢? 因
: 为我用SAS PROC LOGISTIC STEPWISE SELECTION X,不知道需要提前对数据做如何处理

F*******2
发帖数: 371
t****e
发帖数: 23
9
能展开说说resampling的做法吗。谢谢

【在 c***z 的大作中提到】
: one way is rare event logit, just google the name
: another is resampling (e.g. bootstrapping)
:
: ?

1 (共1页)
进入Statistics版参与讨论
相关主题
请教Logistic regression的问题请牛人帮帮忙
R-square of logistic regression关于lasso的variable selection问题
Logistic regression,一个validation 的问题bagging 用于logistic regression because of unbalance data
问个logistic regression的问题。请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD
再问个SAS LOGISTIC REGRESSION的问题。问个logistic regression的问题。
Logistic model中 ROC曲线里面AUC 值太低怎么办?logistic regression结果释疑,解读
proc logistic: how to build 2 X 2 classification table有什么variable selection的方法可以用在Logistic regression上?
Q on logistic model问题:用VIF做feature selection
相关话题的讨论汇总
话题: logistic话题: regression话题: 紧急话题: sas话题: model