由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 问题:用VIF做feature selection
相关主题
有什么variable selection的方法可以用在Logistic regression上?one question about variable selection in SAS
土人请教stepwise做过regression的达人请进下,万分感谢
logistic regression 问题紧急求助,问到MULTIPLE REGRESSION的题
请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD抓狂!为啥选出来的predictor都这么差
问个logistic regression的问题。Re: 请问multi variate linear regression 选择risk factor 问(转载)
再问个SAS LOGISTIC REGRESSION的问题。[新手求救]怎样输出logistic regression的结果?
logistic regression结果释疑,解读Gene expression =?= Variable selection
紧急求助一个LOGISTIC REGRESSION 问题.保险公司technical interview 会怎么问?
相关话题的讨论汇总
话题: vif话题: feature话题: selection话题: 去掉话题: 余下
进入Statistics版参与讨论
1 (共1页)
M***e
发帖数: 531
1
有个问题是怎么用VIF做feature selection.
有上千个feature,要求是最后的logistic regression model的feature VIF要小于2.
想了解一下大家用VIF做feature selection的过程。
1. 是stepwise的方式,每次去掉有最大VIF的feature,然后重新计算余下feature的
VIF,不断循环直到最后余下的feature VIF<2.
2. 是分几步,先去掉VIF>100的,然后重新计算余下feature的VIF,再去掉VIF>10的,
然后重新计算余下feature的VIF.
因为数据量比较大,1的办法太耗时,所以在用2的办法。但是risk就是在VIF>100去掉
的feature里有本该留下的,结果一刀切都去掉了。
求助,多谢
w******H
发帖数: 53
2
我觉得应该用stepwise的方法。如果数据量太大,可以考虑random sampling,取出一
部分数据来做,这样应该对VIF影响不会很大。

.

【在 M***e 的大作中提到】
: 有个问题是怎么用VIF做feature selection.
: 有上千个feature,要求是最后的logistic regression model的feature VIF要小于2.
: 想了解一下大家用VIF做feature selection的过程。
: 1. 是stepwise的方式,每次去掉有最大VIF的feature,然后重新计算余下feature的
: VIF,不断循环直到最后余下的feature VIF<2.
: 2. 是分几步,先去掉VIF>100的,然后重新计算余下feature的VIF,再去掉VIF>10的,
: 然后重新计算余下feature的VIF.
: 因为数据量比较大,1的办法太耗时,所以在用2的办法。但是risk就是在VIF>100去掉
: 的feature里有本该留下的,结果一刀切都去掉了。
: 求助,多谢

J*X
发帖数: 1001
3
Probably no one will do stepwise with thousands of variables. Try
information value/cluster analysis first.
p***r
发帖数: 920
4
VIF has nothing to to with the response variable, so you don't need to run
the logistic regression to get a set of dependent variables with low VIFs.
M***e
发帖数: 531
5
有个问题是怎么用VIF做feature selection.
有上千个feature,要求是最后的logistic regression model的feature VIF要小于2.
想了解一下大家用VIF做feature selection的过程。
1. 是stepwise的方式,每次去掉有最大VIF的feature,然后重新计算余下feature的
VIF,不断循环直到最后余下的feature VIF<2.
2. 是分几步,先去掉VIF>100的,然后重新计算余下feature的VIF,再去掉VIF>10的,
然后重新计算余下feature的VIF.
因为数据量比较大,1的办法太耗时,所以在用2的办法。但是risk就是在VIF>100去掉
的feature里有本该留下的,结果一刀切都去掉了。
求助,多谢
w******H
发帖数: 53
6
我觉得应该用stepwise的方法。如果数据量太大,可以考虑random sampling,取出一
部分数据来做,这样应该对VIF影响不会很大。

.

【在 M***e 的大作中提到】
: 有个问题是怎么用VIF做feature selection.
: 有上千个feature,要求是最后的logistic regression model的feature VIF要小于2.
: 想了解一下大家用VIF做feature selection的过程。
: 1. 是stepwise的方式,每次去掉有最大VIF的feature,然后重新计算余下feature的
: VIF,不断循环直到最后余下的feature VIF<2.
: 2. 是分几步,先去掉VIF>100的,然后重新计算余下feature的VIF,再去掉VIF>10的,
: 然后重新计算余下feature的VIF.
: 因为数据量比较大,1的办法太耗时,所以在用2的办法。但是risk就是在VIF>100去掉
: 的feature里有本该留下的,结果一刀切都去掉了。
: 求助,多谢

J*X
发帖数: 1001
7
Probably no one will do stepwise with thousands of variables. Try
information value/cluster analysis first.
p***r
发帖数: 920
8
VIF has nothing to to with the response variable, so you don't need to run
the logistic regression to get a set of dependent variables with low VIFs.
m***c
发帖数: 118
9
如果是查col-linearity的话,VIF不太靠谱,如果单纯做variable reduction的话,LS
说的对,IV和clustering可以。
c****s
发帖数: 395
10
Never know VIF could be used to select variables, is this a typo? Maybe you
Mean IV?
1 (共1页)
进入Statistics版参与讨论
相关主题
保险公司technical interview 会怎么问?问个logistic regression的问题。
谁给说说marketing analysis主要做什么再问个SAS LOGISTIC REGRESSION的问题。
One interview question:) Looking for helplogistic regression结果释疑,解读
intern 面经紧急求助一个LOGISTIC REGRESSION 问题.
有什么variable selection的方法可以用在Logistic regression上?one question about variable selection in SAS
土人请教stepwise做过regression的达人请进下,万分感谢
logistic regression 问题紧急求助,问到MULTIPLE REGRESSION的题
请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD抓狂!为啥选出来的predictor都这么差
相关话题的讨论汇总
话题: vif话题: feature话题: selection话题: 去掉话题: 余下