由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 关于 Risk model
相关主题
model sample size重要吗?SAS一问
proc logistic遇到missing value怎么处理How to get summary statistics from multiple imputed data sets
问个missing data的问题,关于time series data对于Mixed Linear Model, 如何处理missing covariates?
model和variables都sig.但每个category都不siga regression model test issue
[合集] Missing databuilding prediction models from large dataset
missing data questionsquestion about using sas macro variable and do loop
SAS question,thanks!报一个offer给大家打气,顺便问一下职业发展
请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD请教一下Risk Analyst面试主要问什么方面的?
相关话题的讨论汇总
话题: risk话题: model话题: missing话题: 关于话题: variable
进入Statistics版参与讨论
1 (共1页)
a*********y
发帖数: 36
1
被问到关于risk model的问题,不太理解,请教版上有相关经验的高人。
1. risk model 用很多credit bureau 的数据,大概两百个吧,但是很多variable 的
missing value 高达90%,这种情况应该如何处理?被告知dataset里面所有的missing
value都被populate 成9999,这样是否可行?如果不可行,应该如何处理?
2. 一般用多少个independent variables 来build model, 一般最后选出来多少个?用
sas run proc logistic 的话,放200最后还是选出来50个左右,怎样可以减少到10-15
个?是不是放得太多?如果不放那么多的话,有什么好的方法可以选择出适量的
variables 放进去 run model?
问题太多,谢谢!
G*******s
发帖数: 10605
2
1.可以考虑imputation,对结果影响不大,如果variable很多missing本身就不适合做最
后scoring formula的, 这种variable我宁可不要
2.Principle Component是个不错的选择

missing
15

【在 a*********y 的大作中提到】
: 被问到关于risk model的问题,不太理解,请教版上有相关经验的高人。
: 1. risk model 用很多credit bureau 的数据,大概两百个吧,但是很多variable 的
: missing value 高达90%,这种情况应该如何处理?被告知dataset里面所有的missing
: value都被populate 成9999,这样是否可行?如果不可行,应该如何处理?
: 2. 一般用多少个independent variables 来build model, 一般最后选出来多少个?用
: sas run proc logistic 的话,放200最后还是选出来50个左右,怎样可以减少到10-15
: 个?是不是放得太多?如果不放那么多的话,有什么好的方法可以选择出适量的
: variables 放进去 run model?
: 问题太多,谢谢!

D******n
发帖数: 2836
3
1. discard.
2. Its personal.

missing
15

【在 a*********y 的大作中提到】
: 被问到关于risk model的问题,不太理解,请教版上有相关经验的高人。
: 1. risk model 用很多credit bureau 的数据,大概两百个吧,但是很多variable 的
: missing value 高达90%,这种情况应该如何处理?被告知dataset里面所有的missing
: value都被populate 成9999,这样是否可行?如果不可行,应该如何处理?
: 2. 一般用多少个independent variables 来build model, 一般最后选出来多少个?用
: sas run proc logistic 的话,放200最后还是选出来50个左右,怎样可以减少到10-15
: 个?是不是放得太多?如果不放那么多的话,有什么好的方法可以选择出适量的
: variables 放进去 run model?
: 问题太多,谢谢!

1 (共1页)
进入Statistics版参与讨论
相关主题
请教一下Risk Analyst面试主要问什么方面的?[合集] Missing data
SAS 问题:关于比较variable 包子答谢missing data questions
数学phd求refer, Statistician/Data Scientist/Predictive Modeler/Risk analyst相关SAS question,thanks!
请教做过Multiple Imputation 的牛牛们请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD
model sample size重要吗?SAS一问
proc logistic遇到missing value怎么处理How to get summary statistics from multiple imputed data sets
问个missing data的问题,关于time series data对于Mixed Linear Model, 如何处理missing covariates?
model和variables都sig.但每个category都不siga regression model test issue
相关话题的讨论汇总
话题: risk话题: model话题: missing话题: 关于话题: variable