由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 做过regression的达人请进下,万分感谢
相关主题
logistic regression结果释疑,解读Principal Components Analysis 中 factor 选择的问题
请教backward, forward and stepwise在做variable selection时的区别ask a question about multiple regression with high correlated predictors
遇到这样的regression问题Is there any correlation between the two data set?
有什么variable selection的方法可以用在Logistic regression上?抓狂!为啥选出来的predictor都这么差
问题:用VIF做feature selectionlogistic, overfit了怎么办?
大家做过这个面试题吗?Gene expression =?= Variable selection
紧急求助,问到MULTIPLE REGRESSION的题logistic regression issue
求助,怎么消除线性回归的multicollinearity什么SAS命令可以执行multivariate regression???
相关话题的讨论汇总
话题: 模型话题: 达人话题: 数据话题: stepwise话题: 请进
进入Statistics版参与讨论
1 (共1页)
w*********2
发帖数: 400
1
实在着急,怎么也做不出来了,
现在的问题是 :
我用stepwise和GLR分别做出来air 污染的模型,模型马马虎虎,R2有0.7,也有差的0.3,
无所谓了,我用好的.
可是当我找其他的实验数据验证的时候,差别很大了.比如,实验数据是12,可是模型出来
的是1000.
怎么办呢?
请达人给点建议,虽然我知道这些模型都是骗人的,但是还是想能混过毕业阿.
b********1
发帖数: 2861
2
首先你确定你选择的模型是正确的吗?如果你的数据关系不是简单的线性关系,那么可
能需要更复杂的模型。
其次,你建模之前,是否处理了你的数据,比如outlier,correlated相关的问题,你的
数据是否有代表性,分布如何等等
另外,stepwise是最省事的selection option, 但是很容易产生overfitting的问题,
所以需要谨慎使用
建模是统计分析里面最简单的一步,你的大量时间是用来分析你的数据,具有代表性的
数据,才会有好的预测效果
v*********0
发帖数: 941
3
Nice points.
By the way, could you give us more options about selection based on your
experience?? --> "另外,stepwise是最省事的selection option, 但是很容易产生
overfitting的问题"
Thanks very much and best wishes :)
所以需要谨慎使用

【在 b********1 的大作中提到】
: 首先你确定你选择的模型是正确的吗?如果你的数据关系不是简单的线性关系,那么可
: 能需要更复杂的模型。
: 其次,你建模之前,是否处理了你的数据,比如outlier,correlated相关的问题,你的
: 数据是否有代表性,分布如何等等
: 另外,stepwise是最省事的selection option, 但是很容易产生overfitting的问题,
: 所以需要谨慎使用
: 建模是统计分析里面最简单的一步,你的大量时间是用来分析你的数据,具有代表性的
: 数据,才会有好的预测效果

1 (共1页)
进入Statistics版参与讨论
相关主题
什么SAS命令可以执行multivariate regression???问题:用VIF做feature selection
请问关于LOGISTIC REGRESSION FORWARD VS BACKWARD大家做过这个面试题吗?
如何建立多重变量回归模型?紧急求助,问到MULTIPLE REGRESSION的题
问个logistic regression的问题。求助,怎么消除线性回归的multicollinearity
logistic regression结果释疑,解读Principal Components Analysis 中 factor 选择的问题
请教backward, forward and stepwise在做variable selection时的区别ask a question about multiple regression with high correlated predictors
遇到这样的regression问题Is there any correlation between the two data set?
有什么variable selection的方法可以用在Logistic regression上?抓狂!为啥选出来的predictor都这么差
相关话题的讨论汇总
话题: 模型话题: 达人话题: 数据话题: stepwise话题: 请进