w*********2 发帖数: 400 | 1 实在着急,怎么也做不出来了,
现在的问题是 :
我用stepwise和GLR分别做出来air 污染的模型,模型马马虎虎,R2有0.7,也有差的0.3,
无所谓了,我用好的.
可是当我找其他的实验数据验证的时候,差别很大了.比如,实验数据是12,可是模型出来
的是1000.
怎么办呢?
请达人给点建议,虽然我知道这些模型都是骗人的,但是还是想能混过毕业阿. | b********1 发帖数: 2861 | 2 首先你确定你选择的模型是正确的吗?如果你的数据关系不是简单的线性关系,那么可
能需要更复杂的模型。
其次,你建模之前,是否处理了你的数据,比如outlier,correlated相关的问题,你的
数据是否有代表性,分布如何等等
另外,stepwise是最省事的selection option, 但是很容易产生overfitting的问题,
所以需要谨慎使用
建模是统计分析里面最简单的一步,你的大量时间是用来分析你的数据,具有代表性的
数据,才会有好的预测效果 | v*********0 发帖数: 941 | 3 Nice points.
By the way, could you give us more options about selection based on your
experience?? --> "另外,stepwise是最省事的selection option, 但是很容易产生
overfitting的问题"
Thanks very much and best wishes :)
所以需要谨慎使用
【在 b********1 的大作中提到】 : 首先你确定你选择的模型是正确的吗?如果你的数据关系不是简单的线性关系,那么可 : 能需要更复杂的模型。 : 其次,你建模之前,是否处理了你的数据,比如outlier,correlated相关的问题,你的 : 数据是否有代表性,分布如何等等 : 另外,stepwise是最省事的selection option, 但是很容易产生overfitting的问题, : 所以需要谨慎使用 : 建模是统计分析里面最简单的一步,你的大量时间是用来分析你的数据,具有代表性的 : 数据,才会有好的预测效果
|
|