w*********2 发帖数: 400 | 1 实在着急这里做不出来了,着急着今年毕业可是这部分作的差 .
现在的问题是 :
我用stepwise和GLR分别做出来air 污染的模型,模型马马虎虎,R2有0.7,也有差的0.3,
无所谓了,我用好的.
可是当我找其他的实验数据验证的时候,差别很大了.比如,实验数据是12,可是模型出来
的是1000.
怎么办呢?
请达人给点建议,虽然我知道这些模型都是骗人的,但是还是想能混过毕业阿. | J********9 发帖数: 36508 | 2 统计模型做大气....不就是全凭你调参数么。这些参数全是case specific。
话说回来,现在大气污染的物理模型嫩么多,steady/unsteady,小尺度/大
尺度,一次污染/二次污染,哪一样都能翻出几个来,为啥偏偏弄统计模型。
还有时间,学习学习大气扩散理论,弄点物理模型。EPA网站上就有很多。
【在 w*********2 的大作中提到】 : 实在着急这里做不出来了,着急着今年毕业可是这部分作的差 . : 现在的问题是 : : 我用stepwise和GLR分别做出来air 污染的模型,模型马马虎虎,R2有0.7,也有差的0.3, : 无所谓了,我用好的. : 可是当我找其他的实验数据验证的时候,差别很大了.比如,实验数据是12,可是模型出来 : 的是1000. : 怎么办呢? : 请达人给点建议,虽然我知道这些模型都是骗人的,但是还是想能混过毕业阿.
| w*********2 发帖数: 400 | 3 谢谢指点,
从新来新的是不可能了,打算5月毕业的,以后再学epa的模型吧.
现在就只好不停的调整参数了.
【在 J********9 的大作中提到】 : 统计模型做大气....不就是全凭你调参数么。这些参数全是case specific。 : 话说回来,现在大气污染的物理模型嫩么多,steady/unsteady,小尺度/大 : 尺度,一次污染/二次污染,哪一样都能翻出几个来,为啥偏偏弄统计模型。 : 还有时间,学习学习大气扩散理论,弄点物理模型。EPA网站上就有很多。
| J********9 发帖数: 36508 | 4 不是所有模型都是骗人的。很多物理模型,都有很多大气扩散理论,稳定度理论。
不过在我看来,统计模型做大气,绝对是骗人。
如果你非要弄统计模型,可以考虑用统计模型结合简单的box model,也比你纯统
计模型准。
【在 w*********2 的大作中提到】 : 实在着急这里做不出来了,着急着今年毕业可是这部分作的差 . : 现在的问题是 : : 我用stepwise和GLR分别做出来air 污染的模型,模型马马虎虎,R2有0.7,也有差的0.3, : 无所谓了,我用好的. : 可是当我找其他的实验数据验证的时候,差别很大了.比如,实验数据是12,可是模型出来 : 的是1000. : 怎么办呢? : 请达人给点建议,虽然我知道这些模型都是骗人的,但是还是想能混过毕业阿.
| J********9 发帖数: 36508 | 5 不调参数,还能怎么样。一套数据调出来的参数,用到另一套上,当然
会有问题,这就是case specific
谢谢指点,
从新来新的是不可能了,打算5月毕业的,以后再学epa的模型吧.
现在就只好不停的调整参数了.
【在 w*********2 的大作中提到】 : 谢谢指点, : 从新来新的是不可能了,打算5月毕业的,以后再学epa的模型吧. : 现在就只好不停的调整参数了.
| w*********2 发帖数: 400 | 6 谢谢您的建议!
我不太明白您说的统计模型和box结合,请再给点提示好么?
谢谢
【在 J********9 的大作中提到】 : 不是所有模型都是骗人的。很多物理模型,都有很多大气扩散理论,稳定度理论。 : 不过在我看来,统计模型做大气,绝对是骗人。 : 如果你非要弄统计模型,可以考虑用统计模型结合简单的box model,也比你纯统 : 计模型准。
| J********9 发帖数: 36508 | 7 你学统计的还是学环境的...
box model,不是box
去AE期刊查文章,看
【在 w*********2 的大作中提到】 : 谢谢您的建议! : 我不太明白您说的统计模型和box结合,请再给点提示好么? : 谢谢
| n******v 发帖数: 2184 | 8 我不知道你做什么污染物,但是1000这个数是crazy的。我的建议如下:
1. 检查两套数据的单位是否一致
2. 在fit model之前,认认真真做exploratory analysis,看看missing data和outlie
r等。
3. 关于variable selection,还是有很多其它options的。最近几年有几篇papers讨论
了如何更好的选择变量,不过这个需要比较强的统计背景。cross validation或许你可
以考虑一下,避免overfitting。
【在 w*********2 的大作中提到】 : 实在着急这里做不出来了,着急着今年毕业可是这部分作的差 . : 现在的问题是 : : 我用stepwise和GLR分别做出来air 污染的模型,模型马马虎虎,R2有0.7,也有差的0.3, : 无所谓了,我用好的. : 可是当我找其他的实验数据验证的时候,差别很大了.比如,实验数据是12,可是模型出来 : 的是1000. : 怎么办呢? : 请达人给点建议,虽然我知道这些模型都是骗人的,但是还是想能混过毕业阿.
| w*********2 发帖数: 400 | 9 谢谢!
我查了一下,发现data是有很大偏差。
建立模型的数据中,土地使用都是在偏居民区,而我去验证的时候,土地使用的类型却
不太一样了,有些相差8-9倍。
非常感谢你的建议。
outlie
【在 n******v 的大作中提到】 : 我不知道你做什么污染物,但是1000这个数是crazy的。我的建议如下: : 1. 检查两套数据的单位是否一致 : 2. 在fit model之前,认认真真做exploratory analysis,看看missing data和outlie : r等。 : 3. 关于variable selection,还是有很多其它options的。最近几年有几篇papers讨论 : 了如何更好的选择变量,不过这个需要比较强的统计背景。cross validation或许你可 : 以考虑一下,避免overfitting。
| p*******n 发帖数: 445 | 10 统计模型准不准倒不能下定论,最近看到有不少paper就是用统计模型来做大气,结果
貌似都还可以,而且resolution是骇人听闻的小,不过我觉得是right for wrong
reasons,而且我没看到一篇paper能解释清楚模型里用到的land use variable的物理
意义。就算统计模型的resolution再小,物理上也是没有太多意义的。
我觉得统计模型可能好用的地方就是处理traffic,尤其是物理模型没好的traffic
model时,统计模型还真能起到辅助作用。其实物理模型的问题也在于inventory是case
specific的,调整inventory的时候也挺夸张的,不过物理模型好歹能自圆其说。
【在 J********9 的大作中提到】 : 不是所有模型都是骗人的。很多物理模型,都有很多大气扩散理论,稳定度理论。 : 不过在我看来,统计模型做大气,绝对是骗人。 : 如果你非要弄统计模型,可以考虑用统计模型结合简单的box model,也比你纯统 : 计模型准。
|
|