H*H 发帖数: 472 | 1 大家好,最近在做排污方面的多元线性回归时遇到了一个问题,特来请教一下。
先简单说一下我的例子:
在工厂中,一年的时间内,他们会采取一到三种方法去测量排污量(例如200天用A设备
测,150天用B设备测,15天用C设备测);x1, x2, x3 就是在一年时间内分别用这三种
方法测的排污量,排污总量就是 Y = x1 + x2 + x3。然后工厂还会在年底根据其他方
法估算一年的排污量 Ye. Y 与 Ye这间就必然存在差别,这差别是由A,B, C三种设备
引起的;所以我就利用Y 与 Ye 之间的差别(△y)作为因变量,三种方法实测的量作
为自变量,构建了以下回归方程:
△y = a+ b1*x1 + b2*x2 + b3*x3
利用1000个工厂的数据进行回归, 结果是x1, x2, x3都是与△y 显著相关的;
b1 = -0.08; b2= 0.11; 而 b3 = 3.54
方法A会引起-8%的误差,方法B引起的误差是11%,这都在我们的估计范围内。但是方法
C 引起的误差 354%就远远超出了可能值。
我认为这是由于x3比较小引起的,利用ols方法作回归分析时,x3远小于x1跟x2的话是
不是就会引起x3的系数严重偏大的问题呢?我看了一下这1000个samples, x3的值基本
上只有x1跟x2的1%(因为C设备利用得很少,基本上是在A跟B都不工作的时候才得用C设
备工作,因此利用C设备所测的量x3很少,但是我们又不能忽略不计)
想请问一下在这种情况下,应该怎么处理回归方程,才会使方程对x3参数的估计更合理
呢?
在网上查了一下,也没有得到啥有意义的答案,所以就只能来这里请教一下了;还望高
手赐教,谢谢! | w**g 发帖数: 50 | 2 Normalize x1, x2 ans x3, then try it.
z1=x1/200; z2=x2/150; z3=x3/15
good luck! |
|