s******o 发帖数: 656 | 1 各路高人帮忙看下:
我现在在做一个包括很多国家的国际研究,碰到一个问题是感兴趣的单变量分析
correlation的系数和多元回归regression的系数方向全是相反的。regression的系数
是符合我的hypothesis的。
大概分析了一下,原因可能是美国的数据占绝大多数:总共有34000条左右的记录,美
国的数据占了超过30000条,其他国家加起来3000多条。
regression里我按国家调整了权重(weighted ols regression),做出来结果是感兴
趣的系数跟预期一样。但是pearson correlation的系数就全是反的,如果拿掉美国的
数据就没有这个问题。
我的问题是我想保留美国的数据(因为去掉美国的数据代表性就变弱了),同时让
correlation的系数和weighted regression方向一致。网上搜了一下似乎是有个
weighted correlation,但是不知道这么用在这里合不合适?用sas或者stata怎么实现
? | b*****n 发帖数: 685 | | y********0 发帖数: 638 | 3 如果regression加了权重系数的话,相关矩阵也是要加权重的.
像这种frequency weighting 或者item weighting相对来说简单.
一般我们的做法就是每一个record生成一个weight=expected proportion/actual
proportion.
sas 里的proc corr是有这个weight的,...spss也有相关的weight.. 我们有时候还在
excel里自己生成宏手动计算. stat就不知道了,
实在太久远了,都不知道怎么用了.
【在 s******o 的大作中提到】 : 各路高人帮忙看下: : 我现在在做一个包括很多国家的国际研究,碰到一个问题是感兴趣的单变量分析 : correlation的系数和多元回归regression的系数方向全是相反的。regression的系数 : 是符合我的hypothesis的。 : 大概分析了一下,原因可能是美国的数据占绝大多数:总共有34000条左右的记录,美 : 国的数据占了超过30000条,其他国家加起来3000多条。 : regression里我按国家调整了权重(weighted ols regression),做出来结果是感兴 : 趣的系数跟预期一样。但是pearson correlation的系数就全是反的,如果拿掉美国的 : 数据就没有这个问题。 : 我的问题是我想保留美国的数据(因为去掉美国的数据代表性就变弱了),同时让
| s******o 发帖数: 656 | 4 多谢多谢!
【在 y********0 的大作中提到】 : 如果regression加了权重系数的话,相关矩阵也是要加权重的. : 像这种frequency weighting 或者item weighting相对来说简单. : 一般我们的做法就是每一个record生成一个weight=expected proportion/actual : proportion. : sas 里的proc corr是有这个weight的,...spss也有相关的weight.. 我们有时候还在 : excel里自己生成宏手动计算. stat就不知道了, : 实在太久远了,都不知道怎么用了.
|
|