z***b 发帖数: 4667 | 1 我在跑一个统计模型
800个数据点
Y=Y0+age+sex+age*sex---(1)
sex的p value不是significant
age的p value不是significant
age*sex的p value也不是significant的
但是跑
Y=Y0+age+sex---(2)
或者
Y=Y0+sex---(3)
sex的p value都是significant的
我的paper其他结果都证明sex有significant difference,为什么
这几个regression model结果差别这么大
如果age*sex 是无关项的话,为什么加了这个就导致sex不是significant
哪位前辈能提示一下或者解答一下
谢谢 |
l*****g 发帖数: 996 | 2 a sample size of 800 is not small but may still not provide enough power if
the effect size (check standardised regression coefficient) is very small.
it is possible that there is indeed interaction between age and sex, but the
interaction effect size is very small that the power in the current sample
size is not sufficient to detect it.
【在 z***b 的大作中提到】 : 我在跑一个统计模型 : 800个数据点 : Y=Y0+age+sex+age*sex---(1) : sex的p value不是significant : age的p value不是significant : age*sex的p value也不是significant的 : 但是跑 : Y=Y0+age+sex---(2) : 或者 : Y=Y0+sex---(3)
|
j********y 发帖数: 10 | 3 stat学生,尝试解释一下。
首先,应该可以认定,data set 不是balanced。
Linear regression 中的系数是一种conditional其他effects以后的系数,Eg :最复
杂的model中sex系数不 significant 表明,given effects of age,age*sex 以后,
sex不再significant。
希望有用。 |
e*******c 发帖数: 1479 | 4 我的理解是在你验证过sex age 无相互作用后,最后模型就不需要包含这个,你的理解
无关项任意放不准确 |
s**5 发帖数: 68 | 5 Try centering age and sex, looks like the main effect of sex is not
significant , but the marginal effect of sex is significant. |
s******s 发帖数: 13035 | 6 这不是很正常么。
Y ~ sex就是看Y和sex的相关性,你放了其他垃圾,当然结果不一样。
【在 z***b 的大作中提到】 : 我在跑一个统计模型 : 800个数据点 : Y=Y0+age+sex+age*sex---(1) : sex的p value不是significant : age的p value不是significant : age*sex的p value也不是significant的 : 但是跑 : Y=Y0+age+sex---(2) : 或者 : Y=Y0+sex---(3)
|
t****r 发帖数: 702 | 7 it's called Multicolinearity. It is probabily because some columns of the de
sign matrix (age, sex, age*sex) have strong correlations (linearly dependent
),
which inflates standard errors of the coefficient estimator, leading to
insiginificant p-values. In otherwords, age*sex may have contained similar
information as those in age and sex, hence once you include age*sex, then
age and
sex become redundant. You can check pairwise correlations between age, sex
and age*sex to see if there is strong correlation. For a more formal check,
use the variance inflation factor (VIF).
【在 z***b 的大作中提到】 : 我在跑一个统计模型 : 800个数据点 : Y=Y0+age+sex+age*sex---(1) : sex的p value不是significant : age的p value不是significant : age*sex的p value也不是significant的 : 但是跑 : Y=Y0+age+sex---(2) : 或者 : Y=Y0+sex---(3)
|
q*******3 发帖数: 17 | 8 是不是可以先做F test,看看是否至少一个predictor related,然后再分别做t test
,三个predictor不同配对remodel一下,看看这样结果选择是不是有帮助。关于sample
size,还是看数据单个质量,如果很多outlier把model拉来拉去,有可能是这个
sample质量原因得不出预期结果,可以用bootstrap方法resampling看看mse有多大 |
l**********2 发帖数: 450 | 9 multicollinearity.
Still, why include the moderation effect? Do you have a theory for that? |
s*********s 发帖数: 428 | 10 搭车问一下
interaction的显著性p value是不是以0.10来判断? |
|
|
z***b 发帖数: 4667 | 11 我在跑一个统计模型
800个数据点
Y=Y0+age+sex+age*sex---(1)
sex的p value不是significant
age的p value不是significant
age*sex的p value也不是significant的
但是跑
Y=Y0+age+sex---(2)
或者
Y=Y0+sex---(3)
sex的p value都是significant的
我的paper其他结果都证明sex有significant difference,为什么
这几个regression model结果差别这么大
如果age*sex 是无关项的话,为什么加了这个就导致sex不是significant
哪位前辈能提示一下或者解答一下
谢谢 |
l*****g 发帖数: 996 | 12 a sample size of 800 is not small but may still not provide enough power if
the effect size (check standardised regression coefficient) is very small.
it is possible that there is indeed interaction between age and sex, but the
interaction effect size is very small that the power in the current sample
size is not sufficient to detect it.
【在 z***b 的大作中提到】 : 我在跑一个统计模型 : 800个数据点 : Y=Y0+age+sex+age*sex---(1) : sex的p value不是significant : age的p value不是significant : age*sex的p value也不是significant的 : 但是跑 : Y=Y0+age+sex---(2) : 或者 : Y=Y0+sex---(3)
|
j********y 发帖数: 10 | 13 stat学生,尝试解释一下。
首先,应该可以认定,data set 不是balanced。
Linear regression 中的系数是一种conditional其他effects以后的系数,Eg :最复
杂的model中sex系数不 significant 表明,given effects of age,age*sex 以后,
sex不再significant。
希望有用。 |
e*******c 发帖数: 1479 | 14 我的理解是在你验证过sex age 无相互作用后,最后模型就不需要包含这个,你的理解
无关项任意放不准确 |
s**5 发帖数: 68 | 15 Try centering age and sex, looks like the main effect of sex is not
significant , but the marginal effect of sex is significant. |
s******s 发帖数: 13035 | 16 这不是很正常么。
Y ~ sex就是看Y和sex的相关性,你放了其他垃圾,当然结果不一样。
【在 z***b 的大作中提到】 : 我在跑一个统计模型 : 800个数据点 : Y=Y0+age+sex+age*sex---(1) : sex的p value不是significant : age的p value不是significant : age*sex的p value也不是significant的 : 但是跑 : Y=Y0+age+sex---(2) : 或者 : Y=Y0+sex---(3)
|
t****r 发帖数: 702 | 17 it's called Multicolinearity. It is probabily because some columns of the de
sign matrix (age, sex, age*sex) have strong correlations (linearly dependent
),
which inflates standard errors of the coefficient estimator, leading to
insiginificant p-values. In otherwords, age*sex may have contained similar
information as those in age and sex, hence once you include age*sex, then
age and
sex become redundant. You can check pairwise correlations between age, sex
and age*sex to see if there is strong correlation. For a more formal check,
use the variance inflation factor (VIF).
【在 z***b 的大作中提到】 : 我在跑一个统计模型 : 800个数据点 : Y=Y0+age+sex+age*sex---(1) : sex的p value不是significant : age的p value不是significant : age*sex的p value也不是significant的 : 但是跑 : Y=Y0+age+sex---(2) : 或者 : Y=Y0+sex---(3)
|
q*******3 发帖数: 17 | 18 是不是可以先做F test,看看是否至少一个predictor related,然后再分别做t test
,三个predictor不同配对remodel一下,看看这样结果选择是不是有帮助。关于sample
size,还是看数据单个质量,如果很多outlier把model拉来拉去,有可能是这个
sample质量原因得不出预期结果,可以用bootstrap方法resampling看看mse有多大 |
l**********2 发帖数: 450 | 19 multicollinearity.
Still, why include the moderation effect? Do you have a theory for that? |
s*********s 发帖数: 428 | 20 搭车问一下
interaction的显著性p value是不是以0.10来判断? |
S******e 发帖数: 112 | 21 看anova table的时候,用 type 3 |
m*******p 发帖数: 1978 | 22 multicolinearity, throw out interaction |