由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Faculty版 - 问个统计问题
相关主题
问个文章发表credit的问题A statistic/econometric question
A statistic questionask for review
数据处理遇到了知识瓶颈campus visit
写的第一个proposal 连个分都没有博士毕业当faculty工资比去工业界高还是低?
nih R21格式求救materials science的, 找薄厚怎么这么难? (转载)
有同政府官员打过交道的同学吗?问一下这个回复是什么意思?
死了,死了!求救!投稿问题
onsite回来,感受及问题Onsite面试安排不开了,穿帮了咋整?
相关话题的讨论汇总
话题: sex话题: age话题: effect话题: y0
进入Faculty版参与讨论
1 (共1页)
z***b
发帖数: 4667
1
我在跑一个统计模型
800个数据点
Y=Y0+age+sex+age*sex---(1)
sex的p value不是significant
age的p value不是significant
age*sex的p value也不是significant的
但是跑
Y=Y0+age+sex---(2)
或者
Y=Y0+sex---(3)
sex的p value都是significant的
我的paper其他结果都证明sex有significant difference,为什么
这几个regression model结果差别这么大
如果age*sex 是无关项的话,为什么加了这个就导致sex不是significant
哪位前辈能提示一下或者解答一下
谢谢
l*****g
发帖数: 996
2
a sample size of 800 is not small but may still not provide enough power if
the effect size (check standardised regression coefficient) is very small.
it is possible that there is indeed interaction between age and sex, but the
interaction effect size is very small that the power in the current sample
size is not sufficient to detect it.

【在 z***b 的大作中提到】
: 我在跑一个统计模型
: 800个数据点
: Y=Y0+age+sex+age*sex---(1)
: sex的p value不是significant
: age的p value不是significant
: age*sex的p value也不是significant的
: 但是跑
: Y=Y0+age+sex---(2)
: 或者
: Y=Y0+sex---(3)

j********y
发帖数: 10
3
stat学生,尝试解释一下。
首先,应该可以认定,data set 不是balanced。
Linear regression 中的系数是一种conditional其他effects以后的系数,Eg :最复
杂的model中sex系数不 significant 表明,given effects of age,age*sex 以后,
sex不再significant。
希望有用。
e*******c
发帖数: 1479
4
我的理解是在你验证过sex age 无相互作用后,最后模型就不需要包含这个,你的理解
无关项任意放不准确
s**5
发帖数: 68
5
Try centering age and sex, looks like the main effect of sex is not
significant , but the marginal effect of sex is significant.
s******s
发帖数: 13035
6
这不是很正常么。
Y ~ sex就是看Y和sex的相关性,你放了其他垃圾,当然结果不一样。

【在 z***b 的大作中提到】
: 我在跑一个统计模型
: 800个数据点
: Y=Y0+age+sex+age*sex---(1)
: sex的p value不是significant
: age的p value不是significant
: age*sex的p value也不是significant的
: 但是跑
: Y=Y0+age+sex---(2)
: 或者
: Y=Y0+sex---(3)

t****r
发帖数: 702
7
it's called Multicolinearity. It is probabily because some columns of the de
sign matrix (age, sex, age*sex) have strong correlations (linearly dependent
),
which inflates standard errors of the coefficient estimator, leading to
insiginificant p-values. In otherwords, age*sex may have contained similar
information as those in age and sex, hence once you include age*sex, then
age and
sex become redundant. You can check pairwise correlations between age, sex
and age*sex to see if there is strong correlation. For a more formal check,
use the variance inflation factor (VIF).

【在 z***b 的大作中提到】
: 我在跑一个统计模型
: 800个数据点
: Y=Y0+age+sex+age*sex---(1)
: sex的p value不是significant
: age的p value不是significant
: age*sex的p value也不是significant的
: 但是跑
: Y=Y0+age+sex---(2)
: 或者
: Y=Y0+sex---(3)

q*******3
发帖数: 17
8
是不是可以先做F test,看看是否至少一个predictor related,然后再分别做t test
,三个predictor不同配对remodel一下,看看这样结果选择是不是有帮助。关于sample
size,还是看数据单个质量,如果很多outlier把model拉来拉去,有可能是这个
sample质量原因得不出预期结果,可以用bootstrap方法resampling看看mse有多大
l**********2
发帖数: 450
9
multicollinearity.
Still, why include the moderation effect? Do you have a theory for that?
s*********s
发帖数: 428
10
搭车问一下
interaction的显著性p value是不是以0.10来判断?
相关主题
有同政府官员打过交道的同学吗?A statistic/econometric question
死了,死了!求救!ask for review
onsite回来,感受及问题campus visit
进入Faculty版参与讨论
z***b
发帖数: 4667
11
我在跑一个统计模型
800个数据点
Y=Y0+age+sex+age*sex---(1)
sex的p value不是significant
age的p value不是significant
age*sex的p value也不是significant的
但是跑
Y=Y0+age+sex---(2)
或者
Y=Y0+sex---(3)
sex的p value都是significant的
我的paper其他结果都证明sex有significant difference,为什么
这几个regression model结果差别这么大
如果age*sex 是无关项的话,为什么加了这个就导致sex不是significant
哪位前辈能提示一下或者解答一下
谢谢
l*****g
发帖数: 996
12
a sample size of 800 is not small but may still not provide enough power if
the effect size (check standardised regression coefficient) is very small.
it is possible that there is indeed interaction between age and sex, but the
interaction effect size is very small that the power in the current sample
size is not sufficient to detect it.

【在 z***b 的大作中提到】
: 我在跑一个统计模型
: 800个数据点
: Y=Y0+age+sex+age*sex---(1)
: sex的p value不是significant
: age的p value不是significant
: age*sex的p value也不是significant的
: 但是跑
: Y=Y0+age+sex---(2)
: 或者
: Y=Y0+sex---(3)

j********y
发帖数: 10
13
stat学生,尝试解释一下。
首先,应该可以认定,data set 不是balanced。
Linear regression 中的系数是一种conditional其他effects以后的系数,Eg :最复
杂的model中sex系数不 significant 表明,given effects of age,age*sex 以后,
sex不再significant。
希望有用。
e*******c
发帖数: 1479
14
我的理解是在你验证过sex age 无相互作用后,最后模型就不需要包含这个,你的理解
无关项任意放不准确
s**5
发帖数: 68
15
Try centering age and sex, looks like the main effect of sex is not
significant , but the marginal effect of sex is significant.
s******s
发帖数: 13035
16
这不是很正常么。
Y ~ sex就是看Y和sex的相关性,你放了其他垃圾,当然结果不一样。

【在 z***b 的大作中提到】
: 我在跑一个统计模型
: 800个数据点
: Y=Y0+age+sex+age*sex---(1)
: sex的p value不是significant
: age的p value不是significant
: age*sex的p value也不是significant的
: 但是跑
: Y=Y0+age+sex---(2)
: 或者
: Y=Y0+sex---(3)

t****r
发帖数: 702
17
it's called Multicolinearity. It is probabily because some columns of the de
sign matrix (age, sex, age*sex) have strong correlations (linearly dependent
),
which inflates standard errors of the coefficient estimator, leading to
insiginificant p-values. In otherwords, age*sex may have contained similar
information as those in age and sex, hence once you include age*sex, then
age and
sex become redundant. You can check pairwise correlations between age, sex
and age*sex to see if there is strong correlation. For a more formal check,
use the variance inflation factor (VIF).

【在 z***b 的大作中提到】
: 我在跑一个统计模型
: 800个数据点
: Y=Y0+age+sex+age*sex---(1)
: sex的p value不是significant
: age的p value不是significant
: age*sex的p value也不是significant的
: 但是跑
: Y=Y0+age+sex---(2)
: 或者
: Y=Y0+sex---(3)

q*******3
发帖数: 17
18
是不是可以先做F test,看看是否至少一个predictor related,然后再分别做t test
,三个predictor不同配对remodel一下,看看这样结果选择是不是有帮助。关于sample
size,还是看数据单个质量,如果很多outlier把model拉来拉去,有可能是这个
sample质量原因得不出预期结果,可以用bootstrap方法resampling看看mse有多大
l**********2
发帖数: 450
19
multicollinearity.
Still, why include the moderation effect? Do you have a theory for that?
s*********s
发帖数: 428
20
搭车问一下
interaction的显著性p value是不是以0.10来判断?
S******e
发帖数: 112
21
看anova table的时候,用 type 3
m*******p
发帖数: 1978
22
multicolinearity, throw out interaction
1 (共1页)
进入Faculty版参与讨论
相关主题
Onsite面试安排不开了,穿帮了咋整?nih R21格式求救
What is the most significant piece of research you have read in the last year?有同政府官员打过交道的同学吗?
大家招生看本科学校吗?死了,死了!求救!
钱,货,吹 。。。onsite回来,感受及问题
问个文章发表credit的问题A statistic/econometric question
A statistic questionask for review
数据处理遇到了知识瓶颈campus visit
写的第一个proposal 连个分都没有博士毕业当faculty工资比去工业界高还是低?
相关话题的讨论汇总
话题: sex话题: age话题: effect话题: y0