z****n 发帖数: 67 | 1 请问SAS中proc mixed为什么没有Rsquare的输出? 理论上可以自及计算吗?
如果没有Rsquare怎么判断模型好坏呢? |
|
i*****r 发帖数: 1302 | 2 实际值为正的话,我的预测值为正,就OK
有时候有predictive power的模型Rsquare却很小,所以找别的 |
|
i*****r 发帖数: 1302 | 3 哎...其实我的想法是想抛开这些学术书本上的东西,这些东西谁都知道,想从更实际应
用的地方出发.比如regression,某些vairable在某段时间内有预测能力的,但可能从某
点开始作用就慢慢下降,也许不久又会上升.当你意识到的时候,比如tstats,rsquare变
小的时候,已经发生了太晚了.我就在想能不能有什么办法能early detect模型的变化,
能够及时换走variable或者干脆放弃使用 |
|
l******i 发帖数: 1404 | 4 得出的值方向不对,说明model本身有问题。
选择predictor:如果predictor数目多的话(注意multicollinearity),建议用
stepwise model selection;predictor数目少的话,用all subset search.
在所有感兴趣的model里用R_adjusted_square结合C(p)和PRESS(p)判断。也可以结合
AIC, BIC, SIC。判据越多越好。
不过唯一的最好办法:get much more data, need sample size to be large enough.
这样asymtotic理论下的所有test就有意义了。也就不存在你说的Rsquare一会儿大一会儿小的问题了。
结果实在差的很远,不整regression,用multifactor ANOVA Model
再不行,就用nonparametric approach呗,例如bootstrapping |
|
v*******e 发帖数: 11604 | 5
这太容易了。Pvalue can be as small as you want.
N=c(100,1000,10000,100000)
PValue=rep(as.numeric(NA),length(N))
RSquared=rep(as.numeric(NA),length(N))
for (i in 1:length(N)){
sigmma=rnorm(N[i],0,1)
x=rnorm(N[i],0,1)
y=0.1*x+sigmma
RSquared[i]=summary(lm(y~0+x))$"r.squared"
PValue[i]=summary(lm(y~0+x))$"coefficients"[1,4]
}
data.frame(N,RSqaured,PValue)
N RSquared PValue
1 1e+02 0.007324693 3.947863e-01
2 1e+03 0.014429159 1.392340e-04
3 1e+04 0.010822982 1.792036e-25
4 1e... 阅读全帖 |
|
s******d 发帖数: 538 | 6 问一个关于linear regression的问题,大家不要笑我。这个问题在我心里有一段时间
了,但一直未找到答案,恳请大家帮忙。就是,linear regression里有Rsquare,如果
Rquare大于一个数,好像是0。7,那么这个model就fit data well。但是linear
regression也有ANOVA和F test, 如果F test 的P-value 很小,例如小于0。05,那么
这个model就fit data well。 但如果有这种情形该怎么解释,就是Rsquare比较大,例
如大于0。9,但F test却不significant,i.e.F test的P-value 比较大,例如大于0。
5。long story short, 就是在linear regression 中,如果根据Rqsuare,这个model
fit data well,但如果根据F test,这个model又不fit data well,好像有矛盾,请
问这种情形真的会发生吗?真的发生了又该怎么解释?如果永远不会发生,其理由和根
据又是什么?多谢答复! |
|
i****x 发帖数: 17565 | 7 跟马力有关
你去做回归,马力对驱动轮宽度,绝对超高Rsquare
汽车工程师设计汽车时,一般不会用超过必须的轮胎宽度,否则油耗会有很大影响。
★ 发自iPhone App: ChineseWeb 7.7 |
|
i*****r 发帖数: 1302 | 8 如果我更在乎预测的方向正确与否,多于在乎绝对值是否正确.例如预测10个数值,8个方
向都和实际数值一样,虽然绝对值上有些偏差但我仍然满意
有哪些标准可以判定模型是否work或是break down? |
|
z****e 发帖数: 2024 | 9 你这个“方向”是怎么定义的?
我的理解是,你在判断哪些参数有意义是吗?
step wise 的话,用AIC行吧?
或者用BMA。Bayesian Model Averaging。 |
|
s********7 发帖数: 52 | 10 t stat for significance |
|
s********a 发帖数: 1100 | 11 mark
回lz
并不是是个数据就可以用regression的
不如试试nonparametric approach
ls说的非常好
enough.
会儿小的问题了。 |
|
s********a 发帖数: 1100 | 12 某些vairable在某段时间内有预测能力的
你是不是variable 就选的不对 overstate it的能力了。。 |
|
i*****r 发帖数: 1302 | 13 The qestion is: Is there a approach to early detect if a model is working or
breaking down?
regression只是个例子 |
|
l******i 发帖数: 1404 | 14
or
get much more data, need sample size to be large enough.
不考虑时间的话,也就是你所有数据都是independent的话,不管是不是regression,
你所有的model和test都是基于asymptotic theory。如果你的sample size足够大,你
的model checking又足够多了的话,你的model应该一直是对的,不会有突然间model
break down的问题。
如果考虑时间correlation的话,你要不停变换model的predictors和volatility w.r.t
. time,最好用用ARMA(1,1), GARCH(1,1) 等等financial econometric的model试试,
还有很多其他更复杂的time series model可以让你的model里很多东西都跟时间有关,
接下来怎么做要看具体情况了。 |
|
l******i 发帖数: 1404 | 15 经济良好市场稳定的时候,50%靠模型,50%靠经验。
经济不好市场不稳定的时候,100%靠经验。不管什么approach/model,在这种时候,都
是bullshit,市场无法模拟。 |
|
s********a 发帖数: 1100 | 16 no model is perfect
model would break down when extreme event happens
get more data if possible
or try adjust weights of each factor accoding to time change
or |
|
i******r 发帖数: 323 | 17 1。我用proc reg, ridge, 有一些c value, c=0 to 0.1 by 0.05, 我要在output里有
VIF 和r2,这样我可以判断哪个c最好。我用了
proc reg data=a outest=b outvif rsquare ridge=0 to 0.1 by 0.05;
但是,我的output里只有c=0 的rsqare, 后面就成了missing value.我不知道这对不对
,还有我用的是sas 9.1.
2。也是sas题, observations on Y are to be taken when x=10,20,30,40,50,
respectively. The true regression function is E{Y}=20+10x. The error terms
are independent and normally distributed, with E{error}=0 and variance=0.8x.
How to generate random Y observations for each X level i |
|
l***a 发帖数: 12410 | 18 yes. use rsquare option in model statement |
|
m****r 发帖数: 237 | 19 adj-Rsquare,还要看residual analysis...要符合线性模型的假设呀 |
|
s******g 发帖数: 193 | 20 【 以下文字转载自 JobHunting 讨论区 】
发信人: swanking (TJ Max), 信区: JobHunting
标 题: 有在找统计工作的人么?SAS问题求教
发信站: BBS 未名空间站 (Mon Mar 29 12:04:48 2010, 美东)
我导入一个excel文件后进行cluster analysis,导入过程一切顺利,但是不知道怎么
样分析,因为不知道怎么设置变量名。
我的做法是把excel第一行设置成变量名,数据从第二行开始,然后:
proc import datafile="D:\temp\table7_1.xls" out=table7_1 dbms=excel replace;
getnames=yes;
mixed=no;
scantext=yes;
run;
proc cluster data=table7_1 method=centroid simple noeigen rmsstd rsquare
nonorm out=tree;
id sid;
var income educ;
run;
sid income educ都是变量名,但 |
|
s*******y 发帖数: 2977 | 21 Rsqure大不一定是overfitting,跟你的number of variables and sample size都有关
系。建议看一看Frank Harrell的 regression modeling strategies。
lz的variable很多,建议fit model之前先检查colinearity,对于highly correlated
的variable,keep一个(比如说univariate fitting里rsquare最好的那个),然后再
用stepwise或penalized variable selection.不过2007年好像有个加拿大人写的一篇
文章做了很详细的simulation,比较了backward selection加或不加bootstrapping都
不会给出很好的结果,嘿嘿,eye-dropping conclusions。 |
|
a*****3 发帖数: 601 | 22 我在cterm底下啊 -机器染木马了浏览器不能开,sas每10保存一次,否则机器freeze写
的代码都没了。
反正这个图,x轴是rsqure, y轴是3,40个变量,在同一个cluster的变量是相邻的,根
据业务需要选取一个。随着rsquare的递减,cluster也递减。varclus还生成很多中间结
果 不过我也看不太懂。汗。 |
|
S********a 发帖数: 359 | 23 有个conditional logistic regression,想看AIC,但是结果里并没有给出来,请教什么
code或者命令把AIC求出来。谢谢。
> result0<-clogit(case~hr0+strata(subjid), data=mydata)
> summary(result0)
Call:
coxph(formula = Surv(rep(1, 9704L), case) ~ hr0 + strata(subjid),
data = mydata, method = "exact")
n=8397 (1307 observations deleted due to missingness)
coef exp(coef) se(coef) z Pr(>|z|)
hr0 0 0.001158 1.001158 0.005376 0.215 0.83
exp(coef) exp(-coef) lower .95 upper .95
hr0 1.001 ... 阅读全帖 |
|
c**i 发帖数: 234 | 24 现在是这么做的,但是fit出来Rsquare只有70%不到,不知道是不是因为response
variable不是follow normal distribution的缘故,是不是应该先把response
variable做一下transformation? |
|
l*******s 发帖数: 437 | 25 听有人说现在流行的是把比较大的数据分成十份后做统计分析,然后再比较分析这十份
,是吗?
另外还有个问题,我有个数据,大概有1000多个observation,十个variable,但是我
的dependent variable 不服从正态分布,transform之后也不行,这种情况下build
Linear regression model之后, Rsquare就很低,才0.02, residual plots也肯定不
好了。
请问应该怎么处理呢?
一并谢了! |
|
p********a 发帖数: 5352 | 26 ☆─────────────────────────────────────☆
cici (full house) 于 (Mon Nov 7 08:33:47 2011, 美东) 提到:
对于logistic regression
log(pi/1-pi)=b0+b1x1+b2x2
我现在已知independent variables和response variable{log(pi/1-pi)}
我要怎么做才能把参数b0,b1,b2 fit出来?非常感谢
☆─────────────────────────────────────☆
sleephare (I+don't+know.) 于 (Mon Nov 7 14:16:38 2011, 美东) 提到:
SAS, R?
☆─────────────────────────────────────☆
cici (full house) 于 (Mon Nov 7 16:19:05 2011, 美东) 提到:
R,thanks
☆────────────────────────────────────... 阅读全帖 |
|
mw 发帖数: 525 | 27 外行来问个外行的问题哈,在R里面做个lm
lm(A ~ 0+观测值)
得到的R只有0.001 0.002之类的,可是当我把观测值做个bracket,得到一个table
观测值 | A
-----------------
-0.003 -2
-0.002 -1
-0.001 -1
0 0
0.001 0
0.002 1
0.003 0
我觉得这里明明有一个很强烈的关系存在嘛 ,为什么Rsquare 这么低呢?
有没有专业人士给我解释一下?
谢谢了 |
|
E**********e 发帖数: 1736 | 28 如果高级项统计上不重要,当然可以drop掉。如果某个高级项重要,但是相应的一次项
不重要,就要保留一次项。这是统计上基本的东西。还有可以看别的一些metric,像
Rsquare。减去或加上某一项,AIC/BIC变化大不大。
:y~ 1+ a+b+c+ab+ac+bc+abc
: |
|