a*****y 发帖数: 17 | 1 把GIC看成是CD,是insurance公司issue的而不是银行。
期限一般不长,rate是set的,大的GIC可以negotiate rate.
Insurnace credit都很好,GIC credit rating一般比BIC
高(银行发的)
Insuranc公司会invest一些long term去back GIC
的gurrantee rate,很多management比如immunization.
对于投资者,在很大程度上GIC非常象CD。
不过GIC没有FDIC的back,CD有。 |
|
H*****l 发帖数: 702 | 2 你说的这个是toshiba最初做的一层一层网上叠
一开始matrix semi的东西,sandisk买了matrix和专利,后来转手给toshiba
最后sandisk靠倒腾这个赚了一番.
现在samsung,hynix的eyeing的是一层叠一层的floating gate BiCS
层叠加? |
|
F****3 发帖数: 1504 | 3 请问板上各位大神啊!
从000到255有256个数字,把这256个数字进行转换用字母a到j表示成密码,但是是三位
。请问可以知道每个数字对应哪个吗?谢谢!!!!
aaa
aab
aad
aag
aah
aai
abb
abc
abh
abj
aca
acg
adi
aea
aec
aed
aef
afc
afg
afh
agd
ahb
ahf
aib
aic
aie
aig
aje
aji
baf
baj
bbb
bbg
bbi
bbj
bcb
bcf
bci
bcj
bdc
bdf
bdh
beh
bfb
bfc
bff
bgd
bge
bgg
bgj
bhf
bhg
bhi
bib
bic
bid
bif
bjc
bjg
bjh
caa
cah
cca
ccg
cci
cdg
cef
ceh
cej
cfg
cfh
cga
chi
chj
cib
cih
cjb
cjf
cjj
daa
dac
dad
dae
dce
dcg
dda
ddd
ddh
deb
dec
ded
def
dff
dfh
dgb
dge
dgf
dhe
dia
dif
dii
djb
djc
eac
eai... 阅读全帖 |
|
发帖数: 1 | 4 OPEN POSITIONS in Statistics, Biostatistics, and Econometrics
Positions in:
Market Demand Analytic Team, Global Data Insight & Analytic, Ford Motor
Company
Location: Dearborn, MI
Position: A contract position through Sencom, Inc.
Position Type: Long term/permanent type
H1B /PR sponsor: Yes
Email: [email protected]/* */
Job Requirement
Position Description :
This position will develop analytical methodologies and specify data
requirements by translating business phenomena into appropriate... 阅读全帖 |
|
l******i 发帖数: 1404 | 5 得出的值方向不对,说明model本身有问题。
选择predictor:如果predictor数目多的话(注意multicollinearity),建议用
stepwise model selection;predictor数目少的话,用all subset search.
在所有感兴趣的model里用R_adjusted_square结合C(p)和PRESS(p)判断。也可以结合
AIC, BIC, SIC。判据越多越好。
不过唯一的最好办法:get much more data, need sample size to be large enough.
这样asymtotic理论下的所有test就有意义了。也就不存在你说的Rsquare一会儿大一会儿小的问题了。
结果实在差的很远,不整regression,用multifactor ANOVA Model
再不行,就用nonparametric approach呗,例如bootstrapping |
|
y*******o 发帖数: 6632 | 6 stepwise and calculated information lose weighted by variable number.
AIC, BIC.
不大 |
|
a**a 发帖数: 32 | 7 Stepwise, AIC, BIC, Bayesian Score, LASSO, BOOST. |
|
S***e 发帖数: 108 | 8 Residual plots?
Compare AIC or BIC? |
|
w**********y 发帖数: 1691 | 9 The easiest way might be AIC, BIC..
Further, Bayes Factor..But I don't think you can do that directly in R and
SAS...
Further, en, that is in the research of model selection.
I just realized, what you mean by HIERARCHICAL? they are hierarchical models?
Or do you mean they are nested?== Model A <=Model B?
If so, take suggestion from lapringles ..Fit each model by SAS, then get the
score of -2logL |
|
a*****z 发帖数: 87 | 10 it does not mean anything
supposed |
|
w**********n 发帖数: 5 | 11 做多元回归,共有4.50个自变量,500多个obs,但自变量之间有很强的共线性。用
elastic net方法做model selection,试了试一下子模型里有很多变量。要怎样可以筛
选这些变量呢?BIC value怎么算?相关R的命令怎么写? |
|
T******r 发帖数: 265 | 12 如果ereturn list 没有的话,最少可以自己算
local aic = -2*e(ll)+2*e(df_m)+2
local bic = -2*e(ll)+ln(e(N))*(e(df_m)+1) |
|
x*******u 发帖数: 500 | 13 但是svyset logist里 e(ll) 是missing, 也就是说它不计算ll
如果ereturn list 没有的话,最少可以自己算
local aic = -2*e(ll)+2*e(df_m)+2
local bic = -2*e(ll)+ln(e(N))*(e(df_m)+1) |
|
h******a 发帖数: 198 | 14 > print(summary(lme4_pre_wm1))
Linear mixed model fit by REML
Formula: log(fat) ~ time + time1 + gender + per_income + weight + t2 +
(time + gender + weight | subject)
Data: nurt_miss_n1989
AIC BIC logLik deviance REMLdev
117809 117973 -58886 117673 117773
Random effects:
Groups Name Variance Std.Dev. Corr
subject (Intercept) 3.7478e-01 0.6121924
time 4.8376e-04 0.0219946 -0.216
gender1 |
|
v*****a 发帖数: 1332 | 15 我本身也在学统计,
但是我来说两句“踢场子”的话
您老说的这些,基本上都是错的。
1,“统计学”是科学,但“应用统计”是伪科学。
“统计学”是什么?是“费马”(或者是伯努利?拉普拉斯?)大哥赌色子发明的一门
科学(应该是他们几个老人家吧)。
所有概率学阿,统计学阿都是建立在你有正确的模型的基础上的。
以猜硬币为例,随便你怎么搞,怎么P—VALUE,AIC,BIC,你再怎么搞还是搞博努力吧
。如果我工程上有机会出现硬币立在桌上怎么办?你们所有的分析的根基就错了。所以
说,“应用统计”只是一种方法,而不是一门科学。
总结:不要太高估计“统计”在工程上的正确性。
2,在“非统计本专业内”,统计工作着很难证明自己。
比如我是写程序的,公司没有我,就没有这个程序,就无法正常运行。
而搞统计的呢?你只能帮助写程序的人用更好的方法来解决问题。
也就是说,没有搞统计的,只有写代码的,公司还能凑合运行(可能不怎么正确,而且
效率低下);如果只留搞统计的人下来的话,公司没办法运转。
3,“专业学统计5-6年”的人不一定好找工作。
恕我直言,学得时间越长,越钻得深,找“非统计本专业内”的工作,可能会越吃亏。 |
|
l*******y 发帖数: 22 | 16 不知道你的数据是否都是连续的?
我的经验是,做factor analysis有几个必要的步骤
第一,要有domain knowledge。一般去收集数据的人,心中对于有几个factor都大概有
个底。而且在统计分析完成以
后,并且model is verified statistically,背景知识至少也要能解释你的发现。
其次,如果数据是连续的,首先应当将相关矩阵画出来,(维数小的时候肉眼就可以看
出到底有几个类,比如你用
threshold cut掉一些elements)。如果维数很大,可以用一些基于permutation的算法
将聚类自动调整出来。这两步做完
以后,心里基本上就有个大概的了解了。这两部分虽然简单,其实在实际中很重要。
最后,也就是定量分析阶段,这个时候可以选用的模型就太多了。但是最终选用几个
factor,还是需要用定量分析的办法比
一比的。比如你现在的4个vs7个,就是一个很典型的例子。怎么比呢?方法太多了,比
如aic,bic,似然检验,bayesian
factor。但是直观来看,你variable才10几个,聚类就有7个,overfitting的概率实在 |
|
D******6 发帖数: 6211 | 17 AIC BIC?你去google一下看是否合适。 |
|
h***i 发帖数: 3844 | 18 这么一说,那aic,bic之类的都不考虑了。
那就考虑structure risk minimization 之类的了 |
|
s*r 发帖数: 2757 | 19 bic is better than aic to get a smaller model
they are old. there are many recent development on this area |
|
P****D 发帖数: 11146 | 20 Try each covariance structure and then compare the AIC, AICC, and BIC. |
|
d******e 发帖数: 7844 | 21 你这是什么公司啊?居然考这些问题?
1. grouping是什么概念?第一题不就是说明X1不足以解释Y的么?
2. 赶时髦的话可以试试Lasso, Elastic net或者其他shrinkage methods?
3. BIC,AIC,Cross Validation,Generalized Degree of Freedom, Convariance
Penalty等等?
5. 这个老师上课说过,一般是把所有的marginal的variable都算进去,因为漏掉一个
variable比多一个冗余variable对model的影响要大得多。
important
no
the
should |
|
s*******e 发帖数: 226 | 22 I got your point, which helps indeed. But in your example, you assume
y=a+bx is the correct form. By the same token, if we assume y=bx is the
correct model, the results will be different.
If you try the following;
data two;
DO x=0 TO 100 BY 1;
y=UNIFORM (0)*10*x;
OUTPUT ;
END;
run;
title "with intercept";
proc mixed data=two;
model y=x /s;
run;
title "without intercept";
proc mixed data=two;
model y=x /s noint;
run;
You will find the model without intercept has a bit lower BIC and x is
much more |
|
D*******a 发帖数: 207 | 23 能自学PCA,不错。PCA的用处是减小需要的自变量维数。说不定对你的问题还是有帮助
的。
如果能自学PCA,自然能自学AIC,BIC。这些就是用来去掉多余的自变量的。 |
|
D*******a 发帖数: 207 | 24 下面是我的想法,不一定对。我想主要是因为这个highly的门槛难选吧。多大算highly
? 如果两个变量和结果的关系很紧,则这个门槛要高些才好。如果两个变量都不太重
要,则低点好。你自己凭感觉去去掉,不放心吧。而AIC,BIC什么的,他们的门限就有
理论基础,放心。 |
|
h*******d 发帖数: 272 | 25 好 我去找AIC BIC 去了 太谢谢了 :-)
highly |
|
h*******d 发帖数: 272 | 26 谢谢您的回复
我又迷糊了 那。。。。先用AIC,BIC减少参数, 再用PCA 分析?
:-( 。。。 |
|
f******h 发帖数: 46 | 27 这是个ad hoc(?)的建模,并不适合controlled experiment :)
你说的很对,如果model里面的predictor都和response很相关,那很可以理解他们也非
常可能存在很大的multicollinearity。不过是不是和response相关度大并不是我最终
追求的,我追求的只是,完成清理multicollinearity以后得到的variable subset,在
接下来的variable selection中给我尽可能接近最优解的model
(也许像前面人说的,不能通过R^2来判断这个model优劣,而需要切实validate
model的predictive performance)
而我现在怀疑的是,我在处理multicolinearity的过程中,使用的方法是不是得当。或
者说有没有比较被接受认同的常用筛选方法。
希望我表达清楚了疑问点。。。
if
you
bic
whether |
|
T*******I 发帖数: 5138 | 28 Hi, A大侠,
我一直没搞懂AIC或BIC是个什么东西。它们在统计建模中有何作用?其决定模型的
逻辑基础是什么?我问过SAS的Support Center,专家们说,当你用一个全样本空间建
单一的一个logistic模型时,尽管SAS系统也输出AIC的结果,但这个AIC没有任何意义
,即使在变量选择性的基础上(例如逐步回归)建立模型时,模型的确定也不是由最小
的AIC决定的,而是由进入或剔除变量的临界概率值决定的。因此,这个回答搞得我晕
头转向。既然如此,AIC在logistic回归分析中究竟起什么作用?望你能够一个比较有
说服力的解释。多谢了。
顺便请教你的回答中的几个术语的含义:什么是train error? 什么是test error?
如何理解model的overfit as well as the penalty to overfit? 如果一个model被判
定overfit,如何确定针对overfit的penalty的随机测量?多谢! |
|
A*******s 发帖数: 3942 | 29 致T大师,
不要叫我大侠,折寿啊。
AIC,BIC都是goodness of fit statistics,就是衡量几个model哪个fit得更好呗。我
觉得sas专家的意思是,sas的AUTOMATIC model selection只能stepwise/forward/
backward。Goodness of fit stat肯定不能作为AUTOMATIC model selection的标准,
因为你得比较2^n个模型才行。但如果你只有几个模型可以比较,而且是用人脑而不是
用电脑做选择,为啥不能用AIC呢?
train error就是对于training data而言,test error就是对于test data而言。你看
楼上给出来的AIC公式就知道penalty是怎么样的了。我不大了解有啥普遍的方法是衡量
overfit的,看AIC的公式好像这个penalty也是拍脑袋想出来的:). 我平时一般用cross
validation来避免overfit。
error? |
|
p**********l 发帖数: 1160 | 30 明天下午有一个电面 (刚被通知), 他们会问什么问题呢?
保险公司需要什么样的modeling 的经验呢?
time series modeling? model selection according to BIC, AIC? Model
diagnostics by checking residuals?
还是别的。
读了一个master, 似乎还是什么都不懂。 请大家指教。不胜感激。 |
|
A*******s 发帖数: 3942 | 31 一般来说他是想问你用什么model evaluation的方法吧,比如说sse, r-sqr, aic, bic
, ks, roc curve, misclassification rate...
如果是指定了两种不同的data mining方法要比较的话,那得说说各自的优缺点啥的,
比如说 scale sensitivity, robustness, nonlinearity, computation intensity,
interpretation之类的。
这类问题太广泛,我觉得这不是单纯的技术问题,面试官也会考察你如何通过交流得知
他想问的是啥。 |
|
|
w********o 发帖数: 1621 | 33 Use likelihood. Compared it to the likelihood of a null model. The bigger
the likelihood is, the better is the model fitting. From underlying
rationales of AIC, BIC for mixed models. |
|
f***a 发帖数: 329 | 34 我觉得有两个概念很容易弄混,一个是model的goodness of fit,一个是model
selection。
前面一个是判断某一个model和data是不是fit很好,后一个判断一些candidate models
中哪一个和data最吻合。用model selection方法的时候,当你从candidate models找
出最吻合的那个model时,不能直接就判断那个model的goodness of fit就是很好的。
有可能所有candidate models都差,矮子中拔高个的结果而已。
有很多常用的方法,不过最好具体model、具体数据类型具体分析,找到最合适的方法
。譬如AIC就有很多变种,对应不同类型的数据结构。我列举一些希望对楼主有用。
General model selection methods:
1) common tests: wald Z, chi-square, t, F etc
2) likelihood ratio test and its variants
3) information criteria methods: AIC,BIC, a |
|
d*******o 发帖数: 493 | 35 您就一点幽默感都没有,看骂我骂的像孙子一样,这样大家就没人和您一起玩了。
上头的精算兄不是说了吗,您这模型没有validation和cross-validation. Too much
complexity causes over-fitting. 您的模型就算fits train dataset perfectly,但是
能用吗?像我们这些天天跑模型的马仔,拿着train过以后没有validate的模型跟老板
汇报,不是找
骂吗。
似乎您没有做过模型,只接触过一些AIC, BIC之类的。这样吧,我就跟您指条捷径吧。
SAS里面有个
procedure叫proc glmselect. SAS有个帮助文档,后面有两个例子,您要用sas的话就
跑一下,
您就知道什么叫做validation和cross-validation了。 |
|
g**r 发帖数: 425 | 36 我觉得你应该是看x2是不是比x1更能解释y的VARIANCE,或者说,你的MODEL2是不是比
MODEL1 更好。
如果只是看这个,问题就简单了。你看AJUSTED R2就是了。或者看AIC,BIC,一句话,
比较那个MODEL更FIT就行了。
而X1和X2的系数是否相同,我觉得应该是个不相干的问题:毕竟你重新SCALE一下 (比
如x3=x2/5),系数就不一样了,但不影响MODEL FIT。
所以我觉得你的RESEARCH QUESTION应该是MODEL SELECTION,而不是系数比较。 |
|
p*b 发帖数: 30 | 37 一个简单的方法是先把有NA的那些patient删去,然后用Bernounlli(p)来model output。
具体来说,就是对于5个model:1,2,3; 12,3; 13,2; 1,23;
123. 分别算出各个group的estimate of p,然后用BIC之类的来选model。 这样
就可以通过p的大小以及drug是不是被分在同一个group来确定哪种最好。 |
|
d******e 发帖数: 7844 | 38 ... ...怎么可能不用求呢,做BIC的Model Selection可是需要likelihood的 |
|
A*******s 发帖数: 3942 | 39 likelihood will increase with # of obs. it may not be bad if u have large
dataset. and AIC/BIC/-2logl are only for comparison. try other models to see
whose AIC or validation SSE is smaller. |
|
S********a 发帖数: 359 | 40 下面output最后三行correlation,怎么解释啊,time是fixed effect, id 是random effect, 那么最后的correlation是time 和intercept的correlation?
> #compound symmetry
> fit.gls.cs <- gls(y~time, data=willett, corr=corCompSymm(, form=~time | id
))
> summary(fit.gls.cs)
Generalized least squares fit by REML
Model: y ~ time
Data: willett
AIC BIC logLik
1308.340 1320.049 -650.1698
Correlation Structure: Compound symmetry
Formula: ~time | id
Parameter estimate(s):
Rho
0.7061649
Coefficients:
... 阅读全帖 |
|
d******o 发帖数: 59 | 41 if R^2 is the same. consider BIC. the second one should be better. |
|
a******n 发帖数: 11246 | 42 先看各种指标比如R-squared, adj. R-squared, mellow's Cp, AIC, BIC,...
反正公说公有理,婆说婆有理。
然后要考虑p的范围,比如有些model p是集中在0或者1附近的,
这种情况下可以看ROC curve,比较sensitivity神马的。
希望大牛们指正+补充。 |
|
A*******s 发帖数: 3942 | 43 cv is normally used for choosing the best tuning parameter. or AIC and BIC/
SBC if sample size is sufficient.
的t |
|
d******e 发帖数: 7844 | 44 之所以叫他tuning parameter就是因为要tune啊。基本都是基于grid search来做的。
选择lambda的方法有很多,根据目的不同(prediction或者model selection)选择方
式也不同。
除了Cross validation外还有Extended BIC,Stability Selection,StARS等等。 |
|
p******k 发帖数: 23 | 45 对于高维数据(p~n,或 p>n)LQA或LLA 基本上是很难做的, 里面的矩阵求逆很容易就
出现singular. 用lasso做变量选择基本都是高伟数据, 如果低维的话直接用BIC好了
。 高维IRLS还是会出很多问题的。 |
|
|
a***g 发帖数: 2761 | 47 应该aic用的k-l divergence, bic用的不是
不过我这里有几点不太明白的地方
这里拟合的地方是指把A怎么处理?A是给定的,那么X和Y是不是实现给定的值
我看的感觉是它们不是预先给定,可能是通过mle得到的一组参数的值。当然这个也不
是最重要的。
现在我主要有一个疑惑,通过看你的帖子不太明白。当然我的疑问也不一定合理,一起
探讨一下吧。
我就按我的理解来说,在最开始拟合的时候我们是不是可以把形式写成这样:X=f(A,F)
这里F为一个分布,你把n(0,1)写在右边,我的感觉就是假设正态假定成立,然后开始用
mle估计参数。也就是先假定F=N(0,1)。那么到底F是不是正态,只能说靠过去的经验或
者是蒙的。这里就有了一个要考虑的地方,X和Y两个模型是不是不受F的影响,或者说
是否受F的影响很小。如果F对f有影响,X更贴合数据,Y更迎合正态假设,那么完全可能
出现你说的这个情况:即使在正态假定成立的情况下,拟合的时候X仍然有比较大的似然,
在考虑反过来的时候,由于F也不一定就是正态,所以Y可能通过反函数相对N(0,1)得到更
大的似然。关键就在你通过反函数再次来做衡量,这里逻... 阅读全帖 |
|
n*****n 发帖数: 3123 | 48 【 以下文字转载自 Biology 讨论区 】
发信人: vviiasa (vviiasa), 信区: Biology
标 题: Re: authorship遇到麻烦
发信站: BBS 未名空间站 (Thu Jul 28 16:27:32 2011, 美东)
所谓的高级算法,还不是呼悠搞生物的哥们。。。
其实都是最简单的,(当然对于搞生物的来说,很FANCY拉)
真正的高级算法,要留着学计算机的自己发BIOINFORMATICS
至于数据会马上发光,简直是一定的。
这个效果绝对比学统计的都厉害。。。
(虽然学统计的,搞同一组数据,能得出截然不同的结果,AIC,BIC随你选)
统计是伪科学,已经深入人心了。
下一步计算机(算法)就快变伪科学拉。。。 |
|
A*******s 发帖数: 3942 | 49 来自主题: Statistics版 - 一个理论题 不懂...不过你要是用GLM的方法来搞得话,啥AIC,BIC应该是general的吧 |
|
c********d 发帖数: 253 | 50 来自主题: Statistics版 - 一个理论题 这个可以比较两个model的aic或bic,likelihood ratio不适用于这里。 |
|