z*****n 发帖数: 413 | 1 I don't think there is specific relationship between PCA and regression.
But covariates of regression can be replaced by PCs, if the X matrix has
strong colinearity. Or PCA is a good way to reduce the number of covariates.
I doubt the meaning of what LOUzhu did. For y=mu + b * x, b can be treated
as a scale of the x vector in the n-space. The first component of x,y should
be vector x+y, and this is non-sense if you haven't standardized your data
before PCA. |
|
m*****z 发帖数: 357 | 2 入门题目,比较初级,谢谢版上的各位先
在您bs俺的同时,顺便给俺解答下,俺不胜感谢。
刚才那个题目已经解了,我开始理解题意有点偏,谢谢楼下的解答
5个model
1)Y_ij = mu + epsilon_ij
2) Y_ij = mu_i + epsilon_ij
3)Y_ij = alpha + beta*X_ij + epsilon_ij
4) Y_ij = alpha_i + beta*X_ij + epsilon_ij
5) Y_ij = alpha_i + beta_i*X_ij + epsilon_ij
问R notaion for each model
Y - the response variable,
X - the continuous covariate
A - the discrete covariate
我的回答(不知道对错,2道做不出来。。。)
1)lm(Y~rep(mean(Y), length(Y)))
3) lm(Y~X)
4) lm(Y~X, A) |
|
s****a 发帖数: 296 | 3 Hello, sorry I cannot type in Chinese here. Please bear with me.
I have a question about analyzing longitudinal data.
Say I have repeated meaurements on both dependent(DV) and independent (IV)
variables.
My data in long-format looks like:
Subject time DV IV Cov1 Cov2
1 0 y10 x10 a10 b10
1 1 y11 x11 a11 b11
1 2 y12 x12 a12 b12
1 3 y13 x13 a13 b13
2 0 y20 x20 a20 b20
2 1 y21 x21 a21 b21
2 2 y22 x22 ... 阅读全帖 |
|
D**g 发帖数: 739 | 4 Are you sure that all the covariates and independent variable are time-
varying? Are those covariates categorical or continuous? |
|
m******u 发帖数: 277 | 5 总结一下面试被问到的一些问题。
General questions:
- Why are you interested in this position?
- Tell me something about yourself.
- Give me an example how you deal with challenging problems.
- Describe how you deal with multi tasks.
- Show us a writing example that you recently completed.
- What is your career goal in 5 years?
- How do you communicate with your collaborators?
- Have you ever worked on a project in a team? How did you do it?
Technical questions:
- How do you describe your SAS/R skills?
- Where d... 阅读全帖 |
|
d******9 发帖数: 134 | 6 lz这些data是做什么用的呢?
我最近做的一个project,用来match patients的若干covariates中有些也有missing
data. 我的advisor说用mean imputation既可,我有几个covariates有大约25%的
missing,他说这样的比例不能用imputation了。具体的threshold或者其他详细的
guideline我也不清楚,等其他人来解释吧。 |
|
w******8 发帖数: 59 | 7 Dear all, I am running this procedure for time dependent covariates. I also
have two time INDEPENDENT covariates: Age at baseline which is continuous;
HIVPatient ( a status indicating whether having HIV) which is binary.
The following codes works fine without adding HIVPatient, but I don't
understand why there is nothing estimated for HIVPatient once I included it.
I think this is weird. Could someone help me?
Thanks!
proc phreg data = OnePer;
class HIVPatient(PARAM=Reference Ref='0');
mod... 阅读全帖 |
|
c********d 发帖数: 253 | 8 你就把missing indicator对那些covariates做logistic regression,test 各
covariates的系数是否为0. 另外,确实mixed model对missing data处理更方便一些,
因为mar请况也适用,但问题是mar和nmar都是not testable的。 |
|
u*****8 发帖数: 180 | 9 两位高见。
实际上我尝试了把dose作为一个time dependent covariate. 难点也就是像你说的,怎
么设置这个参数。 我用90天的平均计量。
但是有个缺陷就是,用90天平均计量,会低估一些短episode (比如说一个人最近的
episode只用20天,高剂量,结果中毒了,但是90天的平均计量就变成一个低剂量),
这样不准确。
所以我既设置了个90天剂量做time dependent covariate做了个模型,又想用各自独立
的episode作为time-to-event measure来做一个我称作episode-based模型。
如果觉得我的做法不妥,请务必赐教。 |
|
A*******s 发帖数: 3942 | 10 is there parameterization problem in the second one? i think it treats the
unknown category as the reference category. Not sure if it is valid if no
intercept in the model.
not sure if this would work--1st step, fit the model with that categorical
variable and other covariates; 2nd step, fit the model without the
categorical one and fix the coeffs of other covariates in order to find the
intercept estimate.
or, treat the categorical variable as a random effect. two methods should
have very close... 阅读全帖 |
|
t********m 发帖数: 939 | 11 多谢你的回复。我们只关心病人第一次得病,病人第一次得病以后的数据都不会被用到
model中来。
我想bmi随时间的变化也是我们所关心的。我不是很明白你说的按照传统survival
analysis来做,就只能考虑发病那个月的bmi或者baseline的bmi,因为发病的病人可能
并不只是有两个bmi,比如说,如果有病人在36个月时发病,那么他的有效数据如下:
Obs ID MONTHS SEQ EVENT DAYS AGE BMI
80 12 0 1 0 0.001 45 26.10000038
81 12 12 2 0 372 46 31.60000038
82 12 24 3 0 759 47 31.5
83 12 36 4 1 1179 48 31.89999962
也就是说36个月以后的数据我们不关心,可是之前的包括36个月时候的数据都是我们所
关心的。而且如果病人... 阅读全帖 |
|
A*******s 发帖数: 3942 | 12 如果用cox regression,时间变量该用months还是days?
equivalent but hazard/mortality rate has different scale.
怎样考虑repeated measures,是否用id statement就够了?
time-dependent covariates suffice. id statement is for recurrent events.
看了一些书,说是如果有repeated measures时,在estimate coefficients时要考虑平
均效应,所以新建了一个变量seq和两个array变量。我不是很明白其中的原理。不知道
有没有大牛可以解释下,为什么要这样做?
u need to model the appropriate functional forms of time-dependent
covariates. moving average is one of them. other forms may include weighted
MA, EMMA, max, min, lag, ... 阅读全帖 |
|
y******g 发帖数: 26 | 13 error covariance?指的是error的covariance matrix吗,这个的话,不管什么
rotation都不会变吧 |
|
e*****r 发帖数: 621 | 14 Thank you so much, you got a baozi.
不过一个小问题是:我试的时候,如果把 age 去掉,就没有问题。但是一旦加上,就
告诉我 "age" is not in the covariate list。但是事实上在mlogit那一行里确实有
age这个 covariate呀。会是什么状况? |
|
y*****w 发帖数: 1350 | 15 Thanks for all the comments and suggestions. It seems mixture modeling is a
very effective way to handle this type of situation. However, not only do I
need a model for that variable to be an outcome variable, but I also need to
have the variable controlled for as a covariate in another model. In the
latter scenario, I think I still need some way to transform the variable --
is there any good way to do that? One example of the latter scenario is that
I want to create a model for the change in th... 阅读全帖 |
|
w*******9 发帖数: 1433 | 16 “accommodate the correlation by using time dependent covariates, reduce the
bias by introducing frailty terms.” 怎么与我的理解刚好相反?顺便问一句,大
牛工作中有没有遇到过logistic regression需要解决time dependent covariates 的
情况,你是如何解决的?比如预测PD,假设结婚不结婚买房不买房有影响,某人中途结
了婚买了房,你们是怎么处理这种情况的? |
|
a****a 发帖数: 3411 | 17 survivalsincespinessrs 是时间
vitalstatus 是 censor indicator
progressionofthespinalmet 是 time dependent covariate
futimespineprogression 是 time for time dependent covariate when value chang
e from 0 to 1.
id survivalsincespinessrs vitalstatus progressionofthespinalmet
futimespinep
rogression
1 7.4 1 1 6
2 8.9 1 0 6.9
3 9.9 1 0 5.3
4 36.7 1 0 35.7
5 77.4 1 1 36
6 16.3 ... 阅读全帖 |
|
y*c 发帖数: 247 | 18 There is no interactions in the model. Like linear regression, you plug the
means for the baseline covariates in the model in order to estimate group
means for the main treatment effect. But I have a time-dependent covariate
now. what should I plug in the equation? The average of the time-dependent
variable (infection during follow-up) across all visits and all patients?
what would be more meaningful? Hope somebody can help me.
|
|
Y******Y 发帖数: 8753 | 19 这个drug是作为covariate? 那你把它当作time-dependent covariate来model吧。 最
简单的就是create on/off drug indicator. 反正你的data都要变成counting
process format的。 这个很容易做到。就是在某一段时间这个indicator=1, 下一段时
间这个indicator=0, 在下一段又变成了1, sth like that. |
|
m*n 发帖数: 695 | 20 Covariates 里有5 个变量(age,gender, race, ES (一个环境因素的指标),MP (
一个检测指标), ,其中3个是连续变量。 我想看其中的MP(连续变量)会不会影响某
个疾病的发生( 患病还是不患病)。
1.如果我想控制其他4个变量, 看MP 是否和疾病有关系, 是否必须用enter 的方法
?
2.我试用了三种方法Enter, Forward LR and Backward LR
Enter 的方法结果表明, 在控制其他的因素时,MP 没统计意义, 只有ES 有统计意义
。 Forward LR and Backward LR, 结果都是最后表明ES 有意义。
3. 但是我还想看看ESxMP interaction 对疾病的发生有无意义。 所以又在Covariates
加入了第6个变量ESxMP,三种方法输出的三种不同的结果,而且不同于上面的结果。
Enter 的结果: MP 有统计意义了,ES 反而没有意义了。ESxMP interaction 的p=0.
051.
Forward LR的结果: 最后仍是只有ES 有统计意义
Backwa... 阅读全帖 |
|
w****f 发帖数: 22 | 21 线性关系可能不成立,可以加入 covariate的平方项及 interaction. 另外可以考虑每
个covariate 离散化,分成几个 level, 比如 高中低,再加入 interaction
quite
with |
|
y**3 发帖数: 267 | 22 Thanks, Danou!
I was not able to find concrete methods to forecast time dependent and time
varing covariates, especially for a large of observations. For time varying
covariates such as blood pressure, number of complaints, can I use lag, or
constant, or average to plug into the future forecast ? what is the common
practice in industries?
Thanks so much! Appreciatate it
to |
|
K******c 发帖数: 619 | 23 共线性是covariates之间的吧?你的repeated measure是 outcome 还是 covariates
还是都有? |
|
a*****i 发帖数: 1045 | 24 一个Mixed model的模型。两组人类,一组有病的,一组没有病,5个时间点,主要比较
他们的mmse score 随时间的变化,covariate 有年龄和housing conditions(3个不同
的housing conditions) 这这个model里面,我们用了random intercepts and random
slopes.
1. 在开始时间段,发现两组人类,两组的mmse score的variance 一组大,一组很
小,问问 mixed model 怎么take this into count, 还有两组observations,一组明显
很多人,一组很少人。想问问mixed model count for random effects, 那么人在这里
就是random effects, mixed model 是相当于两个个组分开做linear regression的,
所以并无所谓两组人,一组的variance很大,一组的variance很小。还有两组人数不一
样的问题,unbalance data都可以解决了吗?
2. 我们做了一个cor... 阅读全帖 |
|
t********y 发帖数: 166 | 25 就是covariance的推广。
以Gaussian process为例,Gaussian measure在Banach space上是通过 dual space来
定义的。
那么对于同一个space 上的两个Gaussian measure如何描述他们的关系呢?很自然的用
(cross)covariance。 |
|
w*****i 发帖数: 151 | 26 correlated data, multiple objectives and multiple covariates 是不是可以统称
为“covariant structures”?
求科普。谢谢! |
|
d******e 发帖数: 7844 | 27 covariate和predictor是针对特定问题,比如regression。
一些问题,比如PCA,里面并没有covariate或者predictor的概念。 |
|
d******e 发帖数: 7844 | 28 covariate和predictor是针对特定问题,比如regression。
一些问题,比如PCA,里面并没有covariate或者predictor的概念。 |
|
C*******a 发帖数: 448 | 29 有nxk的一组数据,包括n个数据,每个数据有k个covariate,
这k个covariate有的是numerical,有的是categorical,
现在任取一个数据,找出和它最‘相似’的10个数据,
这个在R里面怎么实现,改用那个包? |
|
c********1 发帖数: 60 | 30 On top of my head,要实现这个功能并没有现成的package或者function可以调用。
如果要自己写代码来实现的话感觉还颇有难度。如果采用euclidean distance to
measure similarity, the distance would be dominated by the distance of
numerical covariates. 换句话说categorical covariates is somewhat ignored in
the similarity metrics.
谷歌了下,关于similarity metrics of categorical variables没有简单现成的答案
,基本都是paper。不知版上诸多大牛是否有好的解决方法? |
|
t****n 发帖数: 2601 | 31 艾未未知道统计嘛,算术小学就很差啊,
比如
mode,Variance
Standard deviation
Covariance matrix
Regression analysis
Correlation coefficient
我觉得他还是继续从事他热爱舞蹈艺术比较娱乐观众。 |
|
w******y 发帖数: 8040 | 32 你这不是纯废话吗?
中国人是比较纯的population, 美国是非常混合的populations
前者绝大多数性状的方差都会低于后者, 等于是一个covariate你没考虑就直接fit
model |
|
w*********g 发帖数: 30882 | 33 高歌,现任北京航空航天大学能源动力学院动力工程及工程热物理学科一级责任教授,
航空发动机气动热力国防重点实验室副主任,长期从事动力工程、工程热物理及流体力
学领域的教学与科研工作,并在基础科研和多学科的应用技术领域取得了一系列国际领
先水平的创新性科研成果。
他在1984年发明的"沙丘驻涡火焰稳定器",获国家发明一等奖,钱学森同志称之为"一
项长中国人志气的重要发明"。该成果广泛应用于我国多种军用航空发动机中,取得了
数以亿元计的经济效益,至今仍保有先进水平。本刊记者于今年10月采访了高歌教授,
了解到了他近期从事的一些前沿科研工作的最新进展,尤其是他对龙卷风的研究及其工
程应用价值,让人耳目一新。
高歌教授在采访中提到,传统的航空发动机技术虽然还在不停地改进提高之中,但
受到原理和材料工艺上的限制,已经逐渐逼近了性能发展的极限。目前虽然涌现出一些
新型航空发动机技术,但仍然没有走出依靠压力膨胀过程来实现热功转换的思路。他强
调,人们应该另辟蹊径,寻找其他可用的工作原理。为此,他研究了自然界龙卷风的形
成与强化机制,发明了一项称为"余热增推"的技术,直接利用龙卷旋涡实现热功转换并
提取... 阅读全帖 |
|
g******2 发帖数: 234 | 34 好吧,我食言了,看到你说了这么多,又夹杂了这么多忽悠人的词汇,我还是忍不住回
了您这个统计"大牛"的帖子了。
1. 真正的推理是根据MLE推测出他们p的估计值
你只学过1,2门统计课,说出这样的话可以理解。 因为你见过的检验基本都是带参的。
这里我只想说,这句是不正确的,在非参的情况下,一般是没有MLE的 (MLE是最大似
然估计值)。另外,用MLE目的为何?为了得到最大power的检验。 很多情况下,这个
也是做不到的。 这个问题说多了就偏题了。
2. Fisher information matrix
你一定要把一个很简单的问题的最麻烦的叙述给拎出来么? 是的, Fisher
information matrix 用来计算MLE的variance的, 不过这种简单情况,根本不用这么
复杂的去算2阶导。
3. 因为covariance为0,所以可以简化成你那一步
你看了我之前关于独立性的描述了么?即使不独立也是可以做的,只不过因为正相关性
,得出方差更大。如果你还是看不懂我上面说的,你可以学一下数理统计1。
还想说一句,不是搬的专业术语越多就越显得你的专业的, 也不是言语中打压别人就... 阅读全帖 |
|
h******i 发帖数: 661 | 35 你们学校ap能发这么多paper?
1989
Cosmological implications of quasar-galaxy associations, L.Z.Fang, Y.Q.Chu
and X.F. Zhu, Mod. Phys. Lett., 4, 887.
Geometrical optics in an inhomogeneous universe, L.Z.Fang and X.P.Wu,
Chinese Phys. Lett., 6, 233.
Quasar clustering and its cosmological implication, L.Z.Fang, Inter. J. Mod.
Phys. A4, 3477.
L'Osservatorio astronomico di Pechino: la sua storia, il presente, L.Z.Fang,
Scienza e Tecnica, Annuario della EST 88/89 404.
Overview on the frontier of high energy astr... 阅读全帖 |
|
b***y 发帖数: 14281 | 36 No. The search include his early works up to 1978. Here is the same list
sorted by year.
1) The Influence of Gravitation on the Vacuum State.
By Li-Zhi Fang.
Acta Phys. Sinica 27 ( 1978) 181-18.
2) THE STRUCTURE AND STABILITY OF THE ABNORMAL NEUTRON STAR.
By Li-Zhi Fang, Qin-Yue Qu, Zhen-Ru Wang, Tan Lu, Liao-Fu Luo.
Sci.Sin.22:187-198,1979.
3) Some Recent Developments in Astrophysics. (Talk).
By Li-Zhi Fang, A. Qadir, R. Ruffini.
In *Nathiagali 1980, Proceedings, Physics and Contemporary Needs... 阅读全帖 |
|
S******8 发帖数: 24594 | 37 老方到美国后发的文章列表,你自己看吧:
1990
174. Biased clustering in a universe with hot dark matter and a cosmic
string, L.Z.Fang, S.P.Xiang and L.Yan, Astr. & Astrophys. 233, 1.
175. Periodicity of redshift distribution in a T-3 universe, L.Z.Fang, Astr.
& Astrophys. 239, 24.
176. An upper limit to quasar's peculiar velocity, L.Z.Fang, Y.Q.Chu, X.F.
Zhu and L.F. Wang, Inter. J. Mod. Phys., 5, 2993.
177. Quasar pair and quasar's peculiar velocity, L.Z.Fang, Developments in
general relativity, astrophysics and qu... 阅读全帖 |
|
|
k**********4 发帖数: 16092 | 39 唯一科学又ethical的方法是用人均收入及其他因子做covariate把自我灭门作为
dependent
variable 做回归分析,一个个案什么问题压说明不了 |
|
b****l 发帖数: 23606 | 40 其实就是最基本的组合投资理论。你需要学一点概率论,知道
一些mean, variance,covariance之间的关系,然后就可以列
二元二次方程了。然后互相倒来倒去求最大值。 |
|
d********m 发帖数: 3662 | 41 我同意前面某个帖子里的说法,赚钱就是靠计算能力预测下一毫秒的动态。
correlation总归是存在。算法相对快能把某个时间段每个毫秒的数据mapping到一个
covariance
matrix里,我相信能相对准确的预测下一个毫秒的数据with high probability。
外行班门弄斧了,说错了多多指教 |
|
b********n 发帖数: 38600 | 42 A and B 的 causality 的三个条件:
1. A is connected to B
2. A precedes B
3. A and B covary |
|
d**********i 发帖数: 524 | 43 We did find a significant association between political conservatism and
rs10952668 (Table 5). This SNP lies in LOC642355, a pseudogene on chromosome
7. Not surprisingly, the SNP also showed an association with the highly
correlated trait of Democrat versus Republican (b=0.260, P<
.02).
An interesting finding was that the SNP associated with political
conservatism, rs10952668, also showed marginal evidence for association with
the personality traits openness (b=0.142, P<.06) and
ag... 阅读全帖 |
|
d****o 发帖数: 32610 | 44 单看一个covariate当然信息少
但都是大数据的一部分 |
|
g*****y 发帖数: 438 | 45 这和我前面说的用多条舰组网差不多
就探测而言, 相控阵波达方向估计(谱估计)如果采用的是经典的MUSIC 算法对于接
收单元的间距是有要求的,好象是不超过半波长什么的,这个不是一个简单的TDOA的问
题。 如果采用网络的方法,不知道信息融合怎么搞,或许可以用一个超级Kalman
filter 在综合所有结果从而得到最有估计(这个严格说可能是有问题的,因为很难知
道网络中各个节点探测的误差实时 covariance)。
不过从大方向上来说,你我所说的方法应该是可行的。毕竟一个大的矩阵包含的信息要
大于几个组成它的小矩阵如果单独处理的结果。
乱说一气,大牛尽管拍。 |
|
y*****w 发帖数: 1350 | 46 Analysis of Covariance (ANCOVA)? |
|
T*********I 发帖数: 10729 | 47 这里有个研究是反驳全国司法部门种族歧视的。研究的方向主要是黑人白人毒品行为的
分析。
http://www.rand.org/pubs/external_publications/EP20061001.html
Published in: Drug and Alcohol Dependence, v. 84, no. 3, Oct. 2006, p. 264-
272
A recent study of arrest data show that African Americans are 2.5 times more
likely to be arrested for marijuana possession offences than Whites, even
though general prevalence estimates show that they are no more likely to be
using. The current study investigates the purchase patterns of marijuana
users from the... 阅读全帖 |
|
N*V 发帖数: 350 | 48 【 以下文字转载自 Military 讨论区 】
发信人: wayofflying (小破熊), 信区: Military
标 题: 人类第一台真空能发动机即将在中国攻关成功
发信站: BBS 未名空间站 (Sat May 14 22:28:25 2011, 美东)
高歌,现任北京航空航天大学能源动力学院动力工程及工程热物理学科一级责任教授,
航空发动机气动热力国防重点实验室副主任,长期从事动力工程、工程热物理及流体力
学领域的教学与科研工作,并在基础科研和多学科的应用技术领域取得了一系列国际领
先水平的创新性科研成果。
他在1984年发明的"沙丘驻涡火焰稳定器",获国家发明一等奖,钱学森同志称之为"一
项长中国人志气的重要发明"。该成果广泛应用于我国多种军用航空发动机中,取得了
数以亿元计的经济效益,至今仍保有先进水平。本刊记者于今年10月采访了高歌教授,
了解到了他近期从事的一些前沿科研工作的最新进展,尤其是他对龙卷风的研究及其工
程应用价值,让人耳目一新。
高歌教授在采访中提到,传统的航空发动机技术虽然还在不停地改进提高之中,但
受到原理和材料工艺上的限制,已经逐渐逼近了性能发... 阅读全帖 |
|
c****i 发帖数: 51 | 49 【 以下文字转载自 NewJersey 讨论区 】
发信人: covari (ance), 信区: NewJersey
标 题: 版上有人用过Plymouth Rock的汽车保险吗?
发信站: BBS 未名空间站 (Mon Jul 9 10:29:48 2012, 美东)
根本不知道这家公司,昨天只是在网上quote了Geico和progressive,以及其他几个,
最后决定买了Geico(半保+comprehensive+collision)。
今天早晨接到一个local的电话,说Plymouth Rock可以给比Geico低300的价格。好像都
没听说过这个公司。值不值得cancel Geico,换过来呢?
谢谢! |
|
m*****r 发帖数: 334 | 50 There are two job openings in our group, and these positions are related to
market risk/credit risk modeling and located at Tampa, FL (not in New York).
These are entry-level positions; I am looking for the candidates who are
fresh phd graduates. Since I want to fill in these two positions asap, if
you already had OPT or GC, it is a big plus.
If you are interested in it, please send me the resume asap.
Position 1:
Position Title: Risk Quantitative Analyst
Position Level: Entry-level
Job D... 阅读全帖 |
|