s*****0 发帖数: 357 | 1 周末杂事比较多,小孩的playdate,还有和朋友约定的网战等等,未能及时更新,见谅。
感谢楼上hbsr2010的一些概念更正,平时理论接触的少了,记忆有偏差,因为在网上随
便写些,也懒得查书,写的时候随兴所至,没有太注意。我尽量让文笔轻快些,让读者
不至于厌烦。以后尽量会避免误导,如有不确实之处,请务必指正。先行谢过了,因为
有自己的一摊东西要收拾,不能像做科研那样严谨了。
前文提到的t test, one way ANOVA以及相关的nonparametric都只有涉及到一个
variable,比如作对照实验,variable即treatment type,不同计量药物或者是
placebo。组和组的区分是由这个variable决定的。在涉及到更为复杂的模型前(比如
two way ANOVA, multiple regression),我觉得还是先唠叨唠叨categorical data的
统计方法,毕竟做multiple regression之类的工作需要一定的统计背景,平时远没有
Chi-square这样的test用得多。所以先简后难了。
Categorical data在生... 阅读全帖 |
|
c**a 发帖数: 94 | 2 一组4个条件,分别是
1, 不给药
2, 给药
3, 在另一条件下,不给药
4, 在与3同样条件下,给药
想知道, 1和2之间, 3和4之间, 1和3之间有没有显著差异.
用什么?
1-way ANOVA+ Bonferroni?
另外一种情况,
数细胞个数, 2种条件(给药和不给药), 每个条件下有2个phenotype(方的圆的), 所以一共4个数据,
想比较同种phenotype, 在给药和不给药之间的不同.
用什么?
t test?
还有一个情况,类似上面
6个条件,每个条件4种phenotype, 一共24个数据, 相互比较. 用什么?
1-way ANOVA?
快崩溃了... |
|
s******h 发帖数: 47 | 3 two-way ANOVA is the perfect tool for doing that from a strict statistic
point of view. However, I do know most biological people usually use T-test
to compare 2 groups of data at a certain timepoint. If that way does not
cause reviewers' concern, it does not bother readers too much any way. If it
does, you have to do 2-way ANOVA, then post-hoc. |
|
v***a 发帖数: 1242 | 4 虽然会用软件,但不明白这两者的具体区别。。。
请教大牛用通俗易懂的语言解释一下
多谢了 |
|
A****t 发帖数: 141 | 5 one-way=one factor
two-way=two factors |
|
|
s*******1 发帖数: 146 | 7 You cannot use ANOVA (assume one way-ANOVA) for your data if you don't know
whether the data follow a normal distribution. As you showed that you only
had 6 samples, the dataset is very small so you can not assume the data are
in normal distribution. But you can use Kruskal-Wallis test to examine
whether the two groups are different.
The n should be 6. |
|
e*******o 发帖数: 4654 | 8 没遇到过类似的情况。
anova使用的前提是正态分布,如果不是正态或者不能转化为正态,要用非参数方法。
与oneway-anova对应的是Kruskal-Wallis test。
如果是我,我会两种方法都用,看结果再说,你懂的。 |
|
|
M*******y 发帖数: 102 | 10 如果每天测的是只是为了重复,拿这个就是repeated measurement. 基本就是一个三组
单条件的ANOVA。
如果时间上有变化,那么可以是双条件的ANOVA,或者是time series |
|
K**R 发帖数: 193 | 11 个人感觉,其实anova 有时候不太适合生物,虽然整体都明显,显著性不好,毕竟生物
variation比较大,
比如10, 7, 5,
第二组 2.8 3.1, 3.1
第三组 1.2, 1.7, 1.9
用anova 可能就没有差异,因为第一组variation大, |
|
j*****u 发帖数: 285 | 12 用的是graph pad,one-way anova 有让选择 post test, tukey, bofferoni 之类的,
但two-way anova就看不到有这个选项了 |
|
n****d 发帖数: 26 | 13 你每个sub 的15个assay之间不是独立样本,我觉得你这个得用 repeated ANOVA.
google repeated ANOVA R, 网上例子很多的。 |
|
w*z 发帖数: 71 | 14 For balanced data the REML method provides estimators and hypotheses test
results that are identical to ANOVA (OLS method), provided that the ANOVA
estimators of variance components are not negative. The estimators are
unbiased and have minimum variance properties. The ML estimators are biased in
that case. |
|
r*****g 发帖数: 99 | 15 我刚刚开始学ANOVA,遇到一个题目:
40 subjects 随机分到 4 个 不同 diet groups 里面,每个group 10 个 subjects,
比较血液中铅含量指标, 已知数据如下:
Group 1 2 3 4
Means 20 22 25 21
Variances 7 12 15 10
求 sd of the difference of two observed treatment means?
我的想法是把两两group的difference 绝对值求出来 (请问是否应当用绝对值?),
一共6个值,然后再求平均值,用这6个difference的值分别减去平均值,平方和相加,
再除以自由度5 ,然后开根号,对吗?
这样做的话似乎跟ANOVA没有直接关系了。
谢谢。 |
|
l**y 发帖数: 2103 | 16 来自主题: Statistics版 - 【包子题】 (1)一个within subject 的design,两个Independent Variable,A 和 B。
(2)A 有两个水平 A1 A2,B 有四个水平B1 B2 B3 B4。
(3)实验假设是 A1 A2 只在B1 的水平上有差距,在其他的B上没有差距。
(4)实验结果用Repeated measures ANOVA 检验,结果发现 A 的main effect 显著但
是 A与B的interaction 不显著,这样看来与我的假设不相符。
(5)接下来我用planned comparison 比较在B的不同水平下,A1与A2的差别,发现在
B1下,A1 与 A2 不同,但是在其他B的水平下,A1与A2没有显著差异。这与我的假设是
一致的。
我的问题是,这个结果该如何解释?到底是强调ANOVA的结果,还是强调planned
comparison的结果呢?哪位老大给指点指点,包子答谢! |
|
h*******e 发帖数: 226 | 17 有6组数据做比较,每组的sample size 不是相同的(ie,unbalanced)
想要比较他们的mean是不是不同,做anova 和posthoc
做anova要满足,normal distribution and homogeneity of variance
我要先测试这两个条件满不满足。
我的问题是
1) test normality的时候是对全部六组的数据一起做,还是单独的每一组数据来分别
test
2)homogeneity of variance 是比较这六组的各自的variance是不是相等么?
3)如果我一套数据里针对某一些变量是normal distributed and equal variance ,
但另一些不是,那么我在处理这一套数据的里面是不是要根据满不满足条件而选择
parametric或者nonparametric的方法进行处理?这样做对于一整套数据来说会不会有
问题呢? |
|
w**********y 发帖数: 1691 | 18 来抢包子...
" analyze those 5 variables all together"
请google: multivariate ANOVA..
简单的说,你这5个response variale如果是independent的,那很好办啦,就一个一个的
做ANOVA就行了(不过你要adjust significant level)..
而MANOVA就是把这5个response当作一个vector,然后去比较你这A,B,C,D的response
vector有没有significant different..而test用的方法基本都是非参的方法..
SAS里面实现MANOVA的例子:
PROC GLM DATA=RAWDATA;
CLASS GROUP;
MODEL Y1 Y2 Y3 Y4 Y5 = GROUP;
manova h=_all_ / printe printh;
然后你的output会有,Wilks' Lambda,Pillai's Trace,Hotelling-Lawley Trace等方法
的test结果..你自己选一个用就行了.
至于要不要用 |
|
s******n 发帖数: 95 | 19 Multivariate ANOVA & Univariate Repeated-Measures ANOVA, are they the same
thing?
Any idea is welcome, thank you so much! |
|
D******n 发帖数: 2836 | 20 t-test只是简单情况下的称呼。多个因素控制的就叫anova了,在anova model下的F-
test . |
|
P******e 发帖数: 75 | 21 我们从Literature里收集了很多关于牛奶中18种氨基酸的含量的数据,每个数据点是文
献当中的平均值。不同文章的牛奶在不同时间收集,不同地方来源.
数据整理后,我们想看一下不同因子有没有影响。
从三个因素考虑,分别是time,region,term.数据是不平衡的.
下表标出了其中两个因素。每个格子里面是多少个观测点。可见是很不平衡的。
Region1 Region2 Region3 Region4
time1 . 6 2 1
time2 . 7 2 3
time3 1 8 7 5
time4 1 11 4 5
time5 3 10 . 2
我们有几个问题请教:
1. 由于我们的每个数据点是每篇文献当中的平均值,能用ANOVA么?数据好像不是很正态
分布。要检测Assumptions?
2. 对我们这个unbalanced的数据处理,可以做Three-way ANOVA么?
3. 用proc GLM, Model AA1 AA2=tim |
|
d*******1 发帖数: 854 | 22 我有一个化学实验, 取样是在某一天的某个plate上的的某一个well (column X row)
, 我有如下的linear model
y= U+ day+ plate(day)+ column + row + e.
我已经有个一个sample dataset, 做好了ANOVA, 有了ANOVA TABLE, 各种因子的 mean
square已经算好, 我现在想根据这些variance demoposition的结果进行一个大的
simulation去模拟真实的数据, 请问如何做 SIMULATION 呢 (已经知道分布是normal
)? sas 或者R 均可。谢谢 |
|
g**r 发帖数: 425 | 23 有两种好的程序员,一种只会编程,只对编程感兴趣,对COMPOUND,PROJECT都不感兴趣
。只要SPEC写的很清楚,编程就非常快。这样的程序员如果还喜欢弄弄MACRO,公司
WIDE的SETTING也都帮忙,就算是很好的程序员。做上5年,合格的SENIOR。
还有一种是对计算机的东西不见得很感兴趣,但很DETAIL,对STUDY的DESIGN,PROJECT
的PROTOCOL,SAP都喜欢搞懂,SPEC写错了,他一下就知道给你指出来。这样的程序员
,速度不是关键。这样的程序员,如果我是老板,三年就应该是SENIOR(这个很多人可
以的)。5年就应该是PRINCIPLE了(当然我不是老板,这个就有点扯淡了,但
PRINCIPLE只应该招这样的)。
说实话,在工业界做STATISTICIAN也一样。你如果把ANOVA搞懂了,绝大多数的统计问
题就不在话下了(当然ANOVA搞不懂的SR我也见过,那就有点过分了)。关键的还是你
要熟悉这个流程,能把握BIG PICTURE 还能对DETAIL PAY ATTENTION。每个人性格不一
样,这两个有时有些矛盾的。对DETAIL我就很烦,但 |
|
y*********e 发帖数: 298 | 24 我刚刚接触统计这方面,有没有入门级介绍
False discovery rate
one way ANOVA
two way ANOVA
tukey's test
Bonferroni correction
之类的书,中英文的都可以。中文更好,入门嘛,便于理解。
哪位能给个提示。
谢谢 谢谢 |
|
f**********t 发帖数: 1001 | 25 非常感谢!我当时就是觉得Proc GLM太具欺骗性了才问的。哈哈。
回答对我很有帮助。
感觉Proc GLM是兼具Proc ANOVA和Proc Reg的功能。Proc ANOVA确实没怎么见到用过。 |
|
y******6 发帖数: 47 | 26 我也攒点人品:以下题目一个是从银行(risk analyst)一个是从市场调查公司(
statistician)
1. What is left join. What's the difference between left join and right join.
2. Example: the original data set has the input like:
Company Location Profits
A BJ 15,000
SH 56,000
B GZ 34,555
HK 43,222
etc. You want to manipulate the data like:
Company Location Profits
A BJ 15,000
A SH 56,000
B GZ 34,555
B HK 43,2... 阅读全帖 |
|
y******6 发帖数: 47 | 27 面了几个地方,现在想总结下自己失败的地方。也希望在找工作的人引以为戒。其实我
觉得这些说的容易做起来很难。
1。说的时候语速问题。个人人为快是致命的。虽然对自己做的东西很熟悉而且确实也
自信,但是一旦说的很快,很容易给人一种你在机械化陈述事实。除非你能又快而且又
能眉飞色舞的讲解。反正我在语速一快的情况下,表情估计不是巨严肃就是僵硬。所以
面一个高管的时候,他在我停顿的时候突然说是不是觉得以前做的很没意思。我说不是
啊。很有意思。后来想来想去会给人那样误解的原因可能是语速和表情。
2。表情。面带微笑有多重要?非常重要。现在想来。面过的面试官如果是有笑容的,
你什么心情?放松,舒服,觉得这人看起来容易相处。所以你笑,别人也会这么觉得你
。但是面世的时候,过于紧张的份围下,有几个能保住笑容的?
3。化学反应。其实看你适合不适合在一个地方其实大部分是看你人好不好相处。什么
叫好相处。什么样的人好相处不接触以后谁也并不知道。如果你在社交场所给别人的第
一印象一直都是好的,那么你不用担心这个问题。如果你给别人的第一印象是没什么印
象或者一般或者说不上来好不好或者完全是不好。那么你该琢磨下这个问题... 阅读全帖 |
|
s*****9 发帖数: 108 | 28 不一样啊,另一个FACTOR会分担一部分variation啊 |
|
s********g 发帖数: 889 | 29 你是说用一个factor A分析结果发现有显著影响(p<0.05),在加一个factor B有可能
A的影响就不显著了?
那要是我不知道都有哪些factor 会影响结果呢? |
|
s*******w 发帖数: 27 | 30 在学校时, 总认为在做ANOVA,REGRESSION 分析前要检测Y是不是正态分布。 但在实
际工作中, 好像Y 很难达到这个要求。 我现在只是把Y plot 一下,去掉看似OUTLIER
的极大和极小的值就直接RUN ANOVA,CORR,REGRESSION.我们小公司只有我一个做统计
的。 我的心里很没底,我的做法对吗? 各位高手能给我一些建议吗?在此,先谢过大
家!!! |
|
x**********0 发帖数: 163 | 31 I have a small sample size (N=20; 10 in intervention group, 10 in control
group) and too many variables (7 dvs), that's why I can't run a Manova.
The big overall question is always whether or not the intervention group
makes more progress and this is rarely the case.
I was advised to run separate mixes method Anovas with Time (pre-post)
and group as in between factors.
My biggest issues are the questions about Bonferroni corrections for
multiple ANOVAs- can I run the analyses by research questio... 阅读全帖 |
|
g**r 发帖数: 425 | 32 LINEAR MODEL翻来覆去逃不出ANOVA,没别的。
repeated measure多用在LONGITUDINAL DATA里面,你如果以前ANOVA学的很透,随便
找本REPEATED MEASURE的书翻翻就是了 (CHANCES ARE你前面问的那个HLM也在里面) |
|
z**********i 发帖数: 12276 | 33 第一步的CORRELATION之后,是要把相关很强的去掉,正在做.多谢!
ANOVA这步,需要分别来看吗?
A one-way analysis of variance (ANOVA) is used when you have a categorical
independent variable (with two or more categories) and a normally
distributed interval dependent variable and you wish to test for differences
in the means of the dependent variable broken down by the levels of the
independent variable.
因为样本比较大,虽然每组的MEAN比较接近,但用F计算的P还是有显著性.另外,
PREDICTOR是ORDINAL,但BMI并不是随着增加或降低.
BACKWARD是用PROC GLMSELECT吧? 以前没用过,去研究一下.
另外,QUESTION5,6,7是相同B... 阅读全帖 |
|
k*****u 发帖数: 1688 | 34 你的question变量值是什么啊? yes / no 这种么?
你的那段英文也说了,anova要自变量是正态。 要是yes / no就不能anova了
differences |
|
Y****a 发帖数: 243 | 35 【 以下文字转载自 JobHunting 讨论区 】
发信人: YueJia (越嘉), 信区: JobHunting
标 题: 有没有想找quant职位的
发信站: BBS 未名空间站 (Sat Oct 8 01:12:48 2011, 美东)
有猎头给我发了下面这些位置,有兴趣的自己联系吧
www.burtchworks.com
MULTIPLE CITIES
Reference #266 A national brand strategy company with multiple U.S.
locations is looking for Statisticians to fill openings in its San Francisco
, Chicago and New York City offices. Will work with both B2B and B2C CPG,
healthcare and entertainment clients using various SAS modeling techniques:
market mix, econo... 阅读全帖 |
|
p***l 发帖数: 1775 | 36 刚开始找统计工作
联系到一个finance company,做次级贷款的吧
公司的一个statistician最近会跟我在电话里聊聊 貌似是做Risk Management的
不知道该如何准备
个人估计她会问一下专业知识,因为毕竟是个statistician
但就不知到她会偏向哪方面。说句实话,个人对这些risk management不大懂得说(
fresh master,没做过这方面的research或者project)
在统计program 2年,修了一些课,比如说基础的regression, anova, probability,
inference. 还有些如sampling,bayesian,stochastic, industrial,clinical trial
,microarray analysis,econometrice. 这些课都修的挺明白的,成绩也很好。会做
一些multivariate analysis,Anova,Clinical trial的protocol writing 还有基因
表达分析都懂一些
R用的比较熟,sas 有advance证书,不过有段... 阅读全帖 |
|
i***m 发帖数: 148 | 37 很好的经验,然后我加一些自己的经验供大家讨论
SAS
(1) Proc transpose
(2) Merge data的时候要注意什么问题?
a. Have to sort both tables before merging
b. Check what’s the type of merge (one to many, one to one, or many to
many?) --- check duplicates in each table (这条很多经验不够的通常都想不到
,只想到sort)
c. What if you only want to keep the IDs in table a?
--many to many merge, data step 与sql的不同
--missing data在merge时的处理,尤其是primary key有missing时
(3) Array
If you have a data set a with 1000 columns, you want to change all the
mi... 阅读全帖 |
|
e*****8 发帖数: 30 | 38 刚实习遇到的SAS问题:
一个关于survey的data,把参与调查的人分成若干组,然后在每个组都问相同的若干问
题。问题答案用数字表示,每个数字表示不同程度的看法。要求个within group
variance 和 between group variance 以及 ICC ( intraclass correlation). 应该
用到哪些关键SAS code阿? 请问这些variance 应该怎么理解阿? 比较常用的anova
例子是比较不同的treatment 对农作物高度影响。 对于这种survey data, 不知道怎么
用anova分析了。。。望解疑答惑,感激不尽!! |
|
j*z 发帖数: 620 | 39 因为数列是非正太的,又得用到anova分析,所以先得进行ln转换,anova不是给出了
mean那一项么,想直接用这个mean值 |
|
s****b 发帖数: 2039 | 40 难道不是典型的ANOVA?教科书上讲ANOVA经常是讲三组:control, before, after |
|
t*****w 发帖数: 254 | 41 我不懂crossover design的好处。请教一下。
我猜anova和tukey's test用不着。 估计anova的结果和t test一样或相似。tukey's
test 应该用在三个或以上样品组。
effects
or |
|
m*n 发帖数: 695 | 42 有三组数据, 需要做两两比较, 但不符合one –way ANOVA 的要求,log 转化后仍然
非正太。
我用的是spss, 做了non-parametric K-S 分析, p< 0.05, 该如何再做两两比较呢?
看文章中有人又用了ANOVA 下的post hoc test 中方差不齐的一个test 来做
multiple comparison. 这样可以吗?
还有人用 non-parametric K-S 单独做了两两的比较, 共做了三次。 这样做p 是不
是要很低才行?
向这种数据该如何做多个样本的两两比较啊?
请高手指点。
万分感谢!!! |
|
r********n 发帖数: 6979 | 43 对啊
kw anova挺好的
为啥一定要anova
就像如果两个group
可以用wilcoxon没必要一定用ttest一样 |
|
B******y 发帖数: 9065 | 44 如果要我回答你的这些问题,我首先要反问你一些问题:你的数据是什么方面的数据,
做什么用的?你的数据是怎么得来的,譬如说,试验设计来的,还是抽样调查出来的?
数据是怎么采集的?做过相同数据分析的文献研究没有,即同行们是怎么处理相同的数
据的?等等。。。没有这些数据的背景资料,在这里谈用如何纠正ANOVA的非正态问题
,无异于给开盲药方。比如一个病人说我头疼,吃了2片阿斯匹林怎么还不好,于是一
帮“医生”有的给出该吃4片,有的说该用中药,连你头疼的原因都没有弄清楚,怎么
开出合理的药方?。。。LZ给出一个太粗旷的范围,或许数据本身就不是应该用ANOVA
来分析的,就这么给建议会领LZ入歧途的。。。 |
|
s****b 发帖数: 2039 | 45 比如tukey,dunnett,等。
如果已经用了two-way/multi-way ANOVA,还需要multimple comparison吗?
multiple comparison 和 multi-way ANOVA 的区别是什么呢 |
|
v*******e 发帖数: 133 | 46 职位是Marketing Analyst
Base 120K差点
Bonus 15%
RSU 105K over 4 years
No sign in bonus
我:不是engineer, 统计的master, 有7年工作经验。 这个Base和其他中小型公司同类
职位比也不算高,一个我不是engineer, 另外工资是比较我目前公司的pay, 当时想先
搬来湾区所以take了目前公司的low pay。
发个面经给去面试的人参考一下时间流程. 从recuiter联系我到offer一共六周时间:
07/21 Apple recruiter发邮件问我对一个职位有没有兴趣
07/22 Apple recruiter phone screen
07/28 phone interview with hiring manager
08/04 On site interview, 一共三小时,包括recruiter面6个人,每人半小时
08/05 hiring manager回复我的thank you letter, 说所有的人给我的评价都很好,
recruiter会联系我
08/11 recui... 阅读全帖 |
|
g******2 发帖数: 234 | 47 you need to know how many groups before you can use ANOVA, so that's why you
need to cluster the data. Yes, use many daily data to cluster the
procedures.
I take back what I said about saturated model, which may not help your case.
Just do clustering + anova. |
|
G***s 发帖数: 10030 | 48 在这里想请教一个问题,用repeated measures,Sphericity test被reject了,然后用
multivariate test,书上写的还要查homogeneity or variance和normality这两个
assumption,但是在ucla的tuitor网站说这两个也被violate了,到底要check哪些
assumption?
Repeated measures ANOVA carries the standard set of assumptions associated
with an ordinary analysis of variance, extended to the matrix case:
multivariate normality, homogeneity of covariance matrices, and independence
. Repeated measures ANOVA is robust to violations of the first two
assumptions. Violations of i... 阅读全帖 |
|
l********8 发帖数: 668 | 49 本人多年搞observatonal study for social sciences. 对clinical trial一点不懂。
但现在job interview必须要准备一点Clinical trial的东西。不然,什么job都找不到。
先来说说我的印象,希望帮我纠正。我印象中clinical trial不就是一个randomized
experimental study吗? 被试随机分配到E和C组,然后比较一下effect of treatment.
一个简单的ANOVA不就能够对付了吗?不知还有什么别的花样。至于power analysis和
sample size在这种design下,用G*Power或nquery自动就给你算出来。有什么麻烦的呢
?
最近我们所做了一个phase 4的longitudinal clinical trial study. E和C组分别是
两种治疗方法,然后治疗开始后的1,3,6,12个月测量outcome variables. 治疗本身
大概9个月。不知道这种design在clinical trial研究中普遍不。但我觉得这不就是个
repe... 阅读全帖 |
|
s*******r 发帖数: 769 | 50 谢谢,我同意mixed model最好,但是repeated measure ANOVA 是不是也可以呢?
repeated measure ANOVA好像就是专门处理这种数据的 |
|