第3页 - 关于anovas的讨论汇总 - 话题女王

s***h
发帖数: 357

嗯，算anova。其实就直接做个线性回归，X变量里有产品（你的ABCD indicator），
gender，产品*gender

d**********2
发帖数: 14

来自主题: Statistics版 - For proc glm, how do I specify within-subject effect and between-subject effect for ANOVA analysis?

Hi,
在用SAS做ANOVA analysis的时候(我用的是proc glm), 怎么样specify哪些variable是
within-subject effect, 哪些variable是between-subject effect? 我知道所有
repeated measures variables都是within-subject effect, 可是我的data不属于这种
情况啊, 而且如果有多于两个viariables属于within-subject effects, 这个repeated
option很不好用啊, 没办法specify两个或者两个以上的repeated measures
variables.
万分感激!
Laomao

a**j
发帖数: 60

来自主题: Statistics版 - For proc glm, how do I specify within-subject effect and between-subject effect for ANOVA analysis?

你要知道是random effect 还是fixed effect, 用factorial model 还是nested model
between-subject effect
within-subject effect
with group, between group?
如果是的话，用nested model
一个women right 的题的部分SAS code 及解释
/*Conduct anova specifies that both ciri and wecon are categorial variable,
nest model ciri is nested with wecon specifies that ciri is random variable
. Conduct model diagnostics by plots=diagnostics option*/
ods graphics on;
proc glm data=torture1 PLOTS=DIAGNOSTICS ;
class ciri wecon;
model physint1=weco... 阅读全帖

s****b
发帖数: 2039

来自主题: Statistics版 - 有谁知道ANOVA里面的SPH／SPT是什么？

ANOVA里面有个量叫SSH，也叫SST，就是sum of square of treatment，
现在看到一个新缩写SPH，和SSH对应，估计也可以叫SPT，请问是什么或者是啥的缩写
？多谢！
sum of (partial) treatment?

c**********w
发帖数: 1746

来自主题: Statistics版 - 包子求解释，为什么anova解释variance这么少

包子求解啊，我有四个predictors，一个outcome，散点图都附上了。四个因素好像都
有点影响，比如只有在x1或者x3比较低的时候，outcome绝对值才会比较大，散点图上
都出现三角形的形态。但是我用四个因素做anovan，总共才解释20%的variance，而且
x1,x3基本没有解释variance（明明x1,x3看起来形态更明显啊）
是我还没有找到更合适的predictor吗？还是这种限制性的因素不适合用anova分析？谢
谢分析！包子致谢。

c********h
发帖数: 330

来自主题: Statistics版 - 包子求解释，为什么anova解释variance这么少

你的y基本都是非正的，而且大部分都是0，变量与y也没有什么线性关系，做anova肯定
不好啊

k****n
发帖数: 165

来自主题: Statistics版 - 包子求解释，为什么anova解释variance这么少

Anova is for the case where your explanatory variables X are categorical. In
your case, try a regression.
After fitting your current simple linear model with interaction, do a
residual check. As catforfish mentioned, you might need to adjust some
higher order terms of X to improve the goodness of fit.

c**********w
发帖数: 1746

来自主题: Statistics版 - 包子求解释，为什么anova解释variance这么少

matlab has a "continuous" anova? I can specify a variable as continuous

In

w*****r
发帖数: 165

来自主题: Statistics版 - Repeated measure ANOVA 后的 post hoc 的问题

求助这里的大牛：
我的数据有3个group，5个时间点。用 R 里面的 lme 来做repeated measure ANOVA:
imgdata.lme <- lme(measdat ~ Group * Time, random = ~1 | Subject,
data=imgdata, method="REML")
我现在想比较每个时间点的group间（A,B,C) 的pair-wise的区别（A vs. B, B vs. C
, A vs. C)。不需要跨时间点比较。所以会是：
T1: A-B
T1: A-C
T1: B-C
T2: A-B
T2: A-C
T2: B-C
T3: A-B
T3: A-C
T3: B-C
T4: A-B
T4: A-C
T4: B-C
T5: A-B
T5: A-C
T5: B-C
但需要correct for multiple comparisons，比如Tukey方法。我试了用glht，但对于
该怎么设contrast matrix感觉很晕。求指点。
谢谢大家。

l**********8
发帖数: 305

来自主题: Statistics版 - ANOVA model 中 CELL count 过小到底对model有什么影响

如题，就简单的one-way ANOVA，有的cell count非常小，还有是0的，如果这样的话
，对model有什么影响？ power？ Type I ERROR?
谢谢大家

l**********8
发帖数: 305

来自主题: Statistics版 - ANOVA model 中 CELL count 过小到底对model有什么影响

谢谢，举个例子，如果OUTCOME 近似于正态分布，但是客户要看一些baseline
measurement, 比如收入，分成了8个level（1-8），有些level里人数非常少，如果
要看收入（catigorical）和连续性的outcome的关系，除了anova，还能有那些模型呢？

where
both
sample
enough
may

n****t
发帖数: 182

来自主题: Statistics版 - ANOVA model 中 CELL count 过小到底对model有什么影响

对one-way,POWER肯定有影响的。极端情况：每个CELL一个数据，就没有办法分析了(
Over fitting).
因为这个比较的是组内变化和组间变化，组内变化的估计DF太小，你的估计也就不精确
，比较也就POWER低。
如果是two-way ANOVA，分析方法要做调整，比如用TYPE II而不是用TYPE III

m*******e
发帖数: 90

来自主题: Statistics版 - ANOVA model 中 CELL count 过小到底对model有什么影响

你说的这个情况属于multicategorical ordinal response的范畴，ANOVA不适用，因为
它是基于linear regression model的。
GLM比较适合，比如可以用baseline category logic model, 也可以用proportional
odds model.

呢？

J*X
发帖数: 1001

来自主题: Statistics版 - 3 way anova

方法就在你标题里，就是3-way anova.

w*****i
发帖数: 151

来自主题: Statistics版 - 包子求科普：Factorial design得到的数据可以用ANOVA来处理吗

不一定非得用regression来处理吧？
可以用ANOVA with correction for multiple comparisons来处理，来比较各个factor
是否有作用吗？
包子求科普，谢谢！

m******r
发帖数: 1033

来自主题: Statistics版 - 包子求科普：Factorial design得到的数据可以用ANOVA来处理吗

那就给你科普下。
regression和anova是紧密相关的。出来的结果，很多数字都是一样的连输出的格式
都非常类似。一开始觉得挺奇怪，想想也很自然。因为两者回答的都是同一问题，比
如这个组比那个组高多少。

w*****i
发帖数: 151

来自主题: Statistics版 - 包子求科普：Factorial design得到的数据可以用ANOVA来处理吗

不一定非得用regression来处理吧？
可以用ANOVA with correction for multiple comparisons来处理，来比较各个factor
是否有作用吗？
包子求科普，谢谢！

m******r
发帖数: 1033

来自主题: Statistics版 - 包子求科普：Factorial design得到的数据可以用ANOVA来处理吗

s*****0
发帖数: 357

来自主题: Biology版 - 简单地说说生物医学里的统计应用吧

说正题以前，先胡扯几句，算是给已经转了统计或者正在转统计的朋友们提个醒。我这
是杂谈贴，不是劝退。偶尔隔壁统计版逛逛，如今正在向生物版靠拢，成为劝退的大本
营。以前是SAS大本营，原本已经很悲哀了，现在有赶超我版的苗头。归根到底就一个
问题，就是现在的行情统计好不好找工作。我要去隔壁说统计很多availability，估计
立刻会被砖头拍死，为什么？因为大部分在版的job seeker都是fresh，又没有经验又
要身份支持，哪怕有一千个机会, 这么一stratify，也剩不了几个，而且广大的老印兄
弟还虎视眈眈。
其时学统计的时候必须要弄清楚一个问题，应用统计的关键在于应用，大部分转统计的
人都不会去搞methodology念PhD，而是期望靠统计找份工作。但当你工作后就会明白，
统计只是一个工具，工作的经验有一部分讲究的是你对统计工具的娴熟，但更看重的是
你在行业里累积的经验。比如在药厂里搞生统，当你写SAP的时候会去理解一个
therapeutic area，在银行里建模，你会去理解各种各样的风险模型信用模型。你以后
改resume跳槽，真正值得突出的是这些经验，而会什么mult... 阅读全帖

p********a
发帖数: 5352

来自主题: Statistics版 - [合集] 问个基本的建MODEL问题

☆─────────────────────────────────────☆
zhongdianshi (brb) 于 (Mon Aug 29 09:50:26 2011, 美东) 提到:
OUTCOME: BMI
PREDICTOR: QUESTION1, QUESTION2, QUESTION5, QUESTION6...
所有的PREDICTORS是ORDIANL VARIABLE.
我想分别TEST OUTCOME和每一个PREDICTOR的CORRELATION.
我用了2个方法:
1.
PROC CORR SPEARMAN;
VAR BMI QUESTION1n QUESTION2n...;
RUN;
生成一个CORRELATION TABLE.
2. ANOVA
分别把每个PREDICTOR和BMI放到MODEL里,这一步,我不是很确定.
proc glm data = DATA;
class QUESTION1;
model BMI = QUESTION1;
meansQUESTION1;
run;
quit;
最终,是要建个MIXED MOD... 阅读全帖

A*********u
发帖数: 8976

来自主题: PKU版 - here u go

Whereas one-way analysis of variance (ANOVA) tests measure significant
effects of one factor only, two-way analysis of variance (ANOVA) tests (also
called two-factor analysis of variance) measure the effects of two factors
simultaneously. For example, an experiment might be defined by two
parameters, such as treatment and time point. One-way ANOVA tests would be
able to assess only the treatment effect or the time effect. Two-way ANOVA
on the other hand would not only be able to assess both time

b***9
发帖数: 34

来自主题: Statistics版 - 问一个统计F value的问题-急!

我的文章刚修回，文章中只有一个试验是用two-way ANOVA 分析的，我标了F 和P
value. 其他的都是用one-way ANOVA 分析的，仅写了p value。但是reviewer要我都
写全，查了一下发表的paper，好像F value只用于two-way or three-way ANOVA，没有
用于one-way ANOVA的。我应该怎样回复呢？如果补全要占不少篇幅呢，哪位高手给指
点一下呀。多谢！

q******g
发帖数: 3858

来自主题: Statistics版 - 问个统计的问题

谢谢各位。我看到有人用nested ANOVA来分析。不知道大家觉得这个方法怎么样？
"It's a problem called pseudoreplication - when you have multiple data
points for the same trait taken from the same biological replicate (at the
same time point). Although technical reps have an important role telling you
how much variation arises from lab analysis, its important that you
distinguish the two types in your statistical analysis (if technical
variation is important). I agree with Christopher, if the variability in
your technical replicat... 阅读全帖

D**g
发帖数: 739

来自主题: Biology版 - 请教一个简单的数据统计问题

第一，你得确认试验数据符合正态分布，如果每组样本量很小，或者有文献说response
value不是正态的，应该用non-parametric方法或者把原始数据做transformation.最
常见的是取对数，然后用ANOVA.不然，应该用ANOVA的non-parametric version:
Kruskal Wallis test
第二，ANOVA或者K-W test 如果p-value > 0.05, POST HOC pairwise test 就可以免
了。因为前面一个p>0.05的意思就是：考虑进multiple comparison的因素并调整TYPE
I 错误（没有区别却错误地认为有区别的概率）以后，没有任何一对比较会是显著的。
有很多方法调整multiple comparison，但前面的p保证了无论你用什么方法，没有一种
会给你一个显著的比较结果。
第三，如果p-value <0.05, 就值得做pairwise的比较。最简单的是用0.05/所有可能的
比较总数作为显著性CUT OFF值。如果你前面用的K-W test, 这里应该用Wilcoxon-Mann
-

f*****y
发帖数: 464

来自主题: Biology版 - qPCR结果的统计分析

本人统计学得粗浅，关于qPCR分析想请教大牛们：
1.如果5组treatment数据，每组4个samples. 是选择直接做non-parametric如kruskal-
Wallis test好，还是先确定是normal distribution然后做one-way ANOVA更容易被
reviewer接受？ANOVA的p-value似乎总是更好看一些。
2.给这些数据做post-hoc test,到底有什么讲究？Duncan, LSD, Tukey等这些是不是哪
个好看就选哪个？另外non-parametric test的post-hoc用SAS怎么做呢？
2.本人想做一个gene expression time-course, 5个时间点，每个时间点只有4个
sample。我计划就是先做个ANOVA,然后做个LSD做post-hoc,根据post-hoc来说明表达高
峰在那个时间。这样合理吗？
提前谢谢指点。

w*********u
发帖数: 7

来自主题: Biology版 - 问个统计学的问题

比如把人分成三组，A组什么都不吃，B组吃减肥药1，C组吃减肥药2，药效2略大于1，
很可能就会得到A和B没有sig diff，B和C没有sig diff但是A和C有sig diff。
就像上面有人说的，A和B（B和C）没有sig diff是power不够，如果sample size增大或
者两者之间的区别增大，都会增大power，从而得到sig diff。
假如你的结果真的是A和B没有sig diff，B和C没有sig diff，而A和C有sig diff，那么
用ANOVA，总的那个p value一般来说一定是sig。
ANOVA本身并非multi test，它只有一个test，就是test A B C三者之间到底有没有
diff。只有在ANOVA的基础上做两两对比的时候才是multi test。

m*******y
发帖数: 16

来自主题: Biology版 - 好几组样品怎样做两两比较的t test

我的理解是3组以上的比较，必须先做anova。
anova告诉你是否存在2组之间有显著性差异，但不能告诉你是哪两组。如果anova都没
有显著性，就没必要做两两比较了。
请大牛纠正。

d********m
发帖数: 3662

来自主题: Biology版 - 好几组样品怎样做两两比较的t test

首先我不是大牛，如有不准确也请大牛纠正。
三组以上并不是必须先做ANOVA。ANOVA和T-test没有本质上的区别，事实上t-
distribution是ANOVA用的F-distribution极端情况(df=1)。
所以两两做T-test在方法学上并没有任何问题。只不过为了保证同时能reject null
hypotheses，p-value必须重新调整(bonferroni theorm)。

w****e
发帖数: 1013

来自主题: Statistics版 - 菜鸟请教一个问题

我需要分析一堆数据，但是之前只上过简单的统计课，基础比较差，现在搞不定了，上
这里来请教一下各位专业人士。谢过了先！
这堆数据包括一个response variable，24个dependent variables，其中20个是
continuous的，另外4个是categorical的。一共400个samples。最终目的就是想看看哪
些dependent variable对于response varible的影响比较大，包括interaction effect
。我的问题是：
（1）是用anova还是用regression analysis比较合适？
（2）我目前正在研究用anova怎么弄。根据网上看的资料我的理解是因为这个既有
continuous variable，又有categorical variable,所以需要用ancova (analysis of
covariance。不知这个理解正确不正确。
（3）看了matlab里面做ancova的function，感觉找不着边。同时在matlab里面anovan
可以做Nway的anova分析，而且可以标明哪些变量是conti

B******y
发帖数: 9065

来自主题: Statistics版 - proc GLM和proc Reg、proc Genmod的比较

SAS中的PROC GLM的命名有重大的欺骗性，这里的GLM是指General Linear Model，而不
是Generalized Linear Model！！！一字之差，区别很大。PROC GLM是一种ANOVA的扩
展，是基于PROC ANOVA的更新程序（PROC GLM出了以后，PROC ANOVA基本上废了）；而
PROC GENMOD才是大家常见的将非正态数据转成正态模型的，所以需要Link Function。
据说SAS公司后来非常后悔PROC GLM的定义，毕竟学术界更习惯于GLM是Generalized
Linear Model的缩写，但PROC GLM出现Generalized Linear Model被普遍接受之前，而
且SAS使用者已经习惯用它了。所以没有办法，只好创造了一个新的PROC GENMOD。

a****m
发帖数: 693

来自主题: Statistics版 - proc GLM和proc Reg、proc Genmod的比较

in Proc GLM model, the input variable can be categorical or continuous,
but only fixed effect only.
whereas PROC REG only count on the continuous input variable, and ANOVA is
for categorical variable.
PROC GLM is extended form of ANOVA, it could be ANCOVA, called analysis of
covariance. it need at least one continuous and at least one categorical
input variable. it is merger of ANOVA and regression for continous
variable.

s******a
发帖数: 184

来自主题: Statistics版 - 一个关于regression的问题

在学习linear regression 的过程中见到这样一个使用ANOVA table 的例子，
在这个模型中，Y 代表response variable, 有两个自变量，X1 和X2
例子中说，根据以上的ANOVA table, 可以判断出以下几点
1）在考虑X2对X1和Y的影响以后，X1 也和Y有很强的线性相关性
2）假如不考虑X2的影响, X1和Y的线性相关性就不那么明显了。
3）不论考不考虑X1的影响，X2 和Y都有很强的线性相关性，
ANOVA table中的哪些信息可以帮助我得到上面的结论呢，

z******n
发帖数: 397

来自主题: Statistics版 - 求教一道google的面试题，关于multicollinearity的

我想我的看法不大受重视。所以构造了一个数值例子。为了使得结果能够重复，我固定
了随机数种子
set.seed(2)
library("mvtnorm")
n<-100
rho<-.9
bet<-c(.1,.1)
sigma<-matrix(c(1, rho, rho, 1), ncol=2)
x<-rmvnorm(n, sigma=sigma)
e<-rnorm(n,sd=.8)
y<-x%*%bet+e
data<-data.frame(y, x)
colnames(data)<-c("y", "x1", "x2")
mdl0<-lm(y~1, data=data)
mdl1<-lm(y~x1,data=data)
mdl2<-lm(y~x2,data=data)
mdl<-lm(y~x1+x2, data=data)
> anova(mdl0, mdl1, test="Chisq")[2, "Pr(>Chi)"]
[1] 0.03725746
> anova(mdl0, mdl2, test="Chisq")[2, "Pr(>Chi)"]
[1] 0.03311402
> anov... 阅读全帖

s*r
发帖数: 2757

来自主题: Statistics版 - 弱问到底什么是fixed/random effect model?

其实教科书上说到fixed random 都是在anova里面引入的，而anova的经典表示方法是y
=u+b+e. y=u+Bx+e是general linear model的写法,这里x就是dummy variable 的
design matrix了。
在anova里理解fix/random effect要容易. b是random effect with p level的话，对
应的B, 在effect coding下，就是一个p-1的vector. 这个vector的每一个element都是
从一个normal distribution里面出来；x总是fixed,因为它代表每个subject的effect
属于哪个level.

A**H
发帖数: 4797

来自主题: Statistics版 - 请教一个频率优化问题（相关性？）

谢谢
我根据这里的方法做的clustering
http://www.statmethods.net/advstats/cluster.html
用的其中的Partitioning这一节，我得到了一个"Within groups sum of squares"
versus "Number of Clusters" plot. 从这个plot里面我选了clusters = 5，然后做下面
fit <- kmeans(mydata, 5) # 5 cluster solution
# get cluster means
aggregate(mydata,by=list(fit$cluster),FUN=mean)
# append cluster assignment
mydata <- data.frame(mydata, fit$cluster)
我得到了哪个项目应该归到哪一类里面
感觉到这里，似乎就已经做完了。。。。。我知道了哪些项目应该编排到一起
然后，我再根据下面这个
http://www.stat.columbia.edu/~martin/W2024/R3.pdf
做anov... 阅读全帖

发帖数: 1

来自主题: Military版 - 还在用我自己给升级到了内存

飞翔将军吉祥，您把lenovo和anova搞混了，估计您经常用anova比较数据吧

w********2
发帖数: 632

来自主题: Military版 - 诺奖得主：人工智能其实就是统计学，只不过用了一个华丽辞藻

看看google怎么收集数据的吧，你不给真ip它不让你查，这才是最关键的。数据噪音大
了，random variance超过function的作用大时候，再好的算法也没戏。有好数据，传
统anova一样可以有不错的结果。ai比基础算法glm anova强多少？有时候好20-30%，有
时候一样，有时候差。

z****e
发帖数: 54598

来自主题: ChinaStock版 - [bssd]为了忘却的纪念 “三二七”国债期货事件十五年记 --本周股版精品原创

几个不同的看法
5月6日那个暴跌千点
其实我认为通过10亿单应该可以实现
因为dow jones的指数构成是由市面上三十只股票取算术均值构成的
所以如果要想在三大股指中通过某种单数搞个暴跌，要我选我也选道指
因为资金量相对较小，只要搞三十个股票就行，甚至还可以优化
在三十只股票中找outstanding stock数量较小的
打击这些数量较小的股票价格就可以了
因为指数构成是算术均数，不考虑权重，所以可以利用这种小杠杆实现
而如果要想把s&p500一下子让它暴跌，其需要的资金量要远远大于道指
因为这有500个股票，而且考虑权重，难度相当大
这多少可以解释为什么10亿单可以让道指暴跌
简单假设，如果你有10亿单，买入ibm，然后用你能想到的最低价格抛售ibm股票
只要成交，瞬间指数就下来了，抛售价格高低也能解释你所说的为什么15亿单没有打下道指
因为挂出10亿卖单，价格1块钱跟挂出15亿单，价格是14块钱，其对道指的影响完全不同
所以10亿单是错误操作的可能性还是存在的，而这里面差距也许仅仅是一个数字4而已
而且这种暴跌对于任何金融机构来说都是亏的，因为一旦成交，那怎么办？送钱？
要对付... 阅读全帖

z****e
发帖数: 54598

来自主题: ChinaStock版 - 我也胡言乱语两句吧

所以从细微的角落可以感觉出来一个人的行业背景
这就是为什么说excel的主要原因，可以感觉出来你不是搞挨踢的
同样，我也多少感觉出来西翼他们也不是搞挨踢的
我说的前面一半主要是为了佐证一个概率，就是他不是搞挨踢的前提下
他做出这些东西的概率有多大
这也是跨行业的好处，可以跟不同专业的人讨论问题
可以感觉出来哪些东西在某个行业觉得是很简单的事情对于其它行业来说是很难理解的
比如说很多外行觉得搞挨踢的必然要对excel这些东西很了解
其实对excel最了解的我觉得是文秘，搞挨踢的很多反而对excel很不了解
就是最普通的html语言，这也不是科班必修课，不懂如何写网页的码工大有人在
同样的，对于搞统计的来说anova是必修，但是对于外行来说，不懂anova的多得去了

d**********n
发帖数: 3634

来自主题: Food版 - 有人用过Sous Vide cooker吗？

前几天减价买的Anova sous vide cooker终于到了，试着玩玩：
大家有tips之类的么？
Edit: 第一代的circulator 减价到$100了
amazon.com/Anova-Sous-Vide-Immersion-Circulator/dp/B00UET2UI2/
use coupon code ANOVAONE

c******n
发帖数: 16666

来自主题: Food版 - sous vide锅打折 99刀税前

http://slickdeals.net/f/8292697-anova-one-sous-vide-cooker-for-99-anova-precision-gets-50-off?src=SiteSearchV2

v*******e
发帖数: 133

来自主题: JobHunting版 - 报一个Apple的Offer和面经 (转载)

【以下文字转载自 Statistics 讨论区】
发信人: virginone (Virgin), 信区: Statistics
标题: 报一个Apple的Offer和面经
发信站: BBS 未名空间站 (Fri Sep 5 02:53:59 2014, 美东)
职位是Marketing Analyst
Base 120K差点
Bonus 15%
RSU 105K over 4 years
No sign in bonus
我：不是engineer, 统计的master, 有7年工作经验。这个Base和其他中小型公司同类
职位比也不算高，一个我不是engineer, 另外工资是比较我目前公司的pay，当时想先
搬来湾区所以take了目前公司的low pay。
发个面经给去面试的人参考一下时间流程. 从recuiter联系我到offer一共六周时间:
07/21 Apple recruiter发邮件问我对一个职位有没有兴趣
07/22 Apple recruiter phone screen
07/28 phone interview with hiring manage... 阅读全帖

t********e
发帖数: 1169

来自主题: JobHunting版 - 报一个Apple的Offer和面经 (转载)

G****a
发帖数: 10208

来自主题: Missouri版 - 报一个Apple的Offer和面经 (转载)

z*****n
发帖数: 413

来自主题: PhotoGear版 - 求推荐一本统计的书

这本书没有讲anova和regression吧？前面是基础知识，后面基本上随机过程的内容了。
regression推荐applied regression analysis by Norman Draper
ANOVA还是这本书吧 Design and Analysis of Experiments by Douglas C.
Montgomery

G*********o
发帖数: 49669

来自主题: LoveNLust版 - 问个问题吧

其实这个anova确实挺重要的，p<0.01会比较好。

还anova anlysis (方差分析）呢

a****5
发帖数: 10854

来自主题: Biology版 - 请教一个简单的数据统计问题

如果你都能用paired t的话,你应该用One-way ANOVA with repeated measure才对啊,
这个的显著性远大于one-way ANOVA

M*****n
发帖数: 16729

来自主题: Biology版 - 请教一个简单的数据统计问题

各位专家，俺不太懂统计。
所以想问问，ANOVA怎么算，什么情况下用。
平时通常用t-test，不过觉得恐怕是有caveat的，因为样本比较小，所以不知道数据是不是正态分布。
还有如果是重复数次的实验，是不是最好ANOVA.

D******n
发帖数: 2836

来自主题: Biology版 - 请教一个简单的数据统计问题

t-test,是anova的特殊情况，1（2）way 2 level
anova可以处理，2，3，。。。ways， and multiple levels...

是不是正态分布。

s*****0
发帖数: 357

来自主题: Biology版 - 简单地说说生物医学里的统计应用吧

周末杂事比较多，小孩的playdate，还有和朋友约定的网战等等，未能及时更新，见谅。
感谢楼上hbsr2010的一些概念更正，平时理论接触的少了，记忆有偏差，因为在网上随
便写些，也懒得查书，写的时候随兴所至，没有太注意。我尽量让文笔轻快些，让读者
不至于厌烦。以后尽量会避免误导，如有不确实之处，请务必指正。先行谢过了，因为
有自己的一摊东西要收拾，不能像做科研那样严谨了。
前文提到的t test, one way ANOVA以及相关的nonparametric都只有涉及到一个
variable，比如作对照实验，variable即treatment type，不同计量药物或者是
placebo。组和组的区分是由这个variable决定的。在涉及到更为复杂的模型前(比如
two way ANOVA, multiple regression)，我觉得还是先唠叨唠叨categorical data的
统计方法，毕竟做multiple regression之类的工作需要一定的统计背景，平时远没有
Chi-square这样的test用得多。所以先简后难了。
Categorical data在生

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

topics

未名新帖统计// 7月16日

历史上的今天