d********h 发帖数: 2048 | 1 1)population variance 是根据P*(1-P)/N;
sample variance是根据p×(1-P)/n; 一般N>>n的,所以我说population的variance
要远小于sample variance的;
2)假设n~N,p*(1-p)/n 是很有可能小于 p_hat*(1-p_hat)/n 的,这时候,再加个
correction factor ,sample variance更是大于 true variance;
3)在你的推理中,var(p_hat)=p(1-p)/n,我认为var(p_hat)=p_hat*(1-p_hat)/n.
另外,在normal distribution中,因为sample mean替代true mean,少一个df的原因
,sample variance是永远小于true variance的,所以要correct;但对于目前
binomial 的公式,sample variance是可能大于population variance的。 |
|
d********h 发帖数: 2048 | 2 我想说的是
Because the sample mean usually differs from the population mean, the
variance and standard deviation that we calculate using the sample mean will
always be smaller than it would have been had we used the population mean.
Therefore, when we use the sample mean to generate an estimate of the
population variance or standard deviation, we will actually underestimate
the size of the true variance in the population To adjust for this
underestimation, we use n - 1 in the denominator of our samp... 阅读全帖 |
|
d********h 发帖数: 2048 | 3 1)population variance 是根据P*(1-P)/N;
sample variance是根据p×(1-P)/n; 一般N>>n的,所以我说population的variance
要远小于sample variance的;
2)假设n~N,p*(1-p)/n 是很有可能小于 p_hat*(1-p_hat)/n 的,这时候,再加个
correction factor ,sample variance更是大于 true variance;
3)在你的推理中,var(p_hat)=p(1-p)/n,我认为var(p_hat)=p_hat*(1-p_hat)/n.
另外,在normal distribution中,因为sample mean替代true mean,少一个df的原因
,sample variance是永远小于true variance的,所以要correct;但对于目前
binomial 的公式,sample variance是可能大于population variance的。 |
|
d********h 发帖数: 2048 | 4 我想说的是
Because the sample mean usually differs from the population mean, the
variance and standard deviation that we calculate using the sample mean will
always be smaller than it would have been had we used the population mean.
Therefore, when we use the sample mean to generate an estimate of the
population variance or standard deviation, we will actually underestimate
the size of the true variance in the population To adjust for this
underestimation, we use n - 1 in the denominator of our samp... 阅读全帖 |
|
d*****0 发帖数: 1500 | 5 Variance是一个bitch
哥听到太多太多朋友感叹玩poker就是3分靠牌技7分靠运气之类的话,有的甚至说是28
开,19开。哥表示,“呵呵”。因为能够开始宣称这类结论的朋友,基本上都是打牌有
点年头,并且已经建立了自己的一套认知体系,当然伴随而来的,也建立起了一定的自
信和EGO,如果这个时候,直接顶上一句,大哥,您打牌打到弯路上去了,估计会招来
不快,甚至强烈的反弹,所以哥通常就只是“呵呵”了。
那打牌到底运气和技术怎么分呢?我下面要码的字,其实是几年来版上各位大牛经验的
概括,并由自己以身试险,进行验证。希望能给出一个大致的picture,解决部分玩家
的疑惑,但是很可能,这样一来,又要抹杀很多玩家打牌打出一片天的梦想。哥在这里
先说声对不住了。
先提一个概念,因为poker的发牌是随机的,造成牌局的结果也是随机的,但是牌的数
量和分布却是固定的,所以统计上来讲,每个人的机会都是均等的。如果玩家每一次都
能做出正确的选择(比如牌大的时候赢更多钱,牌小的时候及时止损),那长期下来,
他就是在不停的积累统计上的价值,那么,统计上来讲,该玩家玩的越多也就应该赢得
越多。这个“每一... 阅读全帖 |
|
z**********i 发帖数: 12276 | 6 你的理论水平肯定是PHD LEVEL的.
我上LONGITUDINAL 课的时候,完全没有很懂.老师是照顾情面给我个B. :-(
我的医院有很多,时间也有很多,我列了3个是为了方便理解.
MIXED MODEL是否可以给出WITHIN和BETWEEN VARIANCE,我不知道,几乎没用过.
但OUTCOME是RATE,要GENERALIZED LINEAR MODEL.GEE是MARGINAL MODEL,可能没有
VARIANCE的计算. 用NLMIXED做GENERALIZED MIXED MODEL,或许可以得到VARIANCE?
我的知识实在是有限...
多谢大家的回复!
量(只有1-3这3个选项),还是random的变量。
个coefficients。
response variable是catigorical data,情况就变得有点复杂。因为用mixed model的
话,也应该用multilevel logistic (or probit) model。用intercept only model,可
以估计出level 2的variance。但是这个varian... 阅读全帖 |
|
d********h 发帖数: 2048 | 7 谢谢你的耐心解释,不过还是有点不明白,unbiased 是希望sample variance更接近
true variance
假设100个patient,true p=0.7,sample p=0.6
true variance=0.7×(1-0.7)/100=0.0021;
sample variance=0.6×(1-0.6)/100=0.0024;
after correction:0.6*(1-0.6)/99=0.00242,variance更大了。
当然如果true p在0.5-0.6 之间的话,correction更有意义
对于normaldistribution,模拟了很多次,correction 确实是更靠近true variance
of
phat |
|
d********h 发帖数: 2048 | 8 谢谢你的耐心解释,不过还是有点不明白,unbiased 是希望sample variance更接近
true variance
假设100个patient,true p=0.7,sample p=0.6
true variance=0.7×(1-0.7)/100=0.0021;
sample variance=0.6×(1-0.6)/100=0.0024;
after correction:0.6*(1-0.6)/99=0.00242,variance更大了。
当然如果true p在0.5-0.6 之间的话,correction更有意义
对于normaldistribution,模拟了很多次,correction 确实是更靠近true variance
of
phat |
|
d********h 发帖数: 2048 | 9 根据variance 公式 p×(1-p)/n, 因为N的缘故,population variance往往会远小
于sample variance。如果要correction的话,factor应该是小于1的,而现在用n-1只
会使sample variance偏离population variance更大。 |
|
h***i 发帖数: 3844 | 10 hehe
1: var(p_hat)=p_hat*(1-p_hat)/n.
你再三思一下吧
2: 另外,在normal distribution中,因为sample mean替代true mean,少一个df的原
因,sample variance是永远小于true variance的,所以要correct;
你这句sample variance 永远小于population variance,我就很好奇,是学统计的说
出来的么?
variance |
|
d********h 发帖数: 2048 | 11 根据variance 公式 p×(1-p)/n, 因为N的缘故,population variance往往会远小
于sample variance。如果要correction的话,factor应该是小于1的,而现在用n-1只
会使sample variance偏离population variance更大。 |
|
h***i 发帖数: 3844 | 12 hehe
1: var(p_hat)=p_hat*(1-p_hat)/n.
你再三思一下吧
2: 另外,在normal distribution中,因为sample mean替代true mean,少一个df的原
因,sample variance是永远小于true variance的,所以要correct;
你这句sample variance 永远小于population variance,我就很好奇,是学统计的说
出来的么?
variance |
|
x**g 发帖数: 807 | 13 如果求total overhead variance,是用DM price variance , DM quantity usage
variance, 还是用three-way variance.
谁可以解释一下,这里的区别?谢了! |
|
b******e 发帖数: 501 | 14 看一下第二章比较好,variance主要会简单的price,usage variance就行了,我26号考
的,有考到比较复杂的variance,但就1题,我也不会算就放弃呗,之前都没有听说过
有人考到复杂的variance的计算,但第二章的概念还是考了一些的,所以还是花时间抓
一下第二章的内容好一些。 |
|
h******e 发帖数: 1791 | 15 一组病人,服药前测其variance,服药一段时间后测其variance,pooled variance能
根据这两个variance计算出吗? |
|
t**c 发帖数: 539 | 16 我觉得该不该用mixed的model,取决于楼主这里是要把hospital作为一个fixed的变量(只有1-3这3个选项),还是random的变量。
如果是前者,是用两个dummy variable来model hospital effect,估计的参数是两个coefficients。
如果是后者,估计的是hospital这个randome variable的variance。但是这里response variable是catigorical data,情况就变得有点复杂。因为用mixed model的话,也应该用multilevel logistic (or probit) model。用intercept only model,可以估计出level 2的variance。但是这个variance是针对latent variable而言,并不是response variable的variance。 |
|
h***i 发帖数: 3844 | 17 E(p_hat*(1-p_hat))=(n-1)/n p(1-p);
so, you are wrong in this statement,population variance往往会远小于sample
variance!
sample variance:
E(p_hat*(1-p_hat)/n) < p(1-p)/n (variance of phat)
so, we need to adjust the bias. |
|
d********h 发帖数: 2048 | 18 你说的是另一种分布,p1,p2,...pn, 每一个都是binomial,这时,variable是p(p1,p2,
..);现在
我们只关注p1,variable是x(0,1,0..)。
p1是基于1000个Bernoulli分布,根据这1000个sample size,我们是足以得到p1_hat,
p1的variance是根据p1_hat*(1-p1_hat)来估算的,也就是说对于p1的variance,它是
类似于单样本的一个p1_hat.如果是continuous normal的话,p1是基于1000个值的,(
x1-p1)^2+....
另外的问题就是当p1_hat=0.5时,corrected variance超出了p1的最大范围。
我的看法是,p*(1-p)/(n-1)做为correction是有问题的,这也是为什么你很难看到
unbiased binomial estimator的说法,在讨论binomial的,更多的提法是sample
proportion是unbiased,而不提variance。 |
|
h***i 发帖数: 3844 | 19 E(p_hat*(1-p_hat))=(n-1)/n p(1-p);
so, you are wrong in this statement,population variance往往会远小于sample
variance!
sample variance:
E(p_hat*(1-p_hat)/n) < p(1-p)/n (variance of phat)
so, we need to adjust the bias. |
|
d********h 发帖数: 2048 | 20 你说的是另一种分布,p1,p2,...pn, 每一个都是binomial,这时,variable是p(p1,p2,
..);现在
我们只关注p1,variable是x(0,1,0..)。
p1是基于1000个Bernoulli分布,根据这1000个sample size,我们是足以得到p1_hat,
p1的variance是根据p1_hat*(1-p1_hat)来估算的,也就是说对于p1的variance,它是
类似于单样本的一个p1_hat.如果是continuous normal的话,p1是基于1000个值的,(
x1-p1)^2+....
另外的问题就是当p1_hat=0.5时,corrected variance超出了p1的最大范围。
我的看法是,p*(1-p)/(n-1)做为correction是有问题的,这也是为什么你很难看到
unbiased binomial estimator的说法,在讨论binomial的,更多的提法是sample
proportion是unbiased,而不提variance。 |
|
q**t 发帖数: 36 | 21 I met a problem to test a nested design with 4 levels. There are one fixed
effect x1.
random effects are nested A, B(A), C( B*A)
For each subgroup C, there are D repeated measurements.
I need to estimated the variance within each subgroup C. Also
I want to test for each subgroup B, the variance within subgroup C
heterogeneous or not?
To estimate the variance within C, here is my code:
*** I try to test the heterogeneity using covtest;
proc mixed data= data4analysis cl covtest ;
clas... 阅读全帖 |
|
v*******e 发帖数: 11604 | 22 细菌在液体中是均匀分布的吗?如果是,假设单位体积里面平均有lambda个细菌,你实
测的单位体积里面的细菌数是泊松分布的,其均值为lambda,variance也是lambda。如
果你测X体积里面的细菌数,那么均值是X*lambda,variance也是X*lambda;所以你从
测X体积的细菌数来计算均值,采用的方法是用X体积里面的细菌数除以X;这个值的均
值是lambda,variance是X*lambda/(X*X)=lambda/X。所以测的体积越大,variance
越小。
如果细菌在液体中不是均匀分布而是有cluster,那么其分布就不是容易弄的了。 |
|
w******d 发帖数: 120 | 23 你是说类似于anova里的variance analysis?
我说的就是总的variance. 比如regularized linear regression, variance怎么算?
为什么regularization会减少variance? |
|
m********y 发帖数: 1867 | 24 variance的题目基本就象小时候的应用题一样,套公式啦,很少特别复杂变化的.
所以要记住那几个variance的公式,然后看题目把条件一个个的放进去,主要就是分清楚
给了什么information,求解什么就好了.
variance的题其实不难,只是通常题目很长,让人觉得害怕.考试前要多练习,习惯写下公
式然后一边读题一边计算,就一点都不难了. |
|
m****n 发帖数: 1066 | 25 RNAi,in vitro transfection.
Control and siRNA treated, QPCR data.
Which one to use, equal variance or unequal variance?
Thanks. |
|
S*******r 发帖数: 11017 | 26 Let's say now we have a variance swap with 90-day expiration and ATM implied
vol of underlying index is 10% for the 90-day period. Is there any certain
relationship between unrealized variance, Kt, of this variance swap and the
90-day ATM implied vol(10%)? Thanks much in advance. |
|
B******y 发帖数: 9065 | 27 楼主,是Homogeneity of Variance,而非Constant Variance,两者之间有本质的差别
。Homogeneity of Variance的假定是进行ANOVA分析的三大假设之一(另两个为
Independence和Normality)。
不严格的说,ANOVA是用方差的形式来推断Mean是否一致。首先假定组间和组内的方差
是相同的,但利用sum of squares分割和F检验(2个方差的比率),发现实际结果与假
定相违背的很多,于是断定差别是来自于组间的Mean的差异巨大。所以说,在进行
ANOVA之前,三大假定必要都符合才可以继续。 |
|
b*****e 发帖数: 223 | 28 看这个: from
http://faculty.chass.ncsu.edu/garson/PA765/anova.htm
The reason for this assumption is that the denominator of the F-ratio is the
within-group mean square, which is the average of group variances taking
group sizes into account. When groups differ widely in variances, this
average is a poor summary measure. Violation of the homogeneity of variances
assumption will increase type I errors in the F test (wrongly rejecting the
null hypothesis). The more unequal the sample sizes in the cell |
|
h******e 发帖数: 1791 | 29 那两者之差的variance呢?比原variance小?
variance |
|
m*****y 发帖数: 229 | 30 今天翻回去看了下以前上课的ppt,觉得repeated measure可以。因为用SPSS GLM
repeated measure 的结果里会出现两个table,“test of within subject effect”
和"test of between subject effect"。total variance在第一个table里,between
hospital variance 在第二个table里,所以应该可以知道“between hospital的
effect占总的variance的多少”。
很久前学得了,都快忘光了,也不知道对不对。谢谢你的包子,呵呵。 |
|
e*****8 发帖数: 30 | 31 刚实习遇到的SAS问题:
一个关于survey的data,把参与调查的人分成若干组,然后在每个组都问相同的若干问
题。问题答案用数字表示,每个数字表示不同程度的看法。要求个within group
variance 和 between group variance 以及 ICC ( intraclass correlation). 应该
用到哪些关键SAS code阿? 请问这些variance 应该怎么理解阿? 比较常用的anova
例子是比较不同的treatment 对农作物高度影响。 对于这种survey data, 不知道怎么
用anova分析了。。。望解疑答惑,感激不尽!! |
|
d********h 发帖数: 2048 | 32 我想我们说的不是一个东西,
我说的sample variance is always smaller than population variance,公式是指
sum(Xi-X_bar)^2 always
相反,对于公式 phat(1-phat)/n ,它与 p(1-p)/n 之间的关系是不确定的,可能大也
可能小,这种情况下,correction是不准确的。
will |
|
d********h 发帖数: 2048 | 33 我想我们说的不是一个东西,
我说的sample variance is always smaller than population variance,公式是指
sum(Xi-X_bar)^2 always
相反,对于公式 phat(1-phat)/n ,它与 p(1-p)/n 之间的关系是不确定的,可能大也
可能小,这种情况下,correction是不准确的。
will |
|
g******2 发帖数: 234 | 34 you have reduced variance because you put some weight on a more stable
estimate.
e.g.
if you have mu_hat as an estimator for mu, then p*mu_1_hat + (1-p)*mu_hat
has smaller variance than mu_hat, where mu_1_hat is independent of mu_hat
and has a smaller variance than mu_hat. |
|
f*****g 发帖数: 15860 | 35 这里面有几个问题。
1) bet size/stack
信息不详
2) range
combo draws vs. set,set只是他的range里面比较小而且比较高端的,他range里面还
有很多其他的可能,比如TPTK,over pair,nut flush draw等等,要综合看你的赢率。
combo和combo也不同,比如KsQs,在JsTd2s的flop上,和9s8s的不一样,因为你的K或
者Q也很有可能是outs。
3) variance
这里和控制variance关系不大,combo往往是big favorite,根据他的range,你还有很
大的fold equity在里面。你不能觉得一次没hit,就怀疑自己的打法。归根结底,扑克
就是在你优势的概率下,做相应的决定。这个胜率最后是通过大量牌(战争)积累出来的
,而非一个或几个战役的得失。
同理,其实bad beat也好,AA让毛驴的77打死什么的,也最终只是长期曲线上的一个微
微弯曲而已,反之(你走运的时候)亦然。当然,这里有个假设,你的bankroll管理很好
,严格控制。 |
|
p**********1 发帖数: 1458 | 36 俺觉得这种情况可以看EV啊,算一算多少个outs,pot odds之类的。像老大说的,控制
variance还是从bankroll management那里做比较好。具体到某一手牌来控制variance
比较难吧。 |
|
c****1 发帖数: 457 | 37 最近看有很多说HUSNG容易addictive。 我也很爱玩,以前以为HU技术成分要占得大些
。 后来才发现有的时候不管你怎么打,牌不行也是白搭。 而且这game还特别容易tilt
。人都有不服输精神,不过越不服输得越多。贴一个我最近打HU的结果。几乎是我打HU
历史上最大的variance。11号那天和同一个人上来连输7吧,咬着牙练习抗tilt能力,
接续玩,后来又连赢6吧。 最后我们两个都感慨HU swing这么大。 这个session,其实
我俩tilt的都不厉害。17号那天遇上一个Russian,上来连续给他bad beat。哥们tilt
开始乱打,让我连赢8把。
总体感觉,HU variance比我想象的太,很多时候是tilt造成(HU比别的game更容易让
你tilt),有的时候不tilt也能连续输N多把。对我来说HUSNG ROI还是不如MTT |
|
g********m 发帖数: 956 | 38 【 以下文字转载自 Statistics 讨论区,原文如下 】
发信人: glassdream (dashao), 信区: Statistics
标 题: How to minimize this variance?
发信站: Unknown Space - 未名空间 (Tue Mar 29 11:00:09 2005) WWW-POST
也许是一个很简单的问题,但实在推不出论文里的结果。
假设x是一个单元随机变量。我们用k个方法去预测它,
y1,y2, ..., yk是这相应的k个预测值。
定义y = a1*y1 + a2*y2 + ... + ak*yk是一个combined forecast for x.
而且sum(a1, a2, ..., ak) = 1, 任何一个常数a1, ..., ak是非负的。
如果要minimize the variance of forecast error bw x and y,
given the assumptions on a1,..., ak,
如何得到这些未知系数a1,..., ak的表达式?
论文的结果是 a = S^(-1)*I/ |
|
c*********t 发帖数: 340 | 39 Sample size for each group?
T-test almost always outperforms welch test (unequal variance) for
microarray expression data. But sample size is very important too. |
|
g********m 发帖数: 956 | 40 【 以下文字转载自 Statistics 讨论区,原文如下 】
发信人: glassdream (dashao), 信区: Statistics
标 题: How to minimize this variance?
发信站: Unknown Space - 未名空间 (Tue Mar 29 11:00:09 2005) WWW-POST
也许是一个很简单的问题,但实在推不出论文里的结果。
假设x是一个单元随机变量。我们用k个方法去预测它,
y1,y2, ..., yk是这相应的k个预测值。
定义y = a1*y1 + a2*y2 + ... + ak*yk是一个combined forecast for x.
而且sum(a1, a2, ..., ak) = 1, 任何一个常数a1, ..., ak是非负的。
如果要minimize the variance of forecast error bw x and y,
given the assumptions on a1,..., ak,
如何得到这些未知系数a1,..., ak的表达式?
论文的结果是 a = S^(-1)*I/ |
|
i*****o 发帖数: 42 | 41 Can anyone refer me a paper which has some clear description on how to do the
variance decomposition for a nonlinear system (say variance decomposition of Y
= A + B'X + X'CX while X follows a AR(p) process)? It seems that this need
simulation and average out the paths...
Thanks! |
|
p*******p 发帖数: 13670 | 42 它的平均值很直接,如何证明一个lognormal分布的变量x的
variance=exp(a^2)*(exp(a^2)-1)呢? a^2是ln(x)的variance |
|
BR 发帖数: 4151 | 43 一个symmetric 的distribution, 如果把它在symmetric 那点分成左右两段。整个
distribution 的variance 和右边(或者左边)这个分段的variance 有什么关系吗?
谢谢。 |
|
a***n 发帖数: 40 | 44 【 以下文字转载自 Statistics 讨论区 】
发信人: alvin (al), 信区: Statistics
标 题: what is this variance?
发信站: BBS 未名空间站 (Sun Jan 28 14:54:43 2007)
for a random sample, how to compute the variance of the sample correlation
coefficient Sxy/(Sx*Sy)? Thanks. |
|
g*****z 发帖数: 333 | 45 I am trying to estimate the variance of a normally distributed data set. All
the information I have about the data set is its mean, min, max and number
of points in the data set. Is there any algorithm to estimate the variance
from these information?
I did some experiments in R and tried some formulae. Two of them looked OK.
1. (mean - min)(max - mean)/18
2. [(min - mean)^2 + (max - mean)^2]/2/18
Is there any theoretical basis for those experimental results?
Thanks a lot for any suggestions and |
|
b******k 发帖数: 58 | 46 A quick google search shows more than 5 articles on the first page about
dynamic mean-variance hedge, lazyass.
PS, I doubt the mean-variance has any practical uses in the industry due to
its flawed assumption in the return distribution. |
|
q**j 发帖数: 10612 | 47 just look at the name. GARCH means 'generalized autoregressive conditional
heteroschedesticity'. so if you think conditional variance is changing,
GARCH; if not, straight variance. |
|
D******n 发帖数: 2836 | 48 equal variance ba, constant means it is constant ...strange word...
also called homoscedasticity(so hard to pronounce....)
equal variance makes sure u can orthogonally decompose the SS and so that u
can use F test... |
|
B****n 发帖数: 11290 | 49 對喔 說錯了 抱歉
所以不能夠從個別的variance pool起來 而是要用兩次的difference來算variance
(因為difference的平方 必然會有中間項) |
|
h******e 发帖数: 1791 | 50 那该怎么算呢?不过无论如何,这个pooled variance应该比大的variance小,比小的
大,对不对? |
|