由买买提看人间百态

topics

全部话题 - 话题: chisquare
1 (共1页)
f******r
发帖数: 11
1
来自主题: Statistics版 - 有关ChiSquare分布两小问
两个ChiSquare(自由度都为1)的差是什么分布啊?简单推了一下,有一步积分遇到问
题。
两个ChiSquare(自由度都为1)的weighted和(权均在0,1之间)是什么分布啊?
可以推吗?
谢谢大虾们
n******7
发帖数: 12463
2
来自主题: Programming版 - 有没有觉得scipy很稀烂的?
平时主要用R,用过几次scipy统计包每次都出点大大小小的问题
最近几次如下
1. fit 一个distribution 参数,搜了一下,stack overflow上一哥们儿怎么都算不对
,后来发现是老版本bug,新版本才fix
2. 做binomial sampling,结果给出超大的数,结果发现是没有正确处理nan
3. 做chisquare,用0.11版发现chisquare([10,10,20,20])可以,
chisquare([10,10,20,20],[10,10,20,20])就不行,必须
chisquare(np.array([10,10,20,20]),np.array([10,10,20,20]))
这叫什么事?这个在0.14版也ok了
最近也开始用numpy,不知道是不是也是怎么buggy?
D*********2
发帖数: 535
3
来自主题: Statistics版 - 问个貌似简单的生统问题
the chisquare test can be used for 2*k or even p*k cases.
extra caution may be exercised when applying chisquare test for drug safety
data, where outcome are fairly sparse.
G***G
发帖数: 16778
4
来自主题: Fishing版 - 【冬鱼肥】毫无悬念的limit
based on what criteria did your boss make the conclusion, statistically?
1)proportion
2)hypothesis two groups testing
3) chisquare testing?

with
M
n******7
发帖数: 12463
5
来自主题: Programming版 - 有没有觉得scipy很稀烂的?
我一般都是转成array来用的
今天发现这个问题是因为我看scipy的chisquare文档里面直接用的python list
就试了一下,发现在0.11不完全work
我本来以为都是要np.array的
你是scipy的contributor?
A****t
发帖数: 141
6
log(likelihood ratio)
这里的likelihood ratio一般小于1,所以log(likelihood ratio)小于0
-2log(likelihood ratio)才是chisquare distribution
G******n
发帖数: 289
7
chisquare就可以了
ks walk更豪华了
d******e
发帖数: 7844
8
qq plot and chisquare plot are much better.
l******r
发帖数: 18699
9
最简单的,X^2是chisquare
d*********a
发帖数: 255
10
来自主题: Statistics版 - 有关ChiSquare分布两小问
please read
1."probability distributions involving gaussian random variables" by Marvin
K.simon
2."on the applications of the double bessel function"by karl pearson 1933
e*****n
发帖数: 15
11
来自主题: Statistics版 - 有关ChiSquare分布两小问
these are simply quadratic forms of a 2-d normal vector
l*********s
发帖数: 5409
12
来自主题: Statistics版 - 请教一个统计问题,泊松分布
or chisquare goodness of fit test
h******s
发帖数: 3420
13
来自主题: Statistics版 - 我适不适合做统计?
成千上万个细节不可能每个都注意到,没人能做到完美,只能说尽量给老板留下一个作
事情非常认真仔细的印象,
chisquare 那个笔误不是很大问题,bmi 那个就比较要命了,至于missing, 如果新手
不懂处理比较正常,但是对干统计来讲也是相当致命,是data cleaning 里最基本的一
步,这个都忽略了,更加不可能注意到data 的其他问题。
我们同事也有新手,虽然经常犯错误,比方把other race 定义成 missing 之类的,但
是工作态度非常认真,每一个细节都刨根问底。 你老板可能觉得你一方面没经验,另
一方面付出不够吧。只能换一份工作再努力一下了。
p********a
发帖数: 5352
14
来自主题: Statistics版 - [合集] 我适不适合做统计?
☆─────────────────────────────────────☆
libra (秤子) 于 (Wed Sep 28 19:55:32 2011, 美东) 提到:
cft
既然你自己都说了受感情困扰所以注意力不能集中,这个状况下你如果不能强迫自己对
待好工作的话,那就只好先解决根源了

MISSING
☆─────────────────────────────────────☆
huaifans (坏粉丝) 于 (Wed Sep 28 20:16:07 2011, 美东) 提到:
再换份工作试试。
我感觉干统计最重要就是细节。什么MISSING,DUPLICATE啊,一个VALUE的各种可能性
啊,有时候"<="跟"<"都是两个故事。
90%的时间精力都花在这上面了。 很难想象不是DETAIL ORIENTED的人能干好这活。
一开始不习惯也很正常。以后尽量注意就好了。同一个ASSIGNMENT用不同方法互相检查
以下再交给老板。细节出错的确非常忌讳。偶知道有很SENIOR 技术很强的人因为马虎
被开掉的。
MISSING
☆─────────────... 阅读全帖
w*******9
发帖数: 1433
15
来自主题: Statistics版 - 2 by 2 table : testing of independence
Does Mcnemar test really test independence? Many people say when the data is
paired use Mcnemar test; otherwise choose Pearson or Fisher exact test. For
example http://yatani.jp/HCIstats/ChiSquare
What do they mean by "paired data"? Any discussion is welcome.
w*******n
发帖数: 469
16
来自主题: Statistics版 - 这个问题怎么可用一个test测出来
Chisquare? use the percentage as weight?
t*****8
发帖数: 157
17
来自主题: Statistics版 - 这个应该用什么test?
有两组人,相互独立,
第一组, case,有10个人 有100次住院记录, 其中20次是离上次出院时间在5天之内,
ratio1
是 20/100;
第二组, control,有20个人 有120次住院记录, 其中30次是离上次出院时间在5天之内
, ratio2
是 30/120
test ratio1=ratio2
住院 再住院
case 100 20
control 120 30
我说用Chisquare, 但是我老板说用z test? 到底用什么test?我理解是z是assume
population variance is known,在这里只知道 sample variance,所以不能用z test,
我对吗?
谢谢
g******7
发帖数: 1433
18
来自主题: Statistics版 - 新手问一个很基础的SAS code问题
谢谢! 用了你的以后run出来了,我在run之前的把sex中unknown和空白的obs drop掉
,只留male和female的,但这样出来写的是Chi-Square Test
for Specified Proportions,那这还是一个chisquare test? 那默认的是5% 的
significant level么?
l****u
发帖数: 529
19
Chisquare is two sided Z. If you want one sided test, then choose Z.
t*****w
发帖数: 254
20
http://www.ling.upenn.edu/~clight/chisquared.htm
Chi-square test will test the disease status is independent from mouse
groups.
Q*****T
发帖数: 558
21
lz对统计的迷惑程度估计已经被各位笑掉大牙了。。。其实我有挺多东西不懂(虽然其
实日常工作中也基本用不到),但是仍然很想搞清楚的。。。
1,被你们拍砖说GLM的residual不一定是正态分布以后,我google了一下,学习了
residual的分布跟response variable的分布相关,譬如data是binary,那residual就
是binomial。那么问题来了,http://www.mun.ca/biology/dschneider/b7932/B7932Final10Dec2008.pdf 这篇文章第二页第六行,说model fit improvement是chi-square distribution (关于这点我也是一知半解,我课上跟老师做过nested model comparison,就是用两个model的-2log likelihood的差,再用degree of freedom的差,用chisquare statistics比较两个model是不是有显著不同),然后这篇文章还是第二页,第13行说到“The importance of normality ... 阅读全帖
i***y
发帖数: 98
22
1.说model fit improvement是chi-square distribution (关于这点我也是一知半解
,我课上跟老师做过nested model comparison,就是用两个model的-2log
likelihood的差,再用degree of freedom的差,用chisquare statistics比较两个
model是不是有显著不同)
likelihood ratio test
然后这篇文章还是第二页,第13行说到“The importance of normality of residuals
in GLMs, on the
other hand, is debated.”
means some people don't care the residual in GLM
try to read this book:An Introduction to Generalized Linear Models
3.上面模型中,b和c的point estimate是用OLS或者Maximum likelihood的方法估计出
来的(这种说法对吗??),
I... 阅读全帖
1 (共1页)