问一个问题 - Statistics版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Statistics版 - 问一个问题

相关主题
● [合集] 请教关于大样本下分布的比较的问题	● 请教熟悉NLP的朋友：怎么找到phrase
● 求助，这个问题应该用哪种假设检验？	● Re: Latex 问题：独立同分布
● 统计的学问 (转载)	● Re: beta分布是怎么回事？
● 求一道假设检验题目的解答，急，谢谢了	● [合集] probability question help
● 请教如何检验是否均匀分布（binomial）	● 一些初级time series问题请教
● 假如一个变量 X 是另外几个变量的函数， X=f(Y1, Y2,...，Yn)，假设Y1，。。YN 的分布是知道的，如何得出X的分布	● [合集] 继续问time series 问题
● 假设检验的问题	● 一个随机数 a, 它的上限是b, 在0 到b 之间希望a类似于高斯分布. 请问有没有这样的分布.
● 请问一个非常简单的统计问题	● 请问一个生物统计的问题，小样本量的统计检验

相关话题的讨论汇总
话题: ww话题: tailed话题: h1话题: 出现话题: 假设检验

进入Statistics版参与讨论

1

(共1页)

D***r 发帖数: 7511	1 我们在做一个项目。简单说就是假设一个词在一个句子里出现的概率p(w)有一个分布。如果两个词都在同一句子里出现，则有一个联合分布p(ww')。然后如果两个词经常一起出现，则可能意义相关（比如可能是一个词组，或者一个词代表另一个词的属性，等等）方法之一是用假设检验，也就是看p(ww')和p(w)*p(w')的关系。我觉得应该用one-tailed test，因为我们是想找经常一起出现的也就是p(ww')显著大于p(w)p(w')的。所以H1：p(ww')>p(w)p(w') 但是负责这个项目的老师觉得应该用two-tailed test H1: p(ww')!=p(w)p(w') 我觉得如果用two－tailed，算出的可能好多是互相排斥的词，根本就不make sense。比如可能＂白色＂＂黑熊＂成了significant 的结果。你们觉得呢？
m*********n 发帖数: 413	2 这是text mining里面很standard的找topic的方式吧，放狗搜一下吧应该有比这更fancy的办法。【在 D**r 的大作中提到】 : 我们在做一个项目。简单说就是假设一个词在一个句子里出现的概率p(w)有一个分布。 : 如果两个词都在同一句子里出现，则有一个联合分布p(ww')。 : 然后如果两个词经常一起出现，则可能意义相关（比如可能是一个词组，或者一个词代 : 表另一个词的属性，等等） : 方法之一是用假设检验，也就是看p(ww')和p(w)p(w')的关系。 : 我觉得应该用one-tailed test，因为我们是想找经常一起出现的 : 也就是p(ww')显著大于p(w)p(w')的。 : 所以H1：p(ww')>p(w)p(w') : 但是负责这个项目的老师觉得应该用two-tailed test : H1: p(ww')!=p(w)p(w')
D***r 发帖数: 7511	3 是的，假设检验比较简单而已我们先这样筛一下不过如果有更好的办法，也可以直接用别的【在 m*********n 的大作中提到】 : 这是text mining里面很standard的找topic的方式吧，放狗搜一下吧 : 应该有比这更fancy的办法。
m*********n 发帖数: 413	4 这样做假设检验会不会有速度问题，毕竟是 o(w**2) w: number of words. 如果我没理解错的话。
D***r 发帖数: 7511	5 是比较慢不过我们只挑选名词和形容词（已经有词性标注） corpus也不是特别大，所以用python code运行一下也没多久【在 m*******n 的大作中提到】 : 这样做假设检验会不会有速度问题，毕竟是 o(w2) : w: number of words. 如果我没理解错的话。

1

(共1页)

进入Statistics版参与讨论

相关主题
● 请问一个生物统计的问题，小样本量的统计检验	● 请教如何检验是否均匀分布（binomial）
● 问个概率小题	● 假如一个变量 X 是另外几个变量的函数， X=f(Y1, Y2,...，Yn)，假设Y1，。。YN 的分布是知道的，如何得出X的分布
● [合集] 这种双层数据问题怎么统计比较好？	● 假设检验的问题
● 如何用统计来证明上帝的存在性？	● 请问一个非常简单的统计问题
● [合集] 请教关于大样本下分布的比较的问题	● 请教熟悉NLP的朋友：怎么找到phrase
● 求助，这个问题应该用哪种假设检验？	● Re: Latex 问题：独立同分布
● 统计的学问 (转载)	● Re: beta分布是怎么回事？
● 求一道假设检验题目的解答，急，谢谢了	● [合集] probability question help

相关话题的讨论汇总
话题: ww话题: tailed话题: h1话题: 出现话题: 假设检验

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)