由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Statistics版 - 我说老陈,咱别玩儿虚的了。你给说明一下这个简单的例子
相关主题
请教一个 R 中随机抽样的问题!Sample size for a Normality Test
陈大师, 我很好奇问题求解。
恭请luckyjet (tejykcul)回答二个问题抽样问题求助
一个简单的数学问题,我和我老板争论不停,其中一定有一个人是(转载)弱问一个概念
请大家帮我看看我的新概念系统吧。问题请教: 如果样本数量是3, 怎么做test?
问一个模型拟合问题Dr. Efron要来DC讲座了,我该去听吗?
求助一个学术问题请教bootstrap的问题
一个线性回归问题,希望大家提供点思路几个面试问题
相关话题的讨论汇总
话题: 总体话题: 未知数话题: 抽样话题: 老陈话题: 样本
进入Statistics版参与讨论
1 (共1页)
g********r
发帖数: 8017
1
我想知道全美国人的身高体重分布,于是我在洛杉矶市中心随机抽样20个人,量了他们
的身高体重。请问大师,在这个例子里,
样本空间师什么?它怎样联系到我想知道的真实分布?
T*******I
发帖数: 5138
2
这确实是我愿意讨论的问题。
首先,指出你的统计设计上存在的问题。你的目的是“想知道全美国人的身高体重分布
”,却只在“洛杉矶市中心随机抽样20个人”,你不觉得你说的有点儿……么?

【在 g********r 的大作中提到】
: 我想知道全美国人的身高体重分布,于是我在洛杉矶市中心随机抽样20个人,量了他们
: 的身高体重。请问大师,在这个例子里,
: 样本空间师什么?它怎样联系到我想知道的真实分布?

s*****r
发帖数: 790
3
你看,这个问题你理解的不错。从那20个人的数据能得到一些“结论”,但是却不一定
能推广到别处。其实,就算是想知道洛杉矶的人的身高体重分布,从那20个人的数据也
不一定得到适用的结果。cross validation这时候很容易就会告诉你了。

【在 T*******I 的大作中提到】
: 这确实是我愿意讨论的问题。
: 首先,指出你的统计设计上存在的问题。你的目的是“想知道全美国人的身高体重分布
: ”,却只在“洛杉矶市中心随机抽样20个人”,你不觉得你说的有点儿……么?

g********r
发帖数: 8017
4
好。老陈对population的定义还是很清楚的。继续问:
(1)如果真的是全美随机抽样,20个人。你的所谓“样本空间”怎么样联系到这个研
究的目标?
(2)如果另一个人做了抽样,他在洛杉矶抽样但是没有告诉你。你以为他全美抽样。
你的结论和事实之间又什么样的关系?

【在 T*******I 的大作中提到】
: 这确实是我愿意讨论的问题。
: 首先,指出你的统计设计上存在的问题。你的目的是“想知道全美国人的身高体重分布
: ”,却只在“洛杉矶市中心随机抽样20个人”,你不觉得你说的有点儿……么?

l***o
发帖数: 5337
5
不对,你的错误回答暴露了你方法论上的缺陷!楼主说的‘随机抽样'指得是一种麻将
的和法,’量‘指得
是昨天晚上阿瓦拉拉星球上穿越时空的飞镖真人秀。我不管你们正常人类语言对这些
term的定义是什
么,但在这个问题中实际你应该指出的是萨达姆和奥尼尔的三姨的第六个小舅子的私人
关系。
你明白了吗?要是不明白,就更加暴露了你的理论没有涵盖辩证法的精髓。。。

【在 T*******I 的大作中提到】
: 这确实是我愿意讨论的问题。
: 首先,指出你的统计设计上存在的问题。你的目的是“想知道全美国人的身高体重分布
: ”,却只在“洛杉矶市中心随机抽样20个人”,你不觉得你说的有点儿……么?

T*******I
发帖数: 5138
6
其实,在我看来,即使是在全美只随机地抽取一个人进行估计,也没什么不可。关键是
,LZ的首贴里将定义的总体与实际抽样的群体混淆了。
假如受条件限制只能获得某个总体中的一个独立个体,那么,对该个体的描述也可以被
认为是有一定意义的,至少比没有对该总体的任何观察结果要好。
20/230000000=0.000000087

2000/230000000=0.0000087
在认识论上有何差别?都是对总体的极小比例的认识。我不认为这两者的结果之间会存
在颠覆性的不同。
统计就是用一种经济省时的办法获得对未知总体的某种认识。

【在 s*****r 的大作中提到】
: 你看,这个问题你理解的不错。从那20个人的数据能得到一些“结论”,但是却不一定
: 能推广到别处。其实,就算是想知道洛杉矶的人的身高体重分布,从那20个人的数据也
: 不一定得到适用的结果。cross validation这时候很容易就会告诉你了。

T*******I
发帖数: 5138
7
在我看来,如果对未知总体的样本量只有20例,那么,其连续型变量的最大最小测量之
间的一个连续空间就构成了一个尺度空间,而每个个体的测量结果就构成了一个样本空
间。如果将这20人的身高和体重描绘在一个二维空间里,为什么我们不能说这个包括
20个样本点在内的二维空间就是这个样本构成的一个样本空间?这是一个令非数学背
景的我感到困惑的地方。
样本是统计学里最重要的核心概念。一个样本就是我们能够获得的对外部未知世界的经
验事实,是我们因此而可以获得有限认识的基础。离开了这个基础,We can do
nothing. 但我们又不能将认识仅仅停留在这个直观的样本之上,因为它仅仅是一个随
机得到的子集。由此,我们形成了样本的代表性的概念。没有什么magic的数学理论可
以解决样本与其总体间的联系的确定性问题。这个就是一个认识上的信心问题。
要想使得一个样本对总体具有代表性,抽样时就要满足随机和足量的法则。终极地说,
真正做到这两点实际上都极其的困难,因为总体具有无限性且一般来说未知,因而“随
机”和“足量”都是很难被较好地定义的。
以上算是对问题(1)的不成熟的回答。
至于问题(2),我觉得那个抽样的人没告诉你只能被称为是工作上的失职或欺骗(瞧
,我多么的幼稚),我不认为统计是要象数学那样解未知数。我们只有一个未知数,那
就是总体。其它都是人操作的,没有什么不可知。故意人为地制造未知数,那不是统计
要解决的问题。

【在 g********r 的大作中提到】
: 好。老陈对population的定义还是很清楚的。继续问:
: (1)如果真的是全美随机抽样,20个人。你的所谓“样本空间”怎么样联系到这个研
: 究的目标?
: (2)如果另一个人做了抽样,他在洛杉矶抽样但是没有告诉你。你以为他全美抽样。
: 你的结论和事实之间又什么样的关系?

d********u
发帖数: 5383
8
“没有什么magic的数学理论可
以解决样本与其总体间的联系的确定性问题。这个就是一个认识上的信心问题。”
我太阳你妹,原来你的意思就是“蒙”啊。怪不得你信心这么足,上下嘴唇一碰,连手
纸都省了。

【在 T*******I 的大作中提到】
: 在我看来,如果对未知总体的样本量只有20例,那么,其连续型变量的最大最小测量之
: 间的一个连续空间就构成了一个尺度空间,而每个个体的测量结果就构成了一个样本空
: 间。如果将这20人的身高和体重描绘在一个二维空间里,为什么我们不能说这个包括
: 20个样本点在内的二维空间就是这个样本构成的一个样本空间?这是一个令非数学背
: 景的我感到困惑的地方。
: 样本是统计学里最重要的核心概念。一个样本就是我们能够获得的对外部未知世界的经
: 验事实,是我们因此而可以获得有限认识的基础。离开了这个基础,We can do
: nothing. 但我们又不能将认识仅仅停留在这个直观的样本之上,因为它仅仅是一个随
: 机得到的子集。由此,我们形成了样本的代表性的概念。没有什么magic的数学理论可
: 以解决样本与其总体间的联系的确定性问题。这个就是一个认识上的信心问题。

T*******I
发帖数: 5138
9
在这里有三个基本要素:
1)总体 = 未知数
2)样本 = 已知数
3)两者间联系的确定性 = 未知数
如此简单的概念模型,还要解释吗?

【在 d********u 的大作中提到】
: “没有什么magic的数学理论可
: 以解决样本与其总体间的联系的确定性问题。这个就是一个认识上的信心问题。”
: 我太阳你妹,原来你的意思就是“蒙”啊。怪不得你信心这么足,上下嘴唇一碰,连手
: 纸都省了。

s*****r
发帖数: 790
10

在我看来,如果对未知总体的样本量只有20例,那么,其连续型变量的最大最小测量之
间的一个连续空间就构成了一个尺度空间,而每个个体的测量结果就构成了一个样本空
间。
=========================
“其连续型变量的最大最小测量之间的一个连续空间”?这是什么连续空间?还是你说
的是区间?空间可是有明确的定义的,希望你知道那个定义。
================
至于问题(2),我觉得那个抽样的人没告诉你只能被称为是工作上的失职或欺骗(瞧
,我多么的幼稚),我不认为统计是要象数学那样解未知数。我们只有一个未知数,那
就是总体。其它都是人操作的,没有什么不可知。故意人为地制造未知数,那不是
====================
???你太天真了。有无数的因素你实际上没法知道,或者不知道要知道,难道你就不
做了?

【在 T*******I 的大作中提到】
: 在我看来,如果对未知总体的样本量只有20例,那么,其连续型变量的最大最小测量之
: 间的一个连续空间就构成了一个尺度空间,而每个个体的测量结果就构成了一个样本空
: 间。如果将这20人的身高和体重描绘在一个二维空间里,为什么我们不能说这个包括
: 20个样本点在内的二维空间就是这个样本构成的一个样本空间?这是一个令非数学背
: 景的我感到困惑的地方。
: 样本是统计学里最重要的核心概念。一个样本就是我们能够获得的对外部未知世界的经
: 验事实,是我们因此而可以获得有限认识的基础。离开了这个基础,We can do
: nothing. 但我们又不能将认识仅仅停留在这个直观的样本之上,因为它仅仅是一个随
: 机得到的子集。由此,我们形成了样本的代表性的概念。没有什么magic的数学理论可
: 以解决样本与其总体间的联系的确定性问题。这个就是一个认识上的信心问题。

1 (共1页)
进入Statistics版参与讨论
相关主题
几个面试问题请大家帮我看看我的新概念系统吧。
有没有可根据已采样本结果动态地调整样本量的方法问一个模型拟合问题
ORDINAL的变量到底当作连续型的好,还是离散型的好么?求助一个学术问题
请教如果计算CI for the ratio of two independent means?一个线性回归问题,希望大家提供点思路
请教一个 R 中随机抽样的问题!Sample size for a Normality Test
陈大师, 我很好奇问题求解。
恭请luckyjet (tejykcul)回答二个问题抽样问题求助
一个简单的数学问题,我和我老板争论不停,其中一定有一个人是(转载)弱问一个概念
相关话题的讨论汇总
话题: 总体话题: 未知数话题: 抽样话题: 老陈话题: 样本