a*******8 发帖数: 4534 | 1 搞生物基因的一个美国教授,说自己做model的时候发明了一种统计方法,他叫leave-
out statistics.
1.有1000个基因样本,先建个模型画个三维图,(他说是模型,不过我估计是用回归分
析最小二乘)。、
2.接下来从中抽出10个样本,然后把剩下的990个再建个模型,画个图(在用回归分析
做个东西)。
3.如果这两个图基本类似,那就再用剩下的990个做同样的工作,直到最后找出特别的
几个数据。
4.如果不同,那就有需要的基因数据在刚才的10个当中。
他问我这在统计里面叫什么,我想来想去不知道这个是什么方法。哪位大牛给解释一下
?? |
R********n 发帖数: 519 | 2 这个方法,基本上和遍历差不多,呵呵,至少应该用一个stochastic sampling吧
和machine learning&statistics里面的Cross-validation, Leave one out有些类似,
不过目的不一样,C.V.主要是为了提高泛化学习能力用的
【在 a*******8 的大作中提到】 : 搞生物基因的一个美国教授,说自己做model的时候发明了一种统计方法,他叫leave- : out statistics. : 1.有1000个基因样本,先建个模型画个三维图,(他说是模型,不过我估计是用回归分 : 析最小二乘)。、 : 2.接下来从中抽出10个样本,然后把剩下的990个再建个模型,画个图(在用回归分析 : 做个东西)。 : 3.如果这两个图基本类似,那就再用剩下的990个做同样的工作,直到最后找出特别的 : 几个数据。 : 4.如果不同,那就有需要的基因数据在刚才的10个当中。 : 他问我这在统计里面叫什么,我想来想去不知道这个是什么方法。哪位大牛给解释一下
|
d******e 发帖数: 7844 | 3 我记得这个应该就是Outlier detection的一种方法。
【在 R********n 的大作中提到】 : 这个方法,基本上和遍历差不多,呵呵,至少应该用一个stochastic sampling吧 : 和machine learning&statistics里面的Cross-validation, Leave one out有些类似, : 不过目的不一样,C.V.主要是为了提高泛化学习能力用的
|
R********n 发帖数: 519 | 4 哦,恩,如果从outlier detection的角度来看,这个方法太慢了,比较简单
当然,优点是不需要太多的assumption
【在 d******e 的大作中提到】 : 我记得这个应该就是Outlier detection的一种方法。
|