h******r 发帖数: 201 | 1 如果我有100G的数据,来自对同一个变量的observation, 如何找到它的distribution
? |
g*****o 发帖数: 812 | 2 样本这么多, 直接用分析空间数据的方法, 画条平滑的曲线/面比较方便吧
distribution
【在 h******r 的大作中提到】 : 如果我有100G的数据,来自对同一个变量的observation, 如何找到它的distribution : ?
|
l******n 发帖数: 9344 | 3 太多数据了,怕你最后做test,无论啥distribution都会悲剧的
先考虑怎么sample吧
distribution
【在 h******r 的大作中提到】 : 如果我有100G的数据,来自对同一个变量的observation, 如何找到它的distribution : ?
|
n****1 发帖数: 1136 | |
p*********s 发帖数: 61 | 5 I will try nonparametric methods first like bucketing/histogram, then you
can make various distribution assumptions based on that. |
L*******t 发帖数: 2385 | 6 这是高频吧?而且是很多年的?
我记得Gene Stanley好像做个很多power law的东西,如果记忆没有混乱,似乎就是说
不同时间尺度上的distribution的,我觉得可以从这儿入手。
先sample和fit低频的数据,然后再用power law。
distribution
【在 h******r 的大作中提到】 : 如果我有100G的数据,来自对同一个变量的observation, 如何找到它的distribution : ?
|
L*******t 发帖数: 2385 | 7 能详细说说MC怎么做吗?
【在 n****1 的大作中提到】 : monte carlo?
|