s******a 发帖数: 184 | 1 有两个时间序列, 我现在可以用Lp Norm 或者 Dynamic Time Warpinging 计算出它们
之间的距离, 但这些距离只是相对的, 一般用于聚类或分类。可我现在的问题是我只
有两个序列, 我只想知道这两个序列可不可以相互替换, 或者说足够近似。 这一般
都有哪些可以定量的方法呢。 | g******2 发帖数: 234 | 2 not an expert, just want to throw bricks to lure jades (pao zhuan yin yu):
1. calculate linear correlation?
2. build a linear model x ~ y using only part of the data, and use other
part of the data as a validation data set.
3. a) fit a time series model for time series x (arima etc.), record the
fitted values
b) randomly swap n elements of time series x with y, refit the time
series model, record fitted values, calculate the distance (MSE etc.)
between the fitted values from b) and those from a).
c) repeat b) k times to obtain a distribution of the distance so that you
know the expected distance and uncertainty of distance. | i***y 发帖数: 98 | | l*****n 发帖数: 608 | 4 如果你只有两个序列的话, 假设他们是对齐的 (No time delay between them), 你可
以用一个moving window 去计算他们每一段的hamming distance, 那么你会有足够多的
样本去判断. 但是我觉得您是否需要先判断你关心数据的哪一个方面? 这两个数据之间
的关系是什么?
比如, 要比较序列的趋势,同时数据的绝对大小并不重要的话, 你可以计算他们的
Kendall tau distance,
http://en.wikipedia.org/wiki/Kendall_tau_distance
如果是模拟出来的数据, 要比较是否完全重复了实验的数据,也可以使用Granger
Causality 比较他们两者之间的causality (实际也是一种delay embadding做
regression的方法) 计算他们的distance. 或者用time embadding的方法, 将时间序列
投影到N维空间内, 计算他们对应点的距离.
但是, 如果数据是独立的,那么你可能只需要判断他们的统计参数, 比如傅立叶变换的
频谱, 关联长度等等, 来决定是否足够近似. 我处理的主要是神经信号的数据, 这是我
粗浅的意见, 请勿奸笑.
【在 s******a 的大作中提到】 : 有两个时间序列, 我现在可以用Lp Norm 或者 Dynamic Time Warpinging 计算出它们 : 之间的距离, 但这些距离只是相对的, 一般用于聚类或分类。可我现在的问题是我只 : 有两个序列, 我只想知道这两个序列可不可以相互替换, 或者说足够近似。 这一般 : 都有哪些可以定量的方法呢。
|
|