a*****g 发帖数: 2 | 1 第一次发帖,想向大家请教一下一个面试题目(本人非统计专业,该题对版上各位应该
是小菜一碟):
给你5个security 的价格x1, x2, x3,x4 ,x5。 所给价格是高频数据,即每隔一分钟给
一个价格。 让你给x1建立一个模型,用x2(t), ..., x5(t) 表示x1(t), 式子也可包含
t-1 时刻。
我是这样做的:
-- 因为是高频数据,auto-correlation很大,于是用 log-return, 即 r(t) = log[x(
t)/x(t-1)] 去分析,
-- 发现 r1(t), r2(t) ,..., r5(t) 之间几乎没有cross-correlation, 但
contemporaneous 的correlation 很大,于是用PCA(principal component analysis)做
-- 线性回归后得出的x1(t) 的predicted price 和 真实的价格吻合很好, R^2 大概
0.8 左右。
感觉这样做应该差不多了,但好像出题者不是很满意,所以想请教大家我哪个地方疏漏
了。
十分感谢。 | l***a 发帖数: 12410 | 2 你的r1只用到r2-r5?pca之前没有再去验证x2-x5对r1的prediction?
含
x(
)做
【在 a*****g 的大作中提到】 : 第一次发帖,想向大家请教一下一个面试题目(本人非统计专业,该题对版上各位应该 : 是小菜一碟): : 给你5个security 的价格x1, x2, x3,x4 ,x5。 所给价格是高频数据,即每隔一分钟给 : 一个价格。 让你给x1建立一个模型,用x2(t), ..., x5(t) 表示x1(t), 式子也可包含 : t-1 时刻。 : 我是这样做的: : -- 因为是高频数据,auto-correlation很大,于是用 log-return, 即 r(t) = log[x( : t)/x(t-1)] 去分析, : -- 发现 r1(t), r2(t) ,..., r5(t) 之间几乎没有cross-correlation, 但 : contemporaneous 的correlation 很大,于是用PCA(principal component analysis)做
| a*****g 发帖数: 2 | 3 你好,libra
请问如何去验证 x2~x5对 r1的prediction?
谢谢
【在 l***a 的大作中提到】 : 你的r1只用到r2-r5?pca之前没有再去验证x2-x5对r1的prediction? : : 含 : x( : )做
| l***a 发帖数: 12410 | 4 你怎么看r2-r5对r1的预测的,就怎么去看x2-x5
【在 a*****g 的大作中提到】 : 你好,libra : 请问如何去验证 x2~x5对 r1的prediction? : 谢谢
| p********6 发帖数: 1802 | 5 问题是你怎么做t+1的prediction
含
x(
)做
【在 a*****g 的大作中提到】 : 第一次发帖,想向大家请教一下一个面试题目(本人非统计专业,该题对版上各位应该 : 是小菜一碟): : 给你5个security 的价格x1, x2, x3,x4 ,x5。 所给价格是高频数据,即每隔一分钟给 : 一个价格。 让你给x1建立一个模型,用x2(t), ..., x5(t) 表示x1(t), 式子也可包含 : t-1 时刻。 : 我是这样做的: : -- 因为是高频数据,auto-correlation很大,于是用 log-return, 即 r(t) = log[x( : t)/x(t-1)] 去分析, : -- 发现 r1(t), r2(t) ,..., r5(t) 之间几乎没有cross-correlation, 但 : contemporaneous 的correlation 很大,于是用PCA(principal component analysis)做
|
|