由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Quant版 - 请教:machine learning methods 真能predict price movement? 有这么神吗?
相关主题
一个年收益15%的策略(系统),如何多挣些钱 ?difference between a quant and programmer?
发现做quant高中学位就差不多了historical data back test的标准流程
sentiment analysis in finance. 这玩意有啥用处?某人在投行做quant,他老婆想炒股可以吗?
有人知道Winton Capital么?Hedge Funds 2011 -- 机器派完胜
请教non-compete问题有人用bayesian概率用在投资上么?
这个东西有没有市场?company timeline其实很失落
Paper Trading 对验证一个 Trading Strategy 的意义有多大?问两个交易成本的问题(StatArb/HFT)
请教一下,面试如果问Market Microstructure theory会问什么问题寻找有钱的合伙人
相关话题的讨论汇总
话题: model话题: ml话题: finance话题: sample
进入Quant版参与讨论
1 (共1页)
m**********4
发帖数: 774
1
最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
在实际中用起来风险很大..
不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
那PROFIT MARGIN很快就会消失了吧。。
我的想法很幼稚,希望有这方面经验的大牛指点一下。
a*******1
发帖数: 1554
2
请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of
-sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准
。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆
parameter然后用linear regression/svm选significant的出来。。。
请拍砖。。。
L*******t
发帖数: 2385
3
Finance paper里面的linear models是啥模型?
你看过的paper,
能否给个链接啊?

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

m**********4
发帖数: 774
4
It is not out-of sample, of course.
Generally, it is not used for prediction. It is used for explanation.
你说的完全正确。学术界做statistics de人大多数不用自己CLEAN DATA。 我个人认为
,用SVM,NN等等都是次要问题。主要问题是找到features。 比如地震和癌症预测,我
还是相信自然届存在那些FEATURE的,但怎么构造出这些FEATURE现在还没有解决。我看
到这些price prediction 文章用到的features都是我们能想到的。。。
从这点来说,做NLP的人更接近实际一些。他们要crawl data,转换成数据,然后work
on it。

of

【在 a*******1 的大作中提到】
: 请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of
: -sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准
: 。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆
: parameter然后用linear regression/svm选significant的出来。。。
: 请拍砖。。。

m**********4
发帖数: 774
5
variations of linear regression...
我找找然后贴上来啊。现在手头没有。。。

【在 L*******t 的大作中提到】
: Finance paper里面的linear models是啥模型?
: 你看过的paper,
: 能否给个链接啊?
:
: finance

z******o
发帖数: 1224
6
Fienberg的学生? what kind of topic you did in ML?

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

s*******n
发帖数: 631
7
ML在science and engineering 领域应用是有目共睹的,但是
任何和人打交道的数据都无比杂乱难处理.
这个有原因么?
貌似一些NLP还是有些进展的,在与人打交道的领域?
m**********4
发帖数: 774
8
NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。
我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data
做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西
还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision
support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研
究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数
研究都有结果,很多所谓的结果对生产也没有意义。
我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable
,那哪里来的profit呢。欢迎大牛指点。

【在 s*******n 的大作中提到】
: ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理.
: 这个有原因么?
: 貌似一些NLP还是有些进展的,在与人打交道的领域?

s******a
发帖数: 472
9
华尔街用的都是很简单的东西

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

L*******t
发帖数: 2385
10
金融里面有一些市场假设,现在很多人在吐血验证中
其中一个假说就是有效市场假说,一旦被验证成立,那么任何通过历史价格获取信息的
交易策略都将是徒劳的。
但是现实是还是有一些pattern存在,可能就是你说的features。人们有各种认知偏差
,交易习惯也会造成种种的pattern。比如交易量在一天内中午是较小的因为大家都去
吃饭了-.-..
我觉得现在的Pattern recognition应该从行为金融学的角度去发掘金融市场的
patterns,也就是行为金融里面说的种种效应。
Curve fitting在确定性问题中应该有很好的解,但是市场不一定总是理性,而且curve
一不一定就有很明显的pattern。所以预测始终是一个很难得问题。也没有模型总是有
效。
而且在时间尺度上说,不同的scale性质就大不一样了。。

data
predictable

【在 m**********4 的大作中提到】
: NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。
: 我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data
: 做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西
: 还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision
: support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研
: 究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数
: 研究都有结果,很多所谓的结果对生产也没有意义。
: 我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable
: ,那哪里来的profit呢。欢迎大牛指点。

相关主题
这个东西有没有市场?company timelinedifference between a quant and programmer?
Paper Trading 对验证一个 Trading Strategy 的意义有多大?historical data back test的标准流程
请教一下,面试如果问Market Microstructure theory会问什么问题某人在投行做quant,他老婆想炒股可以吗?
进入Quant版参与讨论
L*******t
发帖数: 2385
11
小白继续说。。
而且很多实证都表明,存在overfit的现象。在做研究的时候很多人都选择了模型表现
最好的
一段数据去发表结果。。

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

w*********0
发帖数: 48
12
machine learning和其他所有类似研究的人
都是有选择性的发表结果
虽然不是作假,但是和有偏向性的报道一样
即使能做到all but the truth(已经算是难得了),也做不到all the truth
如果他们的模型这么有效,
他们首先想到的绝不是发表,而是用这个去赚钱去了
L*******t
发帖数: 2385
13
而且金融里用的一些识别pattern的模型都很简单实用。。
可能你看了会笑。

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

k*******d
发帖数: 1340
14
呼唤weekendsunny
我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类
的如果可以predict出来也好啊
L*******t
发帖数: 2385
15
Vol的可预测度就高多了。比起mean return来。
也有人做过Price和VOl的联合建模,发表在JF上了。。

【在 k*******d 的大作中提到】
: 呼唤weekendsunny
: 我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类
: 的如果可以predict出来也好啊

l**********e
发帖数: 336
16
如果要看machine learning的应用,不理解为什么看statistics,或者R^2。ML就是因
为比传统的statistics在实际中更能处理复杂的数据,比传统的pattten recognition
更有理论基础,等理由而热起来的
NLP,Speech Recognition,Information Retrieval,Computer Vision,bioinfo这些
应用领域或多或少ML都取得了一些有意思的进展
处理实际问题,提取feature+用现成的package只是一种比较省事的方法,很多时候太
局限了。真要解决问题,还是需要针对问题去建模分析怎样用做合适,自己提model,
甚至自己coding实现

work

【在 m**********4 的大作中提到】
: It is not out-of sample, of course.
: Generally, it is not used for prediction. It is used for explanation.
: 你说的完全正确。学术界做statistics de人大多数不用自己CLEAN DATA。 我个人认为
: ,用SVM,NN等等都是次要问题。主要问题是找到features。 比如地震和癌症预测,我
: 还是相信自然届存在那些FEATURE的,但怎么构造出这些FEATURE现在还没有解决。我看
: 到这些price prediction 文章用到的features都是我们能想到的。。。
: 从这点来说,做NLP的人更接近实际一些。他们要crawl data,转换成数据,然后work
: on it。
:
: of

s*******n
发帖数: 631
17

data
predictable
ML在金融和互联网领域的应用还是有些可以的
我肤浅的理解,ML其实就一些Learning的algorithm
基于现在有的数据/信息,预测未来的可能性
这个逻辑就决定了一定是有局限的
而且只能事后验证
现在互联网做的data product或者online marketing
基本上都是基于ML的吧
有些的确还是不错的,从实践角度来看
如果直接用data做商业decision或者支持decision
这个应该属于BI领域吧
也已经有了很久了
终究还是不能替代人做商业
这个不算局限吧

【在 m**********4 的大作中提到】
: NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。
: 我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data
: 做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西
: 还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision
: support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研
: 究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数
: 研究都有结果,很多所谓的结果对生产也没有意义。
: 我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable
: ,那哪里来的profit呢。欢迎大牛指点。

S*********g
发帖数: 5298
18
out of sample 0.05?
什么horizon的?
有0.05还能scale的话,
就坐着收钱了

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

S*********g
发帖数: 5298
19
最终你还是要换成对price的prediction才能做trade decision不是

【在 k*******d 的大作中提到】
: 呼唤weekendsunny
: 我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类
: 的如果可以predict出来也好啊

S*********g
发帖数: 5298
20
有些很简单的公式确实很管用,看r2的话out of sample在很短的时间段里是有1%左右
的、但是因为简单,知道的人也多,relization非常快,你要是用这些signal去trade
的话,基本上你还没排到前排信号就消失了。而这些信号往往不会大到值得去cross
market

【在 s******a 的大作中提到】
: 华尔街用的都是很简单的东西
:
: finance

相关主题
Hedge Funds 2011 -- 机器派完胜问两个交易成本的问题(StatArb/HFT)
有人用bayesian概率用在投资上么?寻找有钱的合伙人
其实很失落close price经常变呀?
进入Quant版参与讨论
S*********g
发帖数: 5298
21
这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多,
你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点,
关键还有execution做的好一点,你就有钱赚。
细节决定成败,有时候一点小改进,你就可能有一阵子的大优势

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

s*******n
发帖数: 631
22

这个角度如果是针对HF还可以理解
对于所有的买方和portfolio管理
都是这样的话
这个行业就很困难啊

【在 S*********g 的大作中提到】
: 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多,
: 你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点,
: 关键还有execution做的好一点,你就有钱赚。
: 细节决定成败,有时候一点小改进,你就可能有一阵子的大优势
:
: finance

L*******t
发帖数: 2385
23
业界怎么做optimizatio的呀?。。
能传授一下吗?。。

【在 S*********g 的大作中提到】
: 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多,
: 你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点,
: 关键还有execution做的好一点,你就有钱赚。
: 细节决定成败,有时候一点小改进,你就可能有一阵子的大优势
:
: finance

b*********e
发帖数: 38
24
Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学
统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就
没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候
,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型
的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。
b*********e
发帖数: 38
25
这个行业的确很困难啊

【在 s*******n 的大作中提到】
:
: 这个角度如果是针对HF还可以理解
: 对于所有的买方和portfolio管理
: 都是这样的话
: 这个行业就很困难啊

s*******n
发帖数: 631
26

我所理解的modeling
指的就是model整个系统和流程
至少据我所知西蒙斯就是搞这个
从data mining 到feature选择
到execution都是model化的
如果只是选择部分信息,发现零星机会
这种还不如直接赌命
现在的情况是,没有能够够搞定
这么系统化的model和data
以及如何维护这个model
从现在来看,整体上quant model
表现实际上真心不如其他fundamental的

【在 b*********e 的大作中提到】
: Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学
: 统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就
: 没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候
: ,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型
: 的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。

L*******t
发帖数: 2385
27
可是fundamental也不是总有用。至少fundamental会浪费大量的微观数据。
我觉得两者的结合是未来的方向

【在 s*******n 的大作中提到】
:
: 我所理解的modeling
: 指的就是model整个系统和流程
: 至少据我所知西蒙斯就是搞这个
: 从data mining 到feature选择
: 到execution都是model化的
: 如果只是选择部分信息,发现零星机会
: 这种还不如直接赌命
: 现在的情况是,没有能够够搞定
: 这么系统化的model和data

s*******n
发帖数: 631
28

Fundamental不能完胜也没有取代quant的意思
(从历史来看,有人希望quant取代fundamental倒是真的)
但是,Fundamental注重logical relationship
而不是fancy的model,以至无法解释和控制
不是每个Fundamental都能真正解释复杂的市场
所以,不是每个Fundamental都能取得好的结果

【在 L*******t 的大作中提到】
: 可是fundamental也不是总有用。至少fundamental会浪费大量的微观数据。
: 我觉得两者的结合是未来的方向

L*******t
发帖数: 2385
29
还是觉得两者要结合。
总是通过历史数据预测未来,就像看后视镜开车一样。
当然,两者结合也不一定能预测得好。。

【在 s*******n 的大作中提到】
:
: Fundamental不能完胜也没有取代quant的意思
: (从历史来看,有人希望quant取代fundamental倒是真的)
: 但是,Fundamental注重logical relationship
: 而不是fancy的model,以至无法解释和控制
: 不是每个Fundamental都能真正解释复杂的市场
: 所以,不是每个Fundamental都能取得好的结果

w**********y
发帖数: 1691
30
Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
strategy".
我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
correlation...)
HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

【在 S*********g 的大作中提到】
: out of sample 0.05?
: 什么horizon的?
: 有0.05还能scale的话,
: 就坐着收钱了
:
: finance

相关主题
[行业研讨]中美金融领域的差异(六) 量化交易和投资人习惯的区别发现做quant高中学位就差不多了
真心请教,如何start up自己的 hedge fund?sentiment analysis in finance. 这玩意有啥用处?
一个年收益15%的策略(系统),如何多挣些钱 ?有人知道Winton Capital么?
进入Quant版参与讨论
s*******n
发帖数: 631
31

借问行业中真正的标准是啥
如果不用model选择的标准的话?
如何选择strategy呢?

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

S*********g
发帖数: 5298
32
能赚钱是唯一标准
R^2最好的setup不一定是最能赚钱的。
因为R^2是个理论值,
它不考虑risk distribution,constraint,以及slippage等

【在 s*******n 的大作中提到】
:
: 借问行业中真正的标准是啥
: 如果不用model选择的标准的话?
: 如何选择strategy呢?

S*********g
发帖数: 5298
33
看你是在什么horizon了
fundamental model和techinical model各自有各自的强项
其实fundamental model和quantitative model不排斥
现在有不少fundamental model是全自动quantitative的
基于news的model也可以是全自动quantitative的

【在 s*******n 的大作中提到】
:
: 借问行业中真正的标准是啥
: 如果不用model选择的标准的话?
: 如何选择strategy呢?

S*********g
发帖数: 5298
34
0.2 correlation的,R^2也不错了,也有0.04了

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

M*******i
发帖数: 82
35
什么universe/horizon能有20% correlation阿
大侠给个paper的link?

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

k*******d
发帖数: 1340
36
弱弱地问一下这里R^2的准确定义是什么啊?某个东西的variance?

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

n****n
发帖数: 59
37
ML这事儿我觉着是这样(不管是说服自己或者是忽悠客人),两句老话说的好,“现实
和历史总有惊人的相似”,但是“不能踏进同一条河流”。做ML主要是基于第一句话,
但是两方面相辅相成,相生相克。
s*******s
发帖数: 1568
38
personally I don't like any fitting/ml based model, try to use R^2 to
measure how good it is all the time. The most profitable strategies I saw
never use any stats/ml techniques, just purely derived from market intuition.
my two cent.

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

s*******n
发帖数: 631
39

能赚钱这个标准当然是
关键这个是事后的标准
在做决策时候的标准是啥?

【在 S*********g 的大作中提到】
: 能赚钱是唯一标准
: R^2最好的setup不一定是最能赚钱的。
: 因为R^2是个理论值,
: 它不考虑risk distribution,constraint,以及slippage等

S*********g
发帖数: 5298
40
rigorous in-sample/out-sample back testing

【在 s*******n 的大作中提到】
:
: 能赚钱这个标准当然是
: 关键这个是事后的标准
: 在做决策时候的标准是啥?

相关主题
有人知道Winton Capital么?Paper Trading 对验证一个 Trading Strategy 的意义有多大?
请教non-compete问题请教一下,面试如果问Market Microstructure theory会问什么问题
这个东西有没有市场?company timelinedifference between a quant and programmer?
进入Quant版参与讨论
S*********g
发帖数: 5298
41
不矛盾,好多好用的quant model都是有很好的market intuition的
quant model可以帮你把intuition量化,做严格的back testing

intuition.

【在 s*******s 的大作中提到】
: personally I don't like any fitting/ml based model, try to use R^2 to
: measure how good it is all the time. The most profitable strategies I saw
: never use any stats/ml techniques, just purely derived from market intuition.
: my two cent.

J*****n
发帖数: 4859
42
我很好奇,如果用这种ml,甚至是regression类型的non-online algo,速度能跟上么?
s*******n
发帖数: 631
43

quant model可以帮你把intuition量化?
确定可以做到么?

【在 S*********g 的大作中提到】
: 不矛盾,好多好用的quant model都是有很好的market intuition的
: quant model可以帮你把intuition量化,做严格的back testing
:
: intuition.

a*****e
发帖数: 1717
44
第一条从很多层面上不成立。

【在 n****n 的大作中提到】
: ML这事儿我觉着是这样(不管是说服自己或者是忽悠客人),两句老话说的好,“现实
: 和历史总有惊人的相似”,但是“不能踏进同一条河流”。做ML主要是基于第一句话,
: 但是两方面相辅相成,相生相克。

S*********g
发帖数: 5298
45
举个最简单的例
AR model,或者pair trading

【在 s*******n 的大作中提到】
:
: quant model可以帮你把intuition量化?
: 确定可以做到么?

s*******n
发帖数: 631
46

这个我了解
关键是quant model不能完全准备表达
intuition
这是我的观点

【在 S*********g 的大作中提到】
: 举个最简单的例
: AR model,或者pair trading

S*********g
发帖数: 5298
47
不一定要实时算的
好多东西可以先算好,然后就做简单的matching
如果实在计算量大,可以并行计算

么?

【在 J*****n 的大作中提到】
: 我很好奇,如果用这种ml,甚至是regression类型的non-online algo,速度能跟上么?
b*********e
发帖数: 38
48
这个我信,说实话,我也没见过能trade的R2超过0.04的,而且是short horizon。即便
在超高频见过这样的signal,基本上也是unscaleable.
现实总是残酷的

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

s*******s
发帖数: 1568
49
why? if you are doing pure arb/latency arb, correlation should close to 1.
Sharpe should be > 30 in production.

【在 b*********e 的大作中提到】
: 这个我信,说实话,我也没见过能trade的R2超过0.04的,而且是short horizon。即便
: 在超高频见过这样的signal,基本上也是unscaleable.
: 现实总是残酷的

s*******s
发帖数: 1568
50
The problem was most of those strategies are hard to back tests...they are
trying to impact the market to make money. As far as know SPOT Trading lose
tons of money on trading futures due to a software glitch several years ago,
and they develop a very profitable strategy based on that --- impact the
market.

【在 S*********g 的大作中提到】
: 不矛盾,好多好用的quant model都是有很好的market intuition的
: quant model可以帮你把intuition量化,做严格的back testing
:
: intuition.

相关主题
historical data back test的标准流程有人用bayesian概率用在投资上么?
某人在投行做quant,他老婆想炒股可以吗?其实很失落
Hedge Funds 2011 -- 机器派完胜问两个交易成本的问题(StatArb/HFT)
进入Quant版参与讨论
S*********g
发帖数: 5298
51
quant当然也不是万能的。寸有所长,尺有所短。
你这个strategy不叫predict market
是擦边球的manipuldate market吧

lose
ago,

【在 s*******s 的大作中提到】
: The problem was most of those strategies are hard to back tests...they are
: trying to impact the market to make money. As far as know SPOT Trading lose
: tons of money on trading futures due to a software glitch several years ago,
: and they develop a very profitable strategy based on that --- impact the
: market.

w**********y
发帖数: 1691
52
Isn't this the tricky part of Ultra HFT? Welcome to share more insiders'
views :)
When people mentioned R^2, that might be assumed to be a rough estimate of
predictability of the signal/predictive model. Frankly, the said 0.04 R^2
was from 2012 several months'out-of-sample test, with a medium trading
frequency. Impossible to be replicated in real life. Or why I need to put
that into a paper...

lose
ago,

【在 s*******s 的大作中提到】
: The problem was most of those strategies are hard to back tests...they are
: trying to impact the market to make money. As far as know SPOT Trading lose
: tons of money on trading futures due to a software glitch several years ago,
: and they develop a very profitable strategy based on that --- impact the
: market.

S*********g
发帖数: 5298
53
给个paper的link吧

【在 w**********y 的大作中提到】
: Isn't this the tricky part of Ultra HFT? Welcome to share more insiders'
: views :)
: When people mentioned R^2, that might be assumed to be a rough estimate of
: predictability of the signal/predictive model. Frankly, the said 0.04 R^2
: was from 2012 several months'out-of-sample test, with a medium trading
: frequency. Impossible to be replicated in real life. Or why I need to put
: that into a paper...
:
: lose
: ago,

d*******t
发帖数: 273
54
我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几
篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个
strategy能放production。
w**********y
发帖数: 1691
55
我猜他讲的这些strategy都不cross spread. 是不是很多technology很强的地方以前这
些都做的很好?现在不知道volume低了之后这些还好不好做?请两位大牛讲讲

【在 S*********g 的大作中提到】
: quant当然也不是万能的。寸有所长,尺有所短。
: 你这个strategy不叫predict market
: 是擦边球的manipuldate market吧
:
: lose
: ago,

w**********y
发帖数: 1691
56
如果碰巧你说的是John Moody, 那我也有过类似的无用功经历.
正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇
paper 在优化上的一些步骤应该有问题...

【在 d*******t 的大作中提到】
: 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几
: 篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个
: strategy能放production。

S*********g
发帖数: 5298
57
我是外行,没做过超高频的东西。
超高频的好像也确实不怎么需要我们quant

【在 w**********y 的大作中提到】
: 我猜他讲的这些strategy都不cross spread. 是不是很多technology很强的地方以前这
: 些都做的很好?现在不知道volume低了之后这些还好不好做?请两位大牛讲讲

J*****n
发帖数: 4859
58

mid-term freq有两种做法,一种是CTA那种trend follow,注重刻画现在;一种是
regression类型的model,注重预测未来。
我一直很好奇,有没有人把两种方法巧妙地结合起来用的?
还是这两种做法天生就是相克的?

【在 S*********g 的大作中提到】
: 我是外行,没做过超高频的东西。
: 超高频的好像也确实不怎么需要我们quant

S*********g
发帖数: 5298
59
1. I do not agree those are completely different. They are both predicting
price movement using historical pattern. Rule-based strategy typically works
on price while regression model typical works on return.
2.Trend-following used by typical CTA is just a very small subclass of rule-
based strategies. Most modern CTAs use strategies beyond trend-following.
3. Rule-based strategies can typically find supports in regression/
optimization results. For example, moving average trend-following/mean-
reversion is just an AR model (in price). Pricing formula can also be traced
back to an optimization outcome with some sort of risk assumption.
I heard Two-sigma uses forecast/optimization of different horizons in their
CTA program. But, their CTA program did not out-perform industry leaders
such as Winton.
QIM uses some kind of machine learning technique to choose from a large set
of rules.

【在 J*****n 的大作中提到】
:
: mid-term freq有两种做法,一种是CTA那种trend follow,注重刻画现在;一种是
: regression类型的model,注重预测未来。
: 我一直很好奇,有没有人把两种方法巧妙地结合起来用的?
: 还是这两种做法天生就是相克的?

p****u
发帖数: 2596
60
学校里的一波骗子,真的是呼诱的业届的人浪费不少时间。

【在 d*******t 的大作中提到】
: 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几
: 篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个
: strategy能放production。

相关主题
寻找有钱的合伙人真心请教,如何start up自己的 hedge fund?
close price经常变呀?一个年收益15%的策略(系统),如何多挣些钱 ?
[行业研讨]中美金融领域的差异(六) 量化交易和投资人习惯的区别发现做quant高中学位就差不多了
进入Quant版参与讨论
p****u
发帖数: 2596
61
这种算法的paper真的是编数据结果太容易拉,一般谁都没有办法去verify结果对不对.

【在 w**********y 的大作中提到】
: 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历.
: 正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇
: paper 在优化上的一些步骤应该有问题...

S*********g
发帖数: 5298
62
Isn't that part of the game to mislead your competitor and waste their man
power and time?

【在 p****u 的大作中提到】
: 学校里的一波骗子,真的是呼诱的业届的人浪费不少时间。
H*T
发帖数: 43
63
不管什么样的model,都要tradeable,比如能beat交易成本。
各位有经验的说说,在做回测时,都用什么样的成本估计?对于
一个大的day order, 1bps above vwap reasonable?
h****e
发帖数: 2125
64
这个曲线救国也太绕了吧,你怎么忽悠你的对手读paper啊

【在 S*********g 的大作中提到】
: Isn't that part of the game to mislead your competitor and waste their man
: power and time?

J*****n
发帖数: 4859
65

其实我觉得这些人是本末倒置。
应该是先有optimization的框架,然后往里面填策略。
而不是先有策略,然后再去找合适的optimization。
我的感觉是,如果optimization框架做得有独到之处,其能产生的策略也必然有与众不
同之处。

【在 w**********y 的大作中提到】
: 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历.
: 正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇
: paper 在优化上的一些步骤应该有问题...

k***f
发帖数: 10
66

做菜应该先把油盐酱醋买好,然后往里放菜放肉。我的感觉是,如果油盐酱醋鲜美,炒
木头都会香。

【在 J*****n 的大作中提到】
:
: 其实我觉得这些人是本末倒置。
: 应该是先有optimization的框架,然后往里面填策略。
: 而不是先有策略,然后再去找合适的optimization。
: 我的感觉是,如果optimization框架做得有独到之处,其能产生的策略也必然有与众不
: 同之处。

J*****n
发帖数: 4859
67

你跟我抬这个杠有意思么?
你见过哪家公司,同类型的策略用不同的optimizer的?

【在 k***f 的大作中提到】
:
: 做菜应该先把油盐酱醋买好,然后往里放菜放肉。我的感觉是,如果油盐酱醋鲜美,炒
: 木头都会香。

S*********g
发帖数: 5298
68
总会有各种泄密渠道的
特别是如果你是industry leader的话

【在 h****e 的大作中提到】
: 这个曲线救国也太绕了吧,你怎么忽悠你的对手读paper啊
J*****n
发帖数: 4859
69

这种蒋干盗书的计策,也要有曹操那种狐疑的心配合才行啊。

【在 S*********g 的大作中提到】
: 总会有各种泄密渠道的
: 特别是如果你是industry leader的话

k***f
发帖数: 10
70

世界之大,无奇不有。何况你谈论的情况一点也不稀奇。

【在 J*****n 的大作中提到】
:
: 这种蒋干盗书的计策,也要有曹操那种狐疑的心配合才行啊。

相关主题
发现做quant高中学位就差不多了请教non-compete问题
sentiment analysis in finance. 这玩意有啥用处?这个东西有没有市场?company timeline
有人知道Winton Capital么?Paper Trading 对验证一个 Trading Strategy 的意义有多大?
进入Quant版参与讨论
J*****n
发帖数: 4859
71

阁下倒是说些稀奇的,让我等也开开眼界。

【在 k***f 的大作中提到】
:
: 世界之大,无奇不有。何况你谈论的情况一点也不稀奇。

S*********g
发帖数: 5298
72
真是服了你们了,什么都能吵起来

【在 J*****n 的大作中提到】
:
: 阁下倒是说些稀奇的,让我等也开开眼界。

J*****n
发帖数: 4859
73

我说的也都是些稀松平常的东西。
既然这位高人说知道啥稀奇的东西,自然要请教一二。

【在 S*********g 的大作中提到】
: 真是服了你们了,什么都能吵起来
h********3
发帖数: 2075
74
其实计算机能做的事情也就帮助分析,比如快速计算相关性,关联性等等。至于这些结
果有没有用,还是得人来分析。也就是说,计算机只能在大规模数据计算上帮助人,但
是智能点的推理都是不靠谱的。
实际上除了现实里面大部分能用的就data mining。machine learning那么多炫的技术
可用的极少。

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

h********3
发帖数: 2075
75
工业界都是简单模型。

【在 s******a 的大作中提到】
: 华尔街用的都是很简单的东西
:
: finance

k****t
发帖数: 15
76

非常同意,很容易在细节上交学费,亏钱是小事,严重起来把桌子或公司搞倒都有可能

【在 b*********e 的大作中提到】
: Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学
: 统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就
: 没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候
: ,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型
: 的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。

x****m
发帖数: 1084
77
R2要是0.6几的话算好还是不好啊?大家都说0.04我搞糊涂了,我在学校的时候
用ANN做预测的,感觉结果好坏和数据的相关性太大了
S*******s
发帖数: 13043
78
any comments on their work?

【在 L*******t 的大作中提到】
: Vol的可预测度就高多了。比起mean return来。
: 也有人做过Price和VOl的联合建模,发表在JF上了。。

D*****a
发帖数: 2847
79
ML就是事后诸葛亮
啥都能fit
真要用,基本亏钱

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

m**********4
发帖数: 774
80
最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
在实际中用起来风险很大..
不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
那PROFIT MARGIN很快就会消失了吧。。
我的想法很幼稚,希望有这方面经验的大牛指点一下。
相关主题
请教一下,面试如果问Market Microstructure theory会问什么问题某人在投行做quant,他老婆想炒股可以吗?
difference between a quant and programmer?Hedge Funds 2011 -- 机器派完胜
historical data back test的标准流程有人用bayesian概率用在投资上么?
进入Quant版参与讨论
a*******1
发帖数: 1554
81
请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of
-sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准
。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆
parameter然后用linear regression/svm选significant的出来。。。
请拍砖。。。
L*******t
发帖数: 2385
82
Finance paper里面的linear models是啥模型?
你看过的paper,
能否给个链接啊?

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

m**********4
发帖数: 774
83
It is not out-of sample, of course.
Generally, it is not used for prediction. It is used for explanation.
你说的完全正确。学术界做statistics de人大多数不用自己CLEAN DATA。 我个人认为
,用SVM,NN等等都是次要问题。主要问题是找到features。 比如地震和癌症预测,我
还是相信自然届存在那些FEATURE的,但怎么构造出这些FEATURE现在还没有解决。我看
到这些price prediction 文章用到的features都是我们能想到的。。。
从这点来说,做NLP的人更接近实际一些。他们要crawl data,转换成数据,然后work
on it。

of

【在 a*******1 的大作中提到】
: 请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of
: -sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准
: 。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆
: parameter然后用linear regression/svm选significant的出来。。。
: 请拍砖。。。

m**********4
发帖数: 774
84
variations of linear regression...
我找找然后贴上来啊。现在手头没有。。。

【在 L*******t 的大作中提到】
: Finance paper里面的linear models是啥模型?
: 你看过的paper,
: 能否给个链接啊?
:
: finance

z******o
发帖数: 1224
85
Fienberg的学生? what kind of topic you did in ML?

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

s*******n
发帖数: 631
86
ML在science and engineering 领域应用是有目共睹的,但是
任何和人打交道的数据都无比杂乱难处理.
这个有原因么?
貌似一些NLP还是有些进展的,在与人打交道的领域?
m**********4
发帖数: 774
87
NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。
我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data
做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西
还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision
support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研
究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数
研究都有结果,很多所谓的结果对生产也没有意义。
我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable
,那哪里来的profit呢。欢迎大牛指点。

【在 s*******n 的大作中提到】
: ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理.
: 这个有原因么?
: 貌似一些NLP还是有些进展的,在与人打交道的领域?

s******a
发帖数: 472
88
华尔街用的都是很简单的东西

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

L*******t
发帖数: 2385
89
金融里面有一些市场假设,现在很多人在吐血验证中
其中一个假说就是有效市场假说,一旦被验证成立,那么任何通过历史价格获取信息的
交易策略都将是徒劳的。
但是现实是还是有一些pattern存在,可能就是你说的features。人们有各种认知偏差
,交易习惯也会造成种种的pattern。比如交易量在一天内中午是较小的因为大家都去
吃饭了-.-..
我觉得现在的Pattern recognition应该从行为金融学的角度去发掘金融市场的
patterns,也就是行为金融里面说的种种效应。
Curve fitting在确定性问题中应该有很好的解,但是市场不一定总是理性,而且curve
一不一定就有很明显的pattern。所以预测始终是一个很难得问题。也没有模型总是有
效。
而且在时间尺度上说,不同的scale性质就大不一样了。。

data
predictable

【在 m**********4 的大作中提到】
: NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。
: 我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data
: 做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西
: 还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision
: support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研
: 究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数
: 研究都有结果,很多所谓的结果对生产也没有意义。
: 我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable
: ,那哪里来的profit呢。欢迎大牛指点。

L*******t
发帖数: 2385
90
小白继续说。。
而且很多实证都表明,存在overfit的现象。在做研究的时候很多人都选择了模型表现
最好的
一段数据去发表结果。。

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

相关主题
其实很失落close price经常变呀?
问两个交易成本的问题(StatArb/HFT)[行业研讨]中美金融领域的差异(六) 量化交易和投资人习惯的区别
寻找有钱的合伙人真心请教,如何start up自己的 hedge fund?
进入Quant版参与讨论
w*********0
发帖数: 48
91
machine learning和其他所有类似研究的人
都是有选择性的发表结果
虽然不是作假,但是和有偏向性的报道一样
即使能做到all but the truth(已经算是难得了),也做不到all the truth
如果他们的模型这么有效,
他们首先想到的绝不是发表,而是用这个去赚钱去了
L*******t
发帖数: 2385
92
而且金融里用的一些识别pattern的模型都很简单实用。。
可能你看了会笑。

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

k*******d
发帖数: 1340
93
呼唤weekendsunny
我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类
的如果可以predict出来也好啊
L*******t
发帖数: 2385
94
Vol的可预测度就高多了。比起mean return来。
也有人做过Price和VOl的联合建模,发表在JF上了。。

【在 k*******d 的大作中提到】
: 呼唤weekendsunny
: 我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类
: 的如果可以predict出来也好啊

l**********e
发帖数: 336
95
如果要看machine learning的应用,不理解为什么看statistics,或者R^2。ML就是因
为比传统的statistics在实际中更能处理复杂的数据,比传统的pattten recognition
更有理论基础,等理由而热起来的
NLP,Speech Recognition,Information Retrieval,Computer Vision,bioinfo这些
应用领域或多或少ML都取得了一些有意思的进展
处理实际问题,提取feature+用现成的package只是一种比较省事的方法,很多时候太
局限了。真要解决问题,还是需要针对问题去建模分析怎样用做合适,自己提model,
甚至自己coding实现

work

【在 m**********4 的大作中提到】
: It is not out-of sample, of course.
: Generally, it is not used for prediction. It is used for explanation.
: 你说的完全正确。学术界做statistics de人大多数不用自己CLEAN DATA。 我个人认为
: ,用SVM,NN等等都是次要问题。主要问题是找到features。 比如地震和癌症预测,我
: 还是相信自然届存在那些FEATURE的,但怎么构造出这些FEATURE现在还没有解决。我看
: 到这些price prediction 文章用到的features都是我们能想到的。。。
: 从这点来说,做NLP的人更接近实际一些。他们要crawl data,转换成数据,然后work
: on it。
:
: of

s*******n
发帖数: 631
96

data
predictable
ML在金融和互联网领域的应用还是有些可以的
我肤浅的理解,ML其实就一些Learning的algorithm
基于现在有的数据/信息,预测未来的可能性
这个逻辑就决定了一定是有局限的
而且只能事后验证
现在互联网做的data product或者online marketing
基本上都是基于ML的吧
有些的确还是不错的,从实践角度来看
如果直接用data做商业decision或者支持decision
这个应该属于BI领域吧
也已经有了很久了
终究还是不能替代人做商业
这个不算局限吧

【在 m**********4 的大作中提到】
: NLP属于工程科学范畴吧,WORDS还是挺SCIENCE的东西。
: 我shuo de 和人打交道的领域,主要是psychology相关的。比如说通过business data
: 做consulting,用data 设计最好的教学方法等等。我觉得这些偏HUMAN SCIENCE的东西
: 还真的挺需要HUMAN SCIENCE解决的。。。目前statistician很多还是提供decision
: support而不是真正的decision,还是有道理的。其实关键问题是,很多statistics研
: 究的结论是: 没有结论。现在学术界只publish那些所谓的突出成果,但不代表大多数
: 研究都有结果,很多所谓的结果对生产也没有意义。
: 我个人感觉FINANCE还是挺偏psychology的一个领域吧。何况一旦Future predictable
: ,那哪里来的profit呢。欢迎大牛指点。

S*********g
发帖数: 5298
97
out of sample 0.05?
什么horizon的?
有0.05还能scale的话,
就坐着收钱了

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

S*********g
发帖数: 5298
98
最终你还是要换成对price的prediction才能做trade decision不是

【在 k*******d 的大作中提到】
: 呼唤weekendsunny
: 我觉得要Profit不一定只是predict price movement吧,比如volatility, volume之类
: 的如果可以predict出来也好啊

S*********g
发帖数: 5298
99
有些很简单的公式确实很管用,看r2的话out of sample在很短的时间段里是有1%左右
的、但是因为简单,知道的人也多,relization非常快,你要是用这些signal去trade
的话,基本上你还没排到前排信号就消失了。而这些信号往往不会大到值得去cross
market

【在 s******a 的大作中提到】
: 华尔街用的都是很简单的东西
:
: finance

S*********g
发帖数: 5298
100
这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多,
你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点,
关键还有execution做的好一点,你就有钱赚。
细节决定成败,有时候一点小改进,你就可能有一阵子的大优势

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

相关主题
一个年收益15%的策略(系统),如何多挣些钱 ?有人知道Winton Capital么?
发现做quant高中学位就差不多了请教non-compete问题
sentiment analysis in finance. 这玩意有啥用处?这个东西有没有市场?company timeline
进入Quant版参与讨论
s*******n
发帖数: 631
101

这个角度如果是针对HF还可以理解
对于所有的买方和portfolio管理
都是这样的话
这个行业就很困难啊

【在 S*********g 的大作中提到】
: 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多,
: 你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点,
: 关键还有execution做的好一点,你就有钱赚。
: 细节决定成败,有时候一点小改进,你就可能有一阵子的大优势
:
: finance

L*******t
发帖数: 2385
102
业界怎么做optimizatio的呀?。。
能传授一下吗?。。

【在 S*********g 的大作中提到】
: 这年头,其实就看你能不能比竞争对手好一点。就算是大家想法都差不多,
: 你的alpha好一点点,slippage model,riskmodel好一点,optimization做得好一点,
: 关键还有execution做的好一点,你就有钱赚。
: 细节决定成败,有时候一点小改进,你就可能有一阵子的大优势
:
: finance

b*********e
发帖数: 38
103
Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学
统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就
没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候
,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型
的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。
b*********e
发帖数: 38
104
这个行业的确很困难啊

【在 s*******n 的大作中提到】
:
: 这个角度如果是针对HF还可以理解
: 对于所有的买方和portfolio管理
: 都是这样的话
: 这个行业就很困难啊

s*******n
发帖数: 631
105

我所理解的modeling
指的就是model整个系统和流程
至少据我所知西蒙斯就是搞这个
从data mining 到feature选择
到execution都是model化的
如果只是选择部分信息,发现零星机会
这种还不如直接赌命
现在的情况是,没有能够够搞定
这么系统化的model和data
以及如何维护这个model
从现在来看,整体上quant model
表现实际上真心不如其他fundamental的

【在 b*********e 的大作中提到】
: Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学
: 统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就
: 没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候
: ,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型
: 的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。

L*******t
发帖数: 2385
106
可是fundamental也不是总有用。至少fundamental会浪费大量的微观数据。
我觉得两者的结合是未来的方向

【在 s*******n 的大作中提到】
:
: 我所理解的modeling
: 指的就是model整个系统和流程
: 至少据我所知西蒙斯就是搞这个
: 从data mining 到feature选择
: 到execution都是model化的
: 如果只是选择部分信息,发现零星机会
: 这种还不如直接赌命
: 现在的情况是,没有能够够搞定
: 这么系统化的model和data

s*******n
发帖数: 631
107

Fundamental不能完胜也没有取代quant的意思
(从历史来看,有人希望quant取代fundamental倒是真的)
但是,Fundamental注重logical relationship
而不是fancy的model,以至无法解释和控制
不是每个Fundamental都能真正解释复杂的市场
所以,不是每个Fundamental都能取得好的结果

【在 L*******t 的大作中提到】
: 可是fundamental也不是总有用。至少fundamental会浪费大量的微观数据。
: 我觉得两者的结合是未来的方向

L*******t
发帖数: 2385
108
还是觉得两者要结合。
总是通过历史数据预测未来,就像看后视镜开车一样。
当然,两者结合也不一定能预测得好。。

【在 s*******n 的大作中提到】
:
: Fundamental不能完胜也没有取代quant的意思
: (从历史来看,有人希望quant取代fundamental倒是真的)
: 但是,Fundamental注重logical relationship
: 而不是fancy的model,以至无法解释和控制
: 不是每个Fundamental都能真正解释复杂的市场
: 所以,不是每个Fundamental都能取得好的结果

w**********y
发帖数: 1691
109
Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
strategy".
我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
correlation...)
HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

【在 S*********g 的大作中提到】
: out of sample 0.05?
: 什么horizon的?
: 有0.05还能scale的话,
: 就坐着收钱了
:
: finance

s*******n
发帖数: 631
110

借问行业中真正的标准是啥
如果不用model选择的标准的话?
如何选择strategy呢?

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

相关主题
这个东西有没有市场?company timelinedifference between a quant and programmer?
Paper Trading 对验证一个 Trading Strategy 的意义有多大?historical data back test的标准流程
请教一下,面试如果问Market Microstructure theory会问什么问题某人在投行做quant,他老婆想炒股可以吗?
进入Quant版参与讨论
S*********g
发帖数: 5298
111
能赚钱是唯一标准
R^2最好的setup不一定是最能赚钱的。
因为R^2是个理论值,
它不考虑risk distribution,constraint,以及slippage等

【在 s*******n 的大作中提到】
:
: 借问行业中真正的标准是啥
: 如果不用model选择的标准的话?
: 如何选择strategy呢?

S*********g
发帖数: 5298
112
看你是在什么horizon了
fundamental model和techinical model各自有各自的强项
其实fundamental model和quantitative model不排斥
现在有不少fundamental model是全自动quantitative的
基于news的model也可以是全自动quantitative的

【在 s*******n 的大作中提到】
:
: 借问行业中真正的标准是啥
: 如果不用model选择的标准的话?
: 如何选择strategy呢?

S*********g
发帖数: 5298
113
0.2 correlation的,R^2也不错了,也有0.04了

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

M*******i
发帖数: 82
114
什么universe/horizon能有20% correlation阿
大侠给个paper的link?

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

k*******d
发帖数: 1340
115
弱弱地问一下这里R^2的准确定义是什么啊?某个东西的variance?

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

n****n
发帖数: 59
116
ML这事儿我觉着是这样(不管是说服自己或者是忽悠客人),两句老话说的好,“现实
和历史总有惊人的相似”,但是“不能踏进同一条河流”。做ML主要是基于第一句话,
但是两方面相辅相成,相生相克。
s*******s
发帖数: 1568
117
personally I don't like any fitting/ml based model, try to use R^2 to
measure how good it is all the time. The most profitable strategies I saw
never use any stats/ml techniques, just purely derived from market intuition.
my two cent.

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

s*******n
发帖数: 631
118

能赚钱这个标准当然是
关键这个是事后的标准
在做决策时候的标准是啥?

【在 S*********g 的大作中提到】
: 能赚钱是唯一标准
: R^2最好的setup不一定是最能赚钱的。
: 因为R^2是个理论值,
: 它不考虑risk distribution,constraint,以及slippage等

S*********g
发帖数: 5298
119
rigorous in-sample/out-sample back testing

【在 s*******n 的大作中提到】
:
: 能赚钱这个标准当然是
: 关键这个是事后的标准
: 在做决策时候的标准是啥?

S*********g
发帖数: 5298
120
不矛盾,好多好用的quant model都是有很好的market intuition的
quant model可以帮你把intuition量化,做严格的back testing

intuition.

【在 s*******s 的大作中提到】
: personally I don't like any fitting/ml based model, try to use R^2 to
: measure how good it is all the time. The most profitable strategies I saw
: never use any stats/ml techniques, just purely derived from market intuition.
: my two cent.

相关主题
Hedge Funds 2011 -- 机器派完胜问两个交易成本的问题(StatArb/HFT)
有人用bayesian概率用在投资上么?寻找有钱的合伙人
其实很失落close price经常变呀?
进入Quant版参与讨论
J*****n
发帖数: 4859
121
我很好奇,如果用这种ml,甚至是regression类型的non-online algo,速度能跟上么?
s*******n
发帖数: 631
122

quant model可以帮你把intuition量化?
确定可以做到么?

【在 S*********g 的大作中提到】
: 不矛盾,好多好用的quant model都是有很好的market intuition的
: quant model可以帮你把intuition量化,做严格的back testing
:
: intuition.

a*****e
发帖数: 1717
123
第一条从很多层面上不成立。

【在 n****n 的大作中提到】
: ML这事儿我觉着是这样(不管是说服自己或者是忽悠客人),两句老话说的好,“现实
: 和历史总有惊人的相似”,但是“不能踏进同一条河流”。做ML主要是基于第一句话,
: 但是两方面相辅相成,相生相克。

S*********g
发帖数: 5298
124
举个最简单的例
AR model,或者pair trading

【在 s*******n 的大作中提到】
:
: quant model可以帮你把intuition量化?
: 确定可以做到么?

s*******n
发帖数: 631
125

这个我了解
关键是quant model不能完全准备表达
intuition
这是我的观点

【在 S*********g 的大作中提到】
: 举个最简单的例
: AR model,或者pair trading

S*********g
发帖数: 5298
126
不一定要实时算的
好多东西可以先算好,然后就做简单的matching
如果实在计算量大,可以并行计算

么?

【在 J*****n 的大作中提到】
: 我很好奇,如果用这种ml,甚至是regression类型的non-online algo,速度能跟上么?
b*********e
发帖数: 38
127
这个我信,说实话,我也没见过能trade的R2超过0.04的,而且是short horizon。即便
在超高频见过这样的signal,基本上也是unscaleable.
现实总是残酷的

【在 w**********y 的大作中提到】
: Second this. 借用上周party一个TWR的Senior PM的话,"这辈子还没见过超过0.04的
: strategy".
: 我跟他讲我一个paper里面的R^2差不多是0.2,差点没给他逼疯掉..(其实我说的0.2是
: correlation...)
: HFT考虑到你的 slippage,latency和cross over cost, 最终能realized的R^2远小的多

s*******s
发帖数: 1568
128
why? if you are doing pure arb/latency arb, correlation should close to 1.
Sharpe should be > 30 in production.

【在 b*********e 的大作中提到】
: 这个我信,说实话,我也没见过能trade的R2超过0.04的,而且是short horizon。即便
: 在超高频见过这样的signal,基本上也是unscaleable.
: 现实总是残酷的

s*******s
发帖数: 1568
129
The problem was most of those strategies are hard to back tests...they are
trying to impact the market to make money. As far as know SPOT Trading lose
tons of money on trading futures due to a software glitch several years ago,
and they develop a very profitable strategy based on that --- impact the
market.

【在 S*********g 的大作中提到】
: 不矛盾,好多好用的quant model都是有很好的market intuition的
: quant model可以帮你把intuition量化,做严格的back testing
:
: intuition.

S*********g
发帖数: 5298
130
quant当然也不是万能的。寸有所长,尺有所短。
你这个strategy不叫predict market
是擦边球的manipuldate market吧

lose
ago,

【在 s*******s 的大作中提到】
: The problem was most of those strategies are hard to back tests...they are
: trying to impact the market to make money. As far as know SPOT Trading lose
: tons of money on trading futures due to a software glitch several years ago,
: and they develop a very profitable strategy based on that --- impact the
: market.

相关主题
[行业研讨]中美金融领域的差异(六) 量化交易和投资人习惯的区别发现做quant高中学位就差不多了
真心请教,如何start up自己的 hedge fund?sentiment analysis in finance. 这玩意有啥用处?
一个年收益15%的策略(系统),如何多挣些钱 ?有人知道Winton Capital么?
进入Quant版参与讨论
w**********y
发帖数: 1691
131
Isn't this the tricky part of Ultra HFT? Welcome to share more insiders'
views :)
When people mentioned R^2, that might be assumed to be a rough estimate of
predictability of the signal/predictive model. Frankly, the said 0.04 R^2
was from 2012 several months'out-of-sample test, with a medium trading
frequency. Impossible to be replicated in real life. Or why I need to put
that into a paper...

lose
ago,

【在 s*******s 的大作中提到】
: The problem was most of those strategies are hard to back tests...they are
: trying to impact the market to make money. As far as know SPOT Trading lose
: tons of money on trading futures due to a software glitch several years ago,
: and they develop a very profitable strategy based on that --- impact the
: market.

S*********g
发帖数: 5298
132
给个paper的link吧

【在 w**********y 的大作中提到】
: Isn't this the tricky part of Ultra HFT? Welcome to share more insiders'
: views :)
: When people mentioned R^2, that might be assumed to be a rough estimate of
: predictability of the signal/predictive model. Frankly, the said 0.04 R^2
: was from 2012 several months'out-of-sample test, with a medium trading
: frequency. Impossible to be replicated in real life. Or why I need to put
: that into a paper...
:
: lose
: ago,

d*******t
发帖数: 273
133
我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几
篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个
strategy能放production。
w**********y
发帖数: 1691
134
我猜他讲的这些strategy都不cross spread. 是不是很多technology很强的地方以前这
些都做的很好?现在不知道volume低了之后这些还好不好做?请两位大牛讲讲

【在 S*********g 的大作中提到】
: quant当然也不是万能的。寸有所长,尺有所短。
: 你这个strategy不叫predict market
: 是擦边球的manipuldate market吧
:
: lose
: ago,

w**********y
发帖数: 1691
135
如果碰巧你说的是John Moody, 那我也有过类似的无用功经历.
正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇
paper 在优化上的一些步骤应该有问题...

【在 d*******t 的大作中提到】
: 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几
: 篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个
: strategy能放production。

S*********g
发帖数: 5298
136
我是外行,没做过超高频的东西。
超高频的好像也确实不怎么需要我们quant

【在 w**********y 的大作中提到】
: 我猜他讲的这些strategy都不cross spread. 是不是很多technology很强的地方以前这
: 些都做的很好?现在不知道volume低了之后这些还好不好做?请两位大牛讲讲

J*****n
发帖数: 4859
137

mid-term freq有两种做法,一种是CTA那种trend follow,注重刻画现在;一种是
regression类型的model,注重预测未来。
我一直很好奇,有没有人把两种方法巧妙地结合起来用的?
还是这两种做法天生就是相克的?

【在 S*********g 的大作中提到】
: 我是外行,没做过超高频的东西。
: 超高频的好像也确实不怎么需要我们quant

S*********g
发帖数: 5298
138
1. I do not agree those are completely different. They are both predicting
price movement using historical pattern. Rule-based strategy typically works
on price while regression model typical works on return.
2.Trend-following used by typical CTA is just a very small subclass of rule-
based strategies. Most modern CTAs use strategies beyond trend-following.
3. Rule-based strategies can typically find supports in regression/
optimization results. For example, moving average trend-following/mean-
reversion is just an AR model (in price). Pricing formula can also be traced
back to an optimization outcome with some sort of risk assumption.
I heard Two-sigma uses forecast/optimization of different horizons in their
CTA program. But, their CTA program did not out-perform industry leaders
such as Winton.
QIM uses some kind of machine learning technique to choose from a large set
of rules.

【在 J*****n 的大作中提到】
:
: mid-term freq有两种做法,一种是CTA那种trend follow,注重刻画现在;一种是
: regression类型的model,注重预测未来。
: 我一直很好奇,有没有人把两种方法巧妙地结合起来用的?
: 还是这两种做法天生就是相克的?

p****u
发帖数: 2596
139
学校里的一波骗子,真的是呼诱的业届的人浪费不少时间。

【在 d*******t 的大作中提到】
: 我曾经很痴迷过一个用nero-network做ml然后做prediction的方法,而且那个系列好几
: 篇文章都show positive results,然后我拿来鼓捣了3个月p结果也没有。没任何一个
: strategy能放production。

p****u
发帖数: 2596
140
这种算法的paper真的是编数据结果太容易拉,一般谁都没有办法去verify结果对不对.

【在 w**********y 的大作中提到】
: 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历.
: 正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇
: paper 在优化上的一些步骤应该有问题...

相关主题
有人知道Winton Capital么?Paper Trading 对验证一个 Trading Strategy 的意义有多大?
请教non-compete问题请教一下,面试如果问Market Microstructure theory会问什么问题
这个东西有没有市场?company timelinedifference between a quant and programmer?
进入Quant版参与讨论
S*********g
发帖数: 5298
141
Isn't that part of the game to mislead your competitor and waste their man
power and time?

【在 p****u 的大作中提到】
: 学校里的一波骗子,真的是呼诱的业届的人浪费不少时间。
H*T
发帖数: 43
142
不管什么样的model,都要tradeable,比如能beat交易成本。
各位有经验的说说,在做回测时,都用什么样的成本估计?对于
一个大的day order, 1bps above vwap reasonable?
h****e
发帖数: 2125
143
这个曲线救国也太绕了吧,你怎么忽悠你的对手读paper啊

【在 S*********g 的大作中提到】
: Isn't that part of the game to mislead your competitor and waste their man
: power and time?

J*****n
发帖数: 4859
144

其实我觉得这些人是本末倒置。
应该是先有optimization的框架,然后往里面填策略。
而不是先有策略,然后再去找合适的optimization。
我的感觉是,如果optimization框架做得有独到之处,其能产生的策略也必然有与众不
同之处。

【在 w**********y 的大作中提到】
: 如果碰巧你说的是John Moody, 那我也有过类似的无用功经历.
: 正是因为看到他后来做得不错才下了很多功夫去replicate但是都不成功. 他的RRL那篇
: paper 在优化上的一些步骤应该有问题...

k***f
发帖数: 10
145

做菜应该先把油盐酱醋买好,然后往里放菜放肉。我的感觉是,如果油盐酱醋鲜美,炒
木头都会香。

【在 J*****n 的大作中提到】
:
: 其实我觉得这些人是本末倒置。
: 应该是先有optimization的框架,然后往里面填策略。
: 而不是先有策略,然后再去找合适的optimization。
: 我的感觉是,如果optimization框架做得有独到之处,其能产生的策略也必然有与众不
: 同之处。

J*****n
发帖数: 4859
146

你跟我抬这个杠有意思么?
你见过哪家公司,同类型的策略用不同的optimizer的?

【在 k***f 的大作中提到】
:
: 做菜应该先把油盐酱醋买好,然后往里放菜放肉。我的感觉是,如果油盐酱醋鲜美,炒
: 木头都会香。

S*********g
发帖数: 5298
147
总会有各种泄密渠道的
特别是如果你是industry leader的话

【在 h****e 的大作中提到】
: 这个曲线救国也太绕了吧,你怎么忽悠你的对手读paper啊
J*****n
发帖数: 4859
148

这种蒋干盗书的计策,也要有曹操那种狐疑的心配合才行啊。

【在 S*********g 的大作中提到】
: 总会有各种泄密渠道的
: 特别是如果你是industry leader的话

k***f
发帖数: 10
149

世界之大,无奇不有。何况你谈论的情况一点也不稀奇。

【在 J*****n 的大作中提到】
:
: 这种蒋干盗书的计策,也要有曹操那种狐疑的心配合才行啊。

J*****n
发帖数: 4859
150

阁下倒是说些稀奇的,让我等也开开眼界。

【在 k***f 的大作中提到】
:
: 世界之大,无奇不有。何况你谈论的情况一点也不稀奇。

相关主题
historical data back test的标准流程有人用bayesian概率用在投资上么?
某人在投行做quant,他老婆想炒股可以吗?其实很失落
Hedge Funds 2011 -- 机器派完胜问两个交易成本的问题(StatArb/HFT)
进入Quant版参与讨论
S*********g
发帖数: 5298
151
真是服了你们了,什么都能吵起来

【在 J*****n 的大作中提到】
:
: 阁下倒是说些稀奇的,让我等也开开眼界。

J*****n
发帖数: 4859
152

我说的也都是些稀松平常的东西。
既然这位高人说知道啥稀奇的东西,自然要请教一二。

【在 S*********g 的大作中提到】
: 真是服了你们了,什么都能吵起来
h********3
发帖数: 2075
153
其实计算机能做的事情也就帮助分析,比如快速计算相关性,关联性等等。至于这些结
果有没有用,还是得人来分析。也就是说,计算机只能在大规模数据计算上帮助人,但
是智能点的推理都是不靠谱的。
实际上除了现实里面大部分能用的就data mining。machine learning那么多炫的技术
可用的极少。

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

h********3
发帖数: 2075
154
工业界都是简单模型。

【在 s******a 的大作中提到】
: 华尔街用的都是很简单的东西
:
: finance

k****t
发帖数: 15
155

非常同意,很容易在细节上交学费,亏钱是小事,严重起来把桌子或公司搞倒都有可能

【在 b*********e 的大作中提到】
: Trading 是个系统工程,每个细节看起来都那么的简单,基本上只需要一些简单的数学
: 统计甚至高中的东西就可以了,可是把这些看似简单的细节整合成一套有效的系统,就
: 没有那么简单了。为什么华尔街不用那些复杂fancy的model?原因也很简单,很多时候
: ,复杂模型对简单模型improvement可能只有10%,细究的话这10%说不定也是复杂模型
: 的overfitting.更何况简单模型实战中容易维护的多,出了问题也容易查找。

x****m
发帖数: 1084
156
R2要是0.6几的话算好还是不好啊?大家都说0.04我搞糊涂了,我在学校的时候
用ANN做预测的,感觉结果好坏和数据的相关性太大了
S*******s
发帖数: 13043
157
any comments on their work?

【在 L*******t 的大作中提到】
: Vol的可预测度就高多了。比起mean return来。
: 也有人做过Price和VOl的联合建模,发表在JF上了。。

D*****a
发帖数: 2847
158
ML就是事后诸葛亮
啥都能fit
真要用,基本亏钱

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

S*********g
发帖数: 5298
159
is this the strategy described in the paper exploratory trading?

lose
ago,
★ 发自iPhone App: ChineseWeb 7.8

【在 s*******s 的大作中提到】
: The problem was most of those strategies are hard to back tests...they are
: trying to impact the market to make money. As far as know SPOT Trading lose
: tons of money on trading futures due to a software glitch several years ago,
: and they develop a very profitable strategy based on that --- impact the
: market.

t**********h
发帖数: 2273
160
一直以为你是马工。原来是华尔街赚打钱的啊?牛逼。

finance

【在 m**********4 的大作中提到】
: 最近看了几篇著名的用machine learning methods 预测股票走势的文章,结果让人读
: 着很振奋(如同大多数学术界的文章一样)。 我Phd做了挺多年的ML,对它在finance
: 的应用持观望态度 -- ML在science and engineering 领域应用是有目共睹的,但是
: 任何和人打交道的数据都无比杂乱难处理。我老板用ML做了很多年social science
: data, 现在基本还在用70年代那几个model. 很多finance papers做linear models,
: R square经常是0.05以下,只要有significant的variables,也算OK。这样的结果
: 在实际中用起来风险很大..
: 不知道有没有HF真的靠ML 预测股票涨跌赚钱的?那挣钱岂不是太容易了点?如果真的
: 那么神奇,用R 或者MATLAB 跑跑SVM 对于大家应该不是难事吧。一旦未来可以预测,
: 那PROFIT MARGIN很快就会消失了吧。。

相关主题
寻找有钱的合伙人真心请教,如何start up自己的 hedge fund?
close price经常变呀?一个年收益15%的策略(系统),如何多挣些钱 ?
[行业研讨]中美金融领域的差异(六) 量化交易和投资人习惯的区别发现做quant高中学位就差不多了
进入Quant版参与讨论
d*****e
发帖数: 7368
161
给一堆数据也没啥, 不就是PCA/SVD分析以下么.
关键是你给的这堆数据要真的有用的.

of

【在 a*******1 的大作中提到】
: 请问mitchell姐姐:这个R^2 = 0.05是in-sample还是out-of-sample啊?如果是out-of
: -sample的话,能否给个link?俺做高频交易的,out-of-sample R^2是个重要评判标准
: 。。。。。。谢谢。。。。以我的经验看,困难在于构造parameter,而不是给一大堆
: parameter然后用linear regression/svm选significant的出来。。。
: 请拍砖。。。

d*****e
发帖数: 7368
162
不知道别的公司怎么样, 其实都是拍脑袋, 这几个参数怎么样.
然后, 找历史数据看看支持不支持, 然后就上了, 看挣不挣钱.

【在 s******a 的大作中提到】
: 华尔街用的都是很简单的东西
:
: finance

1 (共1页)
进入Quant版参与讨论
相关主题
寻找有钱的合伙人请教non-compete问题
close price经常变呀?这个东西有没有市场?company timeline
[行业研讨]中美金融领域的差异(六) 量化交易和投资人习惯的区别Paper Trading 对验证一个 Trading Strategy 的意义有多大?
真心请教,如何start up自己的 hedge fund?请教一下,面试如果问Market Microstructure theory会问什么问题
一个年收益15%的策略(系统),如何多挣些钱 ?difference between a quant and programmer?
发现做quant高中学位就差不多了historical data back test的标准流程
sentiment analysis in finance. 这玩意有啥用处?某人在投行做quant,他老婆想炒股可以吗?
有人知道Winton Capital么?Hedge Funds 2011 -- 机器派完胜
相关话题的讨论汇总
话题: model话题: ml话题: finance话题: sample