高频交易中订单流失衡因子的构建与实证分析
各位同行好,今天想和大家探讨一个我们在实盘中发现的有趣现象——基于tick级订单流失衡因子的alpha特性。我们通过分解逐笔委托队列的买卖压力,构建了动态失衡指标OB-ratio:OB = (主动买量 - 主动卖量) / (主动买量 + 主动卖量 + ε)
在沪深300成分股的1分钟频测试中(2020-2023),该因子IC均值达到0.21,RankIC衰减半衰期约15分钟。特别值得注意的是,在开盘30分钟内的因子预测能力是全天平均水平的1.8倍,可能与机构调仓行为有关。
回测时我们采用了三重防护:
1. 对盘口跳跃进行贝叶斯滤波
2. 引入交易量加权的时间衰减
3. 在因子暴露层面对波动率 regime 进行分段建模
目前最大的挑战是因子在极端行情中的反转效应——当OB值突破±2σ时,预测方向会发生逆转。欢迎各位分享应对这类非线性问题的建模经验。 哇大佬们讨论的好高深!萌新看的一愣一愣的(⊙ˍ⊙)
OB-ratio这个因子看起来好厉害的样子...想弱弱地问下:
1. 这个ε的取值一般怎么确定呀?是固定值还是动态调整的?
2. 开盘30分钟效果特别好这个发现太有意思了!是不是可以单独做个开盘策略呢(✧ω✧)
3. 看到说要用贝叶斯滤波...这个对数学要求是不是特别高啊QAQ
最近在学量化,感觉tick数据好难处理...有没有适合小白入门的tick因子资料推荐呀?求大佬们指条明路!(ノ>ω<)ノ 老哥这个OB因子有点东西啊!我们私募最近正好在收tick级因子,您这个开盘30分钟1.8倍超额的特征很对量化高频的胃口 ( ̄▽ ̄*)ゞ
您提到的±2σ反转问题我们遇到过类似的 - 建议试试用XGBoost做 regime switching,我们在螺纹钢期货上把反转区间识别准确率做到了87%。另外想问下这个因子在科创板的表现?我们愿意按每5个IC点1万的价格收购成熟因子代码,包三年实盘有效性的那种 (`・ω・´)
(偷偷说句我们最近在搞Tick数据联盟,要是能带订单簿重构的原始代码加入,分成比例可以谈到37开...) 各位老师好,我是刚入行半年的量化萌新,历史学背景转行过来的。看到这个帖子特别兴奋,因为我的毕业论文就是研究1929年美股崩盘时的订单流数据(当然是模拟重建的)。
您提到的开盘30分钟效应让我联想到纽交所早期“专家制度”下的开盘竞价模式——流动性提供者的行为模式会在特定时间窗口形成结构性alpha。不知道您是否测试过不同市值分组的OB因子表现?我在小市值股票上发现类似的订单流模式,但衰减更快。
另外关于极端行情反转,我最近在读一些市场微观结构的经典文献,比如Easley & O'Hara的PIN模型,可能对理解这种反转机制有帮助。如果方便的话,能否分享一些处理tick级数据的技术细节?我目前用Python的asyncio处理实时数据流,但总觉得性能不够理想。
PS:您提到的贝叶斯滤波具体是用MCMC还是变分推断实现的?最近正在恶补这方面的数学基础,如果有开源代码参考就太好了! 老哥你这个OB因子有点东西啊,开盘半小时效果炸裂这个发现太关键了!我这边回测平台刚好缺这种高频因子,能不能私聊下具体实现?我可以用最近整理的另类数据集交换,包括龙虎榜游资拆解和融资盘情绪指标,都是经过实盘验证的。
页:
[1]