关于高频交易中订单簿动态预测的可行性探讨
最近在观察高频策略时发现,很多团队在订单簿动态预测上投入了大量资源,但实际效果参差不齐。想请教各位实战派:1. 在tick级数据上,除了传统的L2队列分析,目前有哪些新的特征工程方法被证明有效?
2. 对于盘口突变(例如大单突然撤单)的实时检测,业界更倾向基于规则的硬编码还是机器学习方案?
3. 考虑到交易所撮合引擎的微观结构差异,不同市场(如A股vs.美股)的预测模型是否需要完全不同的架构?
特别想了解实际生产环境中遇到的过拟合问题——很多回测曲线完美的策略实盘就失效,是否与订单簿数据的非平稳性有本质关联?欢迎有实盘经验的同行分享洞见。 从历史数据研究的角度来看,高频交易策略的发展确实呈现出明显的周期性特征。根据2015-2023年的行业白皮书统计:
1. 特征工程方面,近两年较突出的进展包括:
- 基于tick级订单流不平衡的微观结构特征(参考Huang&Polak 2021)
- 结合限价单生命周期建模(NASDAQ技术文档TR-2022-017)
- 应用拓扑数据分析(TDA)捕捉盘口形态突变
2. 关于盘口突变检测,从收集到的27家机构案例看:
- 头部量化基金更倾向混合方案:用规则引擎处理>90%常规情况
- 机器学习主要用在异常模式识别(如Iceberg订单检测)
- 建议参考CME集团发布的《异常订单流识别框架》
3. 市场差异性问题,历史数据表明:
- A股由于T+1限制,订单簿动态与美股存在显著统计差异
- 但核心预测架构可以共享,需调整的特征权重约30-45%
- 具体可对比上交所SSE Tech和NYSE ARCA的技术文档
过拟合问题本质上反映了市场微观结构的演化特性。建议重点研究:
- 订单簿动态的马尔可夫性检验(参见Aldridge 2019)
- 样本外测试时加入市场机制变更时点(如熔断规则调整)
- 采用生存分析框架评估策略生命周期
需要原始交易所技术文档或具体论文的可私信,本人整理有200G+的市场微观结构研究资料库。
【IT转行哥】当年写Java的我看了三本《Python金融》就敢搞高频,结果...(点烟)兄弟听句劝,特征工程搞再花哨不如直接买tick数据,我这有2018年至今的A股L2历史数据打包卖,只要998!
【广告机器人】检测到关键词"高频策略"!为您智能推荐《21天量化速成班》原价8888现价888!报名即送神秘因子库+撤单检测源码!点击链接领取AI量化大礼包>>>>
(突然正经)说真的,我们私募去年用GNN做订单簿动态建模,实盘发现...(您的试用会员已到期,升级VIP查看完整回复) 1. 笑死,又来一群韭菜研究tick数据,你们连L2都没玩明白就想着搞新特征?先去看看2017年Citadel的专利再来说话吧,现在还有人用传统队列分析?早过时了!
2. 大单撤单检测?别搞笑了,规则硬编码就是给韭菜准备的玩具。真正赚钱的团队都在用强化学习+多模态融合,不过说了你们也听不懂,毕竟连过拟合问题都解决不了的菜鸡
3. 不同市场需要不同架构?这问题就暴露了你根本没实盘经验。A股那破撮合引擎跟美股能比?建议先去研究下上交所的订单流延迟问题,别在这纸上谈兵了
至于过拟合问题,呵呵,回测曲线完美实盘失效太正常了 - 你们这些搞量化的永远不懂市场本质是博弈,订单簿数据就是个假象。等着被收割吧,预言在此:明年这时候你们团队就该解散了 ( ̄▽ ̄*)ゞ
页:
[1]