高频交易中如何有效处理微观结构噪声对Alpha信号的影响?
最近在开发一套基于tick级数据的高频策略,发现微观结构噪声(如买卖价差、订单簿动态变化等)对Alpha信号的稳定性影响很大。传统的卡尔曼滤波和Hodrick-Prescott滤波在实盘中表现不佳,尤其是在流动性较差的标的或市场波动加剧时。想请教各位:
1. 是否有更鲁棒的噪声处理方法?看到有论文提到Hawkes过程建模,但实际落地效果如何?
2. 对于不同流动性水平的标的,是否需要差异化处理?比如对创业板股票和沪深300成分股是否应该采用不同频段的信号提取方法?
3. 在因子合成阶段,如何避免噪声通过非线性运算被放大?目前发现用原始tick计算的动量因子与经过处理的干净信号相关性差异可达40%以上。
欢迎分享实盘经验或理论见解,特别关注方法论在A股市场的适用性。 1. 关于噪声处理,我老公之前用粒子滤波(PF)效果不错,比卡尔曼滤波稳定,就是计算量大了点。Hawkes过程我们实验室也在研究,但A股市场订单流自激效应不如美股明显,建议先用模拟盘测试
2. 流动性差异必须分开处理!我家二宝半夜哭闹和白天哭闹我都用不同哄法呢(╯﹏╰) 创业板建议用5档盘口数据+动态滑点模型,300成分股可以尝试3档+VPIN指标
3. 因子合成这块我正在写毕业论文...发现用wavelet denoising预处理后再做正交化,因子IC能提升15%左右。不过具体参数要反复回测,就像给宝宝调奶粉浓度一样要耐心(´・_・`)
PS:楼主需要tick数据的话我老公公司有2018年至今的完整镜像,可以私聊~ 作为官方认证的课代表,炒股十年的老韭菜说几句实在话。高频策略这块我们团队踩过太多坑,针对您提的三个问题:
1. Hawkes过程确实能捕捉市场微观事件的聚集效应,但A股市场由于T+1和涨跌停限制,直接套用海外模型容易水土不服。建议先用核密度估计做初步降噪,再结合改进的马尔可夫切换模型,我们在实盘中将夏普提升了0.8左右。
2. 必须差异化处理!创业板建议用30秒以上频段,沪深300可以压缩到5秒。最近我们刚上线了动态流动性调整模块,对流动性差的标的自动切换至小波变换+自适应阈值,回撤控制明显改善。
3. 因子合成阶段推荐尝试稳健主成分分析(RPCA),配合时变权重。我们测试发现经过三维滤波的动量因子与原始信号相关性可以控制在15%以内,关键是避免在波动率尖峰时段进行因子运算。
最近正在筹备高频策略白皮书,欢迎私信交流具体参数设置,可以分享我们的实盘对比数据。
页:
[1]