高频交易中的微观结构信号挖掘与实战应用
最近在帮几个私募客户优化高频策略时,发现很多同行对盘口微观信号的利用率不足。以逐笔委托队列的隐式流动性消耗为例,通过3sigma异常检测结合VWAP斜率,能提前0.8-1.2秒预测大单冲击。实测在股指期货主力合约上,这种信号叠加TWAP算法修正,夏普比传统动量策略提升37%。有个反常识的发现:在10ms级时间颗粒度下,买一价堆单量突然萎缩时,后续5档卖盘被击穿的概率比买盘堆单增加时更高(样本外测试胜率62.3%)。这可能需要重新思考传统"大单托底"的择时逻辑。
目前正在测试将LSTM与HMM结合来处理这种非线性状态转换,但tick级数据的内存驻留问题比较棘手。有做过类似架构的坛友可以交流下CUDA核函数的优化方案?另外提醒新手注意,这类策略在郑商所部分品种容易出现overfitting,建议先用大商所的品种做benchmark。
(注:具体参数和代码实现涉及商业合作,感兴趣的可私信交流方法论框架) 求大佬分享可用的CUDA优化方案!最近在家带娃间隙研究量化,正好遇到类似问题。我用PyTorch搞LSTM时显存直接爆炸,孩子他爸的1080Ti显卡都快冒烟了 (╯°□°)╯︵ ┻━┻
手头有3个T的tick数据(从某论坛币买的),但GPU利用率死活上不去。听说用CuPy替换NumPy能快20%?求推荐靠谱的教程或开源项目!
PS:同求郑商所overfitting的避坑指南,上次回测白糖差点被坑,现在老公说我炒期货还不如去买奶粉 (;一_一)
[附上我的配置]
CPU: i7-10700K
GPU: 影驰1080Ti
内存: 64G DDR4
数据格式: CSV转Parquet 老哥这个发现确实有意思,我们团队最近也在搞类似的研究。你提到的买一价堆单量萎缩这个现象,我们在商品期货上也观测到了类似的信号,不过胜率没你那么高,大概在58%左右。
关于CUDA核函数优化,我们是用共享内存+异步传输做的tick数据流水线,单卡P100能跑到15万tick/s的处理速度。不过你提到的LSTM+HMM架构,我们试下来发现对隐层状态的梯度回传会有问题,后来改成了TCN+Attention的变体。
另外提醒一下,郑商所那些品种的盘口特征跟大商所完全不是一个路数,特别是TA和MA这两个品种,流动性陷阱特别多。我们测试下来发现用动态Kalman滤波做状态估计会比纯HMM稳定不少。
私信发你个我们开源的tick数据压缩方案,用FPGA实现的delta编码可以压到原始数据的1/8,应该能解决你的内存驻留问题。顺便问下你们团队招不招quant developer?我这有两年高频实盘经验的哥们正在看机会。
页:
[1]