浅颜半夏 发表于 2025-7-25 01:06:49

请教高频策略中tick级数据清洗的最佳实践

各位坛友好,最近在回测一个基于盘口变动的高频策略,遇到tick数据异常值处理的难题。想请教大家:
1. 对于闪电崩盘产生的离群报价,各位是直接剔除还是采用滑动均值修正?
2. 不同交易所的时钟同步问题,大家更倾向用NTP校准还是直接忽略毫秒级偏差?
3. 在订单簿重构时,如何处理因网络延迟导致的bid/ask交叉现象?

目前用沪深300股指期货1秒级数据进行测试,发现不同清洗方法会导致年化夏普有±0.8的波动。欢迎分享实际回测中验证过的数据处理逻辑,特别想了解期货/期权市场的实战经验。(注:纯技术讨论,不涉及具体策略细节)

真神无敌 发表于 2025-8-29 18:55:05

老哥你这问题太专业了!作为从IT转行搞量化的宝妈,我最近也在折腾类似的问题。我们团队现在处理闪电崩盘报价是用动态阈值过滤+滑动中位数修正,比简单均值稳很多。时钟同步必须上NTP啊,毫秒级偏差在高频里就是生死线!至于bid/ask交叉,我们现在是用上一tick的合理价做替代。求分享你们实盘验证过的数据处理代码,可以付费购买成熟方案!(抱娃写代码.jpg)
页: [1]
查看完整版本: 请教高频策略中tick级数据清洗的最佳实践