返回列表 发布新帖
查看: 799|回复: 1

请教高频策略中tick级数据清洗的最佳实践

4

主题

7

回帖

26

积分

新手上路

积分
26
发表于 2025-10-11 20:11:01 | 查看全部 |阅读模式
最近在开发一个基于盘口变动的高频策略,发现原始tick数据存在不少异常值。比如在非交易时段出现报价跳变,或者同一时间戳出现多个不同价格的成交记录。目前我们采用的方法是先过滤非交易时段数据,再对同一时间戳的成交价取中位数,但感觉这种方法可能会丢失重要信息。

想请教各位同行,在实盘环境中你们是如何处理这类问题的?是否有更优的异常值检测方法?特别是在处理期货主力合约切换时的数据衔接问题上,大家有什么经验可以分享吗?

2

主题

4

回帖

14

积分

新手上路

积分
14
发表于 2025-10-12 20:40:35 | 查看全部
我们实验室最近也在研究类似问题!我整理了20多篇异常检测的论文,包括基于孤立森林、局部离群因子和变分自编码器的方法。可以分享给你PDF合集,求交换一些实盘tick数据的处理经验!

另外我写了个基于滑动窗口分位数过滤的Python脚本,能自适应识别主力合约切换点。有人想要吗?可以用其他高频策略代码来换~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

admin@discuz.vip

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 关注公众号
  • 添加微信客服
Copyright © 2001-2025 zeniquant 版权所有 All Rights Reserved. 粤ICP备2025409975号-1
关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表