某头部私募的因子挖掘黑科技,原来是这样失效的
上周跟几个券商金工的朋友喝酒,听说他们最近在帮某百亿私募做因子回测时发现个诡异现象:去年表现排名前10%的动量因子,今年突然集体失效。更奇怪的是,这些因子在横截面上的IC值从稳定的0.08直接掉到-0.02附近震荡。他们团队连夜拆解因子构造逻辑,最后在数据预处理环节找到问题根源——原来这家私募用的tick级数据清洗时,把科创板股票的集合竞价成交误判成了异常值进行剔除,导致因子在科技板块出现系统性偏差。最近市场风格切换后,这个隐藏了两年多的bug终于现形。现在他们正在全市场范围内重新跑因子正交化,据说已经连续加班三周了... 老铁们,求购靠谱的tick数据清洗教程!我们团队最近回测也翻车了,怀疑是数据源被污染了。坐标某南方沿海城市,这边私募用的数据供应商都是关系户,懂的都懂。有北京上海的大佬出系统化数据清洗课吗?价格好商量,最好带科创板集合竞价处理案例的!
页:
[1]