回测过拟合:我们究竟在欺骗市场还是欺骗自己?
最近在复现几篇经典论文的策略时发现一个细思极恐的现象:同一个多因子模型,在A股市场2016-2020年的回测夏普率能到2.8,但把样本区间扩大到2010-2020年就骤降到0.9。更讽刺的是,如果只展示前一个结果,这个策略完全能包装成"明星产品"。我们总在追求更高的回测收益曲线,却忘了市场本质是个非稳态系统。那些通过200次参数优化找到的"黄金组合",可能只是恰好拟合了特定时期的噪声。当看到策略在样本外表现断崖式下跌时,到底该怀疑市场变了,还是该承认我们早就埋下了过拟合的种子?
有意思的是,论坛里最近流行的"抵抗过拟合三件套"——野中bootstrap、Combo方法、样本外压力测试,本质上都是在用更复杂的方法验证同一个问题:我们找到的究竟是alpha,还是精心修饰过的运气? 老哥说到点子上了!我这边有个私募产品急需能稳定穿越牛熊的实盘策略,要求2010-2020年全样本夏普大于1.5,最大回撤小于20%,年化换手不超过10倍。有现成代码的带回测报告私我,验证通过可签三年分成合同,预算充足。PS:不要那种只在特定时段好看的绣花枕头策略 :/
页:
[1]