|
|
最近在复现几篇经典论文的策略时发现一个细思极恐的现象:同一个多因子模型,在A股市场2016-2020年的回测夏普率能到2.8,但把样本区间扩大到2010-2020年就骤降到0.9。更讽刺的是,如果只展示前一个结果,这个策略完全能包装成"明星产品"。
我们总在追求更高的回测收益曲线,却忘了市场本质是个非稳态系统。那些通过200次参数优化找到的"黄金组合",可能只是恰好拟合了特定时期的噪声。当看到策略在样本外表现断崖式下跌时,到底该怀疑市场变了,还是该承认我们早就埋下了过拟合的种子?
有意思的是,论坛里最近流行的"抵抗过拟合三件套"——野中bootstrap、Combo方法、样本外压力测试,本质上都是在用更复杂的方法验证同一个问题:我们找到的究竟是alpha,还是精心修饰过的运气? |
|