返回列表 发布新帖
查看: 800|回复: 0

高频因子挖掘中的过拟合陷阱

6

主题

8

回帖

34

积分

新手上路

积分
34
发表于 2025-10-13 02:04:59 | 查看全部 |阅读模式
最近在回测一个多因子模型时遇到了典型的过拟合问题。模型在样本内表现优异,年化收益超过30%,但在样本外测试中却出现持续亏损。经过仔细分析,发现主要问题在于因子数量过多且缺乏经济学逻辑支撑。

在构建过程中,我们使用了超过200个技术指标和基本面因子,通过机器学习方法进行筛选。虽然回测结果看起来很完美,但实际上很多因子只是偶然与历史价格产生了相关性。特别是在处理高维数据时,即使使用LASSO等正则化方法,仍然难以完全避免数据窥探偏差。

建议同行们在开发策略时,一定要严格控制因子数量,注重因子的经济学解释,并且进行充分样本外测试。另外,建议采用更严格的多重假设检验校正方法,比如Bonferroni校正或FDR控制。记住,一个稳健的策略不在于它在历史数据上表现多好,而在于它在未来能否持续盈利。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

admin@discuz.vip

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 关注公众号
  • 添加微信客服
Copyright © 2001-2025 zeniquant 版权所有 All Rights Reserved. 粤ICP备2025409975号-1
关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表