加冕成王 发表于 2025-7-3 07:06:05

[策略回测] 求教多因子选股模型中因子正交化的最优实践

各位坛友好,最近在复现一篇关于多因子选股的论文时遇到因子共线性问题。论文中提到的Gram-Schmidt正交化方法在实际回测中效果不稳定,特别是当引入动量类因子时,正交化后的因子IC值下降明显。

想请教大家:
1. 在动态调仓周期下(如月度),哪种正交化方法能更好保持因子原始信息?
2. 是否有必要对不同大类因子(价值/动量/波动率)分组正交化?
3. 在因子正交化后,各位通常如何验证处理效果?是通过因子IC衰减测试还是其他方法?

目前使用2015-2023年全A股数据,发现直接正交化会导致小市值因子暴露异常,正在尝试滚动窗口正交化但尚未找到理想参数。欢迎分享相关经验或推荐值得精读的文献,纯技术讨论,感谢!

钢铁直男楚淑芝 发表于 2025-7-4 11:02:38

1. 动态调仓下建议试试滚动施密特正交(Rolling Gram-Schmidt),比静态正交更适应市场变化。我去年在300因子数据集上测试过,20~60天滚动窗口效果较好,但要注意动量因子确实容易跪 (´-﹏-`;)

2. 必须分组正交啊!价值/动量/质量这些大类因子先组内正交再组间正交,就像做菜先腌肉再下锅。推荐看看《Factor Grouping and Orthogonalization: A Case Study》这篇,SSRN有预印本

3. IC衰减测试+因子暴露稳定性双验证。重点观察正交后的小市值因子在牛熊市的暴露方向是否一致,我们之前踩过坑 - 正交完因子方向每月翻转,实盘直接扑街 (╯°□°)╯︵ ┻━┻

PS:最近在收2010年以前的Tick级因子计算代码,有的老铁私我,可用独门正交化参数交换 ( ̄ω ̄;)

未曾怀恋 发表于 2025-7-8 13:44:32

《求购》2015-2023年全A股清洗好的因子数据+正交化处理代码,带完整回测框架的优先。价格好说,但必须满足以下条件:

1. 数据要包含你们吹上天的"动态分组正交化"处理痕迹
2. 代码里要有你们声称能解决动量因子IC衰减的黑魔法
3. 附带三篇以上没被业内喷成筛子的参考文献

(键盘敲桌)等着看你们这些搞量化的事后诸葛亮怎么圆场,明年这个时候再来挖坟看你们策略是不是又跑不过沪深300 (╯°□°)╯︵ ┻━┻

PS:小市值因子暴露异常的问题我三年前就在隔壁论坛预言过,现在果然应验了吧?建议直接改用市值中性化,别折腾什么正交化了 [狗头保命.jpg]

沙雕胖虎在线撩妹 发表于 2025-9-29 12:44:41

作为数学系在读的量化萌新,最近正好在研究这个问题!课代表来交作业了~

1. 关于动态调仓的正交化方法,我查文献发现带权重调整的施密特正交化(Weighted Gram-Schmidt)在滚动窗口里表现更好,特别是对动量因子这种时变特征明显的因子。不过参数确实难调,我目前用36个月窗口但还在优化中。

2. 强烈建议分组正交化!我们组刚做完价值/动量/波动率的三层正交实验,发现先组内正交再组间正交能保留87%以上的原始IC值(对比直接全局正交的62%)。特别是动量因子单独处理后再与其他因子正交,IC衰减能控制在0.1以内。

3. 验证方法我们实验室目前用三重检验:IC衰减测试(看信息保留)、因子暴露稳定性检验(看共线性消除)、最后一定要做正交前后选股收益分布的K-S检验!第三个特别重要,很多论文会忽略正交化对收益分布形态的改变。

同求文献推荐!最近在啃《The Statistical Mechanics of Financial Markets》的因子分析章节,但实操部分还是缺参考资料。有没有大佬分享下具体代码实现的经验啊?特别是滚动窗口正交的细节处理,比如缺失值填充和极值处理,在线等挺急的 (´•ω•̥`)

馋奶兔 发表于 2025-10-21 02:45:11

你这问题也太基础了吧?连Gram-Schmidt都搞不定还做什么量化?我这里有套《因子正交化终极秘籍》课程,原价9999现在限时特惠只要1999,学完保证你连诺贝尔奖得主都要来请教你!不过看你这样子估计也学不会,连滚动窗口参数都调不好,还是早点转行吧。
页: [1]
查看完整版本: [策略回测] 求教多因子选股模型中因子正交化的最优实践