不如效忠于我 发表于 2025-7-1 07:02:45

标题:多因子选股模型的因子正交化处理与策略稳定性提升

最近在回测一个基于多因子合成的选股策略时,发现部分因子间存在较高的共线性,导致模型在样本外表现不稳定。尝试了三种正交化方法(PCA、施密特正交化、因子旋转),发现不同方法对策略夏普比率的影响差异显著。

具体现象:
1. 原始因子IC均值0.08,但20日衰减速度达60%
2. PCA处理后前三个主因子解释力达85%,但策略换手率上升40%
3. 施密特正交化后的规模因子在市值分组测试中仍然呈现单调性

问题讨论:
- 如何处理正交化后因子经济含义模糊的问题?
- 是否有更好的方法评估正交化对策略稳定性的影响?
- 行业中性处理是否应该放在正交化之前?

(注:完整回测数据已通过t值检验,但为避免广告嫌疑不展示具体参数)

让我失望 发表于 2025-7-1 21:50:55

作为一个刚转行量化的前码农,看到这么硬核的讨论直接跪了...

想请教各位大佬:
1. PCA正交化后因子变成"黑箱"了,有没有办法像特征重要性那样反向推导主因子的经济含义?(⊙_⊙)?
2. 本萌新在回测时只会看夏普和最大回撤,各位都是用什么指标来评估正交化效果的啊?
3. 弱弱问下,行业中性处理和正交化的先后顺序会影响策略逻辑吗?感觉像在debug时遇到的多线程锁顺序问题...

(最近在啃《主动投资组合管理》,但书上案例和实操差距好大啊哭唧唧)

不敌时光 发表于 2025-7-4 12:50:44


1. 正交化后因子经济含义问题,建议用因子旋转+行业专家解读的组合拳。我们内部开发了一个因子语义解析工具包,可以私信发你试用版 (`・ω・´)

2. 稳定性评估方面,推荐采用分层回测+滚动窗口正交化的方法。附件是我们整理的《正交化方法敏感度测试白皮书》,含20+个A股特色因子案例 ( ̄▽ ̄*)ゞ

3. 行业中性处理时机要看具体策略:
- 基本面策略建议先中性化
- 量价因子建议后中性化
这里有个决策流程图解,需要的话留邮箱

PS:我们正在收购优质多因子正交化解决方案,如果有成熟方法论欢迎带夏普>2的实盘记录来聊合作 (๑•̀ㅂ•́)و✧

哭泣的过去 发表于 2025-7-5 20:50:11

1. 你这策略明显过拟合了还在这装专业呢?IC均值0.08也好意思拿出来说?

2. 笑死 PCA换手率上升40%不就是因为正交化把信号搞没了吗 建议回炉重造

3. 还讨论经济含义?先把基础统计学好行不行 连正交化都玩不明白就别搞量化了

4. 行业中性放前放后这种幼儿园问题也值得问?明显是来骗回复的吧

5. 有本事把具体参数放出来啊 遮遮掩掩的肯定是个亏货策略

(纯路人 但看你这个回测结果比我去年亏50%的实盘还烂)

我可是个大屌丝 发表于 2025-7-4 20:55:10

"看到这个帖子我直接一个滑跪!求大佬们把正交化后的玄学因子打包卖我,价格好商量!(╯°□°)╯

作为量化萌新,我回测时正交化完发现:
1. 因子解释力越强,经济含义越像在解《周易》
2. 每次换方法都像在玩俄罗斯轮盘赌,夏普比就是那颗子弹
3. 现在看到PCA三个字母就PTSD发作

重金求购:
- 能同时保持经济学意义和数学纯洁性的"薛定谔因子"
- 行业中性处理的标准操作流程(最好附带和尚开光版)
- 防止正交化后策略变成玄学产品的防沉迷系统

(可以用我珍藏的10TB无效因子库交换,内含2015年熔断时期的珍贵废数据)"

海是岛流尽的泪 发表于 2025-7-17 10:12:16

作为一个刚学量化的小白,看到大佬讨论因子正交化的问题好激动!(✪ω✪)

关于经济含义模糊的问题,我在论文里看到有人用因子旋转(比如varimax)来保持解释性,但实际操作中效果好像不太稳定...

求问各位前辈:
1. 有没有比较适合新手的正交化方法推荐呀?最好能保留因子原始含义的那种
2. 回测时除了夏普比率,还应该重点看哪些指标来判断正交化效果呢?
3. 小白刚开始做应该先尝试PCA还是施密特呀?(´• ω •`)ノ

(悄悄说:如果有相关的Python代码示例就更好了...最近被sklearn的PCA参数搞得头大)
页: [1]
查看完整版本: 标题:多因子选股模型的因子正交化处理与策略稳定性提升