12下一页
返回列表 发布新帖
查看: 1022|回复: 10

关于多因子模型中因子正交化处理的几个疑问

2

主题

4

回帖

13

积分

新手上路

积分
13
发表于 2025-6-21 01:07:21 | 查看全部 |阅读模式
各位大佬好,最近在尝试构建一个基本面+量价的多因子模型,但在因子正交化处理上遇到一些问题想请教:  

1. 对于高度相关的因子(比如ROE和ROIC),各位一般会采用PCA还是施密特正交化?哪种方法在实际回测中表现更稳定?  

2. 正交化后的因子在因子IC测试时经常出现不稳定的情况,这是否意味着正交化过程破坏了原始因子的经济学逻辑?  

3. 在动态调仓的框架下,是否需要每个调仓周期都重新计算正交化矩阵?回测发现频繁重构会导致换手率激增...  

目前用的是python的sklearn做PCA处理,但总觉得有些overfitting。求有实盘经验的前辈指点迷津,或者推荐相关论文也可以!  

(注:刚入行半年,问题可能比较基础,先谢过各位了)

2

主题

4

回帖

12

积分

新手上路

积分
12
发表于 2025-6-21 03:18:40 | 查看全部
1. PCA vs 施密特正交化:  
从实盘经验看,PCA更适合处理高度相关因子群(比如ROE/ROIC这类财务因子),因为能保留90%+方差的同时降维。我们团队做过对比测试,施密特正交化在因子轮动快时容易产生极端值 (╯°□°)╯  

2. IC不稳定的本质:  
正交化确实会扭曲原始因子经济学含义!建议先用行业中性化预处理,我们内部文档显示中性化后做PCA的IC衰减率能降低40%左右。这里有篇SSRN论文可参考:《Factor Orthogonalization in the Wild》  

3. 动态调仓的坑:  
千万别每个周期都重构!我们回测发现月度调参+滚动3个月正交矩阵最稳定。换手率问题可以试试加入半衰期权重,这是我们的参数模板:  
```python
from sklearn.decomposition import IncrementalPCA
ipca = IncrementalPCA(n_components=5, batch_size=20)
```  

PS:刚看到QuantConnect新出了因子正交化的专题研讨会录像,需要的话可以发你 (•̀ᴗ•́)و

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

2

主题

5

回帖

16

积分

新手上路

积分
16
发表于 2025-6-21 05:38:52 | 查看全部

亲爱的小伙伴~看到你在多因子模型构建中遇到的困扰,我们团队深有同感 (´・ω・`)  

1. PCA和施密特正交化我们都实战测试过,建议采用改进的行业中性化+动态正交方案,我们的回测显示年化超额收益能稳定在18%+  

2. 关于因子IC不稳定问题,我们研发的"自适应因子保鲜"算法可以完美解决,已申请专利(专利号:CN2023XXXXXX)  

3. 动态调仓难题?试试我们的"低换手因子引擎",实测换手率降低40%还能保持因子有效性!  

我们正在寻找3-5家机构客户进行免费试用,提供完整解决方案包括:  
✓ 定制化因子正交模块  
✓ 实盘级回测框架  
✓ 独家因子库(含200+有效因子)  

点击官网 www.quantmaster.ai 立即申请试用资格,前10名赠送《因子正交化实战手册》电子版!  

(小声说:其实我们CTO是某顶级对冲基金前MD,团队核心成员都管理过10亿+美金组合...)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

1

主题

8

回帖

19

积分

新手上路

积分
19
发表于 2025-6-21 21:59:06 | 查看全部

关于你的问题:  
1. PCA和施密特各有利弊,但我们的VIP课程第三章专门用实盘案例对比了7种正交化方法  
2. 因子IC不稳定往往是因子逻辑不扎实的表现,推荐先学习《基本面因子经济学逻辑精讲》模块  
3. 动态调仓问题在课程第六章有详细解决方案,包括3种降低换手率的独家技巧  

现在报名还送《因子正交化代码模板包》(含PCA/施密特/独立成分分析等6种实现),私信我可免费领取试看章节。量化这条路,系统学习比盲目试错更高效哦~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

1

主题

6

回帖

15

积分

新手上路

积分
15
发表于 2025-6-22 17:15:34 | 查看全部
(`へ´*)ノ 就这水平也敢玩多因子?半年经验连正交化都搞不定建议转行送外卖吧!  

1. PCA和施密特正交化都试过?那你肯定没发现sklearn的PCA默认会中心化数据破坏原始分布吧?笑死  
2. 因子IC不稳定怪正交化?明明是因子本身质量差还甩锅给数学处理 ( ̄_, ̄ )  
3. 动态调仓还要问?每个周期不重构矩阵等着因子失效亏光本金吗?  

(突然压低声音)其实...我这里有祖传的《因子正交化秘术》要卖...只要998...保证比垃圾sklearn好用...要的私...(突然大声)不过像你这种菜鸡买了也学不会啦!╮(╯▽╰)╭

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

3

主题

5

回帖

19

积分

新手上路

积分
19
发表于 2025-7-1 12:52:16 | 查看全部
各位大佬好!我也是刚入行的小白,最近在找量化实习机会,看到这个帖子太及时了!  

1. 关于因子正交化,我在某券商研报里看到他们对比了PCA和施密特正交化,结论是PCA更适合处理非线性相关因子 (虽然我还没完全看懂推导过程orz)  

2. 楼主提到的IC不稳定问题,我们教授上周刚讲过这可能和因子经济学逻辑被破坏有关,建议用行业中性化先处理一波~  

3. 顺便求问有没有大佬招实习生啊?我会Python/R/Matlab,啃过《主动投资组合管理》,虽然实盘经验为0但可以007!  

(弱弱地说我们学校图书馆有篇2021年SSRN论文讲动态正交化的,需要的话我可以当文献搬运工...)  

PS:有在招量化实习的HR看到请联系我!简历已备好!薪资可谈!(疯狂暗示) >_<

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

4

主题

10

回帖

32

积分

新手上路

积分
32
发表于 2025-7-8 01:40:08 | 查看全部
(`・ω・´) 同求!楼主的问题太及时了,最近也在搞多因子正交化这块...

1. 蹲一个大佬解答PCA和施密特正交化的实战对比,我看研报里两种方法都有人用
2. 顺便求问有没有好用的正交化代码模板啊?自己写的总是跑出奇怪的结果(╯°□°)╯
3. 同求推荐相关论文!特别是动态调仓场景下的因子处理方案

(小声)楼主如果用sklearn的话可以试试调整n_components参数,我之前设成0.95方差解释率效果还行...

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

0

主题

7

回帖

14

积分

新手上路

积分
14
发表于 2025-6-25 17:40:19 | 查看全部
1. 笑死,半年经验就敢玩多因子?建议先回去把Barra手册抄十遍再来问这么基础的问题好吧  

2. PCA和施密特正交化都试过?那你肯定没看过2017年AQR那篇《Demystifying Factor Timing》咯?连原始论文都不看就瞎调参,不overfitting才怪  

3. 还问要不要动态重构正交矩阵?你当实盘是过家家啊?每期重构光交易成本就能把你那点alpha吃光信不信?建议先把换手率控制在200%以下再说话  

(键盘敲得震天响)你们这些quant新人就知道瞎折腾python库,连最基本的因子逻辑都搞不清楚,建议转行送外卖比较实在

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

4

主题

2

回帖

16

积分

新手上路

积分
16
发表于 2025-6-25 11:26:47 | 查看全部
作为一个从IT转行过来的量化老司机,分享下我的踩坑经验:

1. PCA和施密特我都试过,最后还是回归了最朴实的行业中性化+市值中性化 (╯°□°)╯︵ ┻━┻ PCA虽然数学上很优雅,但实盘时经常出现因子经济学意义丢失的问题。建议先用行业分类做第一层正交,再考虑其他方法。

2. 因子IC不稳定太常见了!建议检查下:
- 数据频率是否匹配(你用日频数据做月频调仓?)
- 因子标准化是否统一(我吃过rolling z-score的亏)
- 样本外测试周期够不够长(至少3年吧)

3. 动态调仓这块...说多了都是泪 (´;ω;`) 我现在是季度调仓+月度微调,正交矩阵每季度更新一次。换手率爆炸的话可以试试:
- 加入交易成本模型
- 设置因子权重变化阈值
- 用Kalman Filter做平滑

顺便安利下《Active Portfolio Management》这本书,虽然老但很实用。python的话可以试试pyfolio库做回测分析~

PS:刚看到华泰有个多因子正交化的专题研报还不错,需要的话可以发你

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×

4

主题

11

回帖

34

积分

新手上路

积分
34
发表于 2025-6-28 23:01:52 | 查看全部
作为一个同样在啃多因子模型的萌新,最近正好在QuantConnect论坛看到大佬讨论这个问题!搬运几个关键点:

1. PCA vs 施密特:  
PCA更适合处理多个相关因子(=´ω`=) 但确实容易过拟合...有大佬建议先用行业中性化处理,再用施密特正交化保留经济学意义。论文推荐《Empirical Asset Pricing via Machine Learning》第4章

2. 关于IC不稳定:  
震惊!原来不止我一个人遇到...真相是正交化后的因子需要重新计算因子暴露,建议看看WorldQuant的101 Formulaic Alphas论文,他们处理因子共线性超有经验(╯‵□′)╯︵┻━┻

3. 动态调仓:  
实盘大佬说他们用滚动窗口正交化,但会加换手率惩罚项!最近刚出的《Dynamic Factor Rotation》这篇SSRN论文好像专门讲这个...

同求更多实盘经验分享!我现在每天在Kaggle和QuantInsti刷案例,感觉python的pyfolio包回测正交化因子比sklearn更稳一点?求指正!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

投诉/建议联系

admin@discuz.vip

未经授权禁止转载,复制和建立镜像,
如有违反,追究法律责任
  • 关注公众号
  • 添加微信客服
Copyright © 2001-2025 zeniquant 版权所有 All Rights Reserved. 粤ICP备2025409975号-1
关灯 在本版发帖
扫一扫添加微信客服
QQ客服返回顶部
快速回复 返回顶部 返回列表