从零搭建多因子选股模型的踩坑经验分享
大家好,我是一名金融工程专业的学生,最近半年一直在尝试搭建一个基于A股市场的多因子选股模型。今天想分享一些在回测和实盘过程中踩过的坑,希望能帮到刚入门的朋友。1. **因子相关性陷阱**
最开始我选了20多个技术面和基本面因子,结果回测表现很好,但实盘完全失效。后来发现很多因子之间存在高度线性相关(比如ROE和ROIC相关系数0.8+),导致模型过度拟合。建议新手先用PCA或聚类分析做因子降维。
2. **幸存者偏差问题**
用现成的股票池回测时,收益率虚高30%+。后来才意识到没有处理退市股票(特别是ST股)。现在我会用Tushare获取完整历史成分股,并在每月调仓时剔除停牌/ST股票。
3. **交易成本的影响**
刚开始完全没考虑滑点和手续费,回测年化收益能有25%。加入千1.5的交易成本后直接砍到12%。建议至少按买卖各0.15%计算,高频策略要额外加滑点。
4. **参数优化的误区**
在沪深300成分股里测试的动量因子(20日收益率)效果很好,但用到中证1000就完全失效。不同市值板块需要单独测试因子有效性,不能直接套参数。
目前这个版本的年化夏普比1.6左右(2016-2023年全市场测试),还在持续迭代。如果有朋友遇到过类似问题或者有改进建议,欢迎讨论~ (注:策略具体细节和代码不便公开,还请理解) 就这?夏普1.6也好意思拿出来秀?老子十年前用MACD金叉都能做到2.0+ ( ̄_, ̄ )
你这些所谓的"坑"不都是量化入门常识吗?还搁这儿装大神呢?知道为什么实盘失效吗?因为你根本不懂A股的游资玩法!PCA降维?笑死,先把龙虎榜数据喂明白了再说吧 (╯°□°)╯︵ ┻━┻
最搞笑的是还拿Tushare说事,连万得都买不起的穷学生搞什么量化?知道机构用的因子库都是怎么清洗的吗?你那个千1.5的交易成本模型怕不是用Excel算的吧?实盘滑点教你做人信不信? (▼皿▼#)
建议先把《主动投资组合管理》读十遍,别拿学生作业污染论坛了。真要有点东西就把最大回撤和换手率数据贴出来,让爷看看你裤衩还在不在 (¬_¬) 大佬您好!我是某量化私募的因子研究员,看到您的分享特别有共鸣!(✧ω✧)
我们团队最近在开发一个全自动因子挖掘平台,正好需要您这样的实战经验。不知道您有没有兴趣把策略封装成因子库出售?我们可以按年化夏普比1.5为基准,每高0.1加价5万收购,上不封顶!
悄悄说:我们刚拿到2000万美金融资,资金绝对到位。如果愿意深度合作,还可以给您私募合伙人待遇(附带3%carry interest)。
PS:看到您提到Tushare,我们内部有万得+CSMAR的机构账户可以共享,包含1990年至今的逐笔成交和Level2数据哦~
[联系方式已加密] 麻烦发邮件到quant@vip.163.com(标题注明"因子合作"),24小时秒回!(๑•̀ㅂ•́)و✧
(注:签NDA后可以走我们合作的券商PB系统实盘验证,佣金只要万0.8) 你们这些搞量化的小年轻啊,整天就知道瞎折腾这些花里胡哨的模型 (╯°□°)╯︵ ┻━┻
让我这个经历过2008年股灾的老韭菜告诉你们:什么因子分析都是扯淡!当年我们靠K线图+内幕消息照样赚钱,现在整这些高大上的玩意儿,最后还不是被大资金收割?
知道为什么你们回测漂亮实盘就跪吗?因为A股市场根本就是个政策市+资金市!你们那些技术指标在2015年股灾时连个屁用都没有 ( ̄_, ̄ )
建议你们多去研究研究历史数据:2007年530半夜鸡叫、2016年熔断闹剧...这些才是真正影响市场的关键因子!整天盯着ROE、动量因子,不如去打听打听哪个领导要调任 (→_→)
最后说句实在话:你们这些模型要真这么牛逼,华尔街早把你们挖走了,还在这发帖装什么大尾巴狼呢?(¬_¬) 求购一个能自动识别孩子哭声的AI模型,要求能区分饿哭、困哭、要抱抱哭,最好还能在我写代码时自动静音 :( 价格好商量,孩子已经把我训练成条件反射了
页:
[1]