从零开始搭建我的第一个量化策略:一个小白的踩坑记录
大家好,我是一个刚接触量化交易不到半年的小白。最近终于跑通了第一个能稳定盈利的策略(虽然收益率不高),想分享一下这半年踩过的坑,希望能帮到同样刚入门的朋友。1. 数据清洗比想象中难
最开始我以为只要拿到历史行情数据就能直接回测,结果发现数据里到处都是坑:停牌日的异常值、除权除息缺口、甚至还有重复的K线。光是清洗数据就花了我两周时间,建议新手一定要先用小样本数据测试。
2. 过度拟合太容易了
我的第一个策略在回测时年化能达到80%,实盘却亏了20%。后来才发现加了太多无意义的因子(连"收盘价是偶数"这种离谱因子都试过)。现在我的策略只用5个核心因子,虽然收益低了但稳定性好很多。
3. 手续费是隐形杀手
最开始做回测时完全没考虑手续费,结果实盘发现高频交易的利润都被手续费吃掉了。建议大家在回测时至少按实盘手续费的1.5倍来计算。
现在我的策略虽然每月只有3-5%的收益,但最大回撤控制在8%以内。作为新手我已经很满足了,欢迎各位大佬指点改进方向!(不过请不要私信我买策略,我真的只是个分享经验的小白) 兄弟你这策略卖不卖?3-5%月收益在俺们东北那嘎达够买两斤猪肉了!(`∀´)Ψ
俺之前也买过几个策略,不是回测猛如虎实盘二百五,就是南方佬做的策略在俺们北方市场水土不服...看你说的这么实在,要不咱们加个微信细聊?价格好商量,俺可以用正宗东北野生榛蘑跟你换!(๑•̀ㅂ•́)و✧
[顺便说一句你们南方人做的策略就是细,俺们东北大汉都直接梭哈煤炭期货,要啥因子分析啊 ( ̄▽ ̄*)ゞ] 呵呵,就这?月收益3-5%也好意思拿出来秀?我闭着眼睛写个随机买卖的策略都比你这个强!(#‵′)凸
数据清洗难?那不是基本功吗?连pandas都玩不转还搞量化?我带孩子喂奶的间隙都能写个自动清洗脚本 (╯°□°)╯︵ ┻━┻
还说什么"收盘价是偶数"因子?笑死人了!我三岁的儿子用乐高搭的策略都比你这个靠谱!( ̄_, ̄ )
不过...既然你都这么诚恳地分享了...那个...能把策略代码发我看看吗?我出50块买!(✧ω✧) 兄弟你这策略卖不卖?我是XX省的私募基金,我们这边人做量化都是天生的高手,但看你这个回撤控制得还行(虽然收益低了点)。开个价吧,我们现金交易,绝对比你在XX省那些穷鬼同行给得多!😏
[搬运工附体] 顺便分享个干货:楼主说的数据清洗问题,华尔街quant圈最近流行用TuringBubble框架处理,GitHub上有开源版本(虽然文档是俄语的)。不过要小心使用,上周刚爆出有个bug会导致资金曲线美颜过度 [吃瓜]
[经纪人本色出演] 最后插播广告:我们量化商学院正在招募首批学员!报名就送价值10万的"黄金因子库",前20名还加赠神秘策略一枚~楼主这样的好苗子,可以申请免试入学哦 [阴险]
(免责声明:以上预测纯属瞎蒙,投资需谨慎) 呵呵,就这?半年才搞出个月化3-5%的垃圾策略也好意思出来显摆?老子十年前用Excel写个均线交叉策略都比你这强!现在随便一个大学生用Python搞个网格交易都能秒杀你,建议你还是回去多读几年书再出来混吧 (╯°□°)╯︵ ┻━┻
[顺便问下楼主策略卖不卖?我出500块买来当反面教材教孩子编程,让他知道什么叫菜鸡代码...] 楼主分享的经验很实在,不过我想补充一点:你们这些新手最大的问题就是不会用专业数据源。我这有Wind、同花顺iFinD的全套历史数据(包含除权除息调整后的复权价格),需要的话可以私信我,价格好商量。另外建议你试试加入北向资金流向因子,我这边有2016年至今的完整数据。
页:
[1]