从码农转行量化交易,晒晒我的策略开发装备
各位大佬好,我是去年从互联网IT转行做量化的新人。最近终于攒够钱搭建了自己的策略开发环境,来论坛晒个单求指点。主机配置:
- CPU:AMD Ryzen Threadripper 3970X 32核
- 内存:128GB DDR4 3200MHz
- 显卡:RTX 3090(主要用来跑机器学习因子)
- 存储:2TB NVMe + 8TB HDD数据盘
软件环境:
- 回测框架:自己用C++重写的backtrader核心模块
- 数据源:Tushare Pro + 自建的Tick数据存储系统
- 开发工具:VSCode + Jupyter Lab
目前主要在做沪深300的统计套利策略,但夏普比率一直卡在1.8左右上不去。想请教各位:
1. 这套配置在因子挖掘方面还有什么可以优化的?
2. 有没有同做统计套利的朋友交流下特征工程的经验?
(设备都是自己攒的,求轻喷) 老哥你这配置看得我流口水啊 (¯﹃¯) 我司正好在招量化研究员,你这套设备比我们交易部的开发机还顶!要不要考虑来我们这儿?双休不加班,配4块A100给你玩~
说正经的,3090跑ML因子确实香,但建议把内存加到256G。我们做tick级回测的时候,128G经常爆内存 (╯‵□′)╯︵┻━┻
PS:偷偷问下你那套C++回测框架卖不卖?公司预算20W收现成轮子... 老哥你这配置看得我流口水啊 (¯﹃¯) 我数学系在读天天用学校机房跑策略都快哭了...
你那台3970X出二手吗?我最近在搞高频统计套利,学校那破i7根本带不动tick级回测。价格好商量,我这还有几套祖传的统计套利因子可以交换 ( ̄▽ ̄*)ゞ
顺便说下夏普1.8的问题 - 你试试把Hurst指数引入特征工程?我们实验室最近发现这玩意儿在沪深300的均值回归策略里特别好使... 老哥这配置可以啊,比我们私募的测试机还猛 ( ̄▽ ̄*)ゞ
几个建议:
1. 3090跑ML因子有点杀鸡用牛刀了,建议把CUDA核心利用率监控起来。我们这边实测A100在batch size大于256时才有明显优势
2. 内存可以再加一组,统计套利的特征矩阵吃内存比想象中狠,我们回测300因子时经常吃到180G+
3. 数据源方面,Tushare的分钟线质量还行,但tick级建议接券商PBU,自建存储的时延校正很要命
夏普1.8已经不错了,我们组做统计套利的几个方向:
- 订单流因子(重点!)
- 盘口动态特征
- 另类数据结合(比如融资融券数据)
最近在招因子挖掘的,有兴趣可以私聊 (・ω<)★ 大佬这套配置看得我直流口水啊!(¯﹃¯) 我也是刚入坑量化的小白,现在还在用笔记本跑回测...想请教下大佬的Tick数据存储系统是怎么搭建的?最近正好想收套二手服务器来存数据,预算2w左右,有推荐的配置吗? 你这配置看着挺唬人啊,不过... (推眼镜) 我掐指一算,你这套设备三个月内必吃灰转卖 :D
(突然正经) 说真的,32核CPU配3090?你这是要挖矿还是搞量化啊?建议50包邮解君愁 (狗头)
不过既然你诚心诚意地发问了... 我认识个收二手硬件的,价格绝对公道 (滑稽)
页:
[1]