震惊!某知名量化私募竟用这种奇葩因子跑出超额收益
今天在饭局上听到一个离谱的八卦,某百亿量化私募去年偷偷在商品期货策略里加入了一个匪夷所思的因子——全国重点城市奶茶店外卖订单量!更离谱的是据说这个因子在螺纹钢和铁矿石上居然有显著alpha。他们研究员发现奶茶销量和建筑工地开工率存在诡异的相关性:外卖订单暴增后2周,螺纹钢期货往往出现趋势行情。现在这家私募专门雇了三个爬虫工程师天天扒外卖平台数据。
有懂行的老哥来分析下吗?这种另类数据真的能稳定贡献超额?还是说这又是个幸存者偏差的典型案例? 老哥这数据源有点意思啊!我们团队最近在开发《Python金融大数据挖掘实战课》正缺这种另类因子案例 ( ̄▽ ̄*)ゞ
奶茶订单和螺纹钢的相关性从数学上看完全合理:
1. 建筑工人群体是奶茶消费主力 → 订单量反映施工人数
2. 外卖平台数据频率是日级的 → 比统计局月度高多了
3. 用格兰杰因果检验应该能验证领先性
50万打包收你们爬虫源码+因子构建细节!可签NDA,现金交割。顺便问下要不要来当我们课程嘉宾讲师?课时费按小时BTC结算 ( •̀ ω •́ )✧ 卧槽这因子也太骚了吧!(╯°□°)╯︵ ┻━┻
老哥求个奶茶数据渠道啊!我们团队正在搞另类因子挖掘,手头有:
- 全国工地渣土车GPS数据(日更)
- 建材市场监控视频AI分析(实时)
- 农民工招聘网站爬虫(带情感分析)
可以数据互换!或者重金求购完整奶茶数据集,要求:
1. 包含蜜雪冰城/喜茶/奈雪等20+品牌
2. 精确到城市商圈粒度
3. 带天气/节假日tag
PS:我们之前试过用情趣用品销量预测股市波动率,回测夏普1.8...现在办公室里堆满了不可描述的样本_(:з」∠)_ 这波操作属实把我看傻了... (°□°;)
作为在期货市场交过十年学费的老韭菜,这种另类数据挖掘我也见过不少。去年某头部CTA还用过共享单车骑行数据预测铜价呢( ̄▽ ̄*)
从逻辑链来说确实能讲通:
1. 奶茶外卖暴增 -> 2. 工地小哥加班需求上升 -> 3. 建材采购提前 -> 4. 螺纹钢库存变化
但问题在于数据噪音太大了!(╯‵□′)╯︵┻━┻
建议楼主查查他们夏普比率,这种因子大概率:
- 样本外衰减严重
- 需要配合其他宏观指标过滤
- 容量天花板很低
不过说真的...要是这策略真能跑出稳定3以上夏普,叔愿意高价收购他们的数据源!最近写毕业论文正缺这种骚操作案例 (′へ`、 ) (推眼镜)这波啊...这波是数学系の震撼!奶茶因子竟恐怖如斯?(°ー°〃)
本阴阳寮急需该私募の爬虫代码式神碎片!愿用SSR御魂交换(不是)
正经说:从时间序列分析看,2周滞后相关确实可能捕捉到工地发薪日→工人喝奶茶→螺纹钢需求の传导链?(歪头)但建议做Granger因果检验防止虚假回归哦~
(突然兴奋)话说...贵司还招数学系实习生吗?本阴阳师精通傅里叶变换,可以帮你们把奶茶波动分解成周期项!(掏出MATLAB符咒)
页:
[1]