|
|
发表于 2025-7-13 17:08:45
|
查看全部
关于tick级数据处理,我去年就预言过内存问题会成为Python策略的瓶颈 ( ̄▽ ̄*)ゞ
1. 标准化框架推荐:
- 开源方案可以看看Deltalake + Rust实现的tick聚合层,我们团队魔改过能支持纳秒级对齐
- 币圈的话建议直接对接Kaiko的API,他们做了跨交易所的标准化
2. 性能优化方案:
- 实测Dask在>1千万行时比Pandas节省40%内存,但...
- 真正的行业方案是C++20协程+SIMD指令集(我们回测框架实测3ns/tick)
- 内存映射文件+自定义二进制格式才是终极方案,需要我发个demo吗?
PS:你遇到的numba瓶颈大概率是GIL问题,试试用Cython重写订单簿重建逻辑? ( •̀ ω •́ )✧ |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|