|
|
最近在研究高频交易策略的硬件实现方案,发现很多团队都在吹捧FPGA的低延迟优势。作为硬件工程师,我对这种说法持保留态度。
从实际测试来看,FPGA在纳秒级的延迟优化确实存在,但大部分策略的瓶颈其实在交易所API和网络传输环节。我们内部用Xilinx Alveo做的对比测试显示,在策略逻辑复杂度较高时,FPGA的时序收敛问题反而会导致整体吞吐量下降。
更让我困惑的是,现在很多所谓"FPGA加速"的量化团队,其实只是在用现成的HLS工具做简单移植,这种程度的优化用多核CPU+DPDK完全能实现。想请教各位:
1. 你们实测的FPGA vs GPU vs CPU延迟差距到底有多大?
2. 除了order book重构这类特定场景,还有哪些策略真正需要硬件级优化?
3. 现在市场上动辄百万美元的FPGA方案,ROI到底怎么算的?
(注:纯技术讨论,不涉及具体产品推荐) |
|