前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >高频交易:数学重要?还是技术重要?

高频交易:数学重要?还是技术重要?

作者头像
量化投资与机器学习微信公众号
发布2019-09-17 15:57:34
1.9K0
发布2019-09-17 15:57:34
举报
文章被收录于专栏:量化投资与机器学习

标星★公众号 爱你们♥

作者:Nathan Doromal、1+1=6

各位读者,如果让你回答这个问题:高频交易:数学重要?还是技术重要?你觉得哪个重要呢?在这里。我们给大家普及一些涉及高频交易的专业术语:

  • Co-location:主机托管
  • Flash Trading:闪电交易\指令
  • Low Latency:低延迟
  • Liquidity Rebates:流动性佣金返还
  • Matching Engine:撮合引擎
  • Pinging:试单
  • Point of Presence:接入点
  • Predatory Trading:捕食交易
  • Securities Information Processor:证券信息处理器
  • Smart Routers:智能路由

速度游戏

在高频交易(HFT)中,技术几乎是关键。当你在这场玩速度的游戏中,你需要接近主机(Proximity)、靠谱的硬件和高效的算法

▍Proximity

很重要!因为正如你想的那样,你离交易所越近,你就能更快地接收到最新的波动并对其做出反应。

巴黎证券交易所几年前搬到了伦敦,更准确地说搬到了巴塞尔登,搬进了一个巨大的仓库。你想知道为什么要这样做吗?因为巴黎证券交易所的主要赞助者都是英国人。在高频交易中,地理位置的临近是至关重要的:事实上,离金融中心越近,交易的流通速度就越快(是的,所有交易仍在纳米级上进行)。这就是托管的重要性。

例如,有了MoonX的托管服务,高频交易将受益于30纳秒的优势:在高频交易中,计算机以异乎寻常的速度买卖股票。一些市场,比如纳斯达克,通常会在向这些“交易员”展示订单之前,让他们以30毫秒(0.03秒)的时间快速浏览一下订单。这使得他们能够很快下订单,而且他们知道不久后需求将会强劲。每次操作可以赚几美分,有时一天能赚几百万次。一只行动缓慢的共同基金下了一份购买5000股XYZ股票的订单。

在30毫秒时间内:

  • 订单在发送到整个金融中心之前,会先发送给高频交易员。
  • 在H + 50毫秒的时间里,那些先入之见的高频交易员会以21.00美元的价格买进XYZ的所有股票,然后涌入购买订单市场。
  • 在H + 300毫秒,执行共同基金的顺序;高频交易商以21.01美元的价格出售股票,每股获利1%,在本案中总共获利50美元。
  • 如果该场景是在MoonX托管中心实现的,那么就平均交易规模而言,在高频交易的最大执行性能方面看到有利结果的机会是可能的。

▍硬件

非常重要!而且往往是HFT策略面临的一个非常复杂的问题。

在国内,每快一毫秒(ms)就意味着能够比别人获得更多的机会,同时意味着在这场“负和”的游戏中有更高生存下去的可能。所以这个领域需要的不仅仅是写过几万行高性能C++编程的人,整个流程还需要很多hardcore的IT知识和经验,例如linux kernel tuning,网络硬件延迟的优化,对于海量数据的接收、存贮和读写,并行算法,嵌入式系统,而且越来越多的shop采用定制的硬件,因此对于非x86系统和处理器的深入了解也是非常有帮助的,比如懂FPGA的人(因为要用到低延迟技术):

FPGA(Field Programmable Gate Array)是在PAL、GAL等可编程器件的基础上进一步发展的产物。它是作为专用集成电路(ASIC)领域中的一种半定制电路而出现的,既解决了定制电路的不足,又克服了原有可编程器件门电路数有限的缺点。

不同体系结构性能和灵活性的比较

▍FPGA 为什么快?

CPU、GPU 都属于冯·诺依曼结构,指令译码执行、共享内存。FPGA 之所以比 CPU 甚至 GPU 能效高,本质上是无指令、无需共享内存的体系结构带来的福利。

冯氏结构中,由于执行单元(如 CPU 核)可能执行任意指令,就需要有指令存储器、译码器、各种指令的运算器、分支跳转处理逻辑。由于指令流的控制逻辑复杂,不可能有太多条独立的指令流,因此 GPU 使用 SIMD(单指令流多数据流)来让多个执行单元以同样的步调处理不同的数据,CPU 也支持 SIMD 指令。

FPGA 每个逻辑单元的功能在重编程(烧写)时就已经确定,不需要指令。

冯氏结构中使用内存有两种作用。一是保存状态,二是在执行单元间通信。

由于内存是共享的,就需要做访问仲裁;为了利用访问局部性,每个执行单元有一个私有的缓存,这就要维持执行部件间缓存的一致性。

对于保存状态的需求,FPGA 中的寄存器和片上内存(BRAM)是属于各自的控制逻辑的,无需不必要的仲裁和缓存。

对于通信的需求,FPGA 每个逻辑单元与周围逻辑单元的连接在重编程(烧写)时就已经确定,并不需要通过共享内存来通信。

▍微波塔

它们已经变得越来越重要,特别是在跨国交易中。信号不是通过地下光缆发送,而是从一个塔发送到另一个塔,数据包在空气中的传播速度比光纤快(大多数情况下)。

举一个欧美竞争白热化的例子:GetCo是跟Citadel一样在高频领域少林武当级别的公司,他们有一块业务每年稳定盈利50+ million,突然有段时间这块业务赚不到钱了,这是为什么呢?原来有家公司花重金铺设了从芝加哥到纽约的微波塔,而微波在空气的转播速度快过光纤传输信号的速度,就这看似微乎其微的差别影响了一大块业务线

此外,操作速度也是原始机器温度的函数,这一点也很重要!

▍算法效率

它是一个深层次的问题。你需要知道简单操作(如乘法和加法)的确切处理速度(除法非常昂贵,应该不惜一切代价避免)。此外,每个操作的累加意意味着你希望你的模型非常简单。一个使用500个特征的模型常常会比一个只使用3个特征的模型表现得差,即使这个模型“更具预测性”。这是因为,如果你不能成功地根据这些预测采取行动,可预测性就没有任何意义。

数学游戏

高频交易中有大量的数学运算。请注意,复杂的数学通常包括研究和创建策略。虽然算法需要简单,但研究不必如此(可以很深入)。

在基础层面上,有古典统计学,你需要对所有假设进行彻底审核。金融数据噪声非常大,在前期研究分析时,需要非常小心!

▍机器学习(Machine Learning)

通常,机器学习应用高频交易意味着线性模型上运行复杂的静态拟合。比如支持向量机(SVM)和神经网络通常很难应用,很大程度上是因为市场噪声太大。在样本内/样本外方法之外,围绕目标函数有很多可以研究的地方。

▍目标函数

几乎所有的机器学习算法最后都归结为求解最优化问题,以达到我们想让算法达到的目标。为了完成某一目标,需要构造出一个“目标函数”来,然后让该函数取极大值或极小值,从而得到机器学习算法的模型参数。如何构造出一个合理的目标函数,是建立机器学习算法的关键,一旦目标函数确定,接下来就是求解最优化问题。

关于目标,你必须知道你要预测什么。你是否选择在未来5分钟后买进某一期货合约?下1笔交易单,还是10笔?使用当日成交价格还是其他?等等······

目标函数是用于优化的函数。在经典OLS中,目标函数很简单:

然而Lasso(回归模型)最后使用了这个目标函数:

目标函数在拟合、过拟合和欠拟合方面都非常重要。Lasso很好,是因为它只能从你的特征集中挑出少量的特征,所以,如果你有500多个特征,也许返回5个返回非零值(这是因为绝对值在0时不可微)。然而,如何处理离群值(Outliers)和高度相关的变量,也是我们需要面临的困难。

▍风险管理

在数学中,另一部分主要是涉及风险管理。风险管理通常可以分解为一个线性代数问题。作为一名交易员/量化研究员,你的目标不仅仅是最大化PnL,还要确保你的投资组合在任何一天都不会爆仓。一个有用的策略是使用常见的市场指数对冲你的投资组合。

其他的游戏

市场上许多参与者的目标是利用各种各样的技术操纵市场。例如,一些经验丰富的投资者可能会意识到市场“过于脆弱”,因此买入一些股票,看到市场反应过度,然后以更高的价格卖出。更复杂的策略包括使用交易所提供的多样化订单类型,利用交易所的微观结构等。

在这个微观结构里面,包括你的交易过程怎么做,交易成本,还有交易价格的发现,交易量的流动性等等,当然你还可以看出一些交易行为,包括内部交易、操作市场,另外是交易的监管信息披露。比如利用交易所的微观结构数据(每一次下单、执行和取消,从而可以基于历史数据做到几乎完全重建整个订单)、基于机器学习的订单簿高频交易策略等等。

总结

高频交易策略包括一定程度的速度、数学模型和市场博弈。一些策略是高度专注于快速交易,而另一些策略则利用了市场的特征,但总体而言,成功的高频交易机构对在些方面都非常精通。

看完此文,此刻,你有你心中的答案了吗?欢迎留言!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 量化投资与机器学习 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
腾讯云 TI 平台
腾讯云 TI 平台(TencentCloud TI Platform)是基于腾讯先进 AI 能力和多年技术经验,面向开发者、政企提供的全栈式人工智能开发服务平台,致力于打通包含从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署、到 AI 应用开发的产业 + AI 落地全流程链路,帮助用户快速创建和部署 AI 应用,管理全周期 AI 解决方案,从而助力政企单位加速数字化转型并促进 AI 行业生态共建。腾讯云 TI 平台系列产品支持公有云访问、私有化部署以及专属云部署。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档