一级和二级金融市场数据源介绍

一分钟的价格和成交量信息汇总提供了有价值的信息。虽然这对波段操作和某些日内策略/方法来说已经足够,但额外的一级和二级数据可以改善执行和退出决策,特别是在日内操作中。
我正在将这些信息用于我的自由裁量权交易,其结果令人欣喜。我也已经开始研究处理和解析数据的复杂性(这比普通的OHLC要复杂一到两个数量级)。我这样做是考虑到了量化的视野。
这使我对不同的实时数据馈送规范有了更好的和正确的结构化理解,我在这篇文章中分享了这些信息。
我简要地解释了不同交易所和市场数据供应商提供的不同级别的实时数据的含义,包括快速分析它们有什么用,以及一些标准交易平台和定制量化软件消费它们的例子。对一级和二级的数据都进行了分析,还包括对三级数据的介绍。
什么是I级数据
一级增加了运营商的可用信息,提供最新的买入和卖出报价以及已执行的交易。这在行业内通常被称为 "top of book"-- 最新的买入/卖出报价--和 "the tape " 或 "时间和销售"-- 已执行订单-- 。 这两个信息结合起来可以提供对短期看涨或看跌压力的洞察力,并构成建立交易量概况和订单流信息的基本组成部分。
之所以能获得这样的洞察力,是因为价格需要填补订单簿的要价方才能启动看涨趋势,反之,它需要填补订单簿的要价方才能启动看跌趋势。当订单簿的某一方出现明显的趋势或压力时,可以解读为供应超过需求的情况,或者相反。

"时间和销售 "是一级数据中最具代表性的视图。可以看到成交的订单,包括它们在哪里成交的信息(无论是在买入方还是卖出方)。在其中一方的连续交易往往会导致价格启动一个看涨或看跌的行动过程。
虽然有些作者把这种压力称为 "买入量 " 或 "卖出量" ,但我更倾向于避免使用这种术语,因为每个买家都有一个卖家,不存在 买家多于卖家的情况 ,所以不存在 " 买入量 "这种东西 。这些术语对新人来说是一种误导,因为比你想象的要多的人并不完全了解订单在受管制的市场中是如何完成的,通过使用这些术语,他们一直认为交易量可以分成购买和销售,而这是不可能的。那些作者想通过这些 "买入/卖出量 " 的术语来说明的是,已成交的订单对供应方或对需求方施加压力,在失去平衡和发生另一次启动价格运动之前,一方可能在短期战斗中获胜。实际上不同的是 "愿意卖 "的 人数和 "愿意买 "的人数。 在这种情况下,这两个数字有明显的区别,因为订单没有被填满,强烈的不对称分布可能意味着价格可能掉头,或者至少在某个价格水平上有强大的阻力或支撑(这种未填满订单的信息是二级数据反馈的一部分)。了解这些概念很重要,因为它们是可以从一级(和二级)数据中提取的关键知识。
作为对一级数据的最后说明,我列举了潜在的使用案例:
- 测试空头的平均持有时间的日内策略--抓取数据或仅仅是真正的短期日内交易、
- 找到更好的交易执行时机,以便进场和退场、
- 过滤掉/确认由其他方法引发的交易、
- 启用订单流分析。
什么是II级数据
第二级丰富了第一级的数据,也包括订单簿中一定程度的深度。这意味着你可以计算已提交但尚未成交的订单的信息。这些信息是实时更新的,可以帮助发现高流动性区域,这可能被解释为短期支撑或阻力价格水平。
与第一级相比,第二级增加了很多解析要求,因为不是只处理一个刻度的价格水平,而是需要实时更新和解析一定范围的刻度(称为 账面深度 )。

第二级提供了在账簿中实时可视化挂单的能力。大多数软件包通常会在每个点位汇总一定量的历史交易量,提供高流动性点位/区域的信息。因此,市场概况理论所定义的不平衡和平衡可以被识别。
这些术语的命名和范围因来源不同而有一些变化,但通常情况下,它们被称为这里所描述的那样。无论如何,重要的一点是要理解这些基本概念。
为什么I级和II级信息对小运营商的日内操作有价值
这些信息可以识别大额交易(可能是机构交易),并如前所述对短期看跌/看涨的压力有一个估计。这些信息能给你的赢/输率增加多少是值得怀疑的。我的直觉是,如果掌握得当,它可以达到10%到20%,但我缺乏实际的数字--它们很难量化。这个断言来自于我对实际交易者的观察,当他们成功地将订单流纳入到他们现有的方*论法**中时,他们就会有所改善。
我还认为,这只对真正的短期势头有效,这种信息需要得到其他操作标准的支持。该信息作为一个独立的来源,更有可能作为噪音出现,而不是作为有价值的数据。同样,这来自于我作为一个全权交易员的非常有限的经验,而不是来自任何定量分析研究。我相信有一些操作者完全是靠这些信息赚钱的,因为在交易中我一直学到的是,每一种信息/技术都有专门的玩家,绝对的说法--这个有效,这个无效--通常是错误的。
第三级:为机构公司保留
第三级包括直接来自交易所的所有原始信息,因此它包含了关于特定交易所的每一条信息。处理这种数据源意味着处理真正的高吞吐量和与交易所的直接连接。某些交易所--如法兰克福--只对机构投资者保留这种连接,作为其批准程序的一部分,其他交易所--如芝加哥--不施加任何限制,只要你有钱 (德国与美国的心态,我猜) 。在任何情况下,利用三级数据所需的相关费用、资本和基础设施使其毫无用处,除非你是一个机构HFT玩家或与之合作。
使用的协议是专有的,通常在不同的交易所之间共享。主要的有GLOBEX(CME使用)和T7(EUREX使用)。使用的协议分别是MDP3.0和EMDI/EOBI/RDI/ETI(最新的是T7的接口,而不是实际协议)。所有交易所的API/协议通常借助于FIX协议,这是高端实时金融数据的全球标准。

三级数据需要与交易所直接连接。照片中的欧洲T7 EUREX系统架构。
这些系统还被出售给世界上其他较小的交易所,这些交易所没有坚实的商业案例来建立自己的电子交易基础设施。其他较小的交易所使用他们自己的电子交易系统,虽然他们之间不兼容,但所有这些系统通常共享相同的原则和FIX作为基础协议。这些系统和协议只有在机构基础设施的背景下才有用,较小的参与者可以通过访问聚合数据服务,以更低的成本成功运作,这将提供一个更容易消费的API访问。
第一级可能是对小玩家最有用的工具
如前所述,虽然有些人将账面深度描述为日内和数据抓取操作者的宝贵工具,但不断提交和删除订单的算法的存在往往使这一信息具有误导性,如果不是完全的欺骗。同样,重要的是要明白,如果要将这些信息纳入我们的交易策略,适当的背景和额外的交易操作标准是必不可少的。
对于小规模的自由裁量经营者来说,更可能有用的信息是与 时间和销售 相对应的信息--即已执行的交易--因为这些信息是确认的交易,意味着有人确实在某个特定的价格上投入资金。
虽然仍有可能是算法欺骗策略的一部分,通过困住其他玩家来创造流动性,但已执行的订单可能比待执行的订单更不具欺骗性。说 "我以这个价格买入100份CME ES合约 "与实际买入它们有很大区别(在写这篇文章时,这种合约量的名义价值约为1500万美元)。但这并不是一种常态;最大的运营商拥有无限的资本,他们的轮换区域需要使用广泛的价格范围来满足他们所有的购买/销售需求。
就持有时间而言,越是短期,信息延迟和费用对操作者的影响就越大,因此该领域对专业交易行业的保留就越大。零售和小型运营商需要部署战略,将利润/损失和风险与延迟和经纪/市场费用充分脱钩。
游击队的方法:你不是猎手
对二级数据价值的这种解释,需要非常谨慎地对待。我们不能忘记,80%以上的市场交易来自于算法--可能甚至更高--。
不要搞错:这些算法是由世界上最强大、最机智、最熟练、资金充足、最聪明和最有经验的团队设计的。
他们用无限的资本来计算操作,他们的目的是欺骗其他玩家。他们给订单贴上标签,识别可能的来源(人类操作员、慢速算法、集中的HFT),并据此进行操作,他们实时关联不同的市场和交易所,利用不同市场(期货、现金、期权、OTC、暗池)的分歧。他们还利用时间上的优势进行操作,超过市场上的其他参与者,这要归功于同地办公、基于FPGA的定制硬件使用,有时甚至是交易所本身提供给大玩家的公然优势--称之为 漏洞 。
基本上,他们在各方面都胜过你,重要的是永远不要忘记这一点,所以你的所有行动程序都采用 游击队的方式 ,集中在 正规军无法充分打击 的边缘。
除此之外,机器学习和人工智能的崛起可能会继续以更快的速度提高算法的相关性。我甚至对人工操作在未来是否会成为可能都有一定的怀疑。
虽然目前的技术允许小经营者做过去只有大型机构公司才能做的事情,但同样的技术将机构公司和做市商推向了前所未有的知识和权力水平。目前的市场已经是一场血雨腥风,而且只会越来越糟。

日内操作的小经营者和零售店构成了实际的市场*击狙**手,与正规的、更强大的*队军**作战。他们是一个异质的、不协调的、不规则的游击队的一部分,等待合适的市场条件出现。照片中:E-迷你纳斯达克CME期货合约上的打了就跑的交易的细节。
小经营者的希望是,由于资本如此有限,有可能在几百毫秒内分配和取消资本,而不对市场产生任何影响,因此,有可能在很短的时间内加入机构运动,并仍然获得良好的利润。
流动性从来不是问题,除非是在新闻、特朗普的推文和其他突发事件等不正常的市场情况下--这只适用于零售业和大多数普通民众,因为没有突发事件这回事;在某个地方,总有人在事件发生前就已经知道并做好了充分的准备-- 。
在这些事件中,滑点可能会使你的交易失败的损失重复或增加三倍,但它们是游戏的一部分,任何经验丰富的交易员都可以成功地避免其中的大部分。对于真正意想不到的,它们将被认为只是整体损益中的异常值,而风险管理的高级保护层将避免对我们的操作产生任何严重影响--是的,你需要更多的风险管理层次,而不仅仅是一个单纯的止损--。
通过将操作限制在合适的时机,一个小玩家可以利用这些可用的流动性,在一些运动中代表做市商的微不足道的回报/恼怒。我不是说这很容易(因为它不是),但当正确的时间和背景被利用时,它是绝对可能的。这里的重点是,一级和二级数据有助于实现这一目标,特别是对于日内操作。
在定量分析中处理Tick数据
在定量数据分析方面,tick数据是一个不同的野兽,特别是当需要纳入Book信息的深度时。我估计,从分钟OHLC条到tick数据,在数据处理方面需要一到两个数量级的努力。

Wolfpack Flow™是我最新设计的操作订单流的工具。在其主要功能中:大宗交易分析、成交量集群、成交量概况和订单流。该软件是从头开始设计的,它为操作日内订单流和成交量进行了全面优化。
原因是,对于OHLC,每个时间单位的信息量总是有一个预先定义的大小限制。即使进入一秒钟的蜡烛图(当不使用订单流,但需要分析较短的战略时,这是一个常见的选择)也会增加处理需求,但与一分钟的条形图相比,没有任何改变。对于tick数据,不仅数据量大得多,而且每个时间单位的数据量也是不规则的。这种额外的复杂性对数据的处理方式提出了进一步的限制,因为需要一个更复杂的存储和处理后台。
由于每秒订单中的变化数量可能相当大,特别是在波动的高峰期,因此存储账面深度数据提出了更具挑战性的性能需求。对于这些环境,定制开发几乎是一个硬性要求。
摘要
在这篇文章中,对一级和二级市场数据源进行了简要的回顾。还简要介绍了第三级。
在不涉及任何实际策略的情况下,讨论了一级和二级数据如何有助于自由裁量的日内交易的概述。并介绍了一些关于处理这种级别的数据反馈的挑战的评论。
总的来说,在我们的交易程序中至少包括一级和订单流数据,可以大大增加我们的赢亏率,从而降低风险和缩减。额外的信息也有助于减少与日内交易有关的压力,因为可以确定更明确的进入和退出点。
本文由闻数起舞翻译自 https://towardsdatascience.com/the-war-of-real-time-data-when-every-tick-counts-855c438379b3