航班运行控制系统 (航班运行控制的架构)

注:本文转发本人在航数学院近期发表的文章《航班运行控制及保障建设 –– 神经网络及治理能力》,https://mp.weixin.qq.com/s/6woTA6b_eudOuSo8MPsZDA

航班运行控制是控制系统,是一个行业和领域的控制系统。管理系统中的控制过程在本质上与工程的、生物的系统是一样的,都是通过信息反馈来揭示成效与标准之间的差,并采取纠正措施,使系统稳定在预定的目标状态上的。而当前国内航司的FOC、HCC、AOC、GOC等,还是集中数据库与MIS相结合的状态。虽然很多航司考虑、并尝试神经网络理念的落地应用和参考海外航司的实绩,但是还有很多环节和体系需要重新考虑和建设。

注:本人自08年开始,曾参与FltOps运控产品线研发,CO、UA、DL等运行控制系统的交付,FX与Jeppesen等集成等项目。故之后将从架构和技术视角阐述和分享运行控制等相关领域,需要怎样的革新和技术模式来落地全新的自适应控制下的运行控制及保障恢复。

前言

航司的运行控制及保障不仅仅是集中数据库和管理信息系统的组合,和应用不同的技术重构这些。其本质是运控业务在多元及变化的应用场景下,如何经由一套“治理”,从“架构治理”、到“数据治理”和“服务治理”、最后落地到“业务治理”,形成“实时的运行生产数据体系”。航司运行控制需要按照人体的神经网络的模式运转。按照控制论中自适应系统的要求,未来运控势必更强调ODS的建设、及针对性的实现自适应运行控制的神经网络传导能力的建设,即仿效神经网络或感觉器官,实现智能化的自组织系统。

发展趋势及当前时代下的要求

航司运行控制及保障恢复,结合起来看,并参考海外航空公司的实绩,应该可以分成5个阶段,从“任务式的事后分散保障及逐级恢复的救火模式”,到“事件驱动的集中预判及整体联动的自适应模式”进化。

航班运行控制的架构,航班运行控制系统

1) 反馈控制的被动阶段,70~00年代,主要以针对航班随着时刻变化,动态产生的事件通过系统的方式进行响应为主;

2) 善用技术实现最优控制阶段,00年代到20年代,各个海外航司逐渐考虑人力及飞机利用率最大化的问题,并通过各类架构体系的升级和数字化手段综合提升航班运营的效率。在这段黄金时段中,一些海外航司的实绩尤为典型,并且一些过往的企业服务巨头整合出了一些典型且具有深远意义的运控整体解决方案或平台能力的方案:

  • 自2005年伊始,LH历经3年多规划及设计,和相关改造及实施,实现了PSS及运控的全体系SOA及BPM重组。梳理出了清晰的企业架构和发展建设的基础。例如后续的KDI及常客等系统建设,都基于此进行快速集成和升级改造。2015年开始进入iOCC的全面建设新一代运行调度体系,并推进平台化及产品化,融合机场与第三方运行资源,为LH的多元化业务,例如机务、货运等的业务延伸,提供了数字化平台的全面支撑。并且其注重与机场及地服等运行保障的高度融合。
  • 在2010年前后,CO/UA/DL等FSC进入运控体系建设的阶段,并且期望通过云计算及SaaS,更好的支撑飞行运行的弹性,并更好的接入和集成专业厂商的产品和保障现有关键业务系统的延续性。在集成平台基础上,聚焦ODS及IDS的建设,以此实现运行的全面、实时、协同的调度和协同。2013年之后以美国航司,配套以全新运行调度系统的落地,支撑AOC、OCC、HCC等的协同高效运营。2016年,DL在ODS基础上强化和聚焦建设ODES,提升运控系统与时代技术的融合。
  • IBM、EDS(an HP Company)世界知名企业服务领军企业,注重航空公司集成平台及运行数据体系的建设,期望通过平台化集成能力和体系的架构模式,实现运行控制及调度保障的升级,例如NGDS(Next-Gen Data Service)、AIP(Airline Integration Platform)等,并在其上构建不同于Sabre产品模式的、全新的Aircraft Movement、Load Planning、Flight Planning等等业务模块,意在提升运控控制系统的开放性、业务流程编排能力、标准化及松散耦合的特性。
  • 与此同时,领先的国际航空公司都会聚焦报表及各类航空消息的结构化处理及继承和能力的建设。对于主要使用OEM作为飞行运行的国际航司,譬如Fedex,为了支撑广泛的洲际航线及全球货运业务,需要大量的集成和敏捷的响应能力。对于ACARS、SITA、欧盟空管、FAA、AIDAP、WMSCR等等国际组织的对接,尤其是飞行计划、机组、MEL、NOTAM、ASM、MVT等报文对接及转化存在极大诉求。2015年之后进入全面报文及运行指令的全面及灵活敏捷对接的阶段,强调工具建设,例如Message Engine等模块。

3) 20年前后,海外航司相对较早,整体将进入自适应控制理论落地的阶段。随着技术、大数据、人工智能,以及平台和集成能力的提升,各类科技手段将被充分利用到运行控制及保障调度中;面对更多的源,和更多元的端,则需要一套全新的理念和架构来实现高效、全面、智能的运行调度及航班保障。随着达美的神经网络理念的ODS及相关架构实绩的落地,促使航司在此领域需要结合自身运行控制等的业务特点及技术状况,进行一系列的治理,实现基于“神经网络”的ODS的再升级,和整体的“自适应控制”。这个过程就是一系列治理的过程。

神经网络实现自适应控制的基础

航司运行控制及航班保障等,需要按照人体的神经网络的模式运转。按照控制论中自适应系统的要求,未来运控势必更强调ODS的建设、及针对性的实现自适应运行控制的神经网络传导能力的建设,即仿效神经网络或感觉器官,实现智能化的自组织系统(逐渐替代硬性的SOP标准和人类主观判断,从中由系统根据实际环境自主决策适当的平衡点)。

航班运行控制的架构,航班运行控制系统

而其中最需要进行“数据升级”,即在过往ODS(Operational Data Store)实践的基础上,进行新的数据体系建设和数据能力建设:

  • 整合镜像(实时运行数据):即大脑前扣带皮层形成的直觉。即基于CQRS的数据整合方案。更强调数据架构及数据建模,必须拥有良好的数据存储及数据项的关联能力,能够应对多元数据接入的不确定性及后续整合使用的要求;在满足第三范式的原有ODS领域的星型建模基础上,引入CQRS的数据关联及存储机制,实现ODES(Operational Data Engine & Store),让数据之间的关联实现松耦合;不能摒弃ODS既有的低度聚合、审计日志、字段级排他锁等核心功能;在落地数据的时候,与可视化接入平台一同使用元数据进行数据质量及标准的处理,提高数据的权威性;
  • 经验信息(经验决策数据):即大脑中的存储在海马体和其他机体中的记忆。其是数据湖之上的数据集市,按需选用各类大数据技术。要求时序性质的历史数据存储、及相关数据建模;利用元数据相关标准和手段,提升数据质量和权威性;根据应用场景选用针对性的技术(主要是大数据相关),决策相关存储、计算、查询、挖掘等应用要求;可以与企业大数据平台(上云入湖)的全局企业数据资产平台相整合;利用租户、沙箱等手段,实现对外场景应用的数据支撑;
  • 元数据(存储标准规范):即人类的DNA或细胞结构。元数据管理及相关工具能力是建设关键。提供行业、国际、国家、企业及个性化的数据标准及质量要求,用于全局数据的处理及加工,从而逐级和分领域的实现权威的数据基础,避免后续决策及使用的口径及质量问题;
  • 离线信号(实时多元数据):即人体的神经元的神经末梢。即仿效数据湖构建工具,构建可视接入平台。更多元的数据、信息、信号等的接入手段和能力,即源头多样、接入方式多样等等;能够可视化接入,通过操作界面简单配置实现数据的接入;能够对于物联网等万物互联大前提下的数据接入整合提供支持,尤其是吞吐及协议支持;能够对于数据进行结构化的快速解码或译码,提高后续数据质量和效能;能够对于接入数据进行标识,更灵活实现数据源的可插拔、订阅式接入等能力;能够进行必要的预加工处理,实现类似物联网网关及边缘终端的功效;
  • 干预指令(逐级传导数据):即神经末梢接收指令对外部刺激做出反应。即定制化的发布机制和工具平台。必须是以订阅发布模式为主,提高下游接收指令和控制信息的灵活性,及整体编排能力;必须是结构化的数据结构,且具备口径统一等数据标准约束的权威数据;必须拥有发布数据相关的权限及认证等安全机制,保障相关数据更细粒度的安全可控;必须设置优先级及严重程度等标识,并配置相应的通道和流转机制,便于追踪及优先处置;必须能够可视化的进行整体链路的追踪及溯源,提高事后的不断优化和调整支持;
  • 数据接口(敏捷数据服务):即心电图、核磁共振等等反应大脑状况的人体外设备接口。即微服务架构之上的敏捷数据服务能力。能够敏捷的实现数据服务接口的定义、配置、上线及发布等;必须拥有以服务接口方式发布数据相关的权限及认证等安全机制,保障相关数据更细粒度的安全可控;能够形成注册中心、配置中心、网关,链路跟踪等针对性的微服务能力和框架建设;甚至API集市的能力;能够以SQL的方式实现数据的对外输出的设计和开发,且有可视化的工具平台来支撑;
  • 统一决策大脑(大脑皮层,思维的器官),主导机体内一切活动过程并调节机体与周围环境的平衡。
  • 消息网络(事件驱动的“感/传/判”数据神经中枢):将上述这些数据的单元与大脑进行串联的,就是消息网络(事件驱动的“感/传/判”数据神经中枢),即人体的神经中枢等构成的整体神经网络。即EMS(Enterprise Messaging System)。必须具备高可用、及分主题或场景的多种传导渠道;同时需要具备双订阅模式,保障任何信息、数据、信号都可以被最终落盘存储,不遗漏任何历史信息;能够一定时间的将信号持久化,便于阻塞等特殊异常场景的故障恢复;根据业务复杂度及必要性,对于流转数据进行预加工,例如修订优先级及严重程度,以及分发或同步机制;设置第一层级的按照事件特征的订阅机制,按角色、规则、特征职等进行分发或推送。

航班运行控制的架构,航班运行控制系统

总结来说,航司运行控制在数据层面,需要具备的六点核心能力要求。从接入、传导、传出,再到两大领域的场景化存储、和对外服务等六个能力,要求运行控制的数据体系必须针对性的建设,而不是盲从概念。

升级是一系列治理的过程和结果

航司运行控制的升级,关键是解决治理问题,将是一系列治理工作的过程及结果,而不仅仅是数据层面的整合、消息的有效流动和一系列应用系统及功能的建设。结合技术的发展和成熟应用,以及海内外该领域的差距及优缺点,需要在建设过程中聚焦业务、管理、技术、数据、架构等五个层面寻求突破。

1) 业务补强

  • 缺少应对更纷杂和多元运行数据接入后的处理手段和流程机制;
  • 缺少统一运行规则等集中化的配置及基于数据库的决策手段;
  • 缺少从感知信号到下达指令,并持续跟踪联动的机制;
  • 整体业务环节存在强耦合,很难插拔及按场景重新编排。

2) 管理重塑

  • 通过事件传导及统一规则等,实现整体的、全局的决策;逐步由人工经验决策判断,到基于知识和环境的自主控制;
  • 整合更全面且关联的数据,进行全局的复盘分析及经验发掘;
  • 为挖掘探索等应用场景提供和建立针对性的数据基础。

3) 技术融合

  • 技术已经成熟且多样,可选性极高;
  • 需要使用大数据技术实现特定场景功能,但并不是代表需要建立大数据平台或变成数据中台等;
  • 但更需建立针对性的可视化应用来提高某些环节的效率,降低繁琐工作等;
  • 通过云计算等,来提升系统高吞吐、高稳定性、高可用性等指标。

4) 数据升级

  • 补强国内外本身在数据建模上的差距;
  • 对于各个数据存储单元及责任进行重新定位;
  • 考虑到历史及经验数据的特征及后续使用场景,善用大数据技术或直接基于大数据平台等进行建设;
  • 运行全貌的数据架构及存储等机制,还是必要的,且需要重点建设。

5) 架构创新

  • 需要基于消息驱动来整合和解耦系统;
  • 同时基于订阅发布等模式实现业务编排和联动;
  • 强调敏捷化、可视化的架构组件建设和定义;
  • 注重后续系统可插拔、松散耦合等既定目标。

航班运行控制的架构,航班运行控制系统

为了将上述问题集中和一体的解决,不论是技术、还是理念,还或是管理或业务模式的转变,航司运行控制的升级,是综合的、体系的治理工作。

  • 架构治理解决的是多元技术融合、和基础改造升级的问题;其不仅仅是技术的更新迭代或简单升级,譬如使用Kafka等分布式消息队列代替原来常用的消息队列,其需要在其上建设企业级消息系统和遵循其架构理念形成运控的消息、报文、数据等准时的交换和整体联动。而这一切都需要一个完全不同的、有弹性的、平台化的架构来支撑。例如最后实现多级高可用的消息通道,辅以场景化的订阅发布机制,实现整体运行数据的准实时数据整合能力,形成神经网络模式的企业消息系统体系。
  • 数据治理解决的是数据供应链的业数融合、和体系化的高效协同;首先其需要行业特质的运行领域的数据建模和存储机制,注重核心数据的存储的前提下,还需要注重数据之间的关联及历史变更的存储逻辑,实现高类聚低耦合的数据存储架构和建模逻辑;并且以实时数据和未来数据为主,但也存储当前运行数据的历史修改版本等,并且为使用便捷提供轻度聚合的数据;通过描述信息资源或数据等对象的数据,为数据的接入和治理提供数据标准及质量要求;以T+1历史数据为主,尽量保持全量,用户特定场景的数据建模、分析挖掘、算法及推演应用等。
  • 服务治理解决的是数据及信息安全、敏捷、体系的消费和交互,更关键的是解决体系的业务系统集成;具备可视化的界面,通过配置和编写简单SQL,甚至勾选数据字段等模式,实现数据服务接口的快速配置和上线发布;具备微服务管理及调度控制的全部功能和相应技术实现;基于Spring Cloud等,及微服务技术生态,实现具备注册中心、API网关、配置中心等等的微服务接口的前端,并将开发及实现引入Swagger;或仿效WSO2DSS等实现敏捷的数据服务设计到投产能力;所有对外服务均通过接口实现,并落地到容器;并根据后续发展,逐步减少API应用集市,提高数据服务接口的管控。
  • 业务治理解决的是结构化的、灵活的、可插拔的业务,以及业务标准化的敏捷支撑。这是整体治理的关键。在运控及调度、保障及恢复层面,以及地服、机务、机组等做工种及团队协同视角,需要在技术和数据基础之上,形成全面的协同和深度的一体化运行保障。

航司的运行控制及变革,将是一系列治理工作的过程及结果,而不仅仅是数据层面的整合、消息的有效流动,和一系列应用系统及功能用当前成熟的技术再重新建设。

后续

为充分描述运行控制及航班保障恢复的重塑,以及一系列治理的重点工作,将逐一阐述和分享如下技术和架构相关内容:

  • 企业消息系统及通知中心:企业消息系统(EMS,Enterprise Messaging System)在大多数情况下,它通常是指单个应用程序基础结构中不同应用程序之间的消息传递。这是通过一个软件应用程序实现的,该应用程序允许从一个程序发送消息,存储在消息队列中,然后在第二个程序可用时对其进行处理。传输消息的能力使EMS成为在企业应用程序之间集成不同数据的常用工具。而正是这种特性,才是构建运控领域神经网络的关键和核心架构。航司不仅仅需要所谓的分布式消息队列,而更注重如何构建一个支持多源端到端的消息准实时的传递体系和平台能力,让运控和保障的各个节点和数字化触点,能够形成贯通,并且连接到运控的数据心脏、指挥的大脑,并能够自主自动的联动。
  • 行业数据模型及数据体系:数字化时代,数据是核心企业资产,也是内部运营和生产的关键,但是其需要治理;而治理的其中一个结构就是充分体现航司业务能力的数据模型和数据架构。其在分析体系中,解决挖掘、洞察及智能决策;而在应用体系中,承载的不仅仅是当前系统应用的状态,更支撑着系统的交互和联动。所以需要在运控领域参考行业、国际、国家相关标准,形成适合航司自身的数据模型及存储逻辑,并且面向OLTP和OLAP两类场景,构建好运控领域的整体数据架构,让存储在其中的数据模型真正能够高效运转起来。
  • 节点数字化及统一规则:除了数据模型能够充分体现业务的形态,对于冗长和纷杂的航班保障及恢复链条,最重要的是梳理出遵循安全、适合航司、充分解耦、高效清晰、动态流转的保障节点的链条,在此基础上将相关规则及和数字化能力逐点建设,形成整体联动和协同的基础,更为后续的人工智能等的应用提供基础。
  • “控制塔”理论的应用:控制塔(Control Tower),来自于和重点应用于供应链,传统上,供应链控制塔被定义为整个供应链中数据、关键业务指标和事件的互联、个性化仪表板。供应链控制塔使组织能够更全面地实时了解、优先处理和解决关键问题。但是对于其他领域,尤其运行控制等存在较长监控跟踪及持续保障的场景,也是很适合的。其作为系统架构,本质上是一个智能服务中心,可实现对数据可视、实时监控、智能分析与辅助决策,帮助航司构建以需求为驱动的协同、敏捷、实时、动态的智能航班供应链体系。