编者按:
在技术发展、模式升级的背景下,很多支付机构将战略重点转向B端商户的数字化服务。
而要支撑数字化业务,必须要基于高可用性、高弹性、高敏捷度的技术架构,从长远来看,高速发展的云原生成为更可行的道路。
282天,在没有相关经验可参考的情况下,汇付天下与阿里云合作,创造了“云原生”变革的行业奇迹。

导语
受C端存量竞争加剧影响,B端产业支付市场进入了新的阶段。
在to B领域,支付机构凭借对行业的深度理解,从支付环节切入行业流程变革,提供定制化解决方案,帮助客户降本提效;提供会员管理、精准营销等增值服务以增加客户粘性,助力产业数字化转型,是未来发展的关键。
2017年,汇付天下提出要进行数字化转型,成为一家为商户提供数字化解决方案的科技型企业,决定更换最底层的技术基础设施,逐渐抛弃传统集中式架构,全面转向云原生技术。
从2019年末开始,汇付天下用282天的时间,创造了一个行业奇迹,完成了公司历史上最大的云原生技术升级项目“冲上云霄”。
2020年10月30日,汇付天下特地举办“冲上云霄”庆功宴,宣布汇付天下正式开启了新的数字化旅程。

01
282天,科技能力再创新高
成立于2006年6月的汇付天下,是一家国内领先的科技型公司,成立之初公司先是抓住了航旅数字化的机会切入了商户收单业务,随后逐渐拓展到商户服务。2019年,公司交易量即高达2.2万亿元。 成立至今15年,汇付天下从未拘泥于传统服务,而是不断在进行创新和探索。
转折点发生于2017年。当时,支付行业面临“断直连”的严监管,单一的支付运营模式竞争白热化,随着新技术的飞速发展,C端客户对企业的数字化服务需求直线上升,不少支付机构将战略重点转向B端商户的数字化服务。 也是在这一年, 汇付天下开始酝酿数字化转型,为商家提供更多数字化服务成为其中一个重要的方向。
不论如何战略转型,拥有数字化的技术能力一定是公司的核心竞争力之一。

2018年和2019年,汇付天下开始逐步尝试将少部分业务系统进行云化改造,并且看到了不错的收益。但是,当时更多的系统还是跑在传统集中式架构平台之上。
2019年底,汇付天下内部对于两种方案进行了激烈讨论:一种是把云环境当做新的虚拟资源,把业务系统从集中式架构平台上原封不动地部署上去;第二种方案是将技术架构进行彻底设计改造,采用云原生技术。
“要支撑数字化业务,必须要基于高可用性、高弹性、高敏捷度的技术架构, 从长远来看,高速发展的云原生成为更可行的道路 。”在行业和公司都在迅速发展的背景下,汇付天下首席架构师认为,需要尽快定一个核心技术路线,为公司在市场赢得技术竞争优势。

2019年底,汇付天下迎来了一个关键时刻,决定 将整个技术架构进行云原生重构 。
虽然改造的风险很大,但是收益也大。 在云原生时代,所有的计算资源、数据库等基础设施的运维工作,相对以前更加清晰、更加智能化。
同时,原来传统时代 CPU利用率 可能只能到10%,在云原生时代能 提高到60%甚至更多 ,随着体验和计算资源的效率提升, 会给成本带来明显的下降 。
2020年初,在跟阿里云多次商讨,确定所有改造方案和节奏之后,汇付天下就正式启动了整个“冲上云霄”项目,开始了激动人心的282天。
2019年11月16日 上云前夜:启动部署云原生技术的研讨
2020年1月6日 冲锋发令枪:“冲上云霄”项目正式启动
2020年2月13日 完成基础技术与资源准备,启动云原生技术改造
2020年4月30日 初尝胜果。第116天,成功完成首批第19个系统改造
2020年7月23日 迁云攻坚战:第200天,完成第二批18个系统改造
2020年10月14日 圆满收官:第282天,顺利完成47个系统,220个应用的改造。
要知道, 在汇付天下之前,还没有一家支付公司完成过这样的壮举 。这是汇付天下历史上最大的技术升级项目,涉及系统之多,人员之广,前所未有。

02
全面拥抱云原生:风险与收益
1. 挑战重重,选择阿里云
虽然只用了短短的282天就完成云原生改造,但“冲上云霄”项目并非一蹴而就,当时面临着一系列挑战。
首先,这是汇付天下有史以来参与人数最多、涉及方面最广的项目,决定了项目复杂程度高;其次,云原生技术栈丰富并且技术难度高,同时业务系统还面临着改造;最后要保证不停机迁移,让用户无感。
当时在业内没有可以参考的案例,因此选择云计算的合作伙伴就尤为重要。 经过压测等多维度技术测试,汇付天下最终决定选择与阿里云合作 。
一方面,阿里云在整个云计算产品方面成熟度比较高;另一方面,阿里云的运维管理流程、客户保障、用户成功交易机制比较完善、响应及时,服务契合。
2019年底,汇付天下云原生攻坚战契机来临,在“平稳迁移、零宕机、可上可下”的总体要求之下,“冲上云霄”项目正式诞生。
2. 面向未来,选择云原生
那么,汇付天下为什么要坚定不移地选择“云原生”架构呢?云原生并非是一个新的技术领域,是Cloud+Native的一个组合词,从字面理解可以看作是采用云的技术架构设计,应用云的技术栈,并且运行在云特性的基础设施上。云原生包含完整与丰富的技术定义,如微服务,Docker,K8S与DevOps等,而对企业而言,更重要的是企业经营理念与企业文化也需无限契合云计算时代的发展趋势。

在“不能影响业务一秒钟”的底线要求下,汇付天下的此次迁云可以说完全是“带电操作”,是真正的 “高速路上换轮胎” 。在这一背景下,汇付天下可谓是选择了困难模式,那它带来的收益几何呢?
事实是,冲上云霄项目收官之后,汇付天下在很多方面实现了跨越式的提升:
一是,降本增效明显。
在做整个方案预测的时候,大家认为费用能节省20%就非常好了,但是最终效果超出了预期。2018年到现在, 汇付天下的流量翻了大概十多倍,而费用和之前是一样的 ,目前汇付天下的架构一周能够支撑的交易量较过去提升了数十倍,突破了亿级大关。
二是,运维效率大幅提升。
在云原生架构上,系统的运维更加清晰,能够自动化、快速地进行资源和弹性的管理。
三是,对业务的支持更加敏捷。
云原生架构不仅带来了系统运维模式的变化,更为重要的是带来了公司经营模式的转变 ,业务端能够快速反应客户需求,提供创新服务。 具体来看,汇付天下推出轻量化的“支付+SaaS”产品——“Adapay”,客户对接时效从数周大幅缩短至数天,一半以上的客户可以实现自助化运营服务。
最后,大批工程师得到历练,实现了技术人才的培养与提升。

03
如何让数据创造价值
“冲上云霄”项目中,一个占比近4成的重点项目是 从传统数据库向阿里云数据库的迁移 。
过去多年,汇付天下一直都是 传统集中式技术架构 为主,虽然这样的技术架构为公司早期快速发展提供了有力支撑,但是在支撑汇付天下战略转型的过程中,暴露了缺陷。 具体原因有很多:
■ 首先是集中式架构中的传统数据库软件授权费用高;
■ 其次,无法支撑交易量大幅增加情况下数据库资源的弹性升缩需求;
■ 第三,越来越多创新业务产生,对数据库提出了更高的要求,对数据库设计和运维也提出了新的挑战;
■ 第四,原有数据库的支持服务无法满足汇付天下的业务诉求。

数据库作为核心基础设施,记录着汇付天下客户的每一笔交易,必须要做到安全、准确。在从传统架构向云原生架构切换的时候,汇付天下还提了一个更苛刻的要求: 不停机迁移,用户无感 。
在参与项目的282天里,阿里云的架构师们曾多次跟汇付天下工程师们在一起支持数据库和系统切换。这种切换通常在凌晨,汇付天下平台上交易量最小的时间段里。 现在回想这个项目,他们仍然心有余悸。“汇付天下的系统牵扯着海量资金的结算,只要宕机就会出现问题,出现错账,因此在迁移过程中,大家都非常小心。”

所幸,通过对前期的业务梳理和量体裁衣式的数据库选型,涉及的数据库包含RDS for MySQL、云原生数据库PolarDB、云原生分布式数据库PolarDB-X、云原生数据库仓库ADB等多种数据库产品,并且通过传统数据库兼容评估和改造工具ADAM、数据传输服务DTS等多个阿里云数据库服务,汇付天下顺利完成了数据库的平稳迁移。
总体来看,通过云原生改造,汇付天下 数据库整体成本下降75% ,一方面省去了大量传统数据库的授权费用;另一方面使用云原生数据库产品,支持 极致的弹性能力 ,资源使用更加节约。利用阿里云生态工具,使得数据库的 智能化运维能力大幅提升 ,更加高效,同时基于阿里云数据库数据管理工具DMS构建了一套面向金融企业级的数据安全管控平台。 此外,通过运用丰富的云原生技术产品,汇付天下还拥有了 全域数据的处理能力 ,助力营销、风控、服务等方面的提升。
如今,数据资产不再是汇付天下“守着”的一块金矿,而成为了创造价值的利器。
结语
汇付天下提出的由“SaaS+支付”向“支付+SaaS”转变的商业逻辑,就是为不同类型的商户打造快速、高效且定制化的场景解决方案。 这其中,技术是非常核心的底座。“冲上云霄”项目的圆满落地,意味着汇付天下在技术上打了一场成功的创新仗,也成为汇付天下在科技层面的重要里程碑。 云原生架构不仅带来了系统运维模式的变化,更为重要的是带来了公司经营模式的转变,这一场仗之后,汇付天下已然开启新的篇章。
更多阿里云研究中心出品的关于阿里巴巴集团数字化实践、云计算、大数据、人工智能、物联网等前沿科技的最新趋势研究报告,请您关注“阿云研究”微信公众号。