鑺繉绉戞妧鎬婚儴 (鑺繉鏅鸿兘绉戞妧鏈夐檺鍏徃)

众所周知，中国是世界上最安全的国家之一。得益于近年来持续不断的基础设施建设，中国城市中的摄像头已经具备了规模效应，城市安全、运行管理等工作都受益于视频数据在城市中的大范围覆盖。如此海量的视频及图像数据，需要运用现代化、信息化的手段进行综合分析治理。尤其是今年，新基建浪潮和“疫情”考验的双重驱动，给城市运营的智慧化建设按下了加速键。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

成立两年不到，芯翌科技已经完成了长三角以及粤港澳大湾区等20余个智慧城市产品和项目的交付。除此之外，还在港口、电力、商场、学校等工业和城运场景上进行了落地覆盖，使人们的生产和生活更加智能化。

能在短时间内形成规模化的落地与营收，并实现盈利，这得益于芯翌科技背后强大的技术力量支撑。其中人像一体化技术平台作为核心研发成果, 在加速城市综合治理的进程中发挥着重要作用，面对这场技术能力和综合实力的艰难考验，芯翌科技交出一份理想的答卷。

大规模人像一体化技术平台

人是城市社会活动的主体，是数据的最主要产生者，也是数据服务的直接消费者。当前各个城市已经或正在部署大量的传感器，这产生了大量的数据，其中视频传感器所产生的数据已经占了城市数据的90%以上，承载了最大的信息量。因此，对城市视频数据中人的建模与分析，为每个人建立线下账号体系，继而为政府各部门以及普通市民提供更好的服务，也就成为智慧城市建设的重中之重。芯翌科技基于世界一流的图像感知和物体检测识别技术，在特大城市级智慧城市项目的建设过程中，积累沉淀了一整套针对人员分析的视频图像分析平台——大规模人像一体化技术平台。

该平台使用了先进的深度学习、视觉感知与认知技术，能够满足图片流或视频流的智能化接入需求，支持高精度的人脸和人体关联提取，并提供数十种人脸与人体属性信息，同时综合利用人脸信息和人体信息，将人脸和人体信息进行互补和深度融合，实现十亿级大规模人脸与人体高精度识别检索和聚档分析，从而满足城市级人员个性化管理和服务的强烈需求。

该平台支持不同规模的分布式扩展，已经产出了十余款软硬一体的AI智能计算产品，并成功支撑了多个特大城市级智慧城市项目，为城市安全可靠地运行、高效精准地管理、便捷友好地服务提供了强有力的技术支撑。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

大规模人像一体化技术平台具备四大核心优势：世界一流的图像感知和识别算法、深度认知神经网络在城市数据挖掘分析的创新应用、面向城市大规模治理需求的架构支撑以及对异构AI计算平台的支持。

世界一流的图像感知和识别算法

近些年来，随着深度学习为龙头的人工智能技术变革，算法和算力的突破性发展，使得城市治理可以基于大数据和AI技术实现“找的快，找的准，可预防” 。芯翌科技在此算法领域也早有布局，凭借世界一流水平的算法团队和生产工具，芯翌科技在人脸识别与图像（物体）检测领域取得了瞩目的成绩：人脸识别供应商测试（FRVT）排名世界前五、COCO比赛人体关键点检测获得冠军。

FRVT是美国国家标准技术局组织的独立第三方测试，是目前人脸识别领域最为权威的赛事。FRVT评测不会公布人脸的测评集，同时严格限制了参赛者的提交频率。另外，FRVT对于算法的运行时间也有着统一的限制。这些特点使得FRVT非常客观且直接面向实际应用。芯翌科技团队在第一次参加FRVT的情况下，即取得了1:1人脸验证赛道综合排名世界第五，国内第三，为首次参赛的世界最好成绩，展示了公司在人脸识别领域的深厚积累和技术能力。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

COCO (Common Objects in Context) 数据集是由微软研究院提出的大规模计算机视觉基准，致力于对常见视觉任务进行分析与评测。历年的COCO挑战赛是人工智能领域最具影响力的图像（物体）识别挑战赛，也代表了继ImageNet后图像（物体）识别的最高水平，在学术界和工业界具有极高的认可度和知名度。在COCO 2020的人体关键点检测赛道，芯翌科技位列第一，获得冠军，并刷新了该赛道的历史最好成绩。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

FRVT和COCO分别代表了大规模识别检索和图像检测分割这两个方向最顶级的能力评测，这两个比赛的领先，体现了芯翌科技一流的、全栈的视觉感知技术实力。

同时，基于芯翌科技原创的人工智能基础设施——算法生产工厂，芯翌科技研发团队可以高效地实现人工智能算法的大规模生产、落地和迭代，用可控的资源投入实现最大的技术价值。在本文介绍的芯翌大规模人像一体化技术平台中，芯翌科技研发团队就基于算法生产工厂的基础设施，高效地实现了人像的全目标提取和关联、人脸识别、人体ReID、以及几十余种人脸和人体结构化属性等丰富的算*功法**能，并保证了各项算*功法**能的效果和效率在实际应用中的可靠性。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

深度认知神经网络在城市数据挖掘分析的创新性应用

图像感知与物体识别检测算法对物理世界进行客观的感知结构化抽象，将所有物体包括人表述为带有抽象信息的图结点，将物体与物体，人与人之间的关系表述为结点与结点之间的连接，也就是边。于是感知数据的图结构抽象为后续数据处理提供了一种通用的基于图的表述范式，而基于图的认知神经网络分析则为图结构数据的处理提供了一种通用的计算范式。因此无论是对城市级的人群分析、车群分析，还是个性化的人员行为的挖掘与预测，都可以用图数据驱动的统一范式进行规模化的处理与迭代。芯翌科技创新性地在人像感知大数据的挖掘场景中应用了认知神经网络技术。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

在城市数据挖掘分析中的认知神经网络主要是图卷积神经网络。图卷积神经网络（GCN）把人脸/人体聚类问题建模成图的分类、回归或者分割问题，并且可以通过有监督的数据进行训练，通过图去表示每个节点以及他们之前的关系。基于图的聚类算法有下面的优点：1）建模方式统一、扩展性好；2）聚类性能较好，复杂度可控；3）可以结合应用中积累的大量真实数据，通过有监督的方式不断提高算法性能。在大规模人像一体化技术平台中，芯翌科技已经将此技术应用于大规模人像聚类，以及个性化人员行为分析，并取得了远超传统规则方法的效果。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

面向城市大规模治理需求的架构支撑

在智慧城市的治理中，每天产生数以亿级的数据，城市动态治理需要实时分析海量数据，如何满足大数据量、超大底库（亿级别甚至超十亿级别）的实时检索，是一道难题。大规模向量检索任务面临多方面的挑战。例如，海量且高维特征人像库该如何存储？特征向量的相似性计算该如何搜索？多人像库共存时数据该如何调度和分配？

为此，芯翌科技研发团队在充分调研顶级向量搜素引擎的基础上，开发实现了一套满足人像一体化技术平台检索要求的分布式向量检索服务。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

向量检索服务采用分布式架构，能够实现弹性扩容，理论上能够加载和存储的特征向量无上限。支持不同大小、不同类型的多个人像库，且能够根据人像库的大小和类型，充分利用所有可用的计算资源，自动执行数据负载均衡和优先级控制。基于自研的向量检索引擎，实现了特征向量增、删、改、查操作的高实时性（向量插入后立即生效），且向量的增、删、改、查操作不会影响向量检索的QPS，极大地满足了布控、建档等时延敏感场景的需求。用单台普通GPU服务器加载1亿人像库时，同时进行特征向量的增加和检索操作，系统整体吞吐量能够维持在3000TPS以上。

异构AI计算平台的支持

芯翌科技的全系列产品不仅支持NVIDIA芯片，同时也支持国产芯片，为客户提供更多的选择。在新基建的浪潮下，2020年4月发改委提出要建设以数据中心、智能计算中心为代表的算力基础设施。芯翌科技迅速寻找突破，在软件和算法上适配华为昇腾芯片，与华为合作研发推出基于泰山服务器的全系列AI智能计算产品，满足不同客户对安全可控的需求。

人像系列产品

从成立之初，芯翌科技就形成了覆盖感知、认知、场景的全链路产品体系，帮助企业和组织进行数据分析决策，实现AI的闭环。芯翌科技从数据生产、数据治理以及数据应用构筑了“明” 、“禹”、 ”景” 完备的产品系列，其覆盖了从感知、认知、应用等全业务链路，提供了云边端闭环解决方案。芯翌科技大规模人像一体化技术平台已经支持产出了十余款AI智能计算产品，包括：人脸解析服务器、人脸比对服务器、全目标服务器、人像一体化服务器、人像聚类服务器等。

鑺繉绉戞妧鎬婚儴,鑺繉鏅鸿兘绉戞妧

结语

芯翌科技是一个被“自我驱动”包裹的企业，成就的背后是无数个日夜里的厉兵秣马，哪怕只是缩短一秒的时间，哪怕只为增加一分的便利，也会以一百分的姿态全情投入。从技术竞赛到落地应用、从软件算法到软硬结合、从解决方案到基础设施，芯翌科技已经不满足于单个场景的落地，正式向城市级业务进发，进一步推进AI原创技术和产业落地。芯翌科技希望能够把握住新基建带来的机遇，为智慧城市和智慧经济的发展贡献一份力量。