行人重识别模型的优化 (行人重识别的未来发展趋势)

随着人工智能技术的不断发展,越来越多生物识别技术融入到人们的日常生活中。人脸识别作为应用最早的生物识别技术,以其非接触、高精度、便捷的优势,广泛落地于各行各业。芯翌科技凭借深厚的算法积累和领先的算法实力,在目前全球规模最大、最权威的人脸识别赛事NIST-FRVT中排名世界前三。(FRVT官方成绩:https://pages.nist.gov/frvt/html/frvt11.html)

在更为复杂的应用场景,例如城市治理中,人脸识别技术有一定的局限性,主要反映在对输入图像的人脸质量要求极高。如果某些场景拍摄不到正脸快照,人脸识别将会失效。作为人脸识别技术的重要补充,行人重识别技术(Person Re-Identification,简称 ReID),指在跨设备的非重叠场景下进行行人检索与识别,可以对无法获取清晰拍摄人脸的行人进行进一步拓展追踪。ReID技术能够根据行人的穿着、体态、发型等信息认知行人,与人脸识别结合能够适用于更多新的应用场景。具体来说,对于给定的一张查询图像,ReID在底库中检索与当前查询图像相似度排序较高的Top K图像进行返回,如下图1。

行人重识别模型的优化,行人重识别系统应用场景

ReID的应用方向非常广泛,比如在智能安防中,通过将人工查筛监控视频升级为自动化筛选,可以极大提升工作效率;在大型公共场所寻人时,通过实时对场所各个摄像头进行检索,可以快速锁定丢失者区域;在大型商场以及无人超市中,通过对热点区域进行建模,了解用户购买兴趣,可以大幅提升用户购物体验。但在这些无约束的真实场景下,ReID性能会受到各种因素的影响,比如行人姿态变化、配饰变化、监控相机的角度差异等。

芯翌科技的算法团队针对目前ReID技术急需攻克的难点,通过一系列技术创新和探索,将算法精度提升到了新的高度。在ReID领域三大权威数据集 Market1501、DukeMTMC-reID、CUHK03上,芯翌科技刷新了所有榜单的最高纪录;在目前规模最大、难度最高、跨场景的MSMT17测试集上,芯翌科技更以绝对优势获得最高成绩。

行人重识别模型的优化,行人重识别系统应用场景

行人重识别模型的优化,行人重识别系统应用场景

芯翌科技研发副总裁都大龙表示:

“刷新公开数据集指标记录只是芯翌在行人重识别技术研发和业务应用过程中的一个自然结果。芯翌科技在实际的业务应用中已经广泛地应用行人重识别技术,所涉及的复杂程度已经远超目前公开的行人重识别数据集,并取得了非常显著的落地应用成果。”

芯翌科技的行人重识别技术和系统运用了多项原创创新和业务场景知识,在实际业务应用中有独特的优势,芯翌科技AI算法技术部总监黄冠总结了以下三点:

1. 多项原创技术创新,打造最鲁棒、最实用的工业界行人重识别算法和系统。在实际的业务应用中,芯翌科技使用的原创技术创新包括:1)基于人体关键点和单例分割的自适应注意力机制和动态数据增强,可有效解决遮挡、不同朝向等问题;2)度量学习损失函数的优化;3)时空信息模型的结合等。

2.从感知到认知,通过图神经网络综合建模目标时空信息。芯翌科技对于超大规模图神经网络的算法和优化有着深入的探索,并取得了一系列的技术突破(后续有专题文章进行技术介绍,请大家持续关注)。图神经网络在对于非欧式数据的处理上有着天然的优势,芯翌将目标对象的语义、时空等各项特征通过图神网络进行融合,进而实现精准的目标建模、异常行为分析与预测等认知功能。

行人重识别模型的优化,行人重识别系统应用场景

3. 高效的分布式检索比对算法和系统架构,应对超大规模行人重识别各项业务需求。基于芯翌科技自研的分布式、大规模向量检索框架和系统,可以轻松实现数亿级别的高效检索查询,可以支持实时的向量增删改查等操作,整个系统还可以灵活支持多中心、时空过滤等功能;同时整个系统可以保证高可用、低耦合、自动扩容等架构的稳定性和伸缩性。

除了技术业务落地,芯翌科技在前沿探索创新和产学研一体化上也在不断努力。在智慧城市的视觉理解重点问题上,芯翌科技和清华大学自动化系智能视觉实验室保持了紧密良好的合作。双方在大规模人脸识别、超大规模聚类和人脸-人体一体化等问题上进行了前沿探索和合作,致力于解决无约束场景下活动目标的视觉感知、认知和理解问题。

从人脸到人体,芯翌科技在生物特征识别领域持续保持领先,依托相关技术的应用和系统也已在多种场景中广泛落地。未来,芯翌科技将持续加大研发投入,在人脸、人体、步态等多模态生物特征识别上再接再厉,在智慧城市视觉理解重要问题上持续探索积累,不断推动人工智能技术的开拓创新和产品的业务落地,为建设有温度的智慧城市生命体而不断努力。