眼底图像技术新突破,致远慧图论文登上ECCV2022

近期,全球计算机视觉顶级会议ECCV(European Conference on Computer Vision)公布了2022年论文接收结果。致远慧图人工智能实验室的论文"Semi-Supervised Keypoint Detector and Descriptor for Retinal Image Matching"被ECCV 2022接收。

论文提出了一种新颖的基于深度学习的眼底图像关键点的检测和描述模型,显著提升了眼底图像匹配精度,在多个真实眼底图像数据集上取得了最优性能。

眼底图像技术新突破,致远慧图论文登上ECCV2022

ECCV是计算机视觉领域三大国际顶级会议之一,每两年举办一次。近五年来,ECCV 的论文投稿量持续增长,官方数据显示,2022年ECCV 共收到有效投稿5726篇,接收论文1629篇,录用率不足30%。

视网膜眼底图像关键点匹配技术在眼底图像配准、病人身份鉴别等任务中具有重要意义。现有眼底图像匹配方法大多通过传统数字图像处理技术实现,很少采用深度学习方案,这是因为目前可用的眼底图像标注数据极其稀少,难以支撑深度网络模型的训练。采用传统技术往往面临超参数设置复杂,匹配质量差、速度慢,只能解决单一特定任务等问题,这些方法的实际应用具有很大的限制。

眼底图像技术新突破,致远慧图论文登上ECCV2022

SuperRetina网络结构和训练流程图

为了解决上述问题,研究团队首次提出了基于深度学习的眼底图像端到端关键点检测描述模型SuperRetina,并针对标注缺失的问题,设计了渐进式关键点扩展技术(PKE)来自动扩展每个训练步骤的关键点标签。在每个训练步骤,PKE技术利用初始输入的不完整标签和模型输出的预测结果,进行基于几何的筛选和基于内容的筛选,保留模型自身发现的、未经标记的高可靠关键点。

眼底图像技术新突破,致远慧图论文登上ECCV2022

眼底图像匹配对比实验结果

大量实验证明,SuperRetina可同时解决眼底图像配准和身份鉴别多重任务,并在多个真实眼底图像数据集上都得了最优性能。另外,即使SuperRetina完全不使用人工标注的标签进行训练,取得的性能也超过了现存方法,进一步验证了PKE技术的有效性。

这一研究对于辅助眼科诊断与治疗具有重要意义。在患者随访的过程中,将不同时间拍摄的两幅或多幅眼底图像进行配准,能够帮助医生更精确地从纵向维度衡量和评估疾病的进展及发展情况,根据视乳头、眼底血管和视神经纤维层的变化进行及时地诊断或治疗;通过SuperRetina进行身份验证,能够对眼底照片进行智能化归档管理,进一步节约医生的阅片时间。

此外,视网膜眼底图像是糖尿病、高血压、冠心病等疾病进展判断的有力线索,这些疾病的发生一般会导致视网膜微血管形态发生变化,眼底图像配准精度的提升有利于医生发现细微的血管改变,对部分全身疾病的早期防治和长期管理具有重要的临床价值。

在目前的临床诊断过程中,对比前后两次眼底照片的工作往往由医生人工完成,这要求医生具备丰富的临床经验,费时费力的同时还难以保证配准精度。而基于人工智能的高精度眼底图像配准能够显著提升医生的阅片效率,同时减小医生因图像采集问题等客观因素影响疾病判断的可能性,降低患者受到意外损害的风险。

图像配准问题作为图像处理研究领域中的一个典型问题和技术难点,对于计算机视觉、医学诊断与治疗、图像拼接等领域有广泛的影响。SuperRetina的提出为开发更准确的眼底图像配准工具提供了新思路,有望通过底层技术的创新与优化,赋能眼科临床解决方案的全面提升。

北京致远慧图科技有限公司成立于2016年,是一家专注于人工智能(AI)在眼科医疗行业应用的高新技术企业。致远慧图人工智能实验室拥有以清华、人大、前Intel、Zeiss专家为核心的百余人研发团队,在计算机视觉、模式识别、多模态医学图像分析、医学大数据计算等领域有深厚的技术积累和丰富的行业应用经验。