
结合国内外真实世界临床研究与人工智能技术等的研究进展,围绕开展高质量真实世界中医药临床研究的理念、方法与技术等问题,论述了真实世界研究范式转化、以临床问题为导向的研究模式建立、真实世界数据质量和高质量因果证据方法学等挑战及对策,以期从中医临床诊疗的本体视角充分认识真实世界中医药研究的长期性与对中医药高质量发展的重要性。
真实世界研究(real-world study,RWS)是收集与利用真实世界数据(real-world data,RWD)形成真实世界证据(real-world evidence,RWE)的临床研究方法。RWD是开展RWS的重要数据基础,涵盖源自临床诊疗业务与个体日常生活的健康相关数据,包括临床电子病历、医保付费、疾病注册登记以及患者日常生活场景(如居家活动与运动)中由可穿戴设备获得的健康状态数据等。临床电子病历等临床诊疗业务数据是RWD的核心组成部分。 利用大规模临床电子病历数据形成高质量临床证据是RWS面临的重要机遇与挑战。
自2016年以来,美国食品药品监督管理局连续发布了包括指导原则、方案框架、电子病历数据源和数据标准等在内的系列RWE指南,欧洲药品管理局于2021年启动了达尔文项目,英国相继发布了RWD的使用指南和RWE框架。中国国家食品药品监督管理局2020年以来陆续发布了基于RWD开展医疗器械评价、儿童用药和药物评价的指导原则以及用于产生RWE的RWD指导原则等。各国RWS系列政策法规的制定以及健康医疗RWD的积累,使得RWS成为临床研究的新热点,在癌症、罕见疾病、慢性阻塞性肺疾病(chronic obstructive pulmonary disease,COPD)、慢性肾病、冠心病、糖尿病、类风湿性关节炎和精神类疾病等的药物有效性和安全性方面形成了系列高质量证据。鉴于新发急性传染性疾病的特殊性,RWS也为全球开展新冠肺炎潜在有效药物和疫苗预防效果评价提供了较为有效的研究方法。
在中医药领域,基于中医临床的个体诊疗和临床实践特点,结合10余家首批国家中医临床研究基地近10年的临床研究实践,由中国中医科学院牵头制定的《中医真实世界研究技术规范通则》于2017年发布。 该通则涵盖中医RWS方案设计、数据采集与分析、质量控制、数据安全与共享等各个环节,为提高中医药RWS质量、保证研究结果的真实性和可靠性提供了重要指导。为进一步推进中医药RWS的水平与质量,中华中医药学会和中国针灸学会分别发布了《中医真实世界数据采集操作规范》《中医药真实世界研究技术规范》和《真实世界针灸临床研究标准体系表》等系列标准规范。此类标准旨在针对数据采集、数据库构建、统计分析、证据质量评价、伦理审查和临床疗效评价等不同环节,建立科学合理的技术规范和评价原则。此外,自2016年开始,中医药领域陆续建立了多个相关RWS学术分会,如中国中医药信息学会中医药健康大数据分会和世界中医药学会联合会真实世界研究专委会等,初步形成了中医药RWS科研共同体。
总而言之,在医疗健康大数据时代,RWS日益成为临床研究中不可或缺的新型研究方法。相比传统理想世界研究,RWS具有研究代价较低、证据外推性好、研究方法灵活和技术开放等优点。对中医药而言,“遵循规律、传承精华、守正创新”已经成为发展的主体,抢抓机遇,充分利用数据科学与人工智能技术,大力开展中医药RWS已经成为中医药高质量发展的当务之急!但中医药RWS尚在起步阶段,存在数据质量低、混杂消除与复杂数据处理难等瓶颈,现有大部分RWE的质量与价值较为有限。因此,结合笔者团队的研究体悟与国内外研究进展,梳理中医药RWS的关键问题及可能对策,期望为建立高质量中医药RWS体系提供值得参考的研究思路与发展方向。
研究范式转换是真实世界临床研究的关键
RWS的核心是范式转化问题。它是简单范式向复杂范式的转化,是物质科学研究范式向信息科学研究范式的一种转化,是卫生医疗领域“知识驱动的研究范式,向以临床问题驱动的研究范式的转化”。要实现此种转化,首先要对研究领域的科学观、方*论法**以及价值观进行重新审视和调整,要从健康维护是一个“复杂开放的巨系统”出发,形成“科学共同体成员所共享的信仰、价值、技术等集合所构成的模式和范例”,成为“从事某一科学的研究者群体所公认的工作框架和工作基础”。范式转换往往是科学创新发展的关键要素,尽管这种转换已经在疾病医学向健康医学的转化中演进,但要从根本上实现则是一个漫长的过程。
2013年,刘保延等在近10年“临床科研一体化”技术与临床应用研究实践基础上,提出了中医真实世界临床科研范式,其核心是临床科研一体化,其鲜明的特征是医疗实践与科学计算交替,从临床中来,到临床中去。该范式的提出是源于流行病学与循证医学等传统临床研究方法无法根本解决中医个体诊疗规律与证据“从临床中来、到临床中去”的瓶颈问题。此范式的提出,很快得到了行业内外的积极响应,学者纷纷撰文从真实世界内涵、复杂性科学和人体科学研究方*论法**等不同视角,对建立RWS范式的必要性、科学性与研究价值等进行了深入探讨,认为真实世界临床科研范式是一种复杂性科学“实境范式”的典型案例,对挖掘中医特色、发挥中医传统具有重大意义,也为复杂性科学研究提供了一种具有悠长历史的真实研究案例。同时,学者认为真实世界中医临床科研范式提出的“以人为中心”的理念,既体现了中医范式中对人(即患者客体以及医者主体)的真实性认知,也与中医面向疾病诊疗的整体性、个体化身体观相适应。该范式强调的数据驱动特征也与James Gray(1998年图灵奖得主)提出的“数据密集型范式”(即第四范式)异曲同工。由于范式的转换是一种“科学革命”,要转变科学观、方*论法**,要形成相应的支撑技术体系。更为重要的是要构建相适应的科学研究管理体制与机制,处理好范式转换过程中新旧范式的结合与技术体系衔接等复杂问题。因此,中医药RWS体系构建是一个涉及研究理念、数据获取、研究方法和临床管理等诸多环节的长期过程,我们需要充分认识该体系构建的复杂性与实现难度,需要解决系列瓶颈问题如真实世界临床研究伦理学、临床实施方案设计、组织管理模式等,才能有力推进中医药RWS的高质量发展。
RWS模式要在解决临床问题的过程中逐步形成与构建
RWS的生命力在于解决临床问题的能力与水平。同时,中医药RWS也有其适应的范围,寻找到适合的研究领域,解决用理想世界方法难以解决的中医临床问题是关键所在。笔者团队的中医药RWS实践源于2002年提出的以数字中医药技术体系为核心的“数字中医药”理念和方案。在此基础上,以中医药防治重大慢病个体诊疗评价体系的构建为核心目标,倡导并逐步建立了临床科研一体化的中医临床科研信息共享系统,以解决电子病历为核心数据的中医药RWS的支撑技术问题。在相关理念的指导下,我们在2003年严重急性呼吸综合征(SARS)疫情期间成功组织了以辨证论治为核心的临床研究,研制了SARS中医药诊疗指南,并在世界卫生组织(WHO)的主导下在国际上推广。我们设计研发的中医临床科研信息共享系统包含结构化电子病历系统、临床数据仓库和系列中医药数据挖掘技术,初步解决了中医药RWD的采集、存储管理与分析问题。基于以上技术平台,在中风、糖尿病和冠心病等重大疾病诊疗规律,以及20余位名老中医经验传承等方面开展了真实世界应用研究。在病证关系、证候特征及演变规律、综合治疗方案、名老中医辨证处方经验等方面形成了系列研究成果。
中医是一种复杂干预与个体诊疗方法,辨证论治疗效评价是中医临床评价研究的难点与关键所在。因此,建立体现辨证论治特色的真实世界临床评价模式,实现辨证论治整体临床疗效评价以及源于辨证论治的新方药的发现、优化与验证,是建立高质量中医药RWS体系的基础性工作。结合笔者团队的近期研究实践,本文分别从真实世界有效处方筛选方法、辨证论治加载治疗效果评价和基于医者评价的辨证论治临床评价新方案等临床问题进行示范探讨。
基于真实世界辨证论治数据,挖掘治疗专病的专方、靶向基本证候或主导病机的主方,形成高质量治疗方案证据,是提升辨证论治稳定性和中医临床诊疗能力的关键。笔者团队通过数据挖掘和复杂网络等方法,提出了利用中医临床电子病历数据发现临床有效处方的分析方法。具体而言,通过运用复杂网络方法开展中药配伍规律研究,发现中药配伍存在无尺度网络配伍现象,提示辨证论治中药处方存在核心药物配伍知识。以此为依据,结合基于中药功效相似性的有效药症关系分析、混杂因素分析和临床适应症分析等方法,研制了多阶段临床有效处方分析算法。该方法尝试解决从中医药RWD中筛选临床有效方证的问题,已应用于薛伯寿等近百位名老中医经验传承研究,为高效发掘专病专方等源于临床的真实世界有效方药提供了可行途径。
在新冠肺炎暴发期间,开展大规模前瞻性随机对照试验研究(randomized controlled trial,RCT)非常困难,如何阐明中医临床疗效是一个难题,RWS成为中医药疗效评价研究的首选。笔者团队自2020年2月份开始,处理和利用武汉5家医院1788例(317例重症病例)结局明确的临床全病历数据,采用在常规治疗基础上加载辨证论治的回顾性队列研究设计,开展了真实世界疗效评价研究。研究结果显示,加载辨证论治汤剂可以显著降低重症患者的病死率(粗病死率从45.2%减低到19.4%,采用倾向性评分进行混杂因素消除后风险比仍达到0.34),为开展基于RWS的中医药干预新发突发传染病疗效评价提供了成功范例。
失眠是中医临床门诊的常见病,辨证论治个体化诊疗特点突出,以中药汤剂干预为主。对于顽固性失眠,临床医生几乎每个诊次方药都有所调整,如果针对固定方药进行评价,则会严重干扰辨证论治的疗效评价结果。笔者团队遵循基于临床科研一体化的中医药RWS科研范式,采用不评价固定的方药,而是评价主导辨证论治的医生的治疗效果的方案。利用中医临床诊疗门诊数据,通过回顾性、前瞻性队列设计与随机对照盲法设计的疗效评价,先后对10余位名中医辨证论治失眠的2000余例病例进行了效果比较研究。研究结果显示被评价医生均有较好的治疗效果,但各自辨证论治的思路、方药和疗效特色不同。该评价方法推荐给患者的不是一个固定方药,而是善于治疗此病的名中医。此项评价开创了评价“医生”的先河,进而找到适合辨证论治个体诊疗效果评价的方法,有望带动全新的中医临床评价方法不断兴起。
上述以辨证论治疗效评价为目标的示范性研究为探索建立中医药特色RWS提供了新思路。我们认为,基于特定病种的高质量RWD,建立阶梯递进的辨证论治疗效评价研究模式具有极为重要的价值。该研究模式以中医药加载治疗的整体评价为起点,通过医者评价及其序贯诊疗方案优化,实现优效方证发现,在此基础上,开展以固定方药为干预手段的模拟目标试验。此种阶梯递进的研究方案将逐步分阶段地确认辨证论治的疗效优势、筛选优秀医者及其优效治疗方案、发掘以优效方证为核心的固定方药,并利用人工智能技术实现固定方药临床因果效应的模拟验证研究。该方法体系的建立将极大支撑构建中医药特色的临床诊疗能力提升体系和源于临床的新药研发体系。
高质量临床数据的构建与处理是RWS的基础与前提
RWS研究的挑战源自高质量数据集构建与预处理的困难,开展高质量中医药RWS研究需要首先解决高质量RWD的构建问题。近年来美国与欧洲各国相关医疗管理机构在构建大规模高质量RWD资源方面不遗余力,形成了诸如OHDSI、PCORnet和CODE-HER等大规模RWD,以及阿尔茨海默症(ROADMAP)和COPD(SDG-CARE)等特定病种的真实世界项目,这些RWD资源及其数据处理技术平台的构建为高质量RWE的形成提供了可持续性的资源和技术支撑。但目前大部分中医药RWD在完整性、规范性、可靠性和数据规模等方面都存在明显差距,且数据处理过程的透明性和一致性不够,因此,所获得的高质量RWE极为稀少。由此可见,建立与高质量中医药RWS研究体系相适应的中医药数据资源及其科学技术体系是提升中医药RWS水平的关键所在。
临床电子病历是中医药RWS的核心数据资源,为获得高质量的临床电子病历数据,笔者团队在2002年开始探索基于中医临床标准术语集的结构化电子病历系统,形成了融合临床诊疗业务进行全过程质量控制,以实现从源头采集高质量临床数据的技术途径。同时,由于大量实际电子病历数据仍以自然语言文本为主要载体,因此,我们将基于深度学习的命名实体抽取技术与人工标注审核相融合,研制了基于人机协同的电子病历文本标注与结构化系统。该系统在保证数据结构化质量的前提下,显著降低人工标注与结构化的工作量。自2019年开始,在该系统支撑下,已经开展中西医结合临床疗效评价和病证结合精准分型等中医RWS临床研究10余项,为高质量RWS数据集的构建提供了系统支撑。
另外,由于RWD主要源自繁重的临床诊疗业务或人们的开放式日常健康活动,因此,RWD的完整性、准确性和规范性等质量问题(如电子病历的终点结局信息缺失、临床注册登记信息的随访和数据可靠性有限等)一直是困扰RWS的难点。通过建立相应的数据集成和数据治理技术以提高RWD的数据质量,是RWS领域的重要方向。例如,针对回顾性数据,通过数据链接(data linkage)等技术实现多源数据整合,构建具有完整信息链条的RWD是提高数据完整性与准确性的重要解决途径。为了解决RWD的规范性与多样化术语表达问题,结合医学术语本体与知识图谱,以及自然语言处理方法,进行临床医学规范概念或编码的提取是极具价值的数据治理研究方法。
但从根本上而言,通过人工智能和数据科学等技术,在业务与研究全流程上形成高效的高质量数据采集与处理模式才是真正解决中医药RWD质量问题的有效方法。因此,基于临床诊疗业务流程,建立一套以疗效为导向、以结局管理为抓手,数据质量控制高效融入日常流程的中医临床业务管理模式是实现中医药真实世界可持续性研究的重要发展方向。建立相应的临床与研究融合管理、评价和利用的机制,使临床数据生产者(如医生)感觉到数据的温度与健康价值,体会到数据质量与其自身发展的紧密关系,是提高RWD质量的最有效方法。
RWD到高质量因果证据的方法学挑战与对策
RWD中隐藏的选择偏移、混杂因素和人群异质性等复杂特征结构给数据分析方法带来了极大阻碍。中医辨证论治个体诊疗过程往往就是在医者主导下,医患交互过程中,以疗效为导向的干预与患者健康状态间,从关联关系到因果关系的知识转化过程。但该过程具备的医生主体耦合性、患者人群特征的涌现性与干预措施的复杂性等,使得从中医药RWD中获得可靠的因果性治疗证据面临严峻挑战。
将中医临床诊疗特征如症状群与生物学微观机制(分子、蛋白质、基因网络等)相结合,建立真实世界临床疾病人群分类方法,进而剖析临床人群的异质性,形成疾病精准分型与临床分组,是获得可靠治疗证据的重要方法。以四诊信息为来源的症状体征是中医辨证论治的重要依据,症状群是中医证候的主体内涵所在,对解析真实世界临床人群的异质性具有重要作用。因此,揭示症状体征的科学内涵,融合其生物学关联信息进行疾病的临床分型研究是解构中医药RWS复杂数据,获得同质人群以支持分组对照和排除混杂的重要步骤。我们通过融合人工智能和网络医学方法,利用疾病-基因关系和蛋白质相互作用网络等网络医学知识图谱数据,研究揭示症状体征作为疾病分类与诊断依据具有相应的分子网络模式与规律。在此基础上,研制了基于病证结合的疾病分类新方法和临床人群分型方法(如HEMNet等),并开展了高血压、慢性肝病、肺癌和肺纤维化等10余种疾病的真实世界病证结合分型研究。例如,利用HEMNet方法在200余例肺癌病例中,获得了在预后方面具有更好区分度的患者疾病分型,相比基线方法的组间差异度提升近10倍。
RWD的复杂数据类型与结构还依赖前沿数据处理与分析技术的结合与应用。近年来数据科学和人工智能技术的快速发展为此提供了研究条件,并在智能医学诊断、治疗方案推荐、医学知识图谱和基于人工智能的临床研究等方面也形成了诸多新颖的研究成果,行业呼吁通过建立医疗健康数据科学以促进数据驱动的精准医疗研究与发展。例如,基于深度学习的自然语言处理方法使得对病历文本的大规模深度利用成为可能;融合人工智能和RWD的癌症纳排标准自适应调整方法极大促进了临床研究试验的高效完成;图灵奖获得者Judea Pearl建立的新型因果学习模型(如Do算子和反事实推理方法),为从RWD中挖掘足够可靠的因果性临床证据提供了强大的人工智能方法。因此,利用并发展最新人工智能与大数据等技术,构建以电子病历为核心的中医药RWD资源,研制系列中医药RWD标准规范,建立面向RWS的中医药数据科学与技术体系,将为中医药RWS研究提供可持续性的学科和技术支撑,进而促进高质量中医药RWS的快速发展。
结论
辨证论治个体化诊疗是中医临床的独特优势,能够实现创新方药的临床运用和实践,但作为一种复杂干预对临床研究提出了极大挑战。以往以固定方药为主体干预方法的大部分中医RCT临床研究由于缺乏主治人群特征、预期疗效与组方依据等的前期高质量证据基础,往往实施研究后难以获得可靠有效的临床证据。此类源头性高质量临床证据的缺乏进而限制了系统评价与Meta分析等循证医学研究的必要性与可行性,使得基于RCT与循证医学的中医临床研究进入了两难境地与瓶颈期。制约RCT临床证据质量的关键是其临床治疗方案及其疗效优势的前期优化研究存在明显不足,而该关键问题的解决正是面向临床发现RWS的优势所在。因此,RWS为中医药临床研究瓶颈的突破提供了重大机遇。建立基于临床科研一体化的中医药RWS范式及其研究模式,实现临床治疗方案构成与精准适应症的迭代优化,形成可靠显著的疗效优势将是开展高质量RCT研究的前提与基础。此瓶颈的突破将极大激活中医药临床研究体系,有望推动新型高质量中医药临床研究证据产生体系的构建。由此可见,相比现代医学,RWS对中医药的科学与临床价值更为重要,但由于行业对中医药RWS在范式转化、数据质量与智能数据分析方法等方面问题及其长期性的认识存在不足,在RWS的研究重心部署、数据资源构建和智能数据分析方法等研究方面缺乏系统性设计与规划。因此,中医药RWS至今仍处于初期发展阶段,其研究潜力与临床价值亟待进一步发掘。
为推进高质量中医药RWS体系的构建,我们认为明确4方面的研究理念与方向尤为重要。首先,中医药RWS的范式转化本质使研究者清晰认识到中医药RWS体系构建的复杂性与长期性。因为,范式转化不可能一蹴而就,而是一个长期的“科学革命”过程。其次,把握中医临床的辨证论治独特优势与特色,结合中医优势病种,开展旨在阶梯递进提炼高质量临床证据(如优效方证等)的示范研究,逐步推动中医药特色RWS研究模式的构建是需要开展的重点研究方向。再次,数据质量的瓶颈则需要在临床科研一体化的模式下,建立以疗效为导向、以结局管理为抓手,基于医者评价的中医临床业务评价与管理模式,该模式的建立有望再造中医临床研究体系,真正形成中医临床诊疗理论与能力“从临床中来,到临床中去”的独特创新途径。在此基础上,构建囊括临床数据采集、临床信息与术语规范、大数据分析与智能诊疗决策等技术的中医药数据科学技术与数据资源体系,将形成长期支撑大规模高质量中医药RWD构建的学科与技术保障。最后,可靠因果证据的发掘自始至终都是临床研究的中心目标与任务,中医药RWS也不例外。因此,融合中医药理论领域知识,发展新型因果统计推断与机器学习方法,解构临床样本异质性,建立系统性消除真实世界混杂因素,进而获得可靠因果证据的方法,将是中医药RWS方法学研究的重要方向。
总之,结合中医优势病种的辨证论治临床疗效评价、有效方药发现等特色中医临床问题,进行中医药RWS体系的系统性设计、关键技术研发、RWD资源构建与临床示范研究,通过利用与发展数据科学与人工智能技术,提升中医优效治疗方案的临床发现效率和水平,形成RWS与RCT两法并举、阶梯递进的中医药临床研究新模式与新生态,将有望极大推动中医临床诊疗服务能力提升和中医药创新发展。
本文作者:周雪忠、王世华、张迪、雒琳、黄杏贤、兰天、张润顺、高铸烨、李晓东、何丽云、杨卓欣、曾以德、刘保延
作者简介:周雪忠,北京交通大学计算机与信息技术学院医学智能研究所,山东中医药大学中医药创新研究院,教授,研究方向为中医人工智能、真实世界临床数据分析方法;刘保延(通信作者),山东中医药大学中医药创新研究院,中国中医科学院,首席研究员,研究方向为中医临床评价方法。
原文发表于《科技导报》2023年第14期,欢迎订阅查看。