nccn卵巢交界性肿瘤 (卵巢交界性肿瘤临床指南)

使用 ADNEX 模型在手术前评估卵巢癌的风险，以区分良性、交界性、早期和晚期侵袭性以及继发性转移性肿瘤：前瞻性多中心诊断研究

目的： 开发一种风险预测模型，以在术前区分良性、交界性、I 期侵袭性、II-IV 期侵袭性和继发性转移性卵巢肿瘤。

设计： 使用前瞻性收集的临床和超声数据进行观察诊断研究。

设置： 10 个国家的 24 个超声中心。

参与者： 患有卵巢（包括卵巢旁和输卵管）肿块并在手术前接受标准化超声检查的女性。该模型是在 1999 年至 2007 年间招募的 3506 名患者上开发的，在 2009 至 2012 年间招募的 2403 名患者上进行了暂时验证，然后在所有 5909 名患者上进行了更新。

主要结果指标： 肿块的组织学分类和手术分期。

结果： adneXa (ADNEX) 模型中不同肿瘤的评估包含 三个临床和六个超声预测因子 ： 年龄、血清 CA-125 水平、中心类型（肿瘤中心与其他医院）、病变最大直径、实体组织比例、超过 10 个囊肿室、大量乳头状突起、声影和腹水。 经时间验证，良性肿瘤和恶性肿瘤之间经典区分的受试者工作特征曲线 (AUC) 下面积为 0.94（0.93 至 0.95）。良性与交界性癌症的 AUC 为 0.85，良性与 I 期癌症的 AUC 为 0.92，良性与 II-IV 期癌症的 AUC 为 0.99，良性与继发转移性癌症的 AUC 为 0.95。恶性亚型之间的 AUC 在 0.71 至 0.95 之间变化，其中交界性癌症与 I 期癌症的 AUC 为 0.75，II-IV 期癌症与继发性转移癌的 AUC 为 0.82。校准曲线表明估计的风险是准确的。

结论： ADNEX 模型可以很好地区分良性肿瘤和恶性肿瘤，并且可以很好地区分四种类型的卵巢恶性肿瘤。ADNEX 的使用有可能改善分诊和管理决策，从而降低与附件病理相关的发病率和死亡率。

介绍：

卵巢癌是最具侵袭性的妇科恶性肿瘤。患者的五年生存率约为 40%，该疾病约占妇科癌症相关死亡人数的一半。生存最重要的因素是诊断时的分期。因此，人们尝试开发一种筛查方法，通过在早期检测卵巢癌，有可能减少卵巢癌死亡。 目前还没有这样的筛选方法。 4然而，我们仍在等待英国卵巢癌筛查合作试验的结果。

除了诊断分期之外， 影响预后的一个重要因素是转诊至妇科肿瘤中心进行进一步诊断或分期、减瘤手术以及由跨学科肿瘤委员会进行评估。 尽管建议采用这种集中护理， 因为它可以改善预后，但很大一部分患有卵巢癌的女性仍然接受普通外科医生的治疗， 可能是因为手术前疾病的真实性质未知。卵巢恶性肿瘤的最佳治疗取决于肿瘤的类型。交界性肿瘤的治疗可能不如侵袭性肿瘤的治疗积极，尤其是在保留生育能力很重要的情况下。在某些病例中，I 期卵巢癌的治疗可能比晚期疾病更为保守，而对于转移至卵巢的癌症，治疗取决于原发肿瘤的起源。手术前对附件肿瘤进行准确的具体诊断几乎肯定会改善患者的分诊，从而增加患者接受适当治疗的可能性。

最近，国际卵巢肿瘤分析（IOTA）小组表明，多断层风险预测诊断卵巢癌是可行的。开发数学模型来预测四种肿瘤类型： 良性、交界性、原发性卵巢癌和继发性转移性癌症。 这项工作的重点是比较数学算法。从临床角度来看，出于多种原因，它是初步的。首先，该模型仅使用 754 名患者的信息建立，这些患者患有 40 种交界性癌症、121 种原发性侵袭性癌症和 30 种继发性转移性癌症。其次，尽管对30多个临床和超声候选预测因子进行了统计评估，但没有考虑肿瘤标志物血清CA-125。尽管我们已经证明，在具有二元结果（良性与恶性）的模型中可能不需要血清 CA-125 ，但CA-125 可能对于区分不同类型的恶性肿瘤很重要。第三，模型没有区分 I 期和 II-IV 期原发性癌症，这在临床上很重要。

我们开发了一种多瘤风险预测模型，可以可靠地区分良性、交界性、I 期侵袭性、II-IV 期侵袭性和继发性转移性附件肿瘤。

方法

设计与设置

我们对经临床医生判断至少有一个附件肿块需要手术的女性进行了一项国际多中心前瞻性队列研究。IOTA 研究小组收集了 1999 年至 2012 年间的数据。 IOTA 的成立是为了使用标准化超声检查协议、术语和定义，基于大型多中心数据集开发和验证附件肿块的诊断模型。 从 10 个国家的 24 个中心招募患者。十二个中心被标记为肿瘤中心，即设有特定妇科肿瘤科的三级转诊中心。其余中心包括与肿瘤中心无关的综合医院和妇科超声科单位。数据收集分阶段进行：第 1 阶段 1999 年至 2002 年，第 1b 阶段 2002 年至 2005 年，第 2 阶段 2005 年至 2007 年，第 3 阶段 2009 年至 2012 年。

患者

由于已知或疑似附件肿块而转诊至参与中心之一进行超声检查的患者符合纳入资格。我们纳入了至少有一个附件肿块的连续患者，这些患者被判断为不是生理性囊肿，由一名主要研究者对这些患者进行经阴道超声检查，然后选择进行手术干预。手术决定是由主治临床医生根据包括超声报告在内的完整临床情况做出的，后者基于超声检查员对超声图像的主观评估。根据当地伦理委员会的要求，我们在超声扫描和手术前获得了女性的口头或书面知情同意书。排除标准为拒绝经阴道超声检查、就诊时怀孕以及超声检查后 120 天以上手术切除肿块。如果检测到不止一个肿块，我们会使用超声扫描中形态最复杂的肿块。当我们观察具有相似形态的肿块时，我们使用最大的或最容易通过超声波到达的肿块。

数据采集及参考标准

为了收集临床信息，我们从每位患者那里获取了标准化病史。所有患者均接受标准化经阴道超声检查。20对于经阴道探头无法完全看到肿块的女性，增加了经腹部超声检查。我们根据研究方案收集了灰度和多普勒超声信息。更多信息可以在之前的报告中找到。21 22 23鼓励参与中心测量血清 CA-125。我们使用来自 Roche Diagnostics、Centocor、Cis-Bio、Abbott Laboratories、Bayer Diagnostics、bioMérieux、DiaSorin、Siemens 和 Beckman Coulter 的第二代 CA-125 II 免疫放射测定试剂盒。所有试剂盒均使用 OC125 抗体。

参考标准是外科医生认为合适的开腹手术或腹腔镜手术切除肿块后的组织病理学诊断，以及采用国际妇产科联合会（FIGO）分类的恶性肿瘤分期。切除的组织在当地中心接受了组织学检查。在不知道超声结果的情况下进行组织学分类。最终诊断分为五种肿瘤类型：良性、交界性、I期浸润性、II-IV期浸润性和继发性转移癌。

第一阶段的数据通过专用且安全的数据收集系统（基于网络）输入，后续阶段则通过本地研究屏幕（德国慕尼黑的 Astraia 软件）输入数据。为了确保数据完整性，一些临床医生和统计学家使用内置的自动检查以及手动审查和清理数据。

统计分析

我们使用 IOTA 第 1、1b 和 2 阶段的女性数据 (n=3506) 开发了一个预测模型，并根据第 3 阶段的女性数据 (n=2403) 验证了该模型。

血清 CA-125 肿瘤标志物不是强制性变量，31% 的患者缺少测量结果。正如补充附录 A 中详细描述的，我们使用多重插补来处理 CA-125 的缺失值。我们创建了 100 个插补，产生了 100 个完整的数据集。

我们分两个阶段选择变量。首先，为了避免过度拟合，我们根据主题知识和中心预测变量的稳定性将潜在预测变量的数量减少到 10 个。我们选择了四个临床变量——年龄（岁）、血清 CA-125 水平 (U/mL)、卵巢癌家族史（是/否）和中心类型（肿瘤中心与其他医院）和六个超声变量—病变的最大直径（毫米），实体组织的比例（即最大实体成分的最大直径除以病变的最大直径），是否存在超过10个囊肿小室（是/否），乳头状突起的数量（0、1、2、3、>3）、是否存在声影（是/否）以及是否存在腹水（是/否）。肿瘤中心被定义为具有特定妇科肿瘤科的三级转诊中心。我们纳入了“中心类型”这一变量，因为即使在对患者和肿瘤的特征进行调整后，肿瘤中心的恶性肿瘤风险也可能高于其他中心。其次，我们使用基于多变量分数多项式的方法进行了进一步的数据驱动选择。该方法同时选择变量并使用分数多项式确定数值变量的最佳变换。默认情况下，我们将年龄和中心类型强制纳入模型中。

为了承认中心之间的变异性，我们使用具有随机中心截距的多项逻辑回归来构建多分模型。我们将预测系数与统一的“收缩因子”相乘，以避免夸大模型系数（详细信息请参阅补充附录 C）。我们在多重插补后对 100 个完整数据集中的每一个数据集训练了模型。概率是通过平均线性预测变量（没有随机效应）得出的，优势比是通过平均模型系数得出的。

我们评估了模型的辨别和校准性能。为了评估区分度，我们首先获得了受试者工作特征曲线 (AUC) 下的面积，以用于良性肿瘤和恶性肿瘤之间的基本区分。我们计算了恶性肿瘤总风险 3%、5%、10% 和 15%（即四种恶性亚型的估计风险之和）的敏感性和特异性。然后，我们还使用条件风险方法计算了每对肿瘤类型的 AUC。对于五种肿瘤类型，有 10 个成对的 AUC。最后，我们计算了多分判别指数，即 AUC 的多分版本。该指数估计了当呈现 5 名患者（每种肿瘤类型各一名）时，模型正确识别的患者的平均比例。对于五个组，多分歧视指数范围在 0.20（无价值）和 1（完美）之间。歧视图用于可视化歧视表现。

为了评估预测概率的校准，我们制作了校准图，显示每种肿瘤类型的预测概率和观察概率之间的关系。这些图基于参数多项式逻辑重新校准分析，使用随机中心截距。我们使用此分析的概率结果（包括随机效应）作为观察到的概率，并根据预测的概率进行绘制。

由于模型验证成功，我们根据汇总数据 (n=5909) 更新了模型，以充分利用所有可用信息。然后可以将基于该模型的预测概率与每种肿瘤类型的基线概率进行比较。通过仅包含截距项的随机截距多项逻辑回归模型来估计基线概率。所有分析均使用 SAS 9.3（SAS Institute，Cary，USA）进行。

结果

数据库中总共记录了 6169 名患者的 1、1b、2 和 3 期数据。根据排除标准，我们排除了 255 名患者 (4.1%)：163 名患者 (2.6%)（51 名孕妇、112 名接受手术的女性） > 超声检查后 120 天），91 例（1.5%）是因为数据错误或不确定或缺失最终组织学，1 例是因为违反方案。根据逻辑回归影响诊断39和对存档数据集的进一步数据审查，我们省略了另外五个案例。因此使用了 5909 名女性的数据。 肿瘤中心观察到的恶性肿瘤发生率在 22% 到 66% 之间，而在其他医院则在 0% 到 30% 之间。

模型开发、时间验证和更新

我们在 adneXa (ADNEX) 模型中的不同肿瘤形成评估中纳入了九个变量：年龄、血清 CA-125 水平（对数转换）、中心类型、病变最大直径（对数转换）、实体组织比例（与二次项）、乳头状突起数量、超过 10 个囊肿小室、声影和腹水。变量选择分析排除了卵巢癌家族史。显示了先验选择的 10 个变量的描述性统计。 ADNEX 模型基本区分良性和恶性肿瘤的 AUC 在开发数据上为 0.954（95% 置信区间 0.947 至 0.961），在验证数据上为 0.943（0.934 至 0.952）（表 3 ⇓ ）。良性和恶性之间的区分在各个中心是一致。使用 10% 的截断值来预测恶性肿瘤，验证数据的敏感性为 96.5%，特异性为 71.3%。良性肿瘤与交界性肿瘤相比的验证AUC为0.85，良性肿瘤与I期癌症相比为0.92，良性肿瘤与II-IV期癌症相比为0.99，良性肿瘤与继发性转移癌相比为0.95 。恶性亚型之间的验证 AUC 在 0.71 至 0.95 之间变化。 该模型显示了 I 期癌症和交界性肿瘤（验证 AUC 0.75）以及 I 期癌症和继发性转移性癌症（验证 AUC 0.71）之间的公平区分。它能够很好地区分 II-IV 期癌症与其他恶性肿瘤（II-IV 期癌症与交界性肿瘤的 AUC 为 0.95，与 I 期癌症相比为 0.87，与继发性转移性癌症相比为 0.82）。验证数据的多分判别指数为 0.56（0.54 至 0.59）。

显示了 ADNEX 模型在汇总数据上更新后的辨别性能。判别图显示，对于具有匹配参考标准的患者，特定肿瘤类型的预测概率最高，例如， 组织学证实的交界性肿瘤患者具有最高的交界性恶性肿瘤概率。 ADNEX 模型公式在补充附录 D 中给出。预测变量的效果在表 5 中以优势比表示。根据模型系数的检验统计量（未显示）判断， 实体组织比例和血清 CA-125 水平与结果具有最强的独立关系。中心类型是最弱的预测因子，表明恶性肿瘤发生率的大部分差异是由其他预测因子捕获的。 推导没有 CA-125 水平作为预测因子的类似模型主要影响 II-IV 期癌症和其他恶性肿瘤之间的区分：验证 AUC 从 0.82 下降至 0.59（II-IV 期癌症与转移性癌症），从0.87 至 0.76（II-IV 期癌症与 I 期癌症），以及 0.95 至 0.91（II-IV 期癌症与交界性肿瘤）。

ADNEX 的实施和说明性示例

最终的 ADNEX 模型可在线和移动应用程序中获取 ( www.iotagroup.org/adnexmodel/ )。 尽管性能有所下降，但即使没有血清 CA-125 水平的信息，这些应用程序也可以进行风险计算。例如，我们在妇科肿瘤中心对一名 55 岁的女性进行评估。她的血清 CA-125 水平为 42 U/mL。超声检查发现附件包块，囊室10个以上，无乳头状突起，无声影、腹水，病灶最大直径120mm，最大实性成分直径20mm（即实性成分比例）。组织为 20/120)。ADNEX 模型给出以下概率：交界性肿瘤为 37.4%，I 期癌症为 10.8%，II-IV 期癌症为 8.4%，继发性转移癌为 11.0%。总的恶性肿瘤风险为37.4+10.8+8.4+11.0=67.6%。与任何其他类型的恶性肿瘤相反，该肿瘤最有可能是交界性肿瘤。如果 CA-125 水平不可用，则预测概率为 25.2%（临界）、8.3%（I 期）、35.8%（II-IV 期）和 11.5%（转移性）。每种类型肿瘤的基线概率为：交界性肿瘤为 6.3%，I 期为 7.5%，II-IV 期为 14.1%，转移性癌症为 4.0%。

讨论

我们开发并暂时验证了一种预测模型，该模型能够区分五种类型的附件肿瘤（良性、交界性、I 期癌症、II-IV 期癌症和继发性转移性癌症），同时仍然表现出良性和良性肿瘤之间出色的整体区分能力。根据验证数据，之前提出的恶性肿瘤总风险21的 10% 风险截止值的敏感性为 96.5%，特异性为 71.3%。 ADNEX 模型可以很好地区分良性肿瘤和四种恶性肿瘤（受试者工作特征曲线 (AUC) 下的验证面积在 0.85 和 0.99 之间）。此外，该模型能够区分 II-IV 期癌症与其他恶性肿瘤（验证 AUC 介于 0.82 和 0.95 之间），并显示出 I 期癌症和交界性肿瘤（AUC 0.75）以及 I 期癌症和继发性转移性癌症（AUC 0.71）之间的公平区分。）。该模型使用三个临床预测因子（年龄、血清 CA-125 水平、中心类型）和六个超声预测因子（病变最大直径、实体组织比例、超过 10 个囊肿小室、乳头状突起数量、声影和腹水））。血清 CA-125 水平和实体组织比例是最强的预测因子。

与其他研究相关的结果

附件肿瘤诊断的多断层方法是新颖的。除了国际卵巢肿瘤分析 (IOTA) 小组的工作之外，我们不知道该领域的多变量多部分模型。在最近的一项荟萃分析中，评估了表征附件病理学的预测模型和规则的性能，IOTA 的方法，例如逻辑回归模型 LR2 和简单规则（一组 10 个超声特征）在总体上表现最佳区分良性和所有恶性肿块。英国皇家妇产科学院已将这些简单规则纳入其绝经前患者附件肿瘤治疗指南中。 ADNEX 模型的性能与 LR2 和简单规则类似，甚至稍好一些。例如，LR2 在验证数据（IOTA 第 3 阶段）上的 AUC 为 0.92。与 LR2 和简单规则相比，ADNEX 模型还可以使用风险估计对恶性肿瘤进行特定亚型分类。

本研究的优点和缺点

我们的研究有几个优点和局限性。首先，本研究的优势在于，我们使用标准化方案在 10 个国家的 24 个中心对大量患者进行了前瞻性检查，避免了强数据驱动的变量选择，并对模型进行了大规模的时间验证。验证后，我们使用近 6000 名患者的汇总数据来更新模型系数。因此，我们希望我们的结果具有普适性。其次，对每个包含的肿瘤都获得组织学诊断可能被视为一个优点。这也可以被视为一种限制，因为该模型是基于选择进行手术的患者。因此，我们不能确定如果将 ADNEX 模型应用于肿瘤群体（其中一些肿瘤被选择进行预期治疗），其测试性能是否会得到维持。然而，这一论点适用于诊断卵巢肿瘤的所有预测模型。第三，各中心使用不同的检测试剂盒进行CA-125评估。这也可以解释为优势和局限性：使用不同的试剂盒会引入 CA-125 水平的变异性（尽管这种变异性较小），反映临床现实，并产生较少依赖于测定的结果。第四，一个潜在的限制是经验丰富的操作员检查了研究中的所有肿瘤。然而，其他研究表明，IOTA 小组使用与当前研究中类似的超声变量开发的二分模型在非专家级超声检查员手中效果良好。第五，没有对病理学进行集中审查。在IOTA研究的第一阶段中，随机选择10%的患者进行病理学集中审查。由于我们发现地方报告和中央报告之间报告的结果没有临床上的重要差异，因此在 IOTA 研究的后期阶段没有进行这种集中审查。然而，这可能引入了偏见。例如，对于病理学家来说，区分交界性肿瘤与良性肿瘤或 I 期癌症可能很困难，并且这些肿瘤类型的混淆可能会影响 ADNEX 模型正确区分它们的能力。

对临床实践的影响

ADNEX 模型在优化女性附件肿瘤的治疗方面具有明显的潜力。 目前，恶性风险指数 (RMI) 通常用于将附件肿块描述为良性或恶性。然而，在我们的验证数据上进行测试时，该指数在区分良性肿瘤和恶性肿瘤方面的表现比 ADNEX 模型差得多（在典型的恶性肿瘤风险指数截止值为 200 时，AUC 为 0.88，敏感性为 67.1%，特异性为 90.6%）。除了能够很好地区分良性肿瘤和恶性肿瘤之外， ADNEX 模型还可以预测恶性肿瘤的类型。 术前了解特定类型的附件病理学很可能改善患者分类，并且还可以优化治疗。这反过来又可能降低不同类型卵巢恶性肿瘤的发病率并提高生存率。正确识别I期癌症尤为重要。 ADNEX 模型可以很好地区分 I 期癌症和良性肿瘤以及 I 期癌症和晚期癌症。此外，ADNEX模型可以很好地区分晚期原发癌和继发性转移癌。 后一个结果主要是通过使用血清 CA-125 水平作为预测因子来实现的。虽然在区分良性肿瘤和恶性肿瘤时，CA-125 水平相对于超声信息几乎没有什么附加价值，但本研究表明，血清 CA-125 水平对于良好区分 II-IV 期癌症与 I 期和继发性转移性癌症非常重要。ADNEX 与预测卵巢恶性肿瘤的众所周知的模型（例如恶性肿瘤风险指数和卵巢恶性肿瘤风险算法（ROMA））共有的一个不便之处在于，只有在获得血液样本分析结果后才能进行预测。 ADNEX 实施还允许在没有 CA-125 水平的情况下进行风险计算，但这将导致 II-IV 期癌症和其他类型的恶性肿瘤之间的区分较差。

我们期望非专业超声检查人员能够保持 ADNEX 模型的性能，前提是检查人员熟悉 IOTA 术语和定义并使用 IOTA 检查和测量技术。 ADNEX 的预测风险如何在临床上使用必须根据个人情况决定，因为患者管理取决于许多因素。在决定附件肿块的治疗时，特定类型恶性肿瘤的可能性是关键，但年龄、症状、保留生育能力的愿望、合并症和手术风险也是重要因素。然而，ADNEX 预测可能为患者的最佳管理奠定坚实而客观的基础，并可能被纳入国家和国际临床指南中。

未来的重点研究

未来的工作需要使用新收集的数据定期更新 ADNEX 模型系数，并监控模型性能。此外，迫切需要对接受保守治疗的患者进行研究。这是 IOTA 研究第五阶段的主题，该研究的数据收集于 2013 年初开始。 最后，如果将卵巢癌筛查引入临床实践，ADNEX 模型可以优化用作第二阶段测试。

结论

ADNEX 模型有可能改变患有附件肿瘤的女性的治疗决策。这可能会对与附件病理学相关的发病率和死亡率产生相当大的影响。

NOTE:

将卵巢癌患者转诊至专门的妇科肿瘤中心对生存产生积极影响
目前在欧洲和美国，只有少数女性被分流到妇科肿瘤中心接受专科护理
个性化管理，包括保留生育能力的手术，需要了解卵巢肿块的性质
存在可以区分良性和恶性卵巢肿瘤的预测模型，但它们不能对恶性肿瘤进行细分
ADNEX 模型可以很好地区分良性和恶性卵巢肿瘤
该模型还能够区分良性、交界性、I 期侵袭性、II-IV 期侵袭性和继发性转移性肿瘤
ADNEX 模型可以改善患者分类和管理决策，从而对与附件病理相关的发病率和死亡率产生积极影响

Evaluating the risk of ovarian cancer before surgery using the ADNEX model to differentiate between benign, borderline, early and advanced stage invasive, and secondary metastatic tumours: prospective multicentre diagnostic study - PubMedTwitterFacebookLinkedInGitHubSM-TwitterSM-FacebookSM-Youtube