肺癌筛查(LCS)使越来越多的肺癌患者能够被及早发现,大大提高了生存率。既往肺癌筛查试验表明,使用低剂量CT(LDCT)对吸烟人群进行LCS,可以使肺癌相关死亡率下降20%左右[1]。
但是,事实上,在美国只有10%符合条件的人群正在接受筛查[2],而且,接受筛查者并未坚持定期随访、依从性差[3]。
(资料图片仅供参考)
另外,从不吸烟或吸烟量较少的人,肺癌诊断率正在迅速上升[4],这部分人并不是既往LCS的重点人群,筛查人群和患病人群之间存在明显差距。
为进一步加强肺癌患者管理和LCS实施策略,开发一种简便高效、适用面更广的肺癌风险预测模型很有必要。
近期,由麻省理工学院Regina Barzilay、哈佛医学院Florian J. Fintelmann和Lecia V. Sequist领衔的研究团队,使用美国国家肺癌筛查试验(NLST)的LDCT序列(LDCTs)开发了一个名为Sybil的模型,该模型可在不依赖放射科医生、不需要临床数据的情况下,仅通过一次LDCT扫描即可预测有或没有吸烟史的人群未来6年内的肺癌风险,并在三个独立的数据集上得到验证,研究成果发表在Journal of Clinical Oncology上[5]。
论文首页截图
我们一起来看看这个研究是如何开展的。
研究团队申请并获得了15000名接受LDCT筛查的NLST参与者的放射学和临床数据,并将来自Ardila的研究[6](即卷积神经网络肺癌风险预测模型)中测试集参与者的LDCTs分配至测试集(n=2328),其他参与者的LDCTs随机分配到训练集(n=10200)或开发集(n=2472)。训练集和开发集用于训练Sybil模型,测试集用于验证和测试。
Sybil模型使用了3D卷积神经网络结构来预测未来肺癌风险,放射科医生识别可见癌结节并用边界盒标记,边界盒标记被用于协助训练模型,但在测试集中未使用。
此外,研究团队还纳入了麻省总医院和长庚纪念医院的LDCT数据作为独立的外部验证数据(详见下图)。需要特别指出的是,在长庚纪念医院队列中,包括无吸烟史人群。
数据集构建流程图
为保证图像和数据适用性,研究团队在剔除了扫描局限、数据失访、层厚大于2.5mm、非最薄序列或图像下载失败的序列后,Sybil模型训练集中最后保留了28162个LDCTs,开发集保留了6839个LDCTs,测试集保留了6282个LDCTs。
训练集、开发集、测试集分别有1444个(5.1%)、337个(4.9%)和299个(4.8%)LDCTs阳性数据(即随后6年内诊断为肺癌)。
研究团队通过计算6年内每年的曲线下面积(AUC)和一致性指数(C-index),评估模型在NLST测试集上预测未来肺癌风险的能力。
结果显示,该模型1年的AUC为0.92(95%CI,0.88-0.95),2年的AUC为0.86(95%CI,0.82-0.90),6年预测的C-index为0.75(95% CI,0.72-0.78)。此外,Sybil模型在不同的性别、年龄和吸烟史亚组中都保持了高预测能力(AUC≥0.7)。
接着,研究团队将Sybil模型应用于两个独立的测试集。其中麻省总医院队列中筛选了8821个LDCTs,169个确诊肺癌;长庚纪念医院队列中筛选了12280个LDCTs,101个确诊肺癌。
在麻省总医院和长庚纪念医院队列中,Sybil模型的肺癌风险预测能力与其在NLST测试集中相似,C-index分别为0.81(95%CI,0.77-0.85)和0.80(95% CI,0.75-0.86),具有可比性。
Sybil模型在6年内预测未来肺癌风险能力
A为NLST、B为麻省总医院、C为长庚纪念医院
虽然Sybil模型不需要依靠放射科医生辅助识别LDCT序列上的结节,但研究团队还是进一步探索了这些癌结节对Sybil风险评估的影响。
结果显示,虽然Sybil模型的预测能力因去除可见结节而下降,但仍具有较高的预测能力,2年AUC为0.81(95%CI,0.74-0.86),6年AUC为0.69(95% CI,0.63-0.74)。
为了更好地了解Sybil的内部工作原理并探索其临床应用,研究团队对NLST测试集做了特异性分析,并对真阳性和真阴性LDCTs作了定义。
真阳性LDCTs是指具有可见结节的LDCTs,且结节在6年内被确认为癌症;真阴性LDCTs是指随访6年后未诊断出癌症的LDCTs。
研究团队将肺部成像报告和数据系统(Lung-RADS)评分1-2分为阴性,将3-4分为阳性,并在相同灵敏度下比较了Sybil和Lung-RADS的假阳性率(FPR)。
结果显示,在相同敏感性水平下,Lung-RADS的FPR为0.10(95%CI,0.09-0.11),而Sybil的FPR为0.08(95%CI,0.07-0.09)(P<0.001)。由此可见,Sybil模型预测肺癌的FPR更低,误诊率更低。
总之,该研究开发了包括无吸烟史人群的肺癌风险预测模型,预测性能良好,可以为接受CT肺癌筛查的患者提供有关未来肺癌风险的额外信息,而且对正常临床工作流程无明显干扰。期待未来有更多前瞻性临床研究的开展,以进一步评估其性能和临床效益,早日实现个体化肺癌筛查。
参考文献:
[1]. National Lung Screening Trial Research Team, Aberle DR, Adams AM, et al. Reduced lung-cancer mortality with low-dose computed tomographic screening. N Engl J Med. 2011;365(5):395-409. doi:10.1056/NEJMoa1102873
[2]. Fedewa SA, Kazerooni EA, Studts JL, et al. State Variation in Low-Dose Computed Tomography Scanning for Lung Cancer Screening in the United States. J Natl Cancer Inst. 2021;113(8):1044-1052. doi:10.1093/jnci/djaa170
[3]. Triplette M, Wenger DS, Shahrir S, et al. Patient Identification of Lung Cancer Screening Follow-Up Recommendations and the Association with Adherence. Ann Am Thorac Soc. 2022;19(5):799-806. doi:10.1513/AnnalsATS.202107-887OC
[4]. Tseng CH, Tsuang BJ, Chiang CJ, et al. The Relationship Between Air Pollution and Lung Cancer in Nonsmokers in Taiwan. J Thorac Oncol. 2019;14(5):784-792. doi:10.1016/j.jtho.2018.12.033
[5]. Mikhael PG, Wohlwend J, Yala A, et al. Sybil: A Validated Deep Learning Model to Predict Future Lung Cancer Risk From a Single Low-Dose Chest Computed Tomography [published online ahead of print, 2023 Jan 12]. J Clin Oncol. 2023;JCO2201345. doi:10.1200/JCO.22.01345
[6]. Ardila D, Kiraly AP, Bharadwaj S, et al. End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography [published correction appears in Nat Med. 2019 Aug;25(8):1319]. Nat Med. 2019;25(6):954-961. doi:10.1038/s41591-019-0447-x