分享:
分享到微信朋友圈
X
特别关注
基于多参数MRI影像组学及临床特征的鼻咽癌远处转移可解释性机器学习预测模型
金哲 张斌 张璐 张水兴

Cite this article as: Jin Z, Zhang B, Zhang L, et al. Prediction of distant metastasis in nasopharyngeal carcinoma by interpretable machine learning model based on multiparametric MRI radiomics and clinical factors[J]. Chin J Magn Reson Imaging, 2022, 13(11): 22-29.本文引用格式:金哲, 张斌, 张璐, 等. 基于多参数MRI影像组学及临床特征的鼻咽癌远处转移可解释性机器学习预测模型[J]. 磁共振成像, 2022, 13(11): 22-29. DOI:10.12015/issn.1674-8034.2022.11.005.


[摘要] 目的 建立基于多参数MRI影像组学及临床特征的机器学习预测模型,并评价其治疗前预测鼻咽癌(nasopharyngeal carcinoma, NPC)远处转移风险的效能及临床应用价值。材料与方法 回顾性分析2010年6月至2017年9月来自三家医院的1393例经病理证实的NPC患者的临床资料及MRI图像(训练队列1049例、外部验证队列344例)。用ITK-SNAP勾画感兴趣区并用Pyradiomics包逐层提取特征。使用相关性分析、单因素分析和递归特征消除法筛选特征,最后通过梯度提升机(Gradient Boosting Machine, GBM)算法构建模型。通过受试者工作特征(receiver operating characteristic, ROC)曲线比较模型的预测效能,以及决策曲线分析评估临床实用性。利用SHAP(SHapley Additive exPlanation)算法赋予最佳预测模型可解释性。结果 经筛选后最终保留10个影像组学特征。基于影像组学特征、临床特征、影像组学+临床特征三种特征组合构建了GBM_R、GBM_C和GBM_RC模型。三者在训练集上的ROC曲线下面积(area under the curve, AUC)值分别为0.938、0.724和0.938;GBM_RC(命名为NPC-Wise)在外部验证集中取得了最高的AUC值,为0.775。N分期是NPC-Wise预测过程中最重要的特征。SHAP模型预测力图能直观可视化特征影响NPC-Wise预测远处转移风险的过程。结论 基于多参数MRI影像组学及临床特征的可解释性机器学习预测模型NPC-Wise在预测NPC远处转移风险方面具有较高效能,SHAP算法为其提供了个体水平的可解释性,能为个性化治疗提供有价值的决策依据。
[Abstract] Objective To establish a machine learning prediction model based on multi-parametric MRI features and clinical variables, and evaluate its efficacy in predicting distant metastasis in nasopharyngeal carcinoma (NPC) before treatment.Materials and Methods MRI images of 1393 patients with pathologically confirmed NPC from three hospitals (1049 in the training cohort and 344 in the external validation cohort) from June 2010 to September 2017 were retrospectively analyzed. We used ITK-SNAP and Pyradiomics to delineate regions of interest and extract radiomic features, respectively. Features were selected using correlation analysis, univariate analysis and recursive feature elimination (RFE) method. The gradient boosting machine (GBM) algorithm was utilized to construct models. Receiver operating characteristic (ROC) curve and area under the curve (AUC) were used to compare the predictive efficacy of the models, and decision curve analysis (DCA) was used to assess the clinical utility. The SHapley Additive exPlanation (SHAP) algorithm was used to attribute interpretability to the optimal prediction model.Results Ten radiomic features were finally selected. GBM_R, GBM_C and GBM_RC models were constructed based on the three features combination: radiomic features, clinical variables, and radiomic features + clinical variables. The AUC values of the them on the training set were 0.938, 0.724, and 0.938, respectively. GBM_RC (hereafter, NPC-Wise) achieved the highest AUC value of 0.775 in the external validation set. The SHAP force plot provided a visualization of the direction and degree of influence of each feature on the predicting results of the model.Conclusions The interpretable machine learning prediction model NPC-Wise, based on multi-parametric MRI radiomic features and clinical variables, showed good performance in predicting the risk of distant metastasis in NPC, as well as providing individual-level interpretability with the SHAP algorithm, which can provide a valuable decision basis for personalized treatment.
[关键词] 鼻咽癌;远处转移;影像组学;梯度提升机;可解释性;磁共振成像
[Keywords] nasopharyngeal carcinoma;distant metastasis;radiomics;Gradient Boosting Machine;interpretability;magnetic resonance imaging

金哲    张斌    张璐    张水兴 *  

暨南大学附属第一医院医学影像科,广州 510627

张水兴,E-mail:zsx7515@jnu.edu.cn

作者利益冲突声明:全体作者均声明无利益冲突。


基金项目: 国家自然科学基金 81871323
收稿日期:2022-08-02
接受日期:2022-11-14
中图分类号:R445.2  R739.63 
文献标识码:A
DOI: 10.12015/issn.1674-8034.2022.11.005
本文引用格式:金哲, 张斌, 张璐, 等. 基于多参数MRI影像组学及临床特征的鼻咽癌远处转移可解释性机器学习预测模型[J]. 磁共振成像, 2022, 13(11): 22-29. DOI:10.12015/issn.1674-8034.2022.11.005.

       鼻咽癌(nasopharyngeal carcinoma, NPC)是起源于鼻咽上皮的恶性肿瘤,在中国南方、东南亚以及非洲地区高发,广东省是高发地区之一[1, 2, 3]。近年来随着调强放疗技术提升和免疫靶向药物的综合应用,其5年总生存率提高到67%~77%,然而约30% NPC患者在根治性放化疗后发生治疗失败,其主要原因归咎于远处转移[4, 5]。因此,远处转移风险与患者预后及治疗策略密切相关,在治疗前评估NPC远处转移风险具有重要意义。影像组学近年来发展迅速,其以高通量方式提取医学图像中的定量特征,结合机器学习算法能定量分析肉眼无法捕捉的肿瘤异质性信息[6, 7, 8]。目前基于MRI的影像组学技术已被广泛用于恶性肿瘤的早期诊断、基因表达和预后预测等[9]。同时,血浆爱泼斯坦-巴尔病毒脱氧核糖核酸(Epstein-Barr virus deoxyribo nucleic acid, EBV-DNA)结合TNM分期也被证明可以进一步提高对NPC患者预后的预测效能[10, 11]。然而,现有的NPC远处转移风险评估模型缺乏必要的可解释性,无法得知模型的诊断依据和推理过程,因而在以循证医学为基础的现代医疗系统中迟迟未能得到推广。为此,本研究旨在开发和验证一种基于NPC MRI图像提取影像组学特征,结合血浆EBV-DNA、TNM分期等临床预后因素的NPC远处转移风险预测模型。

1 材料与方法

1.1 一般资料

       本多中心回顾性队列研究遵守《赫尔辛基宣言》,获得暨南大学附属第一医院医学伦理委员会批准并免除受试者知情同意,批准文号:KYk-2022-018。2010年6月至2017年9月来自三家医院的1393例经病理证实的NPC患者被纳入本研究,中心1的1049例患者被作为训练队列,中心2(n=188)及中心3(n=156)共344例患者被作为外部验证队列。纳入标准:(1)组织病理确诊的初诊NPC患者;(2)肿瘤TNM分期为Ⅱ-Ⅳb期;(3)治疗前接受增强MRI检查且检查前未接受其他抗肿瘤治疗;(4)接受完整疗程的同步放化疗或诱导化疗+同步放化疗治疗。排除标准:(1)肿瘤TNM分期Ⅰ期及首诊即发生远处转移的患者;(2)合并其他恶性肿瘤;(3)治疗前MRI缺失或者序列不全或图像伪影重;(4)失访。第8版美国癌症联合委员会/国际抗癌联盟(American Joint Committee on Cancer/Union for International Cancer Control, AJCC/UICC)分期系统评估被用于患者的分期评估[12]。患者的年龄、性别、WHO组织学类型、T分期、N分期、TNM分期和EBV-DNA水平等信息被收集作为临床特征。

1.2 MRI检查方法

       患者治疗前接受头颈部MRI增强检查,采用头颈联合线圈扫描,扫描范围从鞍上池至锁骨的胸骨端下缘。中心1采用的MRI机型包括3.0 T(Discovery MR750, GE, USA)和1.5 T(Achieva, Philips, Netherlands);中心2采用的MRI机型包括3.0 T(Skyra, Simens, Germany;Mangnetom Verio, Siemens, Germany)和1.5 T(Symphony, Simens, Germany);中心3采用的MRI机型为1.5 T(Optima MR360, GE, USA)。扫描序列包括T1WI、T1WI压脂增强(CE-T1WI-FS)、T2WI序列,具体扫描参数见表1。所采用的增强对比剂为Gd-DTPA(0.2 mmol/kg,2.5 mL/s)。

表1  MRI扫描机型及参数
Tab. 1  MRI scan machines and parameters

1.3 随访及临床终点

       中心1纳入患者由确诊时间随访至2021年1月20日,中心2纳入患者由确诊时间随访至2020年12月31日,中心3纳入患者由确诊时间随访至2021年1月29日。随访内容包括:头颈部MRI、胸腹部影像学检查、鼻咽镜、血常规、肝肾功能及血浆EBV-DNA。随访策略:前3年间隔3~6月进行随访,第3~5年间隔6~12月进行随访,5年以上每12月进行一次随访。

1.4 肿瘤感兴趣区勾画

       6名具有5~10年头颈部MRI诊断经验的影像科医生在3.6版本ITK-SNAP软件(www.itksnap.org)中,对患者3个序列的MRI图像沿肿瘤边缘逐层进行感兴趣区(region of interest, ROI)勾画,并由高年资医生进行核对,如不合格则重新勾画(图1)。所有图像中的注释信息在勾画前已被全部移除,所有勾画医生在勾画全程不知患者临床信息、治疗方式、临床结局及病理资料。勾画结果以原始图(nii)和感兴趣区(nrrd)格式保存。

图1  使用ITK-SNAP在T1WI轴位上手动逐层勾画感兴趣区示意图。1A~1C:每一层面感兴趣区;1D:全肿瘤感兴趣区。
Fig. 1  Schematic diagram of manually delineating the region of interest on the T1WI axial images using ITK-SNAP. 1A-1C: Region of interest (ROI) for each slice; 1D: ROI for the 3D volume of the whole tumor.

1.5 MRI图像预处理及影像组学特征提取

       对分割后的图像进行了偏置场校正处理,以消除磁场不均匀对信号强度的影响;并进行灰度值归一化处理,以减少不同机型及扫描参数对影像组学特征的影响。采用Python(version 3.7.6)的影像组学特征提取包PyRadiomics逐层提取MRI图像的影像组学特征。从原始图像、LOG滤波图像(滤波大小2 mm、4 mm、6 mm)和小波滤波图像(binWidth=10)中,按geometryTolerance=0.0001,binWidth=25,interpolator='sitkBSpline',resampledPixelSpacing=[1,1,1]的参数设置进行特征提取。最终获得1130个3D影像组学特征,类型包括:(1)形状特征(n=14);(2)直方图特征(n=72);(3)矩阵特征(n=300):灰度共生矩阵(n=96),灰度游程矩阵(n=64),灰度区域大小矩阵(n=64),邻像素灰度差分矩阵(n=20),灰度依赖性矩阵(n=56);(4)小波特征(n=744)。

1.6 特征选择及远处转移预测模型构建

       特征选择前对影像组学特征矩阵进行了归一化处理,消除单位差异和尺度差异影响。首先采用Pearson相关性分析,将相关系数>0.95的一对影像组学特征中随机删除一个,以降低模型过拟合风险。随后采用基于随机森林的递归特征消除(recursive feature elimination, RFE)法,对T1WI、T2WI及CE-T1WI-FS序列的所有特征进行筛选。临床变量使用单因素分析筛选,连续变量采用独立样本t检验,分类变量采用卡方检验,P值≥0.1的变量被排除。

       基于筛选出的影像组学特征集、临床特征集以及影像组学特征+临床特征集,采用十折交叉验证法在训练集数据上,分别构建梯度提升机(Gradient Boosting Machine, GBM)机器学习分类器。并在外部验证集上对3个模型预测NPC患者远处转移风险的性能进行评估。本研究通过绘制受试者工作特征(receiver operating characteristic, ROC)曲线,并计算ROC曲线下面积(area under the curve, AUC)对模型的远处转移预测性能进行定量化评估;同时采用决策曲线分析(decision curve analysis, DCA)比较预测模型的临床应用价值。

1.7 机器学习模型的可解释性

       采用基于合作博弈论开发的SHAP(SHapley Additive exPlanation)算法分析特征贡献度,从而对最佳预测模型进行局部和全局的解释。其原理为:逐一剔除每个特征取值,计算模型的准确度和预测恶性率的变化,来评估特征的Shapley值和对预测结果的影响方向[13]。本研究根据Shapley值对特征进行重要性排序[14],同时引入了SHAP模型预测力图对外部验证集中两个代表性病例的远处转移风险预测依据和推理过程进行个体水平解释[15]

1.8 统计学分析

       使用Python的Scikit-learn(version 0.24.1)模块和H2O.ai.(version 3.30.0.6)模块进行特征筛选及机器学习模型构建。使用R语言4.0.3(http://www.Rproject.org)对模型预测性能进行分析。使用R包“pROC”计算模型的AUC值、敏感度、特异度和准确率,95% CI通过1000次自助法获得。使用Delong检验对模型的AUC值进行两两比较。利用最大Youden指数确定模型的最佳截止值。双尾P值<0.05为差异具有统计学意义。

2 结果

2.1 患者临床资料及随访

       本研究共纳入1393例NPC患者,其中来自中心1的1049例样本被作为训练集,来自中心2的188例样本及来自中心3的156例样本被整合为外部验证集。截止随访终点,研究队列中发生远处转移者133例(9.5%),未发生远处转移者1260例(90.5%)。训练集与外部验证集间除年龄、性别差异无统计学意义(P=0.313,P=0.050)外,其余临床资料,如WHO病理组织学类型、T分期、N分期、TNM分期及EBV-DNA水平等差异均具有统计学意义(P均<0.05)(表2)。

表2  训练集与外部验证集患者临床资料
Tab. 2  Clinical data of patients in training set and external validation set

2.2 临床及影像组学特征筛选

       以P值<0.1为阈值,单因素分析最终筛选出性别、T分期、N分期、TNM分期和EBV-DNA水平共5个临床特征用于远处转移风险模型构建(表3)。

       经过Pearson相关分析初步筛选后,1130个T1WI序列特征中去除了680个高度相关特征,剩余450个特征经过递归特征消除RFE算法筛选后得到2个重要特征;CE-T1WI-FS序列特征中去除了656个高度相关特征,剩余474个特征经过RFE算法筛选后得到3个重要特征;T2WI序列特征中去除了687个高度相关特征,剩余443个特征经过RFE算法筛选后得到5个重要特征。最终用于模型构建的影像组学特征共10个:T2WI重要特征最多,主要为LOG滤波图像的一阶统计特征以及小波滤波图像的纹理特征,包括灰度共生矩阵、灰度依赖矩阵、灰度游程矩阵、灰度大小区域矩阵;CE-T1WI-FS重要特征为原始图像的一阶统计特征、小波滤波图像的一阶统计特征和灰度依赖矩阵;T1WI重要特征主要为LOG滤波图像和小波滤波图像的一阶统计特征(表4)。

表3  临床变量单因素分析结果
Tab. 3  Univariate analysis results of clinical variables
表4  RFE筛选获得的影像组学特征及其建模映射表
Tab. 4  The radiomics features obtained by RFE algorithm and their modeling mapping names

2.3 NPC远处转移预测模型构建及比较

       本研究基于筛选出的影像组学特征集、临床特征集和影像组学+临床特征集,采用GBM机器学习算法分别构建了3种治疗前预测NPC远处转移机器学习模型。所有用于构建模型的特征之间经Pearson检验证实不存在显著共线性(P>0.75)(图2)。

       训练集中ROC曲线分析结果显示:影像组学+临床特征融合模型(GBM_RC)与影像组学模型(GBM_R)取得了同样最高的AUC值(0.938,95% CI:0.922~0.952),均高于临床模型(GBM_C)(0.724,95% CI:0.696~0.751),差异均具有统计学意义(P<0.001)(图3)。GBM_RC预测NPC远处转移的敏感度为84.3%(95% CI:75.8%~90.8%),特异度为83.7%(95% CI:81.2%~86.0%),准确率为84.3%。GBM_R预测NPC远处转移的敏感度为85.3%(95% CI:76.9%~91.5%),特异度为85.1%(95% CI:82.7%~87.3%),准确率为85.3%。

       在外部验证集上,GBM_RC的AUC最高(0.775,95% CI:0.727~0.818),其次为GBM_R(0.706,95% CI:0.655~0.754)(P=0.125);GBM_RC的AUC同样高于GBM_C(0.651,95% CI:0.598~0.702),差异均有统计学意义(P<0.05)(图3)。GBM_RC的敏感度(77.4%,95% CI:58.9%~90.4%)、特异度(70.3%,95% CI:64.9%~75.3%)和准确率(76.8%)均为最高。GBM_C的敏感度(54.8%,95% CI:36.0%~72.7%)、特异度(59.1%,95% CI:53.4%~64.6%)和准确率(55.2%)均为最低。3种机器学习模型预测NPC远处转移的性能对比见表5,AUC值差异统计结果见表6

       DCA曲线显示,当风险阈值在0.4~0.9(训练组)、0.1~0.3(验证组)范围内,融合模型GBM_RC比单纯影像组学模型GBM_R和单纯临床模型GBM_C的人群净获益更高(图4)。

图2  建模所用影像组学及临床特征Pearson相关性分析热图。特征建模名称与特征全称映射见表4。
Fig. 2  Heat map of Pearson correlation analysis of radiomics features and clinical features used for modeling. The mapping of feature modeling names and feature full names are shown in Table 4.
图3  机器学习模型预测鼻咽癌远处转移的受试者工作特征曲线。3A为训练集;3B为外部验证集。GBM_RC:影像组学+临床特征融合模型;GBM_R:影像组学模型;GBM_C:临床特征融合模型;AUC:曲线下面积。
Fig. 3  Receiver operating characteristic (ROC) curves of machine learning models for predicting distant metastasis of nasopharyngeal carcinoma. 3A: training set; 3B: external validation set. GBM_R, GBM_C and GBM_RC are radiomic features model, clinical variables model and radiomic features+clinical variables model respectively; AUC: area under the curve.
图4  机器学习模型预测鼻咽癌远处转移的DCA曲线。4A为训练集;4B为外部验证集。纵轴为净获益率,横轴为概率阈值。DCA:决策曲线分析;GBM_RC:影像组学+临床特征融合模型;GBM_R:影像组学模型;GBM_C:临床特征融合模型。
Fig. 4  DCA curves of machine learning models for predicting distant metastasis of nasopharyngeal carcinoma. 4A: training set; 4B: external validation set. The vertical axis is the net benefit rate and the horizontal axis is the probability threshold. DCA: decision curve analysis; GBM_R, GBM_C and GBM_RC are radiomic features model, clinical variables model and radiomic features+clinical variables model respectively.
表5  机器学习模型预测鼻咽癌远处转移的性能对比表
Tab. 5  Comparison of the performance of machine learning models for predicting distant metastasis of nasopharyngeal carcinoma
表6  机器学习模型的AUC值对比表
Tab. 6  Comparison of AUC values of machine learning models

2.4 融合模型的可解释性

       GBM_RC在外部验证集均取得了最佳的NPC远处转移风险预测性能,因此本研究将其与SHAP算法结合,从而赋予其全局和局部水平的可解释性,并命名为NPC-Wise。SHAP特征重要性排序图显示N分期是NPC-Wise模型在诊断过程中最重要的特征,其次是9个影像组学特征(图5)。为体现NPC-Wise模型的个体化可解释性预测效能,图6展示了两个同为男性、TNM分期Ⅳa级、WHO病理组织学分类Ⅲ型患者的SHAP模型预测力图,在个体水平可视化了MRI影像组学和临床特征如何影响NPC-Wise模型预测远处转移风险的过程。NPV-Wise的SHAP模型预测力图显示:患者1(图6A)的T2WI_Mean、CE-T1WI-FS_SDLGLE、T2WI_HGLRE和T2WI_LDHGLE影像组学特征产生的“正向”推力(红色)抵消了CE-T1WI-FS_Skewness和T1WI_Minimum特征产生的“反向”推力(蓝色),显著将样本的Shapley值推向高风险方向,最终SHAP算法给出的样本Shapley值高于基线值,因而NPC-Wise正确预测该患者为远处转移高风险。患者2(图6B)的T2WI_MP、CE-T1WI-FS_Skewness、T2WI_Mean和T1_Entropy影像组学特征以及N分期临床特征均显著将样本的Shapley值推向低风险方向(蓝色),最终SHAP算法给出的样本Shapley值低于基线值,因而NPC-Wise正确预测该患者为远处转移低风险。

图5  NPC-Wise的SHAP特征重要性排序图。特征建模名称与特征全称映射见表4。
Fig. 5  SHAP feature importance ranking plot of NPC-Wise. The mapping of feature modeling names and feature full names are shown in Table 4.
图6  NPC-Wise模型预测两位鼻咽癌患者远处转移风险的SHAP模型预测力图。患者1(6A)与患者2(6B)均为男性、TNM分期Ⅳa级、WHO病理组织学分类Ⅲ型的患者,随访结果显示患者1发生了远处转移而患者2未发生远处转移。SDLGLE:小依赖低灰度强调;HGLRE:高灰度行程强调;LDHGLE:大依赖高灰度强调;MP:最大概率。
Fig. 6  SHAP force plots of the NPC-Wise to predict the risk of distant metastasis in two patients with nasopharyngeal carcinoma. Patient 1 (6A) and patient 2 (6B) were both male, TNM stage Ⅳa, WHO pathological histological classification type Ⅲ, and follow-up confirmed that patient 1 had developed distant metastasis while patient 2 did not. SDLGLE: Small_Dependence_Low_Gray_Level_Emphasis;HGLRE: High_Gray_Level_Run_Emphasis; LDHGLE: Large_Dependence_High_Gray_Level_Emphasis; MP: Maximum_Probability.

3 讨论

3.1 影像组学-临床因素融合模型的价值

       本研究首次构建了融合影像组学和临床因素的可解释性机器学习模型,实现治疗前预测NPC患者远处转移风险。这项多中心回顾性研究通过整合NPC的MRI图像特征以及临床指标,构建了能在治疗前准确预测NPC远处转移风险的机器学习模型,并通过SHAP算法赋予了最佳模型可解释性,从而提供个体水平的预测依据和推理过程。在外部验证集上,影像组学+临床特征融合模型的NPC远处转移风险预测性能明显优于临床模型。

       许多研究尝试通过机器学习或深度学习方法在治疗前预测NPC患者的远处转移风险[16, 17],Zhang等[18]基于多参数MRI图像构建的影像组学模型将局部晚期NPC患者划分为高远处转移风险组和低远处转移风险组,两组间预后具有显著差异。然而该研究为单中心研究,模型的普适性并未得到验证且未对模型进行可解释性分析,这将限制模型在临床的实际应用。Peng等[19]基于18F-FDG PET/CT图像构建了影像组学模型预测局部晚期NPC患者的远处转移风险概率,该研究仅包含了85例单中心患者。在本研究中通过融合影像特征与临床特征所构建的模型在独立外部验证集中得到较好的验证(AUC:0.775,95% CI:0.727~0.818),能够为远处转移高风险患者预警,辅助临床医生制订个性化的治疗方案。

       此外,本研究不仅纳入了多参数MRI图像,还纳入了既往研究证实的与NPC预后密切相关的临床变量,研究发现T分期、N分期、TNM分期与NPC远处转移密切相关,同时,基于单纯临床变量的模型预测远处转移的效能明显低于最终融合模型,说明影像组学特征能对TNM分期等临床变量做有益补充,从而进一步提高在治疗前预测NPC患者发生远处转移风险的准确度。此发现的临床意义在于,目前NPC治疗方案仍是按照TNM分期制订,但是同一分期的患者接受同种治疗方案后预后却差异极大[20],通过融合影像组学+临床特征的预后预测模型为患者提供更加精准的分期,将有利于临床医生根据患者发生远处转移的风险制订更加激进或温和的个性化治疗方案。同时,本研究也纳入了经既往大量研究[21, 22]证实的与NPC疾病发生发展密切相关的血清EBV-DNA滴度水平,并再次验证了血清EBV-DNA水平可作为NPC的远处转移的一项重要风险因素。

3.2 可解释性机器学习模型的价值

       既往研究开发的NPC预后预测机器学习模型并没有解决人工智能模型固有的“黑盒”问题,而缺乏透明度和必要的可解释性[23, 24, 25]。医生和患者无法得知模型的推理依据,自然对其预测结果抱有怀疑,因此限制了人工智能模型在临床实践中的应用[26]。近年来,随着机器学习技术的快速迭代和影像组学领域的飞速发展,基于影像组学特征的机器学习模型的精度逐渐达到瓶颈,但模型可解释性的挑战仍未得到妥善解决[27, 28, 29, 30]。由于机器学习模型的预测过程复杂,决策依据难以量化,因此无法像逻辑回归等广义线性模型一样通过数学公式直观地理解模型的结果。有人呼吁用“不可知论”看待人工智能模型,即只关注准确度的高低而不关心模型的决策过程。然而,以循证医学为基石的当代医学仍然要求人们在涉及复杂伦理和道德问题的临床实践中谨慎决策,对于医疗人工智能系统而言,透明的决策过程仍然是有必要的[26]。通过可视化本研究所构建的NPC-Wise模型可发现,影像特征的总体贡献度明显高于临床特征,证实了在常规TNM分期中加入影像特征进行远处转移预测的必要性。同时通过特征重要性排序图我们发现N分期是最重要的特征,并且与远处转移呈正相关,这也与临床相符。

       本研究采用一种基于决策树的机器学习集成算法构建NPC原处转移风险预测模型,称为GBM[31, 32]。决策树是一种分类器,它在树的每个节点上将输入数据分为两个部分,直到所有数据被划分为单个实例。与常见的随机森林算法相似,GBM的主要思想也是将多个决策树进行组合以实现更强的分类效果。不同之处在于,随机森林采用了装袋法并联训练多个决策树模型,通过投票得出最终输出;而GBM采用了串行法螺旋迭代式训练决策树(Boosting),让新学习器通过拟合残差(真实值-原模型预测值),从而降低整体偏差[33]。因此,GBM继承了决策树易于理解的性质,可以通过基于树的形状规划方法进行解释,并且通过Boosting方法有效提高了机器学习模型的预测效能。此外,本研究通过SHAP算法赋予了最佳模型NPC-Wise全局及个体水平的可解释性。SHAP算法可用于评估特征贡献度和特征对模型的影响方向,正向的特征将预测结果推向高风险,而负向的特征则将预测结果推向低风险[34]。SHAP算法通过特征重要性排序图和SHAP模型预测力图,将NPC-Wise的诊断依据和推理过程进行了直观的可视化,帮助医生和患者从全局水平和个体水平感知机器学习这一“黑盒”,有助于提高医生和患者对NPC-Wise的理解和信任[15]

3.3 创新性

       本研究具有以下创新点:(1)从多参数MRI图像而不是单一序列中提取影像组学特征,能充分挖掘出与远处转移密切相关的肿瘤异质性信息。(2)加入临床资料和实验室检查指标建立融合模型,而不局限于单纯的影像组学模型,为无创预测NPC增殖活性提供了更加全面的信息。(3)使用SHAP算法赋予了最佳模型NPC-Wise可解释性,对其预测远处转移风险的过程进行了可视化,提高了临床真实应用的实用性。

3.4 局限性

       本研究仍存在一些局限性:(1)本研究为回顾性研究,本身存在潜在的偏倚,因此仍需要针对NPC-Wise模型开展进一步的多中心前瞻性验证。(2)本研究用于影像特征提取的MRI图像来自于不同的扫描机器。尽管不同场强、不同机型的图像对于增加模型的普适性是非常有益的,但是在归一化的过程中,仍有不少不同机型特异度的特征被筛掉。因此,在未来研究中仍需要增加对不同场强不同机型进行分层分析。

       综上所述,本研究构建的基于多参数MRI影像组学及临床特征的可解释性机器学习预测模型NPC-Wise能准确预测NPC远处转移风险,准确性及泛化性均优于单一特征模型。NPC-Wise通过SHAP算法提供了个体水平的可解释性,能为个性化治疗提供有价值的决策依据。

[1]
Sung H, Ferlay J, Siegel RL, et al. Global cancer statistics 2020: GLOBOCAN estimates of incidence and mortality worldwide for 36 cancers in 185 countries[J]. CA Cancer J Clin, 2021, 71(3): 209-249. DOI: 10.3322/caac.21660.
[2]
Ji MF, Sheng W, Cheng WM, et al. Incidence and mortality of nasopharyngeal carcinoma: interim analysis of a cluster randomized controlled screening trial (PRO-NPC-001) in Southern China[J]. Ann Oncol, 2019, 30(10): 1630-1637. DOI: 10.1093/annonc/mdz231.
[3]
Ou SI, Zell JA, Ziogas A, et al. Epidemiology of nasopharyngeal carcinoma in the United States: improved survival of Chinese patients within the keratinizing squamous cell carcinoma histology[J]. Ann Oncol, 2007, 18(1): 29-35. DOI: 10.1093/annonc/mdl320.
[4]
Chen YP, Chan ATC, Le QT, et al. Nasopharyngeal carcinoma[J]. Lancet, 2019, 394(10192): 64-80. DOI: 10.1016/S0140-6736(19)30956-0.
[5]
Wang WY, Twu CW, Chen HH, et al. Plasma EBV DNA clearance rate as a novel prognostic marker for metastatic/recurrent nasopharyngeal carcinoma[J]. Clin Cancer Res, 2010, 16(3): 1016-1024. DOI: 10.1158/1078-0432.CCR-09-2796.
[6]
Avanzo M, Stancanello J, El Naqa I. Beyond imaging: the promise of radiomics[J]. Phys Med, 2017, 38: 122-139. DOI: 10.1016/j.ejmp.2017.05.071.
[7]
Lambin P, Leijenaar RTH, Deist TM, et al. Radiomics: the bridge between medical imaging and personalized medicine[J]. Nat Rev Clin Oncol, 2017, 14(12): 749-762. DOI: 10.1038/nrclinonc.2017.141.
[8]
Gillies RJ, Kinahan PE, Hricak H. Radiomics: images are more than pictures, they are data[J]. Radiology, 2016, 278(2): 563-577. DOI: 10.1148/radiol.2015151169.
[9]
Chan AT, Grégoire V, Lefebvre JL, et al. Nasopharyngeal cancer: EHNS-ESMO-ESTRO Clinical Practice Guidelines for diagnosis, treatment and follow-up[J/OL]. Ann Oncol, 2012, 23(Suppl 7): vii83-vii85 [2022-08-01]. https://www.annalsofoncology.org/action/showPdf?pii=S0923-7534%2819%2937667-7. DOI: 10.1093/annonc/mds266.
[10]
Lin JC, Wang WY, Chen KY, et al. Quantification of plasma Epstein-Barr virus DNA in patients with advanced nasopharyngeal carcinoma[J]. N Engl J Med, 2004, 350(24): 2461-2470. DOI: 10.1056/NEJMoa032260.
[11]
Leung SF, Zee B, Ma BB, et al. Plasma Epstein-Barr viral deoxyribonucleic acid quantitation complements tumor-node-metastasis staging prognostication in nasopharyngeal carcinoma[J]. J Clin Oncol, 2006, 24(34): 5414-5418. DOI: 10.1200/JCO.2006.07.7982.
[12]
Pan JJ, Ng WT, Zong JF, et al. Proposal for the 8th edition of the AJCC/UICC staging system for nasopharyngeal cancer in the era of intensity-modulated radiotherapy[J]. Cancer, 2016, 122(4): 546-558. DOI: 10.1002/cncr.29795.
[13]
Bi Y, Xiang DX, Ge ZY, et al. An interpretable prediction model for identifying N7-methylguanosine sites based on XGBoost and SHAP[J]. Mol Ther Nucleic Acids, 2020, 22: 362-372. DOI: 10.1016/j.omtn.2020.08.022.
[14]
Tseng PY, Chen YT, Wang CH, et al. Prediction of the development of acute kidney injury following cardiac surgery by machine learning[J/OL]. Crit Care, 2020, 24(1): 478 [2022-08-01]. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7395374/pdf/13054_2020_Article_3179.pdf. DOI: 10.1186/s13054-020-03179-9.
[15]
Lundberg SM, Nair B, Vavilala MS, et al. Explainable machine-learning predictions for the prevention of hypoxaemia during surgery[J]. Nat Biomed Eng, 2018, 2(10): 749-760. DOI: 10.1038/s41551-018-0304-0.
[16]
Zhang L, Wu XJ, Liu J, et al. MRI-based deep-learning model for distant metastasis-free survival in locoregionally advanced nasopharyngeal carcinoma[J]. J Magn Reson Imaging, 2021, 53(1): 167-178. DOI: 10.1002/jmri.27308.
[17]
Wu XJ, Dong D, Zhang L, et al. Exploring the predictive value of additional peritumoral regions based on deep learning and radiomics: a multicenter study[J]. Med Phys, 2021, 48(5): 2374-2385. DOI: 10.1002/mp.14767.
[18]
Zhang L, Dong D, Li HL, et al. Development and validation of a magnetic resonance imaging-based model for the prediction of distant metastasis before initial treatment of nasopharyngeal carcinoma: a retrospective cohort study[J]. EBioMedicine, 2019, 40: 327-335. DOI: 10.1016/j.ebiom.2019.01.013.
[19]
Peng LH, Hong XT, Yuan QY, et al. Prediction of local recurrence and distant metastasis using radiomics analysis of pretreatment nasopharyngeal [18F]FDG PET/CT images[J]. Ann Nucl Med, 2021, 35(4): 458-468. DOI: 10.1007/s12149-021-01585-9.
[20]
Ren XY, Yang XJ, Cheng B, et al. HOPX hypermethylation promotes metastasis via activating SNAIL transcription in nasopharyngeal carcinoma[J/OL]. Nat Commun, 2017, 8: 14053 [2022-08-01]. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5296651/pdf/ncomms14053.pdf. DOI: 10.1038/ncomms14053.
[21]
Huang CL, Sun ZQ, Guo R, et al. Plasma Epstein-Barr virus DNA load after induction chemotherapy predicts outcome in locoregionally advanced nasopharyngeal carcinoma[J]. Int J Radiat Oncol Biol Phys, 2019, 104(2): 355-361. DOI: 10.1016/j.ijrobp.2019.01.007.
[22]
An X, Wang FH, Ding PR, et al. Plasma Epstein-Barr virus DNA level strongly predicts survival in metastatic/recurrent nasopharyngeal carcinoma treated with palliative chemotherapy[J]. Cancer, 2011, 117(16): 3750-3757. DOI: 10.1002/cncr.25932.
[23]
Peng H, Dong D, Fang MJ, et al. Prognostic value of deep learning PET/CT-based radiomics: potential role for future individual induction chemotherapy in advanced nasopharyngeal carcinoma[J]. Clin Cancer Res, 2019, 25(14): 4271-4279. DOI: 10.1158/1078-0432.CCR-18-3065.
[24]
Qiang MY, Li CF, Sun YY, et al. A prognostic predictive system based on deep learning for locoregionally advanced nasopharyngeal carcinoma[J]. J Natl Cancer Inst, 2021, 113(5): 606-615. DOI: 10.1093/jnci/djaa149.
[25]
Zhong LZ, Dong D, Fang XL, et al. A deep learning-based radiomic nomogram for prognosis and treatment decision in advanced nasopharyngeal carcinoma: a multicentre study[J/OL]. EBioMedicine, 2021, 70: 103522 [2022-08-01]. https://www.thelancet.com/action/showPdf?pii=S2352-3964%2821%2900315-7. DOI: 10.1016/j.ebiom.2021.103522.
[26]
Haibe-Kains B, Adam GA, Hosny A, et al. Transparency and reproducibility in artificial intelligence[J/OL]. Nature, 2020, 586(7829): E14-E16 [2022-08-01]. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC8144864/pdf/nihms-1699061.pdf. DOI: 10.1038/s41586-020-2766-y.
[27]
Zhang B, Tian J, Pei S, et al. Machine learning-assisted system for thyroid nodule diagnosis[J]. Thyroid, 2019, 29(6): 858-867. DOI: 10.1089/thy.2018.0380.
[28]
Park VY, Han K, Seong YK, et al. Diagnosis of thyroid nodules: performance of a deep learning convolutional neural network model vs. radiologists[J/OL]. Sci Rep, 2019, 9(1): 17843 [2022-08-08]. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6882804/pdf/41598_2019_Article_54434.pdf. DOI: 10.1038/s41598-019-54434-1.
[29]
Li XC, Zhang S, Zhang Q, et al. Diagnosis of thyroid cancer using deep convolutional neural network models applied to sonographic images: a retrospective, multicohort, diagnostic study[J]. Lancet Oncol, 2019, 20(2): 193-201. DOI: 10.1016/S1470-2045(18)30762-9.
[30]
Peng S, Liu YH, Lv WM, et al. Deep learning-based artificial intelligence model to assist thyroid nodule diagnosis and management: a multicentre diagnostic study[J/OL]. Lancet Digit Health, 2021, 3(4): e250-e259 [2022-08-01]. https://www.thelancet.com/journals/landig/article/PIIS2589-7500(21)00041-8/fulltext. DOI: 10.1016/S2589-7500(21)00041-8.
[31]
Doupe P, Faghmous J, Basu S. Machine learning for health services researchers[J]. Value Health, 2019, 22(7): 808-815. DOI: 10.1016/j.jval.2019.02.012.
[32]
Li K, Yao S, Zhang Z, et al. Efficient gradient boosting for prognostic biomarker discovery[J]. Bioinformatics, 2022, 38(6):1631-1638. DOI: 10.1093/bioinformatics/btab869.
[33]
Golden CE, Rothrock MJ, Mishra A. Comparison between random forest and gradient boosting machine methods for predicting Listeria spp. prevalence in the environment of pastured poultry farms[J]. Food Res Int, 2019, 122: 47-55. DOI: 10.1016/j.foodres.2019.03.062.
[34]
Thorsen-Meyer HC, Nielsen AB, Nielsen AP, et al. Dynamic and explainable machine learning prediction of mortality in patients in the intensive care unit: a retrospective study of high-frequency data in electronic patient records[J/OL]. Lancet Digit Health, 2020, 2(4): e179-e191 [2022-08-01]. https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30018-2/fulltext. DOI: 10.1016/S2589-7500(20)30018-2.

上一篇 泪腺磁化传递成像定量参数在甲状腺相关性眼病临床活动性分期中的价值
下一篇 基于多参数MRI影像组学联合临床影像特征预测鼻咽癌肿瘤细胞增殖活性
  
诚聘英才 | 广告合作 | 免责声明 | 版权声明
联系电话:010-67113815
京ICP备19028836号-2