已发表论文

基于机器学习的肺结节良恶性辅助诊断:一项回顾性研究

 

Authors Wang W, Yang B, Wu H, Che H, Tong Y , Zhang B, Liu H, Chen Y

Received 17 January 2025

Accepted for publication 14 June 2025

Published 27 June 2025 Volume 2025:18 Pages 3735—3748

DOI https://doi.org/10.2147/JMDH.S518166

Checked for plagiarism Yes

Review by Single anonymous peer review

Peer reviewer comments 2

Editor who approved publication: Dr David C. Mohr

摘要:

背景:肺癌作为全球致死率最高的恶性肿瘤之一,通常隐匿表现为肺部结节。其非特异性临床表现与异质性影像学特征阻碍了良性与恶性病变的准确鉴别,而活检的侵入性及操作限制凸显了对非侵入性早期诊断方法的迫切需求。

方法:本回顾性研究分析20112021年解放军总医院第一医学中心门诊及住院记录,聚焦CT扫描显示5-30mm且无明确恶性征象的肺部结节。以病理检查为金标准,通过对比实验对支持向量机(SVM)、随机森林(Random Forest)、XGBoost、前馈神经网络(FNN)以及注意力前馈神经网络(Atten_FNN)等模型性能进行了评估,实验采用五折交叉验证方法,对各模型的AUC值、敏感性(Sensitivity)和特异性(Specificity)进行检验。数据集按7:3划分为训练集和测试集,训练集应用分层五折交叉验证,最优模型通过SHAP解释性分析解析关键预测特征。

结果:研究纳入3,355例患者(1,156例良性,2,199例恶性)。注意力前馈神经网络模型在五折交叉验证中表现最优:AUC0.82、准确率0.75、敏感性0.77F1分数0.80SHAP解释性分析揭示核心预测因子包括人口学变量(年龄、性别、BMI)、CT特征(最大结节直径、形态学、密度、钙化、磨玻璃影)及实验室标志物(特异性神经烯醇化酶、癌胚抗原)。

结论:本研究整合电子病历与病理数据,利用机器学习/深度学习模型预测肺结节恶性风险。基于SHAP解释性分析的可解释性分析揭示了关键临床决定因素。鉴于跨中心泛化性局限,研究提议开发结合CT影像与影像组学的多模态诊断系统,并通过多中心前瞻性队列进行验证,以推动临床实践。该框架为肺癌的早期精准诊断建立了新范式。

关键词  肺部结节;良性;恶性;机器学习;危险因素