已发表论文

基于可解释性机器学习构建ADHD的潜在风险预测模型

 

Authors Zhang X, Xiao X, Luo Y, Xiao W, Cao Y, Chang Y, Wu D, Xu H, Zhao J, Deng X, Jiang Y, Xie R, Liu Y 

Received 25 January 2025

Accepted for publication 7 May 2025

Published 21 May 2025 Volume 2025:21 Pages 1075—1090

DOI https://doi.org/10.2147/NDT.S519492

Checked for plagiarism Yes

Review by Single anonymous peer review

Peer reviewer comments 2

Editor who approved publication: Dr Yu-Ping Ning

江南大学附属医院儿科刘月影教授团队等在德孚医药出版社旗下的期刊Neuropsychiatric Disease and Treatment《神经精神疾病与治疗》发表了题为“基于可解释性机器学习构建ADHD的潜在风险预测模型”的论文,下面是内容摘要:

 

背景:注意力缺陷多动障碍(ADHD)是儿童中最常见的神经发育障碍之一,主要表现为持续的注意力不集中和/或多动冲动。这些症状会在儿童的学习、生活及社会交往等多个方面造成显著影响。目前,ADHD的临床诊断主要依赖于专业医生的经验判断,缺乏客观、可靠的实验室检测手段作为辅助,容易导致漏诊或误诊。针对这一临床难题,本研究旨在运用机器学习算法,构建ADHD风险预测模型,为临床诊断提供科学、有效的辅助工具。

 

方法:本研究以江南大学附属医院儿科2022年至2024年门诊就诊的ADHD患儿的血液检测指标为基础,首先采用单因素和多因素逻辑回归分析,筛选与ADHD相关的风险因子。随后,结合9种不同的机器学习算法,对筛选出的风险因子进行分析,并构建ADHD潜在风险预测模型,同时运用SHAP方法对模型进行可解释性分析,并开发了基于该模型的Web工具。除此之外,我们还进一步采用双向孟德尔随机化方法,探究所筛选的风险因子与ADHD发病之间的潜在关联。

 结果:在9种机器学习算法中,Gradient Boosting模型表现最佳。通过递归特征消除分析,确定以8个变量作为模型的最佳特征组合。双向孟德尔随机化分析结果显示,在这8个变量中,血液维生素D含量可能与ADHD症状存在关联。
结论: 本研究成功构建了基于Gradient Boosting算法的ADHD风险预测模型。需要强调的是,该模型目前仅可用于辅助诊断,且其准确性仍需通过更多外部临床队列的验证。

关键词:注意力缺陷多动障碍;机器学习;生物标识物;SHAP