论文已发表
注册即可获取德孚的最新动态
IF 收录期刊
基于随机森林与支持向量分类的儿童肥胖与高尿酸风险预测研究
Authors Wang Y, Shi S, Wei X, Wu Y, Shi Y, Cai J
Received 1 February 2025
Accepted for publication 22 June 2025
Published 7 July 2025 Volume 2025:18 Pages 2221—2233
DOI https://doi.org/10.2147/DMSO.S519284
Checked for plagiarism Yes
Review by Single anonymous peer review
Peer reviewer comments 2
Editor who approved publication: Dr Mark D. DeBoer
摘要:
背景
儿童肥胖与高尿酸血症的双重上升趋势已成为严峻的公共卫生问题。两者通过复杂的代谢机制相互影响,并显著增加心血管代谢性疾病的远期风险。机器学习(Machine Learning, ML)为儿童人群的风险预测提供了高效建模框架。
目的
本研究旨在构建并评估两种机器学习模型——随机森林(Random Forest, RF)与支持向量分类(Support Vector Classification, SVC),通过整合临床与生化变量预测儿童肥胖与高尿酸的发生风险。
方法
本研究共纳入101名儿童,其中包括60例肥胖儿童与41例肥胖合并高尿酸血症患儿。数据预处理步骤包括递归特征消除(RFE)、基于ROSE算法的过采样处理及特征标准化。模型评估指标包括ROC曲线下面积(AUC)、精确率-召回率曲线及校准曲线。采用SHAP(Shapley Additive Explanations)方法解释模型特征贡献。
结果
两种模型均展现出优异的预测性能,AUC值达0.96。其中,SVC模型在精确率与召回率方面略优,适用于社区或学校层面的高风险儿童筛查;而RF模型校准性能更佳,适合于临床决策中个体化随访与干预规划。SHAP分析识别出肾小球滤过率(GFR)、高密度脂蛋白胆固醇(HDL-C)及载脂蛋白B(ApoB)为关键预测因子,部分变量与疾病风险呈非线性关系。
结论
RF与SVC模型可作为儿童肥胖与高尿酸早期风险预测的可靠工具,各自适用于不同临床场景。本研究结果支持早期识别与靶向干预策略的实施。未来研究将探索整合代谢组数据与集成学习方法,以进一步提升模型性能与临床适用性。
作者中文姓名(含作者贡献):
王宇航*,史爽*,魏兴华,吴彦静,史云龙,蔡晋(通讯作者)
(*共同第一作者)
团队简介:
本研究团队来自南通大学及其附属医院儿科,长期聚焦儿童肥胖、内分泌与代谢相关疾病的机制探索与精准干预。团队结合组学分析、人工智能建模与临床数据,开展以儿童肥胖、高尿酸、性发育异常等为核心的系统性研究,致力于推动现代儿科疾病的早期筛查与个体化治疗策略发展。