已发表论文

基于中国艾滋病月发病数和死亡数的单变量建模和预测方法研究

 

Authors Yang Y, Gao X, Liang H, Yang Q

Received 2 May 2024

Accepted for publication 5 October 2024

Published 24 October 2024 Volume 2024:16 Pages 397—412

DOI https://doi.org/10.2147/HIV.S476371

Checked for plagiarism Yes

Review by Single anonymous peer review

Peer reviewer comments 2

Editor who approved publication: Prof. Dr. Olubunmi Akindele Ogunrin

目的:艾滋病对全球公共卫生造成了严重危害。本文使用五种单一模型:ARIMA、SARIMA、Prophet、BP神经网络和LSTM方法,对中国每月艾滋病发病数和死亡数进行建模和预测。我们还提出了LSTM-SARIMA组合模型,以提高预测的准确性,为艾滋病的防治提供了有力的数据支持。

研究方法:我们收集了2010年1月至2024年2月中国每月的艾滋病发病数和死亡数数据,选取2010年1月至2021年2月的数据用于建模,其余数据用于验证。在建模过程中,我们根据数据集的特征对其进行了处理。研究中的所有模型建立均使用Python3.11.6。同时,我们使用研究中构建的模型预测了2024年3月至2024年7月的每月发病数和死亡数,并使用RMSE、MAE、MAPE和SMAPE参数对预测结果进行了评估。

结果:预测死亡病例数方面,LSTM和BPNN等深度学习方法的结果优于ARIMA、SARIMA和Prophet;但在预测艾滋病发病人数时,两类方法之间的差异不大,LSTM方法的预测效果略优于其他方法。同时,各模型预测艾滋病死亡数的平均误差明显低于预测艾滋病发病数的平均误差。在预测艾滋病发病数和死亡数方面,LSTM-SARIMA方法均优于其他方法。

结论:由于艾滋病发病数和死亡数序列的不同特点,不同方法的性能也略有不同。艾滋病死亡数序列比发病数序列更平滑。LSTM-SARIMA组合模型的预测效果优于传统方法和单独的LSTM方法,这对于优化艾滋病的预测结果具有重要的现实意义。