已发表论文

基于大样本数据分析的一种新型肝细胞癌生存风险评估模型构建和应用

 

Authors Zheng YJ, Liu YL, Zhao SF, Zheng ZT, Shen CY, An L, Yuan YL

Received 25 July 2018

Accepted for publication 25 October 2018

Published 21 November 2018 Volume 2018:10 Pages 6079—6096

DOI https://doi.org/10.2147/CMAR.S181396

Checked for plagiarism Yes

Review by Single-blind

Peer reviewers approved by Dr Justinn Cochran

Peer reviewer comments 2

Editor who approved publication: Dr Ahmet Emre Eskazan

背景:肝细胞癌(HCC)是一种高死亡率的原发性肝癌,发病率在世界范围内逐年增加,而目前缺少有效的诊断方法和预后生物标志物。
材料和方法:从 GEO 数据库收集 149 对 HCC 组织的基因表达谱及相关临床数据,进而筛选 HCC 和配对癌旁正常组织之间的差异表达基因(DEGs),并对 DEGs 使用 GOKEGG 进行通路富集和 PPI 网络分析。接下来,利用 TCGA 数据库对 DEGs 进行单因素分析和 Cox 比例风险回归分析并构建 HCC 生存风险评估模型,并利用 GSE14520 数据库验证该模型。我们进一步通过 TCGAGEO 和 qPCR 对风险模型中的关键分子 mRNA 表达进行了检测,并使用免疫组化证实了它们蛋白水平的表达。同时,我们利用 TCGA 数据库初步探究了这些基因表达与 DNA 甲基化状态的关系。
结果:从三个 GEO 数据集中筛选得到了 98 个 DEGs,其中有 13 个上调基因和 85 个下调基因; GO 和 KEGG 注释通路分析表明 DEGs 具有重要生物学特征; PPI 网络分析表明 DEGs 之间关系密切,该网络包括了 64 个节点和 115 个边缘。我们利用 TCGA 数据库对 DEGs 分析并成功建立了基于 个基因(SPINK1 TXNRD1 LCAT  和 PZP )表达的 HCC 生存风险评估模型,同时在 GSE14520 中得到了很好的验证。TCGAGEO 和临床样本检测均证实这 个基因在 HCC 中具有一致的差异表达。TCGA 数据分析进一步提示,这 个基因的表达可能与 DNA 甲基化调控密切相关。
结论:本研究首次基于配对大样本数据分析构建了一种新型肝细胞癌生存风险评估模型,用于预测 HCC 的预后。风险模型中的 个生物标志物分析不仅能提示 HCC 发展的分子机制,更为肝癌的治疗策略提供新的思路。
关键词:肝细胞癌,GEOTCGA,生物标志物,差异表达基因




Figure 7 The expression of SPINK1, TXNRD1, LCAT, and PZP in gene and protein levels.