342
浏览4.3.2 不同建模方法结果比较
PLS-DA:前两个潜在变量可解释数据方差约70.2%,分类准确率在训练集中达到85.0%,在验证集中达到82.5%。
Logistic回归:通过逐步回归筛选出4个关键蛋白,结合年龄、性别等混杂因素,模型的AUC约为0.88。
Random Forest:整合全部10个蛋白,绘制特征重要度排序,结果显示Clusterin、C3、ApoA1等为前3位重要蛋白,最终模型在交叉验证集上AUC可达0.90左右。
4.3.3 最优模型的ROC曲线分析
将Random Forest模型作为最终方案,计算ROC曲线。
AUC:0.90
敏感度:87.5%
特异度:82.5%
结果表明该模型能够较好区分早期AD患者与健康对照,为血浆蛋白质组学的临床应用提供了可行参考。
4.4 关键蛋白功能与通路分析
4.4.1 GO分析
对纳入最终模型中的关键蛋白进行GO生物学过程(BP)富集分析,结果显示这些蛋白主要涉及补体激活、脂质运输、蛋白质代谢调控及炎症应答等过程。
4.4.2 KEGG通路分析
KEGG分析提示,补体与凝血级联通路、脂质代谢相关通路及神经退行性疾病通路在这些关键蛋白网络中富集显著。结合已知文献报道,推测机体慢性炎症激活与脂质异常代谢在阿尔茨海默病早期阶段可能起到重要促进作用
6
6。
第五章 讨论与结论
5.1 主要发现与意义
本研究从血浆蛋白质组学的角度出发,利用高分辨质谱技术与多变量统计模型,识别出数个与阿尔茨海默病早期病理进程显著相关的蛋白标志物组合,并构建了具有良好预测性能的分类模型。研究结果提示,补体系统、脂质代谢及炎症通路等在AD早期阶段已经发生明显紊乱,可为临床早期诊断与预后判断提供新的思路。
与传统的脑脊液Aβ、tau蛋白等入侵性检测相比,基于血浆的无创检测更适合于大规模筛查和早期管理,如果结合机器学习模型进行风险评估,则有望在一般人群体检或社群卫生保健中实现对阿尔茨海默病的早期预警。
5.2 局限性与未来展望
样本规模和中心数有限:本研究在单中心条件下开展,样本量相对有限,需多中心、大样本进一步验证模型稳定性与普适性。
干扰因素控制:血浆蛋白组学易受年龄、合并慢病及生活方式等影响,后续研究应进一步严格纳入排除标准,或增加层次分组方法。
临床转化及成本:血浆蛋白组检测尚不具备全民筛查的经济可行性,未来可借助候选蛋白的免疫学检测试剂盒开发简便的筛查手段。
尽管存在一定挑战,随着质谱技术与大数据分析方法不断进步,基于血浆蛋白质组学与多变量统计模型的阿尔茨海默病早期诊断方案将逐渐趋于成熟,为该疾病的精准医学策略及个体化干预提供新契机。
5.3 总结
本研究证明,结合高分辨质谱的血浆蛋白质组学与多变量统计模型分析,可以在无创、简便的条件下识别早期阿尔茨海默病特征蛋白组合,并对疾病风险做出相对准确的预测。这一思路为阿尔茨海默病的早期发现与干预提供了新的研究方向,也为后续大型临床验证及新型诊断试剂的开发奠定了初步基础。