准确便捷地评估个体衰老对于识别健康风险和预防衰老相关疾病至关重要。然而,目前的衰老指标往往面临诸多挑战,例如方法论局限性、与不良后果的关联性较弱以及普适性有限。
2025年7月23日,来自清华大学等研究团队在Nature Medicine杂志发表题为“Large language model-based biological age prediction in large-scale populations”的文章。
该研究提出了一个框架,利用大型语言模型 (LLM),仅使用健康体检报告即可估算个体整体和器官特异性衰老。
值得一提的是,该模型在六个人群队列中进行验证,涵盖超过 1000 万参与者,证明了其有效性和可靠性。
为了验证 LLM 是否能够有效预测整体年龄和器官特定年龄,研究人员将 LLM 的预测结果与其它衰老指标进行了比较,包括实际年龄、虚弱指数、端粒长度、八个表观遗传年龄和四个 ML 预测年龄。
结果表明,LLM 预测的总体年龄与五种表型的关联性显著高于其他指标:足跟骨密度、牙齿、步行速度、长期疾病和虚弱指数。此外,与四种 ML 预测的总体年龄相比,LLM 预测的总体年龄与十种表型的相关性显著增强。
随后,研究人员进一步比较了8个老龄化指标在预测36种健康结果方面的一致性指数。 发现LLM 预测的总体年龄在全因死亡率、冠心病、中风、慢性阻塞性肺疾病、肾功能衰竭、关节炎和其他22种结局中显示出更优的C指数。
紧接着,研究人员比较了LLM和四种ML模型中12种衰老相关表型的总体年龄差距之间的相关性。结果显示,与ML模型相比,基于LLM的总体年龄差距与大多数表型的关联明显更强。
除了能够更好地预测不良后果的无监督衰老模型外,LLM 在衰老评估方面还具有三大优势,包括强大的通用性、能力演变和动态衰老评估。
为了验证其普适性,研究人员在NCRP、CHARLS、CFPS和CLHLS上重复了上述分析。在NCRP、CHARLS和CFPS中观察到了与主要发现相似的结果,表明LLM具有很强的普适性。然而,在CLHLS和NCRP的老年参与者中却发现了相反的结果,这意味着目前的LLM可能不太适合评估老年人的衰老情况。
最后,研究人员确定了多个与衰老相关的蛋白质组生物标志物,包括LEP、OXT、ALPP和FGF21等。
总而言之,该研究发现LLM可以利用常规健康检查报告来预测总体年龄和器官特异性年龄,并在多个队列中验证其可靠性。通过应用LLM预测的年龄和年龄差距,可以实现更精确的个体老龄化和相关健康风险建模,从而提高人群的健康效益。
参考文献:
https://www.nature.com/articles/s41591-025-03856-8
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.