撰文丨王聪
编辑丨王多鱼
排版丨水成文
20 年后,你会患上哪些疾病?这个看似无法回答的问题如今可能有了答案——
一款名为Delphi-2M的 AI 大模型能够通过分析一个人的医疗记录和生活方式,为超过 1000 种疾病提供风险评估,甚至能够提前数十年做出精准预测。
这项研究于 2025 年 9 月 17 日 发表在了国际顶尖学术期刊Nature上,论文题为:Learning the natural history of human disease with generative transformers,研究团队来自德国癌症研究中心(DKFZ)、欧洲分子生物学实验室欧洲生物信息学研究所(EMBL-EBI)、哥本哈根大学。
该研究开发了一款名为Delphi-2M的 AI 大模型,具有令人惊叹的一次性模拟和预测多种疾病的能力,利用健康记录和生活方式因素来预测一个人在未来 20 年内患上癌症、皮肤病、免疫疾病等多达 1258 种疾病的可能性,从而生成完整的未来健康轨迹,帮助医生和健康规划者更好地理解和应对个性化健康需求。
许多人在一生中会患上不止一次疾病,也不止一种疾病,但预测不同疾病(例如心血管疾病与癌症)如何互相影响,一直是个难题。医疗决策日益依赖于根据病史预测个体健康演变趋势。人工智能(AI)通过分析患者记录的大数据集,为识别疾病进展模式提供了强大工具。但这些模型的全部潜力仍未得到充分发掘,尤其在人群规模上。
实际上,研究人员已经开发出了多种基于人工智能(AI)的工具,用于预测一个人患上某些疾病的风险,包括某些癌症以及心血管疾病等。但这些 AI 工具中的大多数只能评估一种疾病的风险,这意味着医疗保健专业人员必须运行数十种工具才能给出全面的答案。
为了解决这个问题,研究团队对一种基于生成式预训练 Transformer(GPT)的大语言模型(LLM)进行了修改,这是诸如 ChatGPT 等 AI 聊天机器人的基础。当被提问时,GPT 会根据其在海量数据上的训练,提供统计学上可能的答案。
研究团队设计了改进后的大语言模型——Delphi-2M,利用来自英国生物样本库(UK Biobank)的40 万名参与者的长期生物医学监测数据对该模型进行了训练,从而实现根据个人过往病史预测其将来患1258 种疾病的可能性。该模型还纳入了个人的年龄、性别、体重指数以及与健康相关习惯(例如吸烟和饮酒情况)。
Delphi 是一种改进的 GPT 架构,对健康轨迹进行建模
对于大多数疾病(包括痴呆症、心血管疾病以及死亡风险等等),Delphi-2M 的预测结果与当前用于评估单一疾病发病风险的模型的准确性相当,甚至更高。Delphi-2M 的表现也优于利用生物标志物来预测多种疾病风险的机器学习算法。研究团队表示,Delphi-2M 的预测效果好得令人惊讶。
Delphi-2M 可以精确地模拟各种疾病的发病率
Delphi-2M 在预测某些类型癌症等遵循可预测发展规律的疾病轨迹时,效果最佳。其根据个人医疗记录中的信息,计算出一个人在未来长达二十年的时间段内患上每种疾病的概率。
研究团队在丹麦国家患者登记处的 190 万份健康数据上对 Delphi-2M 进行了测试,这是一个全国性的数据库,记录了近半个世纪以来的患者住院情况。研究团队发现,Delphi-2M 对该数据库中记录的患者的预测结果仅略逊于其对训练数据集英国生物样本库(UK Biobank)参与者的预测结果。这表明,Delphi-2M 在应用于其训练数据集以外的其他国家卫生系统数据集时,仍能做出相对可靠的预测。
Delphi-2M 是对同时建模多种疾病这一新兴领域的一项“引人入胜”的贡献,但它目前还有一些局限性,例如,其训练所使用的英国生物样本库中的数据,仅记录了参与者首次患病的情况,而一个人患病的次数对于其健康轨迹的建模非常重要。研究团队表示,将进一步使用来自多个国家的数据集评估 Delphi-2M 的预测准确性,以扩大其应用范围。
论文链接:
https://www.nature.com/articles/s41586-025-09529-3
https://www.nature.com/articles/d41586-025-02993-x
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.