
在生命科学领域,高通量测序技术产生了海量的转录组、蛋白质组、磷酸化蛋白质组等组学数据,描绘着细胞内在的分子全景。然而,如何从这数以 TB计的数据中,精准识别出关键的调控 因子 并理解其背后的生物学机制,一直是科学家们面临的巨大挑战。传统的差异表达、富集分析等方法往往止步于统计显著性,难以深入揭示其生物学功能。这一困境,如今有望被一种融合了前沿人工智能技术的新方法打破。
2025年1月8 日,华中科技大学薛宇教授团队在NatureBiomedical Engineering杂志上发表了题为A deep learning and large language hybrid workflow for omics interpretation的研究论文。 该研究开发了一种名为“蓝猫(LyMOI)”的革命性混合工作流,它将深度学习的精准预测能力与大语言模型的常识推理能力相结合,首次为大规模组学数据的机制性解读提供了一个高效、智能且具备“生物学家思维”的解决方案。
![]()
“蓝猫”:为组学数据装上“AI大脑”
典型的组学数据解读需要科学家们从海量分子中筛选出候选目标分子,并基于大量文献阅读,梳理它们之间的相互作用关系,最终形成一套完整的机制性解释。这是一个耗时耗力的过程。“蓝猫” 工作流的创新之处在于,它巧妙地将这一过程自动化、智能化。
该工作流的核心是一个“双核引擎”:
大型图模型:研究团队 整合了涵盖 562个真核物种、涉及超过109万个蛋白质的近1.88亿个相互作用数据,构建了一个超大规模的知识图谱 。 随后,利用先进的图卷积网络技术对该图谱进行预训练和 逐层微调 ,使其能够从复杂的分子网络中学习并预测在特定生物情境下起关键作用的 调控 因子。
大语言模型:研究团队通过创新的“提示 词 工程”,引导GPT-3.5生成了数万个高质量的生物学知识对。在此基础上, “蓝猫” 能够 针对 大型图模型 预测出的关键分子, 自动生成“机器思维链”,像一位博学的生物学家一样,推理并阐述这些分子在生物系统中扮演的具体角色和作用机制。
以自噬为例:验证“蓝猫”的强大效能
为了验证“蓝猫” 的效能,研究团队以细胞自噬——这一与多种疾病相关的关键细胞过程 —— 作为模型系统。他们收集并处理了1.3 TB的、涵盖人类、小鼠、大鼠和酵母四种生物体的自噬相关多组学数据。 结果显示,与传统差异表达分析平均仅能覆盖 4.1%的已知自噬调控基因相比, “蓝猫” 的预测将这一比例显著提升至30.9%,极大地提升了组学数据挖掘的生物学相关性。通过“蓝猫”的指导,研究团队成功在酵母中发现Gin4、Elm1、Rvs167和Ste50共4个蛋白激酶是新的潜在自噬调控因子,并揭示其调控自噬的分子机制。
从虚拟到现实:发现抗癌治疗新靶点与新策略
更具转化医学价值的是,“蓝猫” 成功地将目光投向了癌症治疗。它推理出两种人类癌蛋白——CTSL和FAM98A,是抗肿瘤药物双硫仑 (DSF) 触发保护性自噬所必需的关键因子。后续的细胞实验证实,沉默这两个基因能有效减弱 DSF 介导的自噬,并抑制癌细胞的增殖。 最令人振奋的发现来自于动物实验:将 DSF与Z-FY-CHO(一种先前用于预防SARS-CoV-2感染的CTSL特异性抑制剂)联合使用,在体内实验中表现出远超预期的肿瘤生长抑制效果。这为 DSF 的临床应用,以及针对CTSL的癌症联合疗法,开辟了全新的道路。
综上所述,薛宇教授团队开发的“蓝猫”工作流,不仅是一个强大的组学数据解读工具,更代表了一种AI与人类专家协同探索生命奥秘的新范式。它通过赋予机器“常识”与“推理”能力,加速了我们从海量数据到生物学机制,再到潜在治疗策略的转化进程,有望为未来生物医学研究带来颠覆性的变革。
![]()
图1 . 实验流程 。 首先,通过零样本提示词策略驱动大语言模型解读了四种真核生物的全基因组基因与自噬的潜在关联。随后,将大语言模型产生 的合成数据集 与THANATOS收录的自噬调控因子数据集相结合,作为标签数据用于大型图模型的训练。该图模型基于涵盖 562 种真核生物的 109 万余 个蛋白质 及其 1.9亿 条 相互作用或互作同源物 构建而成。接着,通过对收集的1 .3 TB自噬相关多组学数据进行归一化处理和特征编码,成功构建了“蓝猫( LyMOI )”的深度学习预测模块。该模块分别在营养饥饿诱导的酵母自噬模型和双硫仑诱导的哺乳动物自噬模型中完成预测验证。思维链提示词策略驱动大语言模型推理分子调控关系构成了“蓝猫”的推理模块。最后,利用“蓝猫”的推理模块系统阐释了不同自噬诱导条件下的分子调控机制 。
华中科技大学 唐大超 、 张弛 、 张玮之 为该论文的共同第一作者 , 薛宇教授和 彭迪副 教授为该论文的通讯作者。四川大学 贾大 教授 、复旦大学杨力教授、北京理工大学刘滨教授、澳门 大学 沈汉明 教授、 华中科技大学同济医学院陈刚教授、孙朝阳教授、武汉大学崔逸仙教授、华中科技大学张珞颖教授 等也为课题提供了大力支持。
原文链接:https://www.nature.com/articles/s41551-025-01576-5
制版人: 十一
学术合作组织
(*排名不分先后)
![]()
战略合作伙伴
(*排名不分先后)
![]()
![]()
转载须知
【非原创文章】本文著作权归文章作者所有,欢迎个人转发分享,未经作者的允许禁止转载,作者拥有所有法定权利,违者必究。
BioArt
Med
Plants
人才招聘
近期直播推荐

点击主页推荐活动
关注更多最新活动!
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.