欢迎星标 果壳硬科技
![]()
如果要选一篇论文代表 2026 年开年的科学突破,会是什么?当谷歌 DeepMind 团队的 AlphaGenome 论文摆在面前时,答案变得显而易见。
昨天 Nature 的封面,给了开年后最炸裂的一篇论文,一幅由 DNA 序列与神经网络交织构成的抽象图案,标题简洁有力:《用 AlphaGenome 推进调控性变异效应预测》,论文的通讯作者令人瞩目:Demis Hassabis——诺奖得主兼 DeepMind 创始人和 CEO,当然还有他的老搭档 Pushmeet Kohl。
这已经不是 DeepMind 团队第一次震撼科学界。六年前,他们的 AlphaFold 解决了困扰生物学 50 年的蛋白质折叠问题。这次,这个“不让人活”的团队再次挑战了生命科学的另一座高峰。
AlphaGenome 到底做了什么?简单说,它给长达 100 万字母的生命天书(DNA),配上了一台“实时编译模拟器”。输入一段包含变异的 DNA 序列,它就能“编译运行”,一口气告诉你这个变异会如何影响基因开关、产品组装甚至整个细胞车间的布局。这意味着我们终于有了一台能理解、模拟并最终编写生命底层逻辑的机器。这远不止是一个工具的升级,而是一场真正的研究范式革命。 一举攻克“不可能三角”
AlphaGenome 的厉害,在于它一举攻克了基因组预测领域的“不可能三角”:即长序列、高精度、多任务难以兼顾的困境。
过去的“望远镜”与“显微镜”:此前的工具各有短板。有的像“望远镜”(如 Enformer),能看很长的 DNA 段落(约 20 万碱基),但输出模糊,像打了马赛克(128 碱基一团)。有的像“显微镜”(如 SpliceAI),能高清看到单个碱基的效应,但视野狭窄,看不到远程调控。
但 AlphaGenome 像一个“高清广角镜”,它创新性地采用了“U-Net + Transformer”混合架构,可以理解为一种“先览全景,再察细微”的智能工作流。
U-Net 部分像一位快速扫描员,先将长达 100 万碱基的 DNA 序列进行多层概括,快速抓住“这里有个增强子,那里是启动子”的大局。
Transformer 部分则像一位深思熟虑的分析师,用注意力机制仔细推敲序列中远距离部分之间如何“隔空对话”。
最后,模型再层层还原细节,精确指出每一个特定碱基的作用。由此,远程调控与局部效应得以同时被精准捕捉。
更巧妙的是其训练策略——“知识蒸馏”。团队先训练出一群各有所长的“专家教师模型”,再训练一个统一的“学生模型”去学习所有老师的集体智慧与判断。最终,这个“学生”AlphaGenome 集百家之长于一身,且预测速度快如闪电(单次变异评估<1 秒)。
最终,它能同时输出超过 11 类、数千种具体的基因组功能预测,从基因表达量、剪接模式到染色质三维结构,提供一份前所未有的“综合体检报告”。
一场“破暗”之旅的启程
AlphaGenome 能登上《自然》封面,绝不仅仅因为技术先进。根本原因在于,它为人类开启了一场系统性地“破解生命暗物质”的旅程,从而具有范式变革的潜力。
照亮疾病的“黑箱”:论文中展示的 T 细胞白血病案例极具说服力。对于那些已知致癌但机制不明的非编码突变,AlphaGenome 不仅准确预测它们会激活致癌基因 TAL1,更揭示了具体手法——意外地创造了一个全新的“开关”(转录因子 MYB 结合位点)。这为从“知其然”到“知其所以然”提供了强大工具。
重构研发的“管线”:在药物研发,尤其是基因疗法、反义寡核苷酸药物等领域,研究人员可以先在计算机中进行海量“虚拟试验”。快速筛选出最有效的靶点,并提前预警潜在的脱靶副作用,能将临床前研究的成本和风险大幅降低。
提供统一的“框架”:此前,解读一个变异可能需要组合使用多个独立工具,过程繁琐且结论可能矛盾。AlphaGenome 提供了一个统一、协同的分析框架,使得生成可验证的、机制性的科学假说变得前所未有的高效。
《Nature》封面,正定义着一个领域未来十年研究方向的开拓性工作。它标志着计算生物学从“零散工具辅助”迈向“系统智能模拟”的关键一步。
AI for Science:生命科学之后,轮到谁?
AlphaGenome 是“AI for Science”浪潮中一面最耀眼的旗帜。这一范式的主旨,是让 AI 成为科学发现本身的引擎,而不仅仅是数据分析的工具。
DeepMind 团队的路径清晰地展示了这种“逐个击破”的模式:
AlphaFold:解决“蛋白质如何折叠”的结构生物学核心问题。
AlphaMissense:解读“蛋白质编码区的错义变异有何影响”。
AlphaGenome:破译“非编码 DNA 序列的调控语法与功能”。
每一步都攻克了上一环提供基础。蛋白质结构知识加深了对基因功能的理解,而这又反过来助力解读基因变异的影响。AI 正在生命科学的逻辑链条上,自下而上地系统性推进。
这一模式正在席卷其他科学领域:
数学:AI 协助数学家发现新的猜想与定理。
材料学:AI 高速筛选、设计具备特殊性能的新材料。
物理学:AI 用于模拟极端物理条件,甚至辅助设计核聚变装置。
这些探索的共同内核是面对高维、复杂、充满未知相互作用的系统,人类直觉和传统方法已触及边界,而 AI 能从海量数据中挖掘出超越人类经验的“隐式规律”。
从预测单一蛋白质,到解读整个基因调控网络,AI 解构生命复杂性的层次正在不断深入。AlphaGenome 不仅是一篇顶刊论文,更是一封来自未来的信息:以计算模拟和智能设计为核心的全新科学时代,已经加速到来。
论文信息
文章标题:
Advancing regulatory variant effect prediction with AlphaGenome
发布期刊:Nature
发布时间:2026年1月28日
![]()
吴欧|编辑
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.