网易首页 > 网易号 > 正文 申请入驻

诺奖得主实验室走出的中国团队,正用世界模型重构生命分子设计

0
分享至



机器之心发布

过去几年,AI4Bio 最深入人心的突破,莫过于 Google DeepMind 开发的 AlphaFold。

它让 AI 大规模、接近实验精度地 “看见” 蛋白质结构。到了 AlphaFold 3,AI 甚至开始进一步理解蛋白、核酸、小分子、离子组成的多组分复合体。

但生命工程真正想要的,不只是看见。

而是设计。设计一个分子,让它在正确的位置、以正确的方式与目标发生作用,进而调控通路、改变病理过程,甚至重构某种生命功能。



以核糖体为例,它不仅是蛋白质、RNA 与小分子药物共同作用的分子机器,也是多种小分子药物的作用靶点。

这正是 AI 分子设计今天面对的关键断点。

过去的 AI 分子设计并非没有突破。只是很多能力仍困在 “模态孤岛” 里:蛋白设计、小分子生成与分子对接、核酸结构建模,长期各自为战。

注:这里的 “模态” 不是文本/图像/音频,而是蛋白质、小分子、核酸等生命分子的不同类别,可以看作是不同类型的 “Token”。

这不是模型数量问题,而是表征方式、训练数据和任务目标被切开之后,AI 很难在同一套框架里连续理解和设计跨模态互作。

但真实生命系统从不按这些边界运行。一个靶点场景中,多模态共存是常态。疾病机制的发生,也往往取决于分子之间如何识别、结合、调控和失衡。

既然生命问题天然跨模态,分子设计模型为什么还要被模态的边界限制?

从全模态分子设计

走向分子世界模型

“物理学里有四大基本相互作用力。在这个框架下,生物分子之间的作用,本质上都可以理解为电磁相互作用的不同阶展开。”

也就是说,蛋白、核酸、小分子这些标签,是人类为了理解生命系统而划定的分类;但在更底层的原子尺度上,分子之间遵循的是统一的物理相互作用规律。

既然底层物理统一,学习分子互作的 AI,也不该被模态标签限制。

这套极具穿透力的底层解释,来自一位 “很不单模态” 的年轻科学家。

张昊天本科阶段同时修读浙江大学物理学与药学,随后获得浙江大学医学硕士,并进入华盛顿大学计算机方向继续研究。从物理的底层规律、医学的生命表象,到计算机的建模推演,张昊天本人的学术轨迹,同时也是对 “打破边界” 最生动的注脚。

这样的交叉学科背景,让他既能从原子尺度理解分子作用,也能从模型视角重构分子设计问题。

此前,由张昊天作为一作兼共同通讯作者在临港实验室联合上海浦江实验室、华盛顿大学、哈佛大学、MIT 等科研力量共同推进的ODesign开源科研项目,定位于全球首个面向全模态的分子设计基座模型。



  • 论文地址:https://odesign1.github.io/static/pdfs/technical_report.pdf
  • 试用地址:https://odesign.lglab.ac.cn/

ODesign 试图把蛋白质、DNA、RNA、小分子与离子等多模态实体放进同一套生成框架,让 AI 学习它们之间的相互作用,并在分子整体、功能基序、提示原子三种粒度下,实现任意两类分子之间的可控设计。

在张昊天看来,该项目要证明的不是 “一个模型能多做几类任务”,而是一个更底层的问题:如果生命分子的相互作用本来就是跨模态的,那么模型也必须具备跨模态学习和生成的能力。否则,任何单一模态的建模,本质上都是在用一个被截断的世界去近似真实系统,最终只能依赖大规模筛选来弥补建模能力的不足。因此,基于研究团队在分子设计模型上的研究基础与长期积累,ODesign 尝试在这一方向上做出探索:在同一生成框架下,对蛋白质、DNA、RNA、小分子与离子等不同模态进行统一表示,使模型能够在一定程度上学习它们之间的相互作用,并支持跨模态的联合建模与设计。



ODesign 全模态生成框架示意,ODesign 将蛋白、DNA、RNA、小分子与离子纳入同一生成框架,支持不同分子类型之间的 all-to-all 设计,并可在刚性或柔性靶标条件下生成目标结合分子。来源:《ODesign: A World Model for Biomolecular Interaction Design》

支撑这一野心的,是一支 “从 2024 诺贝尔化学奖实验室走出来” 的年轻科学家团队。

2024 年,David Baker 因 “计算蛋白设计” 获诺贝尔化学奖。ODesign 项目组三位核心成员:张昊天、应可钧、王佳淇,均来自于 Baker Lab。团队同时具备前沿 AI 建模能力、计算蛋白设计训练背景和干湿闭环理解,是国内少数真正站在 AI4Science 与生命分子设计交叉处的团队。

统一表征与涌现

世界模型的雏形

理念上的跨模态,必须在工程上落地为统一表征。

ODesign 直面的第一个难题是:蛋白、小分子、核酸结构差异极大,如何让同一套模型真正 “读懂” 不同分子?

研究团队的思路,是寻找不同模态之间可以共享的 “最小化学生成单元”(MCGU)。模型不再把蛋白、小分子、核酸视为割裂对象,而是先拆解到统一的化学基元层面,再通过 Modality Token 和 Unit Token 进行表征。推理时,模型先围绕共享基元生成,再补齐不同模态特有的原子信息。



ODesign 的统一表征架构。 模型将不同分子类型的最小化学生成单元抽象为统一 token,并通过 Pairformer 学习其与目标结构之间的相互作用,再由全原子扩散模块生成满足空间约束的三维结构。

这不只是工程技巧,更是实现跨模态迁移的前提:只有在表征层打通壁垒,模型才能学到超越单一分子类型的通用互作规律,找到一种统一的 “分子语言”。

在这个基础上,ODesign 还构建了一套以结构预测为基础的生成式架构。团队先训练结构预测框架,再重构信息流和目标函数,让模型从 “预测这些分子会形成什么结构”,转向 “生成一个能按预期发生作用的新分子”。

前者是理解结构,后者是设计关系。

那么,这种统一表征是否真的带来了新能力?

目前的验证结果显示,ODesign 的价值不只是 “一个模型能做更多任务”,而是它在不同模态之间表现出了迁移能力。

在蛋白设计上,ODesign 首先证明自己能打。它在计算通量上较 RFDiffusion 提升约 10 倍,在 RFDiffusion2 的 AME 测试集上,ODesign-Flex 实现相较于RFDiffusion2 20 倍设计候选通量的提升。

更关键的验证在低数据模态——核酸。相比蛋白,核酸数据更少,成熟模型也更少。ODesign 在 RNA 单体设计上的成功率约为 RNAFrameFlow 的两倍;在训练集外的蛋白 - RNA 复合体零样本设计中,平均成功率达到 77.9%。这说明它绝非 “蛋白模型披上全模态外衣”,而是真正把蛋白场景中学到的互作规律,迁移到了 RNA、DNA 等低数据模态。



ODesign 在核酸设计任务中的跨模态迁移验证。 在 RNA / DNA 单体生成与蛋白结合 aptamer 设计中,ODesign 展现出向低数据核酸模态迁移互作规律的能力,其中 protein-binding RNA 任务体现了其零样本设计潜力。

小分子则更接近药物研发场景。ODesign 在蛋白结合小分子任务上较 SurfGen 提升超过 40 倍,并覆盖 DNA/RNA 结合小分子设计。这不再是旧任务刷分,而是触及了传统小分子模型无法处理的盲区。



ODesign 在小分子设计任务中的表现。 在蛋白、DNA、RNA 结合小分子设计中,ODesign 展现出跨靶标类型生成小分子的能力,开始覆盖传统专家模型更难处理的跨模态设计组合。

计算指标之外,最终还要看湿实验,也就是在真实生物实验体系中被检测、筛选和确认。

据张昊天介绍,ODesign 已在 8 个靶点上获得 nM 级至 pM 级亲和力的候选分子。与 RFDiffusion、BindCraft、BoltzGen、PXDesign 等方法相比,ODesign 在 protein design 上将 binding affinity 提升数倍至数百倍。这标志着 ODesign 开始真正进入生物实验体系。

统一生成、跨模态迁移与实验验证的跑通,正是 “分子世界模型雏形” 的价值所在。它证明模型终于跨过了模态边界,开始学习分子世界更底层的相互作用规律

从基座到闭环

重构科学发现的基础设施

但 ODesign 作为一个开源科研型项目,对团队而言还不是终点。作为一个原型机,它验证了统一生成与跨模态迁移的可行性,却距离一个真正的微观分子世界模型还有一段距离。除此之外,它尚未被封装成可规模化、可验证、可容错的产业工具。真正的挑战在于:如何从一个能生成分子的模型,进化为一个能参与真实药物研发全流程的系统。

为解决这个问题,张昊天决定独立出来,联合应可钧、王佳淇等志同道合的小伙伴,共同创立了英灵殿科技,并完成由五源资本领投的首轮融资

张昊天团队从技术路径出发,将这条道路拆解为三个清晰的台阶:AI4BioAI4AIAI4Phy

短期看,AI4Bio 是商业化入口,从真实生物分子设计任务切入,服务药企和科研机构。在真实药物研发里,模型不能只看结合力,还要面对毒性、渗透性、免疫原性、可合成性等多重约束。

中期看,AI4AI 指向自我迭代的科学智能框架。

今天 AI4Science 的一个现实困境是,很多模型能刷新 Benchmark,却很难真正说服客户。问题不只是结果不够好,也在于模型输出往往还是黑盒:它为什么这么设计?依据是什么?失败了该往哪里改?

AI4AI 想解决的,正是这个问题。它把非结构化文献、实验数据和模型输出整理成可导航的知识拓扑,让模型不只是给一个答案,而是能围绕假设提出、归因评估和结果优化继续推理。

再往后,则是 AI4Phy,也就是自驱动实验室。

模型生成候选,实验系统进行合成、纯化、测试,结果再回到模型里,推动下一轮设计。这个循环一旦跑起来,模型就不再只是吃历史数据,而是在真实反馈中持续校正自己。

这才是分子世界模型和普通生成模型真正拉开距离的地方。

普通生成模型可以给出候选。世界模型要理解的是:一个分子设计进入真实物理世界后,会发生什么,会失败在哪里,又该如何修正。

做到这一步,拼的就不只是模型能力,而是团队能否同时理解科学问题、实验反馈和产业流程。

这也是英灵殿团队结构值得关注的原因。张昊天横跨物理、药学、医学与计算机;CTO 应可钧拥有哈佛生物医学与计算机背景,并有斯坦福医学院和 Baker Lab 博士后经历;联合创始人王佳淇则长期从事大模型与计算生物学交叉研究。

这种交叉结构,正对应了 AI Biotech 最难的一环:模型生成出来的东西,必须被生物学问题定义,被化学规则约束,被实验体系验证,最后还要被产业流程接住。

这支从 Baker Lab 走出来的团队,也让五源资本愿意下注早期。投资人表示,团队兼具算法能力、生命科学理解、干湿闭环能力和企业家精神,是他们愿意长期陪伴的科学创业力量。

当分子之间的相互作用开始被模型统一学习、生成和验证,AI4Bio 的叙事逻辑正在发生变化。它不再只是更快地发现候选分子,而是让科学家以一种更可编程的方式提出假设、生成设计、进入实验,再用真实结果反哺模型。

AlphaFold 让 AI4Bio 的第一场革命发生在“看见结构”,而英灵殿科技想挑战的,是下一步:让 AI 不只是理解生命分子如何相互作用,而是能够模拟、设计微观世界的动态过程,最终走向对生命功能本身的模拟与重构

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
河南郑州一远嫁妻子哭诉,丈夫月薪涨至6万后频繁家暴,岳母下跪求情仍不停手,还侮辱其女儿容貌,已去世婆婆曾劝阻:现在离婚亏了

河南郑州一远嫁妻子哭诉,丈夫月薪涨至6万后频繁家暴,岳母下跪求情仍不停手,还侮辱其女儿容貌,已去世婆婆曾劝阻:现在离婚亏了

大风新闻
2026-04-28 15:13:21
特变电工:一季度归母净利润18.15亿元 同比增长13.4%

特变电工:一季度归母净利润18.15亿元 同比增长13.4%

证券时报
2026-04-29 17:04:17
太可怕了!继注射药物、热巴事件后,王阳再揭娱乐圈最脏的一面

太可怕了!继注射药物、热巴事件后,王阳再揭娱乐圈最脏的一面

橙星文娱
2026-04-17 13:19:56
所有人都说钱越来越难赚了,可2025年GDP依旧上涨5%

所有人都说钱越来越难赚了,可2025年GDP依旧上涨5%

流苏晚晴
2026-04-27 19:48:45
外资“躺平网红”用伪躺平洗脑网民,众多网民被洗脑而走向极端

外资“躺平网红”用伪躺平洗脑网民,众多网民被洗脑而走向极端

清滨酒客
2026-04-29 15:50:57
5月起殡葬新规正式试行!824号令全面落地,城乡居民都要早了解

5月起殡葬新规正式试行!824号令全面落地,城乡居民都要早了解

复转这些年
2026-04-28 11:37:16
土以要开打?埃尔多安威胁攻打以色列后,不到1天,卡茨强势出招

土以要开打?埃尔多安威胁攻打以色列后,不到1天,卡茨强势出招

老谢谈史
2026-04-14 17:08:45
正式发行!2026版人民币来了,不是新纸币,兑换办法一次说清

正式发行!2026版人民币来了,不是新纸币,兑换办法一次说清

说故事的阿袭
2026-04-29 15:31:50
特朗普:伊朗刚告知我们,他们已处于“崩溃状态”,希望美国尽快开放海峡!伊朗:已绝对控制霍尔木兹,通过须缴费、用波斯语通讯

特朗普:伊朗刚告知我们,他们已处于“崩溃状态”,希望美国尽快开放海峡!伊朗:已绝对控制霍尔木兹,通过须缴费、用波斯语通讯

每日经济新闻
2026-04-28 22:58:06
破案!没有得罪杜锋,陈家政却被弃用的原因找到,粤名嘴说出实情

破案!没有得罪杜锋,陈家政却被弃用的原因找到,粤名嘴说出实情

后仰大风车
2026-04-29 09:05:11
赵心童被不雅喊话24小时,特鲁姆普曝墨菲夺冠优势,潘晓婷坦言

赵心童被不雅喊话24小时,特鲁姆普曝墨菲夺冠优势,潘晓婷坦言

李橑在北漂
2026-04-29 16:40:08
姚高员任浙江省政府党组成员

姚高员任浙江省政府党组成员

汲古知新
2026-04-28 14:30:38
动不动就是3秒加速,你一个电车跑那么快有什么用?

动不动就是3秒加速,你一个电车跑那么快有什么用?

少数派报告Report
2026-04-29 05:14:45
朝鲜获赠德国“豹2”、美国M1A1坦克,这下朝鲜又有好东西山寨了

朝鲜获赠德国“豹2”、美国M1A1坦克,这下朝鲜又有好东西山寨了

蓝星杂谈
2026-04-27 17:33:21
WC!火箭或交易杜兰特...

WC!火箭或交易杜兰特...

技巧君侃球
2026-04-29 18:09:29
汤唯宣布怀二胎:大大的意外,很开心,家里要多匹小马驹了,都很期待

汤唯宣布怀二胎:大大的意外,很开心,家里要多匹小马驹了,都很期待

鲁中晨报
2026-04-29 18:16:06
石油巨震!阿联酋退出欧佩克,引爆金融核弹,人民币砍出致命一刀

石油巨震!阿联酋退出欧佩克,引爆金融核弹,人民币砍出致命一刀

最美的开始
2026-04-29 10:46:23
巩晓彬犀利点评,忍不住爆粗口,邱彪这次丢人丢大了

巩晓彬犀利点评,忍不住爆粗口,邱彪这次丢人丢大了

砚底沉香
2026-04-29 17:57:21
96岁奶奶街头摆摊10年还清2077万元债务,本人最新回应:这辈子没做过什么大事,只是守住了做人的底线

96岁奶奶街头摆摊10年还清2077万元债务,本人最新回应:这辈子没做过什么大事,只是守住了做人的底线

极目新闻
2026-04-28 21:45:41
突发,金价暴跌!

突发,金价暴跌!

吉刻新闻
2026-04-29 09:41:29
2026-04-29 18:51:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12890文章数 142640关注度
往期回顾 全部

科技要闻

今晨庭审纪实|马斯克当庭讲述OpenAI被偷走

头条要闻

女子被骗与"未婚"高管发生关系 得知对方年薪百万举报

头条要闻

女子被骗与"未婚"高管发生关系 得知对方年薪百万举报

体育要闻

一场九球狂欢,各路神仙批量下凡

娱乐要闻

马頔一句话,孙杨妈妈怒骂节目组2小时

财经要闻

苏州,率先进入牛市

汽车要闻

技术天花板再摸高 全能型的奕境X9首秀

态度原创

房产
时尚
手机
健康
数码

房产要闻

80亿投资!浙商总部基地+海口北站,金沙湾这是要起飞啊!

除了“薄底鞋”,今年最流行这5双鞋,怎么搭都好看!

手机要闻

同档唯一2nm旗舰!小米18标准版首发骁龙8E6芯片:2nm时代来了

干细胞治烧烫伤能用了么?

数码要闻

没人买了:NAND现货价格一个月暴跌40%!

无障碍浏览 进入关怀版