网易首页 > 网易号 > 正文 申请入驻

蛋白质基座的GPT时代来了?!

0
分享至

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

蛋白质模型的GPT时刻来了!

清华大学智能产业研究院(AIR)周浩副教授课题组联合上海人工智能实验室发布了AMix-1

首次以Scaling Law、Emergent Ability、In-Context Learning和Test-time Scaling的系统化方法论来构建蛋白质基座模型。



这为通往蛋白质的通用智能构建起了新的技术范式。让停留在BERT时代、缺乏可扩展性和通用性的蛋白质基座领域实现了向GPT时代的跨越。

就像NLP领域的ChatGPT一样,AMix-1不再局限于某一种蛋白质任务,而是能举一反三、自主学习。

这个“蛋白质GPT”能自己摸索规律,看几个例子就会设计新蛋白,甚至越研究越厉害。

由AMix-1设计的蛋白质已经通过湿实验的硬核考验,最优变体蛋白质活性提升了50倍

并且,它的模型权重、代码和技术细节已全部公开,下面来看看具体细节。

四大“超能力”

  • 当语言模型涌现出通用智能时,蛋白质模型的通用智能还有多远?

在NLP领域,语言模型基座经历了从BERT到GPT的跨时代变化,涌现出了各种超出预期的通用智能,BERT时代的模型关心具体任务的提升,缺乏对可扩展性、通用性和涌现能力的系统化讨论。

而在GPT时代,系统化的讨论逐渐显现,通用智能的爆发也因此开始。

然而,在蛋白质基座领域,几乎没有贯彻这条智能涌现的路径,一系列工作同样停留在BERT时代,在“预训练+任务微调”这一范式下前行,缺乏对可扩展性、通用性和涌现能力的系统化讨论。



AMix-1是基于贝叶斯流网络(Bayesian Flow Networks, BFNs)的蛋白质基座新范式,为蛋白质基座模型实现Test-time Scaling提供了一整套系统性的技术方案:

  • Pretraining Scaling Law明确了参数、样本数和计算量如何权衡,才能最大化模型的能力。
  • Emergent Ability显示随着训练的推进,模型会涌现出对蛋白结构的“感知理解”。
  • In-Context Learning解决了功能优化中的对齐难题,让模型学会在进化语境中推理与设计。
  • Test-time Scaling让AMix-1在验证预算增加时,“越花时间越有回报”,开启基于演化的设计新方式。

实际上我们可以将其概括为AMix-1的四大“超能力”。

成长有规律,进步看得见

就像学生刷题越多、成绩提升越稳定,AMix-1有个“可预测的成长曲线”。

研究者设计了从800万到17亿参数的多尺度模型组合,利用训练FLOPs(浮点操作数)作为统一衡量指标,精确拟合、预测了模型交叉熵损失与计算量的幂律关系。



他们发现,只要增加模型参数、训练数据或计算量,AMix-1的性能(比如预测蛋白质结构的准确度)就会按规律提升。

这意味着科学家能精准规划资源,不用担心花了钱却没效果,为更大规模的蛋白质研究铺平了路。

突然开窍,看懂蛋白质的隐藏规律

AMix-1最神奇的一点是会“顿悟”。

刚开始训练时,它只懂识别蛋白质的基本序列,但随着训练深入,当loss降到某个阈值时,它会自动具备“结构感知能力”——

不用任何人教,就能自动理解蛋白质的折叠方式、空间结构。



这种能力不是渐进,而是跳变。就像从只会认字母,突然学会了读懂整篇文章的意思,这种“质变”让它能更好地把握蛋白质结构和功能的关系。

不需要微调,看例子就能“仿写”

这实际上是其In-Context Learning机制在蛋白质设计过程中的体现。

以前设计蛋白质,要针对不同任务改算法,就像做一道新题要重新学公式。

但AMix-1 会上下文学习:给它几个同类蛋白质的例子(比如一组能在高温下工作的酶),它能自动总结规律,直接设计出符合这些规律的新蛋白,不用任何额外训练。



具体来说,这种方法把一组蛋白质MSA(多序列比对)压缩成一个位置级的概率分布,作为提示输入给模型。

而模型不需要任何微调,就能根据这些例子自动推理出结构和功能规律,并生成符合意图的新蛋白。



在结构任务上(上图a-b),以常规同源蛋白甚至在近乎无同源的“孤儿蛋白”为提示,AMix-1生成在预测结构上高度一致的新蛋白;

在功能任务中(上图c-d),AMix-1在输入蛋白的酶学功能和化学反应引导的酶设计上,AMix-1能生成出功能高度一致的蛋白酶。

越琢磨越厉害,进化能力无上限

AMix-1设计了独特的测试时扩展方法EvoAMix-1,能够利用其特有的上下文学习范式,在简单可插拔的验证(包括计算模拟与湿实验评估)加持下,实现模型能力随验证预算提升的可持续扩展。

同时,AMix-1也是第一个具备了测试时扩展能力的蛋白质基础模型。

实验结果显示,EvoAMix-1在所有任务上展示出强劲的扩展能力,同时也体现其跨任务、跨目标的强大通用性。

下图展示了EvoAMix-1在六个定向进化基准中的Test-time Scaling性能。



这也就是说,给它更多验证时间和资源,它能不断优化设计结果。

比如设计酶的时候,第一次生成10个候选蛋白,测试后挑出最好的2个,再让它基于这2个继续改进,重复几次,就能得到性能远超初始版本的蛋白质。

下图展示了AMix-1在推理阶段进行进化扩展算法的工作流程。



AMix-1已经通过了湿实验的硬核考验。

研究者想优化一种叫AmeR的转录调控因子(常用于合成生物学的基因开关),让它更擅长结合DNA。

用AMix-1生成40个变体后,实验发现最优的变体蛋白质活性提升了50倍,比目前最先进的方法还提升了77%。



更关键的是,整个过程全自动化,不用科学家手动调整,完美实现了「从模型到实验」的闭环。

清华大学智能产业研究院还联合上海人工智能实验室研发了一个虚拟生物实验室



AMix-1支撑了该虚拟生物实验室的蛋白质生成与进化工作。



以前需要反复试错、耗钱耗时的蛋白质改造,现在可能像和ChatGPT聊天一样简单~

技术报告:https://arxiv.org/pdf/2507.08920
项目主页:https://gensi-thuair.github.io/AMix-1/
模型权重:https://huggingface.co/GenSI/AMix-1-1.7B
代码仓库:https://github.com/GenSI-THUAIR/AMix-1

虚拟生物实验室:https://virtualbiolab.intern-ai.org.cn/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“最帅展昭”离世,享年58岁!

“最帅展昭”离世,享年58岁!

黎兜兜
2025-11-08 21:22:56
雷军这波“自杀式公关”,暴露了小米的流量焦虑

雷军这波“自杀式公关”,暴露了小米的流量焦虑

热点菌本君
2025-11-02 15:26:23
全运会男足:上海U20 3-2新疆U20,刘诚宇、蒯纪闻破门,李新翔绝杀

全运会男足:上海U20 3-2新疆U20,刘诚宇、蒯纪闻破门,李新翔绝杀

懂球帝
2025-11-08 22:25:03
张靓颖“零透光”裙惊爆热搜,性感曲线令全场屏息,时尚女王?

张靓颖“零透光”裙惊爆热搜,性感曲线令全场屏息,时尚女王?

娱乐领航家
2025-10-28 22:00:07
鹿晗和格格打起来的瓜

鹿晗和格格打起来的瓜

热闹吃瓜大姐
2025-11-07 19:22:37
绝了!C罗 希尔顿酒店大瓜,十年后被曝恋爱快过冲刺

绝了!C罗 希尔顿酒店大瓜,十年后被曝恋爱快过冲刺

罗氏八卦
2025-11-08 11:01:50
大势已去!录音门事件再升级,向太、李安、黄百鸣的话字字珠玑

大势已去!录音门事件再升级,向太、李安、黄百鸣的话字字珠玑

阿废冷眼观察所
2025-11-06 11:21:30
福建渔民捞到3斤巨型海螺,螺中现15.6克龙珠!曾拍2200万天价!

福建渔民捞到3斤巨型海螺,螺中现15.6克龙珠!曾拍2200万天价!

狸猫之一的动物圈
2025-09-23 10:20:10
资产移交美国,岛内爆发逃兵潮,国台办给出警告,赖清德审判将至

资产移交美国,岛内爆发逃兵潮,国台办给出警告,赖清德审判将至

博览历史
2025-11-07 18:03:15
A股:刚刚,国办、财政部发布,释放两个信号,下周一将迎新拐点

A股:刚刚,国办、财政部发布,释放两个信号,下周一将迎新拐点

云鹏叙事
2025-11-08 00:00:05
神剧情:第91分钟落后,第96分钟绝平,曼联创造英超奇迹

神剧情:第91分钟落后,第96分钟绝平,曼联创造英超奇迹

足球狗说
2025-11-08 22:27:27
Wifi电话要来了,不用手机信号就能接打电话,号码显示你的手机号!

Wifi电话要来了,不用手机信号就能接打电话,号码显示你的手机号!

通信老柳
2025-11-07 17:00:03
曼联上次击败热刺还是2022年10月,当时B费破门、C罗提前退场

曼联上次击败热刺还是2022年10月,当时B费破门、C罗提前退场

懂球帝
2025-11-08 22:41:15
悲剧!一名27岁研究生被发现在实验室身亡

悲剧!一名27岁研究生被发现在实验室身亡

超级数学建模
2025-11-07 23:07:28
现实爽文!Meta裁掉的AI蛋白质团队,被扎克伯格高价买回,目标消灭所有疾病!

现实爽文!Meta裁掉的AI蛋白质团队,被扎克伯格高价买回,目标消灭所有疾病!

智药局
2025-11-08 18:08:30
艳冠群芳!北京这一夜,珠光宝气的杨幂和白鹿,全败给了42岁蒋欣

艳冠群芳!北京这一夜,珠光宝气的杨幂和白鹿,全败给了42岁蒋欣

温柔娱公子
2025-11-07 20:45:03
基耶利尼:全球对意甲联赛的兴趣正在急速下降

基耶利尼:全球对意甲联赛的兴趣正在急速下降

懂球帝
2025-11-08 11:30:48
突发特讯!中方向欧方提出严正交涉,罕见措辞引爆国际舆论

突发特讯!中方向欧方提出严正交涉,罕见措辞引爆国际舆论

在新加坡生活
2025-11-08 19:31:11
白酒立大功!医生研究发现:糖尿病喝白酒时,或有6种好处!

白酒立大功!医生研究发现:糖尿病喝白酒时,或有6种好处!

游者走天下
2025-11-07 14:29:11
“谁娶我女儿谁倒霉!”母亲吐槽女儿房间太乱,网友:啥妈啥闺女

“谁娶我女儿谁倒霉!”母亲吐槽女儿房间太乱,网友:啥妈啥闺女

妍妍教育日记
2025-11-08 13:43:12
2025-11-08 23:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
11646文章数 176329关注度
往期回顾 全部

科技要闻

美股“AI八巨头”单周市值损失8000亿美元

头条要闻

美财长:美25年来制造首块稀土磁铁 结束中国"卡脖子"

头条要闻

美财长:美25年来制造首块稀土磁铁 结束中国"卡脖子"

体育要闻

马刺绞赢火箭,不靠文班亚马?

娱乐要闻

古二再度放料!秦雯王家卫吐槽出现新人物

财经要闻

小马、文远回港上市 但自动驾驶还没赢家

汽车要闻

特斯拉Model Y后驱长续航版上线:28.85 万元

态度原创

家居
游戏
手机
公开课
军事航空

家居要闻

现代自由 功能美学居所

秋促给他腾时间?《半条命3》11月18日会公布吗

手机要闻

iPhone 18再曝,影像、性能、屏幕全升级

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

福建舰常驻地为三亚军港

无障碍浏览 进入关怀版