网易首页 > 网易号 > 正文 申请入驻

蛋白质基座的GPT时代来了?!

0
分享至

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

蛋白质模型的GPT时刻来了!

清华大学智能产业研究院(AIR)周浩副教授课题组联合上海人工智能实验室发布了AMix-1

首次以Scaling Law、Emergent Ability、In-Context Learning和Test-time Scaling的系统化方法论来构建蛋白质基座模型。



这为通往蛋白质的通用智能构建起了新的技术范式。让停留在BERT时代、缺乏可扩展性和通用性的蛋白质基座领域实现了向GPT时代的跨越。

就像NLP领域的ChatGPT一样,AMix-1不再局限于某一种蛋白质任务,而是能举一反三、自主学习。

这个“蛋白质GPT”能自己摸索规律,看几个例子就会设计新蛋白,甚至越研究越厉害。

由AMix-1设计的蛋白质已经通过湿实验的硬核考验,最优变体蛋白质活性提升了50倍

并且,它的模型权重、代码和技术细节已全部公开,下面来看看具体细节。

四大“超能力”

  • 当语言模型涌现出通用智能时,蛋白质模型的通用智能还有多远?

在NLP领域,语言模型基座经历了从BERT到GPT的跨时代变化,涌现出了各种超出预期的通用智能,BERT时代的模型关心具体任务的提升,缺乏对可扩展性、通用性和涌现能力的系统化讨论。

而在GPT时代,系统化的讨论逐渐显现,通用智能的爆发也因此开始。

然而,在蛋白质基座领域,几乎没有贯彻这条智能涌现的路径,一系列工作同样停留在BERT时代,在“预训练+任务微调”这一范式下前行,缺乏对可扩展性、通用性和涌现能力的系统化讨论。



AMix-1是基于贝叶斯流网络(Bayesian Flow Networks, BFNs)的蛋白质基座新范式,为蛋白质基座模型实现Test-time Scaling提供了一整套系统性的技术方案:

  • Pretraining Scaling Law明确了参数、样本数和计算量如何权衡,才能最大化模型的能力。
  • Emergent Ability显示随着训练的推进,模型会涌现出对蛋白结构的“感知理解”。
  • In-Context Learning解决了功能优化中的对齐难题,让模型学会在进化语境中推理与设计。
  • Test-time Scaling让AMix-1在验证预算增加时,“越花时间越有回报”,开启基于演化的设计新方式。

实际上我们可以将其概括为AMix-1的四大“超能力”。

成长有规律,进步看得见

就像学生刷题越多、成绩提升越稳定,AMix-1有个“可预测的成长曲线”。

研究者设计了从800万到17亿参数的多尺度模型组合,利用训练FLOPs(浮点操作数)作为统一衡量指标,精确拟合、预测了模型交叉熵损失与计算量的幂律关系。



他们发现,只要增加模型参数、训练数据或计算量,AMix-1的性能(比如预测蛋白质结构的准确度)就会按规律提升。

这意味着科学家能精准规划资源,不用担心花了钱却没效果,为更大规模的蛋白质研究铺平了路。

突然开窍,看懂蛋白质的隐藏规律

AMix-1最神奇的一点是会“顿悟”。

刚开始训练时,它只懂识别蛋白质的基本序列,但随着训练深入,当loss降到某个阈值时,它会自动具备“结构感知能力”——

不用任何人教,就能自动理解蛋白质的折叠方式、空间结构。



这种能力不是渐进,而是跳变。就像从只会认字母,突然学会了读懂整篇文章的意思,这种“质变”让它能更好地把握蛋白质结构和功能的关系。

不需要微调,看例子就能“仿写”

这实际上是其In-Context Learning机制在蛋白质设计过程中的体现。

以前设计蛋白质,要针对不同任务改算法,就像做一道新题要重新学公式。

但AMix-1 会上下文学习:给它几个同类蛋白质的例子(比如一组能在高温下工作的酶),它能自动总结规律,直接设计出符合这些规律的新蛋白,不用任何额外训练。



具体来说,这种方法把一组蛋白质MSA(多序列比对)压缩成一个位置级的概率分布,作为提示输入给模型。

而模型不需要任何微调,就能根据这些例子自动推理出结构和功能规律,并生成符合意图的新蛋白。



在结构任务上(上图a-b),以常规同源蛋白甚至在近乎无同源的“孤儿蛋白”为提示,AMix-1生成在预测结构上高度一致的新蛋白;

在功能任务中(上图c-d),AMix-1在输入蛋白的酶学功能和化学反应引导的酶设计上,AMix-1能生成出功能高度一致的蛋白酶。

越琢磨越厉害,进化能力无上限

AMix-1设计了独特的测试时扩展方法EvoAMix-1,能够利用其特有的上下文学习范式,在简单可插拔的验证(包括计算模拟与湿实验评估)加持下,实现模型能力随验证预算提升的可持续扩展。

同时,AMix-1也是第一个具备了测试时扩展能力的蛋白质基础模型。

实验结果显示,EvoAMix-1在所有任务上展示出强劲的扩展能力,同时也体现其跨任务、跨目标的强大通用性。

下图展示了EvoAMix-1在六个定向进化基准中的Test-time Scaling性能。



这也就是说,给它更多验证时间和资源,它能不断优化设计结果。

比如设计酶的时候,第一次生成10个候选蛋白,测试后挑出最好的2个,再让它基于这2个继续改进,重复几次,就能得到性能远超初始版本的蛋白质。

下图展示了AMix-1在推理阶段进行进化扩展算法的工作流程。



AMix-1已经通过了湿实验的硬核考验。

研究者想优化一种叫AmeR的转录调控因子(常用于合成生物学的基因开关),让它更擅长结合DNA。

用AMix-1生成40个变体后,实验发现最优的变体蛋白质活性提升了50倍,比目前最先进的方法还提升了77%。



更关键的是,整个过程全自动化,不用科学家手动调整,完美实现了「从模型到实验」的闭环。

清华大学智能产业研究院还联合上海人工智能实验室研发了一个虚拟生物实验室



AMix-1支撑了该虚拟生物实验室的蛋白质生成与进化工作。



以前需要反复试错、耗钱耗时的蛋白质改造,现在可能像和ChatGPT聊天一样简单~

技术报告:https://arxiv.org/pdf/2507.08920
项目主页:https://gensi-thuair.github.io/AMix-1/
模型权重:https://huggingface.co/GenSI/AMix-1-1.7B
代码仓库:https://github.com/GenSI-THUAIR/AMix-1

虚拟生物实验室:https://virtualbiolab.intern-ai.org.cn/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
胖东来2025年销售数据公布,较2024年上涨近40%,新店开业一周入账近1亿元,于东来曾表示:如果升得太快,员工就得加班

胖东来2025年销售数据公布,较2024年上涨近40%,新店开业一周入账近1亿元,于东来曾表示:如果升得太快,员工就得加班

极目新闻
2026-01-01 19:24:34
一场122-125给快船送上大礼!有望进前10,管理层迎来了艰难抉择

一场122-125给快船送上大礼!有望进前10,管理层迎来了艰难抉择

少冰五分糖
2026-01-01 15:03:10
申花官宣6人离队

申花官宣6人离队

五星体育
2026-01-01 13:24:17
李渊退位之时,死死握住李世民的手:房玄龄此人太深,不可全信

李渊退位之时,死死握住李世民的手:房玄龄此人太深,不可全信

千秋文化
2025-12-27 20:37:21
张柏芝好奇怪,2025年最后一天,她晒了一个老男人和三儿子的照片

张柏芝好奇怪,2025年最后一天,她晒了一个老男人和三儿子的照片

乐悠悠娱乐
2026-01-01 10:32:19
重生或出局:川普迫使联合国进行30年未见之改革

重生或出局:川普迫使联合国进行30年未见之改革

斌闻天下
2026-01-01 09:00:03
四川女外卖员失联后续:尸体已找到,现场画面曝光,有个两岁娃

四川女外卖员失联后续:尸体已找到,现场画面曝光,有个两岁娃

王二哥老搞笑
2026-01-01 12:46:42
一切为了销量、利润,消息称三星决定不提高Galaxy S26系列售价

一切为了销量、利润,消息称三星决定不提高Galaxy S26系列售价

IT之家
2026-01-01 20:34:06
事业巅峰远赴美国,被老外“玩腻”后晚年回国,如今变成了这样!

事业巅峰远赴美国,被老外“玩腻”后晚年回国,如今变成了这样!

归史
2025-12-09 11:10:44
湖南出现历史上最荒唐法官!判男方净身出户,然后跟拿到全部资产的女方结婚

湖南出现历史上最荒唐法官!判男方净身出户,然后跟拿到全部资产的女方结婚

爆角追踪
2025-11-23 11:25:00
出大事了,美媒:中蒙边境,中国部署了100多枚东风-31洲际导弹?

出大事了,美媒:中蒙边境,中国部署了100多枚东风-31洲际导弹?

花花娱界
2026-01-01 16:27:26
人形机器人十大龙头榜单:三花智控落榜,核心特征看这2点

人形机器人十大龙头榜单:三花智控落榜,核心特征看这2点

娱乐督察中
2026-01-01 15:06:32
美军轰炸港口,特朗普下令开第一枪,中俄伊介入局势,油井已关闭

美军轰炸港口,特朗普下令开第一枪,中俄伊介入局势,油井已关闭

有你的星空
2026-01-02 04:23:31
美专家惊人兵推曝光:美军若向京沪扔核弹,中国不会选择对等报复

美专家惊人兵推曝光:美军若向京沪扔核弹,中国不会选择对等报复

番茄说史聊
2025-12-28 14:09:37
一路走好!1天传出2位名人去世,70、80后都认识,真正的艺术家

一路走好!1天传出2位名人去世,70、80后都认识,真正的艺术家

往史过眼云烟
2026-01-01 12:01:54
中国海警发海报,要查扣美国军火?四国已经集结,准备对华出手?

中国海警发海报,要查扣美国军火?四国已经集结,准备对华出手?

荐史
2026-01-01 10:08:49
女人动情后,很难抗拒这些事,别不信

女人动情后,很难抗拒这些事,别不信

巧大叔
2025-12-31 23:48:02
蒋万安的一张全家福,他有三个儿子,妻子看着就是挺和善的一个人

蒋万安的一张全家福,他有三个儿子,妻子看着就是挺和善的一个人

大江
2025-12-30 14:45:26
1981年,演员孙飞虎被选饰演蒋介石,蒋经国看后说:真的太像了!

1981年,演员孙飞虎被选饰演蒋介石,蒋经国看后说:真的太像了!

古书记史
2025-12-30 20:26:24
国安中场加盟海港顶替徐新,签约三年,在国安得不到尊重被称水货

国安中场加盟海港顶替徐新,签约三年,在国安得不到尊重被称水货

体坛风之子
2026-01-01 07:00:11
2026-01-02 06:55:00
量子位 incentive-icons
量子位
追踪人工智能动态
11957文章数 176355关注度
往期回顾 全部

科技要闻

特斯拉Model 3车主首度全程自驾横穿美国

头条要闻

瑞士酒吧新年爆炸致百余死伤 有人严重烧伤难以辨认

头条要闻

瑞士酒吧新年爆炸致百余死伤 有人严重烧伤难以辨认

体育要闻

2026,这些英超纪录可能会被打破

娱乐要闻

跑调风波越演越烈!沈佳润被网友喊话

财经要闻

巴菲特「身退,权还在」

汽车要闻

一汽-大众2025年整车销量超158万辆 燃油车市占率创新高

态度原创

教育
健康
旅游
房产
军事航空

教育要闻

400分江苏女孩放弃单招走高考,遭1.7w人打击:还不如玩半年

元旦举家出行,注意防流感

旅游要闻

自贡非遗花灯点亮江南夜!2026无锡梅里古镇新年灯会璀璨启幕

房产要闻

实景暴击!海口这个顶流红盘,抛出准现房+顶级书包双王炸!

军事要闻

福建舰全体官兵列阵 送上硬核祝福

无障碍浏览 进入关怀版