网易首页 > 网易号 > 正文 申请入驻

蛋白质基座的GPT时代来了?!

0
分享至

闻乐 发自 凹非寺量子位 | 公众号 QbitAI

蛋白质模型的GPT时刻来了!

清华大学智能产业研究院(AIR)周浩副教授课题组联合上海人工智能实验室发布了AMix-1

首次以Scaling Law、Emergent Ability、In-Context Learning和Test-time Scaling的系统化方法论来构建蛋白质基座模型。

这为通往蛋白质的通用智能构建起了新的技术范式。让停留在BERT时代、缺乏可扩展性和通用性的蛋白质基座领域实现了向GPT时代的跨越。

就像NLP领域的ChatGPT一样,AMix-1不再局限于某一种蛋白质任务,而是能举一反三、自主学习。

这个“蛋白质GPT”能自己摸索规律,看几个例子就会设计新蛋白,甚至越研究越厉害。

由AMix-1设计的蛋白质已经通过湿实验的硬核考验,最优变体蛋白质活性提升了50倍

并且,它的模型权重、代码和技术细节已全部公开,下面来看看具体细节。

四大“超能力”

  • 当语言模型涌现出通用智能时,蛋白质模型的通用智能还有多远?

在NLP领域,语言模型基座经历了从BERT到GPT的跨时代变化,涌现出了各种超出预期的通用智能,BERT时代的模型关心具体任务的提升,缺乏对可扩展性、通用性和涌现能力的系统化讨论。

而在GPT时代,系统化的讨论逐渐显现,通用智能的爆发也因此开始。

然而,在蛋白质基座领域,几乎没有贯彻这条智能涌现的路径,一系列工作同样停留在BERT时代,在“预训练+任务微调”这一范式下前行,缺乏对可扩展性、通用性和涌现能力的系统化讨论。

AMix-1是基于贝叶斯流网络(Bayesian Flow Networks, BFNs)的蛋白质基座新范式,为蛋白质基座模型实现Test-time Scaling提供了一整套系统性的技术方案:

  • Pretraining Scaling Law明确了参数、样本数和计算量如何权衡,才能最大化模型的能力。
  • Emergent Ability显示随着训练的推进,模型会涌现出对蛋白结构的“感知理解”。
  • In-Context Learning解决了功能优化中的对齐难题,让模型学会在进化语境中推理与设计。
  • Test-time Scaling让AMix-1在验证预算增加时,“越花时间越有回报”,开启基于演化的设计新方式。

实际上我们可以将其概括为AMix-1的四大“超能力”。

成长有规律,进步看得见

就像学生刷题越多、成绩提升越稳定,AMix-1有个“可预测的成长曲线”。

研究者设计了从800万到17亿参数的多尺度模型组合,利用训练FLOPs(浮点操作数)作为统一衡量指标,精确拟合、预测了模型交叉熵损失与计算量的幂律关系。

他们发现,只要增加模型参数、训练数据或计算量,AMix-1的性能(比如预测蛋白质结构的准确度)就会按规律提升。

这意味着科学家能精准规划资源,不用担心花了钱却没效果,为更大规模的蛋白质研究铺平了路。

突然开窍,看懂蛋白质的隐藏规律

AMix-1最神奇的一点是会“顿悟”。

刚开始训练时,它只懂识别蛋白质的基本序列,但随着训练深入,当loss降到某个阈值时,它会自动具备“结构感知能力”——

不用任何人教,就能自动理解蛋白质的折叠方式、空间结构。

这种能力不是渐进,而是跳变。就像从只会认字母,突然学会了读懂整篇文章的意思,这种“质变”让它能更好地把握蛋白质结构和功能的关系。

不需要微调,看例子就能“仿写”

这实际上是其In-Context Learning机制在蛋白质设计过程中的体现。

以前设计蛋白质,要针对不同任务改算法,就像做一道新题要重新学公式。

但AMix-1 会上下文学习:给它几个同类蛋白质的例子(比如一组能在高温下工作的酶),它能自动总结规律,直接设计出符合这些规律的新蛋白,不用任何额外训练。

具体来说,这种方法把一组蛋白质MSA(多序列比对)压缩成一个位置级的概率分布,作为提示输入给模型。

而模型不需要任何微调,就能根据这些例子自动推理出结构和功能规律,并生成符合意图的新蛋白。

在结构任务上(上图a-b),以常规同源蛋白甚至在近乎无同源的“孤儿蛋白”为提示,AMix-1生成在预测结构上高度一致的新蛋白;

在功能任务中(上图c-d),AMix-1在输入蛋白的酶学功能和化学反应引导的酶设计上,AMix-1能生成出功能高度一致的蛋白酶。

越琢磨越厉害,进化能力无上限

AMix-1设计了独特的测试时扩展方法EvoAMix-1,能够利用其特有的上下文学习范式,在简单可插拔的验证(包括计算模拟与湿实验评估)加持下,实现模型能力随验证预算提升的可持续扩展。

同时,AMix-1也是第一个具备了测试时扩展能力的蛋白质基础模型。

实验结果显示,EvoAMix-1在所有任务上展示出强劲的扩展能力,同时也体现其跨任务、跨目标的强大通用性。

下图展示了EvoAMix-1在六个定向进化基准中的Test-time Scaling性能。

这也就是说,给它更多验证时间和资源,它能不断优化设计结果。

比如设计酶的时候,第一次生成10个候选蛋白,测试后挑出最好的2个,再让它基于这2个继续改进,重复几次,就能得到性能远超初始版本的蛋白质。

下图展示了AMix-1在推理阶段进行进化扩展算法的工作流程。

AMix-1已经通过了湿实验的硬核考验。

研究者想优化一种叫AmeR的转录调控因子(常用于合成生物学的基因开关),让它更擅长结合DNA。

用AMix-1生成40个变体后,实验发现最优的变体蛋白质活性提升了50倍,比目前最先进的方法还提升了77%。

更关键的是,整个过程全自动化,不用科学家手动调整,完美实现了「从模型到实验」的闭环。

清华大学智能产业研究院还联合上海人工智能实验室研发了一个虚拟生物实验室

AMix-1支撑了该虚拟生物实验室的蛋白质生成与进化工作。

以前需要反复试错、耗钱耗时的蛋白质改造,现在可能像和ChatGPT聊天一样简单~

技术报告:https://arxiv.org/pdf/2507.08920
项目主页:https://gensi-thuair.github.io/AMix-1/
模型权重:https://huggingface.co/GenSI/AMix-1-1.7B
代码仓库:https://github.com/GenSI-THUAIR/AMix-1

虚拟生物实验室:https://virtualbiolab.intern-ai.org.cn/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
KTV聚会照被疯传!郭麒麟认了是本人!严浩翔私生公开小号关注列表

KTV聚会照被疯传!郭麒麟认了是本人!严浩翔私生公开小号关注列表

观察鉴娱
2026-03-28 09:22:06
特朗普,“最后一击”

特朗普,“最后一击”

中国新闻周刊
2026-03-28 21:38:09
俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

俄乌战场传来血的教训,我们最先进的歼20,不能再抱着火箭弹不放

安安说
2026-03-28 11:54:14
大陆放话:不管台湾当局点不点头,厦金大桥照建不误,直达金门

大陆放话:不管台湾当局点不点头,厦金大桥照建不误,直达金门

汪镛的创业之路
2026-03-28 10:24:01
黄贵华突发心梗去世

黄贵华突发心梗去世

番禺台
2026-03-29 00:04:18
伊朗议长:伊朗将加速以军崩溃

伊朗议长:伊朗将加速以军崩溃

新华社
2026-03-29 00:33:08
45名反中乱港分子在香港被判重刑,台湾反应强烈,外交部犀利回应

45名反中乱港分子在香港被判重刑,台湾反应强烈,外交部犀利回应

近史博览
2026-03-28 20:31:38
日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

日本不再欢迎中国人?3月起日本签证“一刀切”,华人进退两难!

有范又有料
2026-03-25 14:08:39
张雪峰遗体已火化,传骨灰安葬地确定:11岁女儿哭昏厥,画面曝出

张雪峰遗体已火化,传骨灰安葬地确定:11岁女儿哭昏厥,画面曝出

博士观察
2026-03-28 13:59:13
王传福拿下小米汽车

王传福拿下小米汽车

新浪财经
2026-03-27 08:42:30
委内瑞拉石油,引爆美方4个炼油厂,特朗普做的孽,终于来了报应

委内瑞拉石油,引爆美方4个炼油厂,特朗普做的孽,终于来了报应

阿握聊事
2026-03-28 12:27:56
41岁单亲妈妈因“涉黑”被羁押821天后无罪释放,申请国家赔偿仅13天就被叫停,法院认定无罪警方又以骗贷为由再立案,检察院回应

41岁单亲妈妈因“涉黑”被羁押821天后无罪释放,申请国家赔偿仅13天就被叫停,法院认定无罪警方又以骗贷为由再立案,检察院回应

大风新闻
2026-03-28 12:10:12
印度现在终于知道了,只要中国不点头,印度高铁找谁合作都修不了

印度现在终于知道了,只要中国不点头,印度高铁找谁合作都修不了

甜柠聊史
2026-03-28 12:55:39
台湾地区,长期阻碍中国统一就是马英九。这个人非常之狡猾!

台湾地区,长期阻碍中国统一就是马英九。这个人非常之狡猾!

安安说
2026-03-28 11:40:47
官方定调了,跌破6%,2025年出生人口792万,这意味着什么?

官方定调了,跌破6%,2025年出生人口792万,这意味着什么?

毒sir财经
2026-03-28 22:22:36
iPhone 18 Pro屏幕盖板偷跑:灵动岛缩小实锤了 告别大药丸

iPhone 18 Pro屏幕盖板偷跑:灵动岛缩小实锤了 告别大药丸

快科技
2026-03-28 19:53:31
一场本该属于C罗的投票,梅西却赢到让所有人闭嘴

一场本该属于C罗的投票,梅西却赢到让所有人闭嘴

耀阳体育
2026-03-29 04:46:57
不到100万,毁了一辈子:那个曾经飞扬跋扈的领导,终于进去了

不到100万,毁了一辈子:那个曾经飞扬跋扈的领导,终于进去了

苏格拉高
2026-03-28 07:39:54
邀请赛:“徐州姆巴佩”苗润东发挥抢眼,U19国足1比0击败澳大利亚

邀请赛:“徐州姆巴佩”苗润东发挥抢眼,U19国足1比0击败澳大利亚

足球报
2026-03-28 16:56:47
张雪峰好兄弟曝内情泣不成声,人民日报悼念官媒定义,卫健委追责

张雪峰好兄弟曝内情泣不成声,人民日报悼念官媒定义,卫健委追责

潮鹿逐梦
2026-03-26 10:55:41
2026-03-29 06:31:00
量子位 incentive-icons
量子位
追踪人工智能动态
12360文章数 176427关注度
往期回顾 全部

科技要闻

华为盘古大模型负责人王云鹤确认离职

头条要闻

伊朗:击中美军F-16战机 强力反击加速以政权崩溃

头条要闻

伊朗:击中美军F-16战机 强力反击加速以政权崩溃

体育要闻

“我是全家最差劲的运动员”

娱乐要闻

陈牧驰陈冰官宣得子 晒一家三口握拳照

财经要闻

卧底"科技与狠活"培训:化工调味剂泛滥

汽车要闻

置换补贴价4.28万起 第五代宏光MINIEV正式上市

态度原创

手机
家居
亲子
教育
军事航空

手机要闻

华为手机全面回归!畅享90 Pro Max下周首销:1699元起

家居要闻

曲线华尔兹 现代简约

亲子要闻

小孩子能口无遮拦到什么程度!网友:恨不得当场找个地缝钻进去

教育要闻

著名大学校长去世!他把这所学校,重新带回世界高教的中心…

军事要闻

美军中东基地损失最新披露

无障碍浏览 进入关怀版