网易首页 > 网易号 > 正文 申请入驻

苹果发布首个基于流匹配的蛋白质折叠模型SimpleFold

0
分享至



编辑丨coisini

自 AlphaFold2 问世以来,蛋白质折叠模型取得了突破性进展。但是这些模型,往往是通过将领域专业知识融入架构设计和训练流程而构建的。

鉴于最近几年,生成模型在多个领域取得成功,我们不禁要问:蛋白质折叠模型的特定架构设计是否必要?

为了回答这个问题,来自苹果的研究团队提出首个基于流匹配(flow-matching)的蛋白质折叠模型 ——SimpleFold,该模型仅使用通用 Transformer 层,无需依赖多重序列比对、配对相互作用图、三角更新(triangular updates)或任何等变几何模块,即可将蛋白质序列直接映射至其完整三维原子结构。

正如研究论文题目所述:「蛋白质折叠比你想象的更简单」。



论文地址:https://arxiv.org/pdf/2509.18480v1

大幅简化架构设计

研究团队将蛋白质折叠重新定义为条件生成任务。SimpleFold 突破了当前依赖专用架构的设计范式,采用通用 Transformer 主干网络,并通过流匹配目标进行端到端训练。

SimpleFold 包含三大核心模块:轻量级原子编码器与解码器(采用对称设计,即模块数量和隐藏层维度相同)以及残差主干网络。所有模块均通过标准 Transformer 块实现,并配备根据时间步长自适应调节的层结构。



SimpleFold 采用简化的流匹配训练目标,辅以 LDDT 损失函数进行训练,而非组合多种蛋白质特异性损失项。这一简化使研究团队能够实现模型规模和训练数据量级的同步扩展,最终发布了从 1 亿参数到 30 亿参数的系列模型。

重要的是,研究团队证明:无需显式配对表示、三角更新或 MSA,模型也能实现强大的折叠性能。这显著降低了架构复杂性,并对以往蛋白质折叠模型设计的必要性提出了挑战。



值得注意的是,基于标准 Transformer 模块的简洁架构使 SimpleFold 可通过适配器、LoRA 等微调技术灵活适配特定蛋白质结构数据与折叠外任务。通过蒸馏技术,SimpleFold-3B 模型还能实现更快速的推理与高效部署。

实验评估

研究团队在两个广泛采用的蛋白质结构预测基准上评估 SimpleFold:CAMEO22 和 CASP14,旨在通过严格测试来检验模型的泛化能力、稳健性及原子级精度,实验结果如下表所示。



基于其生成式训练目标,SimpleFold 能够对蛋白质结构分布进行建模。这意味着 SimpleFold 不仅能针对输入氨基酸序列生成单一确定性结构,还可产生不同构象的集合。

为验证此能力,研究团队在 ATLAS 数据集上进行了分子动力学构象集生成性能基准测试。下表展示了 SimpleFold 与基线模型在 ATLAS 数据集上的比较结果,全面衡量了生成构象集的质量,涉及柔性预测、分布精度以及构象集可观测值。



众所周知,生成模型在视觉和语言等领域遵循扩展定律。类似地,研究团队通过实证方法从模型和数据双维度展示了 SimpleFold 的规模扩展规律,为构建强大的生物生成模型提供重要参考。



结果表明,采用更大训练成本的大规模模型能获得更优性能。规模最大的 SimpleFold-3B 模型(训练数据规模近 9M)在标准折叠任务中展现出竞争优势,并在多项生成任务中达到顶尖水平。

而轻量级 SimpleFold-100M 模型具备高效推理特性,尤其适用于计算资源受限的场景,即使在消费级设备上也能执行高效推理。

SimpleFold 代表了一种颠覆性范式,降低了对计算复杂网络模块的依赖,为蛋白质结构预测开辟了一条全新且重要的发展路径。

感兴趣的读者可以阅读论文原文,了解更多研究内容。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

上海,八旬独居老人独居无靠,居委会联系送养儿子,儿子:凭什么

街声巷闻
2025-11-17 14:36:54
惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

惊天大瓜!原来川普和希拉里不止是政敌,同时还是情敌。

电动猫
2025-11-18 00:18:26
聚焦“十五五”规划建议|保持制造业合理比重

聚焦“十五五”规划建议|保持制造业合理比重

新华社
2025-11-17 15:54:02
王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

王欣瑜耗时2小时47分钟2-1艰难战胜王曦雨,晋级全运会四强

懂球帝
2025-11-18 17:17:31
张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

张家界荒野求生赛宣布14名选手全部进入决赛:气温骤降,不再按原计划淘汰4人

极目新闻
2025-11-18 15:19:03
捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

捷克“炮弹计划”或终止!斯洛伐克法院关键裁决,援乌战斗机合法

鹰眼Defence
2025-11-18 17:53:12
捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

捅完琉球窝!中国再掀北海道老底,日本80年前埋的雷,炸了

南宫一二
2025-11-17 07:17:39
全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

全运乒乓男团四强巅峰对决:马龙樊振东领衔,四大豪门谁主沉浮?

带你逛体坛
2025-11-18 18:34:10
罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

罗伯逊:距离世界杯只差90分钟,我相信我们能战胜丹麦

懂球帝
2025-11-18 14:25:08
日韩股市,开盘暴跌!

日韩股市,开盘暴跌!

证券时报
2025-11-18 09:47:04
湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

湖人最不需要担心的人!里夫斯:GOAT詹皇回归将有4打3优势

体育妞世界
2025-11-18 14:08:30
乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

乡镇编制膨胀:从12人到100人,时代变了乡镇变了,初心还在吗?

君好伴读
2025-10-27 10:33:08
付某梅(女),已被大连警方抓获归案!

付某梅(女),已被大连警方抓获归案!

半岛晨报
2025-11-18 12:40:05
因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

因文件问题无法靠港,3000头奶牛被困土耳其海上58天,船只恶臭弥漫、尸体堆积

起喜电影
2025-11-18 15:29:35
赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

赢麻了!现在全网最想哭的人估计是冷美人,30多天拿到30000多元

火山诗话
2025-11-18 18:36:08
华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

华为Mate 80系列备货比例曝光 标准版和Pro Max成主力

手机中国
2025-11-18 16:50:44
钟丽缇168cm的大块头,一般男人征服不了她吧?

钟丽缇168cm的大块头,一般男人征服不了她吧?

小椰的奶奶
2025-11-18 13:14:26
毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

毛主席视察天津时想见李银桥,得知他已经入狱,伟人只说了2个字

南书房
2025-09-28 23:01:03
日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

日本天下第一香木,传为隋炀帝所赐,仅有三位人物切下小块使用

收藏大视界
2025-11-09 20:38:12
只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

只待2天!全红婵火速从北京飞回广州,去医院看望梁小静,姐妹情深

乡野小珥
2025-11-18 07:31:38
2025-11-18 19:39:00
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1155文章数 218关注度
往期回顾 全部

科技要闻

小米:汽车及AI等业务首次单季度经营盈利

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

头条要闻

孟加拉国前总理哈西娜被判死刑 中方回应

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

搭载1.5T增程动力 吉利银河V900官图发布

态度原创

本地
亲子
家居
健康
公开课

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

亲子要闻

孩子咳嗽怎么办?应该如何缓解?

家居要闻

彰显奢华 意式经典风格

警惕超声报告这六大"坑"

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版