网易首页 > 网易号 > 正文 申请入驻

MIT:基础模型或学得物理现实的共同底层表征,附实验证据

0
分享至



编辑丨coisini

人工智能经历了一次范式转变,从定制化的任务专用模型转向了通用型「基础模型」。模型在大量多样化数据集上进行预训练,因此能够执行诸多未经明确训练的下游任务。这种涌现能力的关键在于其表征能力:基础模型学习每个输入的紧凑潜在表征,使其在远超训练样本范围的数据上仍能表现出色。

在语言和视觉领域的成功,激发了基础模型在科学领域的探索,各种模态与架构迥异的机器学习模型正在被训练。然而,这些模型是否学得了相似的物质内部表征仍不明确。

最近,来自麻省理工学院(MIT)的研究团队开展了一项分析研究,发现近六十种科学模型(涵盖字符串、图结构、三维原子尺度及蛋白质等多种模态)在广泛化学体系中学习到的表征具有高度一致性。这暗示基础模型正在学习物理现实的共同底层表征。



论文地址:https://arxiv.org/pdf/2512.03750

研究概览

该研究涵盖 59 个模型,涉及多种输入模态(分子的 SMILES/SELFIES 字符串编码、三维原子坐标、蛋白质序列、蛋白质结构和自然语言)、架构(等变与非等变的机器学习相互作用势、保守与直接预测模型)和训练领域(分子、材料和蛋白质)。



研究团队比较了来自五个数据集的物质表征,包括:

  • QM9 和 OMol25 的分子
  • OMat24 和 sAlex 的材料
  • RCSB 的蛋白质

具体而言,该研究通过将这些数据集中的结构输入每个模型,并保存其最后一层隐藏层的数值嵌入来生成表征,并使用四种截然不同的度量方法(直接作用于模型嵌入)来衡量表征对齐度,即两个模型的潜在空间有多相似。





科学基础模型表征趋同性的证据

研究团队发现不同模态、训练任务和架构的科学基础模型,其潜在表征是显著对齐的。

随后,该研究又观察到随着模型性能的提升,它们的表征趋于收敛,这表明基础模型学习到了物理现实的一个共同底层表征。



研究团队还通过探测模型已见过的分布内结构和未见过的分布外结构的表征,建立了一个基础模型泛化能力的动态基准。



研究意义

该研究发现科学模型存在两种明显不同的机制:

  • 在训练数据相似输入上,高性能模型表征紧密对齐,而弱模型则偏离至表征空间的局部次优解;
  • 在与训练数据差异巨大的结构上,几乎所有模型都坍缩为低信息表征,这表明当前模型仍受限于训练数据与归纳偏置,尚未编码真正通用的结构。

而这项研究将表征对齐确立为科学模型基础层面泛化能力的量化基准。

随着模型规模的持续扩大,这项研究成果能够追踪通用表征范式的形成轨迹,并为筛选最能支持跨模态、跨物质类型、跨科学任务迁移应用的模型提供理论指引。

感兴趣的读者可以阅读论文原文,了解更多研究内容。

声明:包含AI生成内容

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026年一季度消费:汽车、彩电、空调全线下跌

2026年一季度消费:汽车、彩电、空调全线下跌

风向观察
2026-04-21 09:27:07
A股:2.5亿股民,今晚可能要兴奋得睡不着觉了,你知道为什么吗?

A股:2.5亿股民,今晚可能要兴奋得睡不着觉了,你知道为什么吗?

另子维爱读史
2026-04-21 19:44:48
重庆一大叔火车上崩溃大哭,同车男子买盒饭转账500元:他赶回老家见大儿子最后一面

重庆一大叔火车上崩溃大哭,同车男子买盒饭转账500元:他赶回老家见大儿子最后一面

潇湘晨报
2026-04-21 13:00:15
库明加登老鹰海报扎心科尔!美媒曝主帅信任差距大:还晒分数对比

库明加登老鹰海报扎心科尔!美媒曝主帅信任差距大:还晒分数对比

颜小白的篮球梦
2026-04-21 15:40:44
年仅39岁!蓝天救援队员陈延寿搜救时遇难

年仅39岁!蓝天救援队员陈延寿搜救时遇难

新民晚报
2026-04-21 15:00:21
“法院干警配偶低价拍得银行6000万债权”引质疑,多方回应

“法院干警配偶低价拍得银行6000万债权”引质疑,多方回应

澎湃新闻
2026-04-21 14:58:02
越来越清晰:只剩革命卫队问题还没解决,未来会被内外联合绞杀吗

越来越清晰:只剩革命卫队问题还没解决,未来会被内外联合绞杀吗

民间胡扯老哥
2026-04-21 05:45:15
105岁才能取本金“随用随取”成空话 保险公司算欺诈吗?法院判了

105岁才能取本金“随用随取”成空话 保险公司算欺诈吗?法院判了

环球网资讯
2026-04-21 15:08:47
近6轮中超首胜!国安1-0送新鹏城3连败 35岁张稀哲替补世界波绝杀

近6轮中超首胜!国安1-0送新鹏城3连败 35岁张稀哲替补世界波绝杀

我爱英超
2026-04-21 20:58:57
亏惨了!车管所正式提醒,2026 新规后只买交强加三者险行不通

亏惨了!车管所正式提醒,2026 新规后只买交强加三者险行不通

夜深爱杂谈
2026-04-21 07:42:53
豆芽立大功!浙科大实证:豆芽可通过菌群代谢,减少84%腹部脂肪!

豆芽立大功!浙科大实证:豆芽可通过菌群代谢,减少84%腹部脂肪!

科学认识论
2026-04-20 14:45:02
龙珠,日本男子花160万还原布尔玛19,简直太绝了!

龙珠,日本男子花160万还原布尔玛19,简直太绝了!

动漫心世界
2026-04-21 17:33:31
美国开始退钱了:涉33万企业1650亿美元,多数涉及中国

美国开始退钱了:涉33万企业1650亿美元,多数涉及中国

观察者网
2026-04-21 10:56:03
注意!6月1日起大医院不再随意接诊,看病不按规矩可能白跑

注意!6月1日起大医院不再随意接诊,看病不按规矩可能白跑

夜深爱杂谈
2026-04-21 07:45:20
伊朗军舰军演返航曾遭美军击沉87人死亡,幸存船员讲述:毫无预警,他们的目标是杀人

伊朗军舰军演返航曾遭美军击沉87人死亡,幸存船员讲述:毫无预警,他们的目标是杀人

红星新闻
2026-04-21 18:27:32
交警提醒:私家车将迎来“3+1”的严格检查,车主:为何不早说?

交警提醒:私家车将迎来“3+1”的严格检查,车主:为何不早说?

复转这些年
2026-04-21 17:19:57
国内油价今年来首次下调

国内油价今年来首次下调

界面新闻
2026-04-21 14:57:08
炸裂!女子刚分手就献身异性,男友尾随当场抓获,情夫赤裸一脸懵

炸裂!女子刚分手就献身异性,男友尾随当场抓获,情夫赤裸一脸懵

李晚书
2026-04-21 16:43:59
多地出台政策,鼓励技校招收大学毕业生

多地出台政策,鼓励技校招收大学毕业生

21世纪经济报道
2026-04-21 09:00:05
商家发视频吐槽:景区人满为患,却无人消费,评论区全是人间清醒

商家发视频吐槽:景区人满为患,却无人消费,评论区全是人间清醒

谭谈社会
2026-04-21 10:12:09
2026-04-21 21:28:49
ScienceAI incentive-icons
ScienceAI
关注人工智能与其他前沿技术
1283文章数 226关注度
往期回顾 全部

科技要闻

创造4万亿帝国、访华20次,库克留下了什么

头条要闻

六层楼高大树"偷"走家里光线 女子起诉隔壁小区业委会

头条要闻

六层楼高大树"偷"走家里光线 女子起诉隔壁小区业委会

体育要闻

62岁,成为中国足坛最火的人

娱乐要闻

周润发时隔16年再卖楼,变现数亿资产

财经要闻

现实是最大的荒诞:千亿平台的冲突始末

汽车要闻

全新坦克700正式上市 售价42.8万-50.8万元

态度原创

本地
房产
旅游
时尚
公开课

本地新闻

春色满城关不住|白鹃梅浪漫盛放,吴山藏了一片四月雪

房产要闻

年薪40-50万!海南地产圈还在猛招人

旅游要闻

欢迎来到“家家泉水户户垂杨”体验区——济南!“沿着黄河遇见海”全国旅行商山东行——“相约文旅盛会 发现宝藏山东”采风活动带你了解不一样的济南~

时尚启蒙必看片单,终于更新了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版