★置顶zzllrr小乐公众号(主页右上角)数学科普不迷路!
像ChatGPT这样的流行AI模型是基于语言或照片训练的,而由熨斗(Flatiron)研究所的研究人员及 Polymathic(博学)AI 协作组的成员创建的新模型则是使用真实的科学数据集训练的。模型们已经利用从一个领域学到的知识,去解决另一个领域看似完全不同的问题。
![]()
Walrus(海象)AI模型模拟流畅运动
海象(Walrus)/ 博学人工智能(Polymathic AI)
https://youtu.be/3iM_rd3t0_Q
作者:Elizabeth Fernandez 2025-12-9
译者:zzllrr小乐(数学科普公众号)2025-12-13
虽然大多数AI人工智能模型——包括 ChatGPT——都是基于文本和图像训练的,但一个多学科科学家团队则有不同的目标:物理训练AI。
最近,Polymathic AI https://polymathic-ai.org 合作组成员展示了两款使用真实科学数据集训练的新人工智能模型,旨在解决天文学和类流体系统中的问题。
这些模型——被称为 Walrus(海象) https://neurips.cc/virtual/2025/loc/san-diego/poster/119922 和 AION(永恒)-1 https://neurips.cc/virtual/2025/loc/san-diego/poster/119776 ——独特之处在于它们能够将从某一类物理系统获得的知识应用于看似完全不同的问题。例如,海象(Walrus)可以应对从爆炸恒星到 Wi-Fi 信号再到细菌活动等各种系统。
Walrus首席开发者、Polymathic AI研究科学家 Michael McCabe(迈克尔·麦凯布)表示,这种跨学科技能组尤其令人兴奋,因为它能加速科学发现,并在面对小样本或小预算时赋予研究人员优势。
“也许你的场景里有新的物理,是你们领域不习惯处理的。也许你用的是实验数据,但不太确定它属于哪个类别。也许你根本不是机器学习研究者,不想花时间去研究所有可能符合你情景的模型,“麦凯布解释道。“我们希望,这些更广泛的类别训练能让它更易使用,并且更有可能被这些用户推广,因为对他们来说,'新'的物理可能是其他领域已经处理了一段时间的事情。”
加州大学伯克利分校博士生、AION-1 项目首席研究员利亚姆·帕克(Liam Parker)表示,使用跨学科模型也能在数据稀少或研究罕见事件时提升预测效果。
Polymathic AI团队最近在arXiv.org https://arxiv.org/abs/2511.15684 发布了Walrus(海象)的预印本 ,并于12月5日星期五在圣地亚哥举行的 NeurIPS https://neurips.cc 大会上展示了 AION-1。
Walrus 和 AION-1 是“基础模型”,意味着它们是通过来自不同研究领域或实验数据集训练的https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/ 。这与大多数科学中的人工智能模型不同,后者是针对特定子领域或问题训练的。基础模型不是从一组基本方程开始学习特定情境的细节,而是学习物理过程的底层基础。由于这些物理过程是普遍的,人工智能所学到的知识可以应用于具有相同物理原理的各个领域或问题。基础模型有诸多好处——从加快计算速度、在低数据环境中的良好表现,到发现跨领域共享的物理学。
AION(永恒)-1 是天文学的基础模型。它基于本身就已庞大的天文巡天(astronomical surveys)数据进行训练: 巡天资产(Legacy Survey)https://www.legacysurvey.org 、 高分辨率深场巡天(HSC,Hyper Suprime-Cam) https://www.naoj.org/Projects/HSC/ 、 斯隆数字巡天(SDSS,Sloan Digital Sky Survey) https://sloan.org/programs/research/sloan-digital-sky-survey 、 暗能量光谱仪(DESI,Dark Energy Spectroscopic Instrument)https://www.desi.lbl.gov 和盖亚(Gaia) https://www.esa.int/Science_Exploration/Space_Science/Gaia_overview 。总的来说,这相当于超过 2亿次恒星、类星体和星系的观测,总数据总量约为 100TB。AION-1 利用图像、光谱及多种其他测量数据,尽可能多地了解天体。然后,当科学家获得一个星系的低分辨率图像时,AION-1 可以从数百万个星系的物理学中提取更多关于该星系的信息。
Walrus(海象)的领域是流体和类流体系统。Walrus 利用了 Well——一个由 Polymathic AI 团队编制的庞大数据集,参阅:
Well的数据涵盖了 19 个不同的场景和 63 个流体动力学领域。总的来说,它包含 15TB 的数据,描述了密度、速度和压力等参数,涵盖了从中子星合并、声波到地球大气层层变化等广泛物理系统中的变化。
这样的基础模型可以非常强大。AION-1和Walrus可以利用物理学在不同案例中应用,学习新事物。这类似于我们的感官。AION-1 团队在一篇关于该项目的博客文章中解释道:“多感官结合——而不是一次只感知一种感官——能让你更全面地理解一次体验,https://polymathic-ai.org/blog/aion-1/ 。“随着时间推移,你的大脑会学会将事物的外观、味道和嗅觉联系起来,所以如果某个感官无法使用,你通常能从其他感官中推断出缺失的信息。”
然后,当科学家进行新的实验或观察时,他们有一个起点——一张在类似情境下的物理表现的地图。“就像看到了许多人类,”Polymathic AI的首席研究员、天体物理学家和机器学习专家 Shirley Ho 说。Shirley Ho是熨斗研究所的高级研究科学家,同时也是纽约大学的教授。当你遇到一个新朋友,因为你之前认识了很多人,你能在脑海中绘制地图......这个人类会比你以前的朋友们怎么样,“她说。
基础模型通过简化数据处理,使科学家的工作更加轻松。科学家们不再需要为每个项目或任务从零创建新的框架;取而代之的是,他们可以从已经训练好的人工智能作为基础开始。“我认为我们对这个基础模型的愿景是,它让任何人都能从他们感兴趣的数据的强大嵌入出发......并且在不必从零开始构建整个管道的情况下,依然能实现最先进的精度,“AION-1 首席研究员 Parker 说。
他们的目标是制造科学家日常研究中可用的工具。Shirley Ho 说:“我们希望把所有这些AI智能带给需要的科学家。”
NeurIPS 2025 会议的其他亮点
宇宙学基准测试集(CosmoBench)
https://neurips.cc/virtual/2025/loc/san-diego/poster/121643
CosmoBench 是一个多视图、多尺度、多任务的几何深度学习宇宙学基准测试集。CosmoBench 基于最先进的宇宙学模拟,是同类中最大的基准测试,拥有超过 34000 个点云和 25000 棵定向树。CosmoBench 包含来自宇宙学和多样化基线的具有挑战性的评估任务,包括宇宙学方法、简单线性模型和图神经网络。该演讲展示 CosmoBench 如何推动宇宙学和几何深度学习的前沿。
迷失在潜空间(Lost in Latent Space)
https://neurips.cc/virtual/2025/loc/san-diego/poster/115208
物理学家利用对物理定律的理解,建模并预测物理系统的行为。然而,这些计算需要相当大的计算能力。熨斗研究所的科学家及 Polymathic AI 合作组的其他成员研究了一种较轻负担的计算方式是否仍能产生准确结果。这种被称为“潜在扩散建模”(latent diffusion modeling)的计算模型,利用人工智能以更低的计算成本生成高质量图像,同时准确刻画物理行为。
神经元作为感觉动力学中相干集合的探测器(Neurons as Detectors of Coherent Sets in Sensory Dynamics)
https://neurips.cc/virtual/2025/loc/san-diego/poster/117502
我们对触觉、味觉、视觉和疼痛的感知由将外周受体信号传递到大脑的神经元介导。这项工作表明,这些神经元可以被理解为检测感官流中的“连贯集合”——即随时间共同演化、因此共享共同过去或共同未来的刺激轨迹群。通过区分这些相干集合,一些神经元主要编码刚刚发生的事情,而另一些则可靠地提示接下来可能发生的事情。
因此,传统的感觉神经元分类可以被重新解释为反映了对过去的聚焦处理与对未来的预测处理之间的分歧。理解神经系统如何以这种方式分离和转化感官输入,可能为治疗精神疾病提供新途径,也可能指导生物启发人工智能的发展。
预测部分可观测动力系统(Predicting Partially Observable Dynamical Systems)
https://neurips.cc/virtual/2025/loc/san-diego/poster/118611
科学家可以通过确定性模型预测下落物体的运动或流体的演化,这些模型从过去的观测中计算出单一的未来结果。但这种方法在物理系统中失效,因为大部分状态被隐藏。一个显著的例子是太阳:我们可以观察到太阳表面的活动,但深处的过程大多是看不见的。没有这些内部条件,就没有足够的信息来预测一个单一的“正确”未来。
熨斗研究所的研究人员与 Polymathic AI 项目的合作者共同开发了一种概率方法,可以推断这些隐藏的太阳过程。通过将遥远过去的信息纳入基于扩散的生成模型,他们的方法生成了一个合理的未来集合,更清晰地理解过去太阳黑子活动如何塑造其未来演变。
参考资料
https://www.simonsfoundation.org/2025/12/09/these-new-ai-models-are-trained-on-physics-not-words-and-theyre-driving-discovery/
https://youtu.be/3iM_rd3t0_Q
https://polymathic-ai.org
https://neurips.cc/virtual/2025/loc/san-diego/poster/119922
https://neurips.cc/virtual/2025/loc/san-diego/poster/119776
https://arxiv.org/abs/2511.15684
https://neurips.cc
https://www.simonsfoundation.org/2024/12/02/new-datasets-will-train-ai-models-to-think-like-scientists/
https://www.legacysurvey.org
https://www.naoj.org/Projects/HSC/
https://sloan.org/programs/research/sloan-digital-sky-survey
https://www.desi.lbl.gov
https://www.esa.int/Science_Exploration/Space_Science/Gaia_overview
https://polymathic-ai.org/blog/aion-1/
https://neurips.cc/virtual/2025/loc/san-diego/poster/121643
https://neurips.cc/virtual/2025/loc/san-diego/poster/115208
https://neurips.cc/virtual/2025/loc/san-diego/poster/117502
https://neurips.cc/virtual/2025/loc/san-diego/poster/118611
小乐数学科普近期文章
·开放 · 友好 · 多元 · 普适 · 守拙·![]()
让数学
更加
易学易练
易教易研
易赏易玩
易见易得
易传易及
欢迎评论、点赞、在看、在听
收藏、分享、转载、投稿
查看原始文章出处
点击zzllrr小乐
公众号主页
右上角
置顶加星★
数学科普不迷路!
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.