天文学家最近干了一件听起来很科幻的事:让AI去翻NASA的"旧账",结果从两百万颗恒星的观测数据里,挖出了100多个以前没确认的行星,其中31个是全新的世界。
这件事的有趣之处在于,它不是什么"未来科技"——用的全是TESS卫星已经拍好的照片,只是以前没人(也没工具)能这么快地看完、看懂。
![]()
TESS全称"凌日系外行星巡天卫星",是NASA2018年发射的太空望远镜。它的工作方式很朴素:盯着一大片天空,记录恒星的亮度变化。如果某颗恒星突然暗了一点点,可能是有一颗行星从它前面"路过",挡住了极少的光。这种亮度下降通常不到1%,人眼根本看不出来,但对仪器来说是个信号。
问题是,TESS每秒都在产生海量数据。第一年的观测就覆盖了两百多万颗恒星,后面几年还在持续扫描。传统方法是天文学家手动筛选这些"光变曲线",判断哪些是真正的行星,哪些是假信号——比如两颗恒星互相绕转、互相遮挡造成的"食双星",看起来和行星过境几乎一模一样。
华威大学的天文学家团队做了一个叫RAVEN的AI工具来解决这个瓶颈。RAVEN的核心思路是:先造一批"假数据"来训练模型。团队模拟了几十万个真实的行星信号,以及同样数量的假信号(食双星、仪器噪声、恒星自身亮度波动等),让机器学习区分这两者的细微差别。
训练完成后,RAVEN被投喂了TESS前四年的全部数据。结果它筛出了超过2000个高质量的行星候选体,其中近1000个是此前从未被标记过的。经过后续验证,最终确认了118颗新行星,包括31个此前完全未知的世界。
论文第一作者Marina Lafarga Magro博士说,这是目前对"短周期行星"最精确的一次普查。团队特意关注了轨道周期小于16天的行星——也就是那些紧紧贴着恒星、一年比我们的一天还短的极端世界。
这类行星之所以重要,有几个原因。首先,它们最容易被TESS发现:离恒星近意味着过境频率高,16天的周期在几年的观测里能重复很多次,信号累积得更可靠。其次,它们代表了行星形成和演化的一种极端情况。按照目前的理论,行星在靠近恒星的地方很难存活:恒星辐射会吹散大气,潮汐力会扭曲轨道。但观测表明这类行星并不少见,说明要么形成机制和我们想的不一样,要么它们是从更远的地方迁移过来的。
这次发现里还有几个特别有趣的类别。一类是"超短周期行星",公转周期不到24小时——比地球自转一圈还快。目前已知的这类行星只有几十颗,每一个都是检验理论的珍贵样本。另一类位于所谓的"海王星沙漠":这是一个轨道距离上的特殊区域,按照模型应该很少有中等质量的行星存在,因为恒星辐射会把它们的大气层剥光,最后只剩下岩石核心。但RAVEN在这里找到了一些漏网之鱼,说明"沙漠"可能没我们想的那么荒凉。
还有一些是多行星系统。RAVEN识别出了几对此前未知的行星"室友"——两颗行星共用同一颗恒星,轨道周期不同但都很短。这种紧密排列的系统对轨道稳定性要求极高,是研究行星间引力相互作用的天然实验室。
说到这里,可能有人会问:AI介入天文学,会不会漏掉什么?这是个好问题。RAVEN的设计其实保留了人工复核的环节——AI负责从两百万颗恒星里快速缩小范围,但最终确认仍然需要传统的天文分析,包括地面望远镜的跟进观测。论文里也提到,RAVEN的模拟训练集是基于"我们已知的行星类型",如果存在某种完全超出预期的信号形态,它确实可能错过。
不过就目前而言,这种"AI初筛+人工精修"的模式,已经把行星确认的效率提升了一个数量级。TESS的设计寿命原本是两年,现在已经超期服役到第八年,积累的数据还在增长。没有自动化工具,这些观测资源很大程度上是沉睡的。
另一个值得玩味的点是,这次发现完全是"数据再利用"。TESS前四年的观测早已公开,全球任何研究者都可以下载。RAVEN的价值不在于拿到独家数据,而在于用新的分析方法从旧数据里榨取出新信息。这在天文学里越来越常见:开普勒卫星退役多年后,仍有团队用改进的算法从中发现新行星;SDSS(斯隆数字巡天)的星系光谱发布二十年了,至今每年还有上百篇论文基于这些数据发表。
某种程度上,这反映了现代天文学的一个转向:观测设备的建设周期以十年计,但数据分析方法的迭代速度是年甚至月。同样的望远镜,用2020年的算法和2026年的算法,能看到的东西可能完全不同。RAVEN这类工具的出现,相当于给现有的观测设施装上了"新眼睛"。
当然,确认118颗行星本身不会改变我们对宇宙的认知框架。真正有意思的是这个样本的统计特征:短周期行星到底有多常见?海王星沙漠的边界在哪里?多行星系统的轨道分布遵循什么规律?这些问题的答案,需要把RAVEN的发现和此前的巡天结果拼在一起,才能看出趋势。
论文发表在《皇家天文学会月刊》(MNRAS)上,这是一个有着近两百年历史的期刊,在天体物理领域以严谨著称。选择在这里发表,而不是追求更快的预印本平台,说明团队对结果的可重复性和细节披露有较高要求——这也是AI介入科学研究时的一个微妙考量:当发现过程涉及复杂的机器学习模型,审稿人和读者需要足够的信息来判断,这个"黑箱"里到底发生了什么。
最后说一个轻松的细节。RAVEN这个名字,在英语里是"渡鸦"的意思。在北欧神话里,渡鸦是奥丁的耳目,每天飞遍世界带回信息。给行星搜索工具起这个名字,倒是挺贴切的——只不过这只"渡鸦"的飞行范围是数据空间,它的"世界"是两百万颗恒星的亮度变化,而它带回来的"信息",是118个遥远世界的存在证明。
这些世界里,最近的也在几十光年之外,最远的超过一千光年。以人类目前的航行能力,到达任何一个都是不可能的任务。但知道它们在那里,知道它们以不到一天的时间疯狂绕转,知道有些侥幸生存在理论上不该存在的区域——这种"知道"本身,就是天文学能提供的某种慰藉。宇宙很大,但我们正在学会阅读它的迹象,一颗星一颗星地,把地图补全。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.