网易首页 > 网易号 > 正文 申请入驻

ChatGPT惨败Llama!MIT官宣AI开飞船0%失败率,马斯克火星殖民不再是梦

0
分享至

新智元报道

编辑:定慧

【新智元导读】MIT最新研究让LLM直接操控宇宙飞船进行太空追逐挑战赛:ChatGPT少量微调即获第二,开源Llama更胜一筹,凭提示词精准追踪卫星、节省燃料,更是0%失败率,验证AI小数据高效与自主航天可行,为未来的太空漫游铺路。

刚刚,一项最新关于AI「驾驶」宇宙飞船的研究刚发布就火了!

在由Kerbal Space Program衍生的航天挑战赛中,MIT等研究团队让ChatGPT作为「主控」智能体,竟然一举夺得第二名。

这项比赛被视为太空探索自主化的重要实验场,而AI的表现,也预示着「AI开飞船」或许比我们想象的更近!

或许,太空漫游2027真的可以成为现实!围绕地球的卫星、太空垃圾未来都可能由AI自主运行和处理。

研究团队并没有重度训练模型,而是巧妙地用提示词工程+少量微调,就让ChatGPT成功驾驭复杂的太空任务:追击卫星、规避侦测……样样精通。

整个系统由文本状态输入→语言模型决策→代码执行三步组成,展现出LLM模型强大的泛化与适应能力。

MIT和马德里理工大学这一研究论文已被《空间研究进展》(Journal of Advances in Space Research)接收,即将发表。

论文地址:https://arxiv.org/pdf/2505.19896

研究亮点速览:

  • ChatGPT用文字指令完成飞船导航、控制决策,表现远超预期;

  • 研究无需大规模训练,充分利用LLM已有知识与语言理解;

  • 虽仍有「幻觉」等风险,但自主化航天已从幻想变为可行路线。


AI自主开飞船上太空

研究人员长期以来一直致力于开发用于卫星控制和航天器导航的自主系统。

未来的卫星数量实在太多,人类无法全部手动进行控制。

而对于深空探测来说,光速的限制意味着我们无法实时直接控制航天器。

如果我们真的想要在太空领域拓展,就必须让机器人自己做决定。

为了鼓励创新,近年来航空研究人员创建了《Kerbal Space Program》博弈挑战赛。

这是一类基于广受欢迎的《Kerbal Space Program》电子游戏的试验场,让研究社区在一个(某种程度上)真实的环境中设计、试验和测试自主系统。

《Kerbal Space Program》(KSP)最早是由墨西哥工作室Squad开发的一款太空飞行模拟视频游戏,于2015年发布。

尽管它是一款游戏,但通过添加模组(mod),它可以被用作模拟环境,这些模组可以增加诸如更真实的物理效果等新功能。

尽管KSP并未提供对现实的完美模拟,但其精确的轨道力学机制受到了赞誉,甚至与NASA建立了合作关系,使其地位超越了一款普通游戏。

该模拟环境被限制为一个二体问题,并且仅限于少量行星,最常见的情况是只有一个名为Kerbin的类地行星。

该挑战赛包含多个场景,例如追踪并拦截卫星的任务以及规避探测的任务。

研究人员决定使用LLM,因为传统的控制方法需要经过多轮的训练、反馈和改进。

但Kerbal挑战的本质是尽可能逼真,这意味着任务仅持续数小时。

因此,不断改进模型将变得不切实际。

LLM之所以如此强大,是因为它们已经接受了大量人类写作文本的训练。

因此在最佳情况下,它们只需要少量精心设计的提示工程和几次尝试,就能为特定情境获取正确的上下文。

但这样一个「对话」模型真的可以驾驶宇宙飞船吗?

用GPT和Llama开飞船

首先介绍一下KSP挑战中需要解决的问题,智能体通过推力发动机控制航天器在所有三个旋转轴(偏航、俯仰和滚动)上的运动。

动作是在航天器的参考系下表达的,包括每个轴的推力大小以及施加推力的持续时间。

KSP挑战包含以下三种场景:

  • 追击者-逃逸者:智能体控制追击者。主要目标是使追击者与逃逸者之间的距离最小化。

  • 目标守卫:智能体控制劫匪航天器靠近航天器。

  • 遮挡太阳:智能体旨在将航天器定位在逃逸者与太阳之间。

    本研究的讨论范围只有「追击者-逃逸者」范畴。

在追击者-逃逸游戏的不同场景中,逃逸者的初始轨道在所有场景中保持不变,而追击者的初始轨道则有所变化。

追击者和逃逸者具有相同的飞行器参数。

评估指标包括追击者与逃逸者之间的距离(米)、最近接近时的速度(米/秒)、追击者燃料消耗量(千克)以及经过的时间(秒)。

明确了任务,让我们具体看看GPT和Llama是怎么开飞船的,该研究探索了两种路线:

1. ChatGPT+微调

选用GPT是因其易于使用,重点使用微调模型策略。

2.Llama+提示词工程

选用Llama则是由于其社区支持和开源灵活性,使用提示工程进行主要研究路线,并进行简单微调。

研究人员开发了一种方法,用于将航天器的给定状态及其目标以文本形式进行翻译。

然后,他们将其传递给LLM,并要求LLM提供如何调整和操控航天器的建议

研究人员随后开发了一个翻译层,将LLM基于文本的输出转换为可操作模拟飞行器的功能代码。

研究通过生成多个轨道的示例,用于收集Llama训练数据。

研究还给出了轨道数据生成的伪代码。

通过一系列简短的提示和一些微调,研究人员让ChatGPT完成了挑战中的许多测试任务,并且它在最近的一场竞赛中最终获得了第二名。

Llama竟然打败了GPT

有趣的是,OpenAI的微调API需要定制,但它提供的工具非常有限,尤其是与Llama相比。

因此,GPT训练的效果在很大程度上取决于数据的数量和质量,以及某些调整(特别是超参数),其中LRM的影响最为显著。

思维链方法的应用显著提高了飞船驾驶技术在追击问题中的泛化能力,并成功引导模型实现了执行过程中的0%失败率

Llama的结果远超研究人员预期。

该模型不仅遵循了一条稳定的顺行轨道,而且在KSPDG挑战中表现优于几乎所有其他方法。

需要强调的是,基础的Llama模型比GPT模型取得了更好的结果。

然而,考虑到Llama-3是与GPT-4竞争的模型,而非研究中GPT方法中使用的GPT-3.5,这一结果是在预期之内的。

(果然即使是研究人员也烧不起API的钱,开源这一点确实促进了生态的发展)

研究团队表示,这次研究发现结果非常令人满意。

轨道生成和智能体集成表明,使用AI构建训练场景可以作为一个出色且简单的模拟引擎替代方案。

虽然这个研究还属于早期,并且使用模型也不是目前最新的顶尖AI模型,但这个研究探索本身就很有启发意义。

未来我们不仅要竞争地面资源,太空资源也成为了新时代的「兵家必争之地」。

马斯克的星链计划已经开始抢占地球的低空轨道资源。

根据目前的数据统计,截止2025年上半年,在轨的星链卫星已经突破了6500+。

这是一个非常庞大的数量,虽然现在星链的运行只是按照既定轨道,少量需要人类干预,未来呢?

单纯靠人来控制这些卫星完全不够,也不现实。

所以这个研究如果真的能够让LLM来控制太空飞行器,那么将颠覆未来的太空竞赛生态。

在美剧《太空部队》中编剧设想了一个场景:

中国的空间站飞行到美国卫星上方时,运用机械臂将美国卫星的翅膀给剪了下来。

然后,美国的卫星就变成了太空垃圾。

除了编剧的「恶趣味」以外,AI上太空开飞船的场景还有很多,比如《特种部队2:全面反击》中太空钨棒武器。

或者是《火星救援》中的远航小队,如果有了足够智能的AI,就不用冒险再返回拯救马特达蒙,人类派出AI就够了。

这些场景未来还有很多很多。

甚至,最近硅谷投资彼得·蒂尔透露马斯克说要放弃殖民火星的梦想。还在采访中说「2024年是埃隆不再相信火星的一年。」

马斯克的转变是受到他与谷歌DeepMind CEO Demis Hassabis的一次谈话影响。

两人讨论了人工智能和星际旅行哪个会成为世界上最重要的技术进步。

据报道说,在Hassabis告诉他「你知道我的人工智能将能够跟随你去火星」后,Elon沉默了。

不管老马因为什么原因对火星失去信心,但是如果AI真的能够自主驾驶宇宙飞船,也许可以帮助他继续殖民火星的梦想!

可以设想一下,未来进行这种太空攻防对抗、互助救援和殖民外星球的背后,不仅仅比拼人的水平,还有AI的能力——谁家的AI更聪明、更智能。

毕竟,在太空探索的背景下,人类的一生还是太过于短暂,也许只有AI能扛过时间的侵蚀了。

人类终将沉睡于时光的尘埃,而AI,或许是那唯一能在深空中继续诉说文明故事的见证者。

——ChatGPT

参考资料:

https://arxiv.org/abs/2505.19896

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

环球网资讯
2026-03-25 15:39:26
人社部明确:事业编制改革启动,3100万人的“铁饭碗”要变了

人社部明确:事业编制改革启动,3100万人的“铁饭碗”要变了

慧眼看世界哈哈
2026-03-24 06:36:05
原来他12年前就已离世!患病3年女儿不愿照看,死后为争遗产现身

原来他12年前就已离世!患病3年女儿不愿照看,死后为争遗产现身

白面书誏
2026-03-26 13:38:18
张雪峰猝死全过程曝光!知情人发声,本来可以活,3次机会没抓住

张雪峰猝死全过程曝光!知情人发声,本来可以活,3次机会没抓住

智慧生活笔记
2026-03-25 18:23:01
伊朗两名高级将领殒命,巴盖里家族再添亡魂,强硬派折损惨重

伊朗两名高级将领殒命,巴盖里家族再添亡魂,强硬派折损惨重

老马拉车莫少装
2026-03-26 00:02:39
26号收评:沪指失守3900点,所有人都注意了,大盘后市开始这样看

26号收评:沪指失守3900点,所有人都注意了,大盘后市开始这样看

春江财富
2026-03-26 15:26:22
惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

惊呆了!网传某妇产医院一少妇哭求医生,改她儿子的血型鉴定书…

火山詩话
2026-03-26 11:40:00
伊朗被美以单方面轰炸23天,为何革命卫队依旧不认输?

伊朗被美以单方面轰炸23天,为何革命卫队依旧不认输?

高博新视野
2026-03-24 08:00:16
斯人已逝,建议收藏:张雪峰最看好的十大黄金专业,高考家庭必存

斯人已逝,建议收藏:张雪峰最看好的十大黄金专业,高考家庭必存

云隐南山
2026-03-25 20:56:01
4月1日起执行!高血压糖尿病患者必看:3件事现在办,省钱又省心

4月1日起执行!高血压糖尿病患者必看:3件事现在办,省钱又省心

牛锅巴小钒
2026-03-26 13:38:17
快讯!欧尔班的回旋镖来了!

快讯!欧尔班的回旋镖来了!

达文西看世界
2026-03-26 12:23:16
写小说判十年,把生殖器放女孩嘴巴里判两年九个月

写小说判十年,把生殖器放女孩嘴巴里判两年九个月

昊轩看世界
2026-03-24 19:56:42
6岁男孩躲避母亲殴打离家22年,长大方知母亲悲惨人生

6岁男孩躲避母亲殴打离家22年,长大方知母亲悲惨人生

孤酒老巷QA
2026-03-25 20:19:35
社保基金与外资持仓版图曝光:7只个股获“双重青睐”,最高年内涨超50%

社保基金与外资持仓版图曝光:7只个股获“双重青睐”,最高年内涨超50%

财闻
2026-03-26 16:59:58
加速心梗恶化的原因:饮酒排第5,排第1的,很多朋友天天做

加速心梗恶化的原因:饮酒排第5,排第1的,很多朋友天天做

岐黄传人孙大夫
2026-03-26 18:31:00
干翻埃尔法?尊界MPV实车曝光,前脸照搬S800

干翻埃尔法?尊界MPV实车曝光,前脸照搬S800

泡泡网
2026-03-26 11:21:11
眼睛是“脑梗”的放大镜?医生说:眼睛若有这6个异常,及时就医

眼睛是“脑梗”的放大镜?医生说:眼睛若有这6个异常,及时就医

健康之光
2026-03-23 22:15:04
俄军北极最强战舰,被击沉!乌军集中390架自杀机饱和突破成功

俄军北极最强战舰,被击沉!乌军集中390架自杀机饱和突破成功

沧海旅行家
2026-03-26 18:23:44
50岁保姆自述:月薪6千,包吃包住,却要满足男雇主各种要求

50岁保姆自述:月薪6千,包吃包住,却要满足男雇主各种要求

孢木情感
2026-03-26 14:13:28
黄天鹅晒出的检测报告上显示检测开始日期是2027年

黄天鹅晒出的检测报告上显示检测开始日期是2027年

映射生活的身影
2026-03-26 18:40:07
2026-03-26 21:08:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14821文章数 66721关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

教育
手机
亲子
旅游
军事航空

教育要闻

来上课了——高考阅读难题大综合(细节+主旨+含义)(下)第1段

手机要闻

OPPO K15 Pro系列突然官宣:天玑9500s+主动散热,4月1日发布

亲子要闻

孩子模仿这种行为,容易被坏人盯上!

旅游要闻

20元人民币背景观景台乱收费?景区通报:不存在封闭管控、强制收费等

军事要闻

担心特朗普突然停战 以总理下令48小时尽力摧毁伊设施

无障碍浏览 进入关怀版