网易首页 > 网易号 > 正文 申请入驻

全球首次实测通过!CMU华人用AI设计的乐高「不翻车」

0
分享至

新智元报道

编辑:peter东 英智

【新智元导读】如何将一句简单的文字描述变成物理稳定的乐高模型?LegoGPT通过物理感知技术,确保98.8%的设计稳如磐石。

输入一段文字,AI就能设计出可实际搭建的乐高?

来自CMU的研究人员提出的LegoGPT彻底改变了游戏规则。

只需输入「金属紫色电吉他」,AI就能生成一个不仅外形逼真,还能在现实中稳稳站立的乐高模型!

不同于传统3D建模工具生成的,LegoGPT通过微调Meta的LLaMA模型,结合47,000个稳定结构数据集,确保98.8%的设计符合物理定律。

LegoGPT是第一个能够将文本输入转换为物理稳定的乐高设计的AI模型。

目前,数据集、代码和模型均已开源。

论文地址:https://www.arxiv.org/abs/2505.05469

项目地址:https://avalovelace1.github.io/LegoGPT/

不同于那些会为了迎合你输入的请求而生成奇怪(且不稳定)设计的 AI 生成器,LegoGPT的设计遵循物理定律,这意味着。

LegoGPT不仅设计了与文本描述(提示词)相匹配的乐高模型,还确保它们可以在现实世界中逐块搭建,无论是人类测试者通过手工搭建,还是借助机器人辅助构建。

搭建高背椅子的乐高过程

图1:生成的乐高模块,经过带有力传感器的双臂机器人系统,根据 AI 生成的指令来拾取和放置积木,最终组成完成的乐高成品

LegoGPT生成的乐高组件,不止包含了具体的结构,还能按照提示词,包含喷漆机纹理图案。

图2:LegoGPT生成的乐高组件

生成带有提示词纹理图案的乐高组件

LegoGPT根据提示词金属紫色电吉他,生成的乐高组件是吉他形状,并且下部为紫色

LegoGPT相比之前生成3D建模的工具,其最大的优势在于其生成的结构是稳定的。

许多现有的 3D 生成模型专注于创建具有详细几何形状的多样化物体,但其生成的设计往往无法物理实现。

没有适当的支撑,设计的一部分可能会坍塌、漂浮或保持断开状态。

而使用LegoGPT生成的设计98%的时间是物理稳定的。

突破传统3D建模局限

LegoGPT怎么做到给出稳定设计的?

首先,LegoGPT的微调了Meta的一个开源大模型LLaMA-3.2-1B-Instruct,为了训练模型,团队构建了一个名为StableText2Lego的新数据集。

其中包含超过47,000个稳定的乐高结构,28000个独特的3D对象,其中每一个都由OpenAI的GPT-4o生成描述性标题,例如「流线型」「细长的船」或「具有醒目前格栅的经典风格汽车」这样的描述以及对应的3D乐高组件。

图3:a)统将 LEGO 设计分割成一系列文本标记,以从下到上的光栅扫描方式排序,b)将砖块序列与描述配对,以微调 LLaMA-3.2-Instruct-1B。c)在推理时,LegoGPT 通过根据文本提示逐个预测砖块来增量生成LEGO设计

每个结构都经过了物理分析,以确保它可以在现实世界中建造。

此外,LegoGPT团队使用了一个独立的软件工具来增强积木预测模型,该工具可以使用模拟重力和结构力的数学模型来验证物理稳定性。

图4:考虑乐高重力和结构力的物理模型,以预测乐高组件拼接后的稳定性

LegoGPT作为第一个预训练LLM,该模型不是预测下一个词,而是逐步预测要添加的下一个积木,从而逐步搭建出一个完整的由乐高组成的世界。

LegoGPT会通过首先生成一系列精确放置的乐高积木来工作。

对于序列中的每个新积木,系统确保它不会与现有积木碰撞,并且能够适应建筑空间。

完成设计后,它使用上述数学模型来验证模型能够直立而不倒塌。

如果LegoGPT生成的模型在实际搭建中部分组件倒塌,系统也会识别出第一个不稳定的积木并回溯,移除它以及所有后续积木,然后尝试不同的方法。

这种具有物理感知的回滚方法被证明是LegoGPT的要点。没有它,只有24%的设计能够站立,而使用完整系统时,成功率则有98.8%。

图5:LegoGPT生成的不稳定组件,在回滚中被去除

乐高不只是一个玩具,LegoGPT的用途,也远远不止加速新一代乐高玩具的设计,把乐高店里的玩具价格打下来。

LegoGPT展示出的技术实力,有着现实用途。

能够设计出稳定的乐高组件,也就能让大模型设计出可以3D打印的组件,再由机器人将这些组件拼接成具有现实功能的工具,例如无人机,无人驾驶的船只及模型车,这些在技术上,是一脉相承的。

LegoGPT中对于物理模型,以及不稳定组件的回滚,使其能够成为第一个具有极高可靠率,能产生稳定3D结构的预训练模型。

当然,LegoGPT仍存在一些局限性。

当前的LegoGPT版本仅在20×20×20的建筑空间内工作,并且仅使用八种标准积木类型。

LegoGPT目前支持一组固定的常用乐高积木,在未来工作中,LegoGPT的研究团队计划扩展积木库,以包含更广泛的尺寸和积木类型,例如斜坡和地砖。

研究人员希望扩大他们的训练数据集,以包含比目前可用的21个类别更多的对象。

作者介绍

Kangle Deng

Kangle Deng是卡内基梅隆大学(CMU)机器人研究所的博士生,由Deva Ramanan和Jun-Yan Zhu的共同指导。 此前,他于2020年获得北京大学学士学位。

Kangle Deng的研究方向主要为计算机辅助创作,目前的研究工作得到了微软研究院博士奖 学金的支持。

Ruixuan Liu

Ruixuan Liu卡内基梅隆大学(CMU)计算机学院机器人研究所的博士生,导师是智能控制实验室的Changliu Liu教授。

他的研究方向为机器人学习/控制、生成式制造以及人机协作。

Ruixuan Liu在卡内基梅隆大学(CMU)获得了电气与计算机工程学士学位,辅修机器人技术。

本科期间,他在Sebastian Scherer教授领导的AirLab实验室工作,工作重点是用于建筑结构检测的传感器融合和三维重建。

参考资料:

https://arxiv.org/html/2505.05469v1

https://arstechnica.com/ai/2025/05/new-ai-model-generates-buildable-lego-creations-from-text-descriptions/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
不到一周张雪机车再战WSBK!张雪:可能会输 提前泼一盆冷水

不到一周张雪机车再战WSBK!张雪:可能会输 提前泼一盆冷水

快科技
2026-04-13 11:12:10
约基奇场均29+13+10刷爆历史,NBA用了78年等来第一个三冠王

约基奇场均29+13+10刷爆历史,NBA用了78年等来第一个三冠王

体坛观察猿
2026-04-13 15:02:31
伊朗总统通过普京表态:愿和美国达成公平协议,这是妥协的信号

伊朗总统通过普京表态:愿和美国达成公平协议,这是妥协的信号

叮当当科技
2026-04-14 02:49:03
这双Adidas被Alba穿成半永久,84刀还能偷增高1英寸

这双Adidas被Alba穿成半永久,84刀还能偷增高1英寸

追星雷达站
2026-04-13 08:09:09
伊朗用血泪换来的教训:中美一旦开战,中国必须首先锁定这一点

伊朗用血泪换来的教训:中美一旦开战,中国必须首先锁定这一点

触摸史迹
2026-04-14 03:16:56
颠覆“一国两制”框架?吴建国倡议两岸统一新路径

颠覆“一国两制”框架?吴建国倡议两岸统一新路径

人生录
2026-04-13 10:00:27
“人间悲剧”张紫妍:被31位财阀灌药性侵,总统都无法替她申冤

“人间悲剧”张紫妍:被31位财阀灌药性侵,总统都无法替她申冤

她时尚丫
2026-04-07 23:22:56
山东省菏泽市委常委、秘书长肖友华接受审查调查

山东省菏泽市委常委、秘书长肖友华接受审查调查

界面新闻
2026-04-13 10:04:23
官宣中国队19人名单!宫鲁鸣苦练5个月,7大老国手无缘3人是亮点

官宣中国队19人名单!宫鲁鸣苦练5个月,7大老国手无缘3人是亮点

老吴说体育
2026-04-13 22:52:28
法国官宣开火,中东这趟浑水,欧洲终究没能躲过去

法国官宣开火,中东这趟浑水,欧洲终究没能躲过去

荷兰豆爱健康
2026-04-14 00:45:50
崔始源演「振动器意外」被喷上热搜,400万围观网友集体懵圈

崔始源演「振动器意外」被喷上热搜,400万围观网友集体懵圈

影视情报室
2026-04-13 08:18:09
联盟最虚伪超巨!2.7亿续约没兴趣,只要赢球:不想留我可以交易

联盟最虚伪超巨!2.7亿续约没兴趣,只要赢球:不想留我可以交易

你的篮球频道
2026-04-13 14:32:20
打败欧尔班后,马扎尔:我们解放了匈牙利,夺回了国家

打败欧尔班后,马扎尔:我们解放了匈牙利,夺回了国家

军科零零
2026-04-14 02:18:52
成年人的社交潜规则|无论谁帮了你,一定要送礼,不收也要送

成年人的社交潜规则|无论谁帮了你,一定要送礼,不收也要送

杏花烟雨江南的碧园
2026-04-11 16:15:03
只差6分,英超争冠白热化!曼城与阿森纳剩余赛程全面对比

只差6分,英超争冠白热化!曼城与阿森纳剩余赛程全面对比

夜白侃球
2026-04-13 10:10:19
暴跌!价格几乎腰斩!一女子连吃两天,剧烈腹痛胃底被堵死!很多人爱吃

暴跌!价格几乎腰斩!一女子连吃两天,剧烈腹痛胃底被堵死!很多人爱吃

南方都市报
2026-04-13 16:44:33
美官员称美伊双方在伊斯兰堡会谈后继续保持接触

美官员称美伊双方在伊斯兰堡会谈后继续保持接触

财联社
2026-04-14 01:54:06
今夏最热时间表出炉了,啥时候最热?2026年夏天热不热?早了解

今夏最热时间表出炉了,啥时候最热?2026年夏天热不热?早了解

小谈食刻美食
2026-04-13 16:58:41
美国一旦霸权结束,一定会灭亡的三个国家,排第一的果然是它

美国一旦霸权结束,一定会灭亡的三个国家,排第一的果然是它

今夜繁星坠落
2026-04-07 02:36:47
下架、召回!广东多款饮用水,细菌超标!情况通报

下架、召回!广东多款饮用水,细菌超标!情况通报

娱乐的硬糖吖
2026-04-14 00:52:32
2026-04-14 04:36:49
新智元 incentive-icons
新智元
AI产业主平台领航智能+时代
14960文章数 66768关注度
往期回顾 全部

科技要闻

"抄作业"近四年,马斯克版微信周五上线

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

头条要闻

上海女子2个月内结2次婚 生下的孩子却是第3个男人的

体育要闻

一支球队不够烂,也是一种悲哀

娱乐要闻

初代“跑男团”合体,邓超、鹿晗缺席

财经要闻

谈判未完全关闭?3国力促美伊重启谈判

汽车要闻

不止命名更纯粹 领克10/10+要做纯电操控新王

态度原创

旅游
游戏
本地
公开课
军事航空

旅游要闻

“一站式”赏花

韩国传奇选手坦言不希望LCK再夺冠!网友:他不怕被韩网爆破吗?

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

特朗普:今晚10点封锁伊朗 对北约非常失望

无障碍浏览 进入关怀版