网易首页 > 网易号 > 正文 申请入驻

CMU朱俊彦等上新LEGOGPT,一句话搭乐高,网友:复杂零件行不行?

0
分享至

机器之心报道

机器之心编辑部

AI 不允许有人不会搭乐高。

近日,CMU 助理教授朱俊彦团队带来了新研究 —— 基于文本生成 3D 乐高的大模型。

这款大模型有多强呢?比如输入文本「基本款沙发」,一眨眼的功夫,乐高沙发就拼好了。

如果你觉得乐高沙发太简单,可以继续上难度,让它生成一个复杂点的书架,只见不同大小的积木拼拼凑凑,乐高书架就完工了,整个流程像不像你在拼乐高:

不仅如此,生成的乐高还有纹理和颜色:

为了证明 AI 搭乐高的设计过程在现实生活中可用,研究人员让机器臂组装了由 AI 创建的 LEGO 模型,结果很完美。

接下来,我们看文章主要内容。

得益于生成模型和神经渲染技术,3D 生成模型已经取得了显著进展,并在虚拟现实、游戏、娱乐和科学计算等领域实现了各种应用。比如,一些研究探索了从文本合成 3D 对象、为网格添加纹理以及操控现有 3D 对象和场景的形状和外观。

不过,应用现有方法创建现实世界中的对象仍然充满挑战。大多数方法侧重于生成具有高保真几何形状和外观的多样化 3D 对象,但受限于两个关键挑战,这些数字设计往往无法在物理上实现。一是,这些对象可能难以使用标准组件来组装或制作。二是,即使可以组装,最终的结构也可能存在物理不稳定。如果没有适当的支撑,设计的某些部分可能会坍塌、漂浮或保持分离状态。

因此,朱俊彦团队探讨了生成物理可实现对象的挑战,并在乐高(LEGO)设计环境中进行研究。乐高广泛应用于娱乐、教育、艺术创作和制造原型。同时,由于所有标准组件很容易获得,乐高可以作为可复现的研究基准。由于手动设计需要付出巨大努力,最近一些研究开发了自动化算法来简化流程并生成了令人信服的结果。

然而,现有方法主要基于给定的 3D 对象创建乐高设计,或者专注于单一对象类别。本文的目标是开发一种方法,直接从自由格式的文本提示生成乐高设计,同时确保其物理稳定性和可搭建性。具体来说,研究者的目标是训练一个生成模型,使其能够生成具有以下特点的设计:

  • 物理稳定性:构建在具有强大结构完整性的乐高底板上,不会出现积木漂浮或坍塌的情况。
  • 可搭建性:与标准乐高积木兼容,并且能够由人类或机器人逐块组装。

研究者提出了 LEGOGPT,其关键洞察在于将最初用于下一个 Token 预测的自回归大型语言模型重新用于下一个积木预测。他们将乐高设计问题表述为一个自回归文本生成任务,其中下一个积木的尺寸和位置用简单的文本格式指定。而为了确保生成的结构既稳定又可搭建,研究者在训练和推理过程中都强制执行物理感知的组装约束。

在训练过程中,研究者构建了一个包含物理稳定的乐高设计并配有字幕的大规模数据集。在自回归推理过程中,研究者通过有效性检查和物理感知回滚来执行可行性,以确保最终的 Token 符合物理定律和组装约束。

  • 论文标题: Generating Physically Stable and Buildable LEGO® Designs from Text
  • 论文主页:https://avalovelace1.github.io/LegoGPT/
  • arXiv 地址:https://arxiv.org/pdf/2505.05469
  • GitHub 地址:https://github.com/AvaLovelace1/LegoGPT
  • Demo 地址:https://huggingface.co/spaces/cmu-gil/LegoGPT-Demo

实验表明,本文生成的乐高设计稳定、多样且视觉吸引力强,同时能够完美契合输入文本提示。本文方法优于预训练的 LLM(无论是否包含上下文学习)以及以往基于网格 3D 生成的方法。

朱俊彦表示:LegoGPT 是迈向「物理对象生成制造」这一终极目标的一小步。当前版本仍存在局限:仅支持 20x20x20 的构建尺寸、21 种物体类别和基础积木类型,但他们也在努力扩展其能力!

面对这么好玩的应用,网友纷纷求教程:

还有网友担心,复杂的零件能不能完成啊?

方法介绍

数据集

训练自回归模型需要大规模数据集,因此,本文推出了 StableText2Lego,这是一个全新的大规模 LEGO 数据集,包含 47,000 多种不同的乐高结构,并涵盖 ShapeNetCore 数据集中 21 个常见对象类别中的 28,000 多个独特的 3D 对象。其概览如图 2 所示。

LegoGPT Pipeline

在实现方法上,本文提出了 LEGOGPT,这是一种能够根据文本提示生成物理结构稳定的 LEGO 设计的方法。

该方法通过利用 LLM 的序列建模和文本理解能力,对预训练 LLM 进行 LEGO 生成任务的微调。为了增强设计成品的结构稳定性和可搭建性,本文在推理过程中采用了逐块拒绝采样和物理感知回滚机制。图 3 展示了本方法的整体框架。

模型微调:本文进一步使用自定义指令数据集对预训练的 LLM 进行微调,该数据集包含来自 StableText2Lego 的文本提示及其对应的乐高结构。

预训练基础模型。本文使用 LLaMA-3.2-1B-Instruct 作为基础模型,如图 5 所示,基础模型可以通过上下文学习生成类似 LEGO 的设计。

然而,生成的设计通常会遗漏某些物体部件,并且包含相交或断开的积木,这使其在物理上不稳定且无法搭建。为了解决这些问题,本文使用数据集进一步微调了预训练模型。

物理稳定性:尽管该模型基于物理稳定性数据进行了训练,但有时生成的设计仍会违反物理和组装约束。为了解决这个问题,该研究进一步将物理稳定性验证纳入自回归推理中。

如果乐高结构在底板上搭建时不会倒塌,则该结构被认为是物理稳定的且可搭建的。为此,本文使用稳定性分析方法评估物理结构稳定性。图 4 (a) 展示了施加在单个积木上的所有可能力。

LEGOGPT 推理算法如下:

乐高纹理和着色:颜色和纹理在创意乐高设计中也起着至关重要的作用。因此,本文提出了一种应用精细 UV 纹理或为单个积木分配统一颜色的方法。

实验

图 5 展示了一系列多样化、高品质的 LEGO 设计,这些设计紧密遵循输入提示。

本文选取 LLaMAMesh 、LGM、XCube 和 Hunyuan3D-2 作为基线方法。如表 1 所示,本方法在所有指标上均超越基线方法。图 5 直观展示了本方法生成的乐高结构质量显著优于基线方案。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
《主角》:赢了天赋,输了心性,终究活成了自己讨厌的样子

《主角》:赢了天赋,输了心性,终究活成了自己讨厌的样子

怂熊剧场
2026-05-24 06:45:08
四川发布干部任前公示 周杰拟任正厅级领导职务

四川发布干部任前公示 周杰拟任正厅级领导职务

掌上金牛
2026-05-29 19:58:07
正式获批!浙江迎来第三所985!

正式获批!浙江迎来第三所985!

新浪财经
2026-05-28 16:33:09
六一儿童节官宣!国务院明确:6月1日不满14周岁儿童放假1天

六一儿童节官宣!国务院明确:6月1日不满14周岁儿童放假1天

奇葩游戏酱
2026-05-30 00:12:37
交了智商税才明白:这4种家电一定要买贵的,没钱干脆先不买

交了智商税才明白:这4种家电一定要买贵的,没钱干脆先不买

装修秀
2026-05-21 21:07:00
苏联为他破例,毛主席为他题词:一位被遗忘的“共和国全才”

苏联为他破例,毛主席为他题词:一位被遗忘的“共和国全才”

长江浊酒客
2026-05-28 10:30:06
情况越来越不妙,赖清德决定签字,两岸对话被毁,民进党闯下大祸

情况越来越不妙,赖清德决定签字,两岸对话被毁,民进党闯下大祸

观史搜寻着
2026-05-29 06:54:01
江苏一男子手术失败快不行了,妻子抱着他哭得肝肠寸断,谁料,男子却凑到妻子耳边说了句话,听完当场就笑了...

江苏一男子手术失败快不行了,妻子抱着他哭得肝肠寸断,谁料,男子却凑到妻子耳边说了句话,听完当场就笑了...

大爱三湘
2026-05-29 19:22:31
我国首个“亿级车企”诞生!无锡马力全开

我国首个“亿级车企”诞生!无锡马力全开

新浪财经
2026-05-28 22:05:32
如果一个家庭长期没酒局、没社交,也少走亲戚,只能说明这两个问题

如果一个家庭长期没酒局、没社交,也少走亲戚,只能说明这两个问题

心理观察局
2026-05-04 09:23:46
丈夫的兄弟每周来家里留宿,凌晨我闭眼装睡,他竟偷偷推开房门

丈夫的兄弟每周来家里留宿,凌晨我闭眼装睡,他竟偷偷推开房门

半身Naked
2026-03-19 09:37:26
扎克伯格再出王炸!开源全球首个AI蛋白质世界模型,最高88%命中率,颠覆药物研发!

扎克伯格再出王炸!开源全球首个AI蛋白质世界模型,最高88%命中率,颠覆药物研发!

智药局
2026-05-28 19:10:25
窦骁说,不是张艺谋找我演的主角,演主角完全是一个意外

窦骁说,不是张艺谋找我演的主角,演主角完全是一个意外

童叔不飙车
2026-05-29 15:27:19
敢说!德比斯:马西亚像神经病一样疯狂比手势 我以为我撞死人了

敢说!德比斯:马西亚像神经病一样疯狂比手势 我以为我撞死人了

念洲
2026-05-29 13:25:03
六小龄童发文悼念:《西游记》“福星” 饰演者安云武逝世,享年78岁

六小龄童发文悼念:《西游记》“福星” 饰演者安云武逝世,享年78岁

极目新闻
2026-05-29 08:38:28
拉比奥与米兰分手在即?“叛将”说法无从说起

拉比奥与米兰分手在即?“叛将”说法无从说起

爱看球的龙江闲人
2026-05-30 04:20:14
巴拿马触底线,求饶路已自堵死

巴拿马触底线,求饶路已自堵死

风铃草语
2026-05-29 06:31:59
乘组飞了210天!神舟二十二号飞船着陆:返航时为何要穿航天服

乘组飞了210天!神舟二十二号飞船着陆:返航时为何要穿航天服

林子说事
2026-05-30 01:48:00
老虎证券新西兰遭中方调查,新西兰监管机构回应

老虎证券新西兰遭中方调查,新西兰监管机构回应

发现新西兰
2026-05-29 12:15:32
97年我跑长途捎了一位尼姑,尼姑下车时送我三句话,三年后全应验

97年我跑长途捎了一位尼姑,尼姑下车时送我三句话,三年后全应验

千秋文化
2026-04-29 19:09:51
2026-05-30 04:51:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13115文章数 142655关注度
往期回顾 全部

科技要闻

Claude Opus 4.8凌晨突发上线

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

头条要闻

释永信被判24年 中国佛教协会:完全是咎由自取

体育要闻

即使是文班亚马,也做不到这件事

娱乐要闻

奚梦瑶何猷君将于6月在法国举行婚礼

财经要闻

近3个月跌超20% 黄金"猴市"下的众生相

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

手机
教育
本地
公开课
军事航空

手机要闻

自研OS+玄戒+AI大模型,小米18系列,稳了!

教育要闻

“不漂亮,还很吓人!”大眼睛艺考生走红,颜值却令网友感到不适

本地新闻

用剪纸的方式,打开江苏扬州

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

中方公布参加香会阵容 几大议题受到关注

无障碍浏览 进入关怀版