网易首页 > 网易号 > 正文 申请入驻

从文本生成物理稳定积木模型,BrickGPT革新创意制造

0
分享至

就在几天前,美国卡耐基梅隆大学(CMU)的团队获得了国际计算机视觉大会 ICCV 的年度最佳论文奖。

这项研究来自 CMU 朱俊彦助理教授、刘畅流副教授和德瓦·拉马南(Deva Ramanan)教授联合团队,他们提出了一种新方法 BrickGPT,首次通过端到端的方式,从文本提示生成符合语义、物理稳定且实际可行的积木装配模型。

简言之,他们将搭积木变成一个写句子的过程。比如,你只需要用文字描述“一把吉他”,BrickGPT 就可以生成模型结构,并提供详细的步骤说明,这样你可以按照这些指导用积木一步步搭建出这把吉他。

值得关注的是,这些设计不是虚拟创意而是真正能够实现现实制造。除了能够通过手工组装,还可以让机器人自动组装。

相关论文题目为《从文本生成物理稳定且可建造的积木结构》(Generating Physically Stable and Buildable Brick Structures from Text)[1]。


图丨相关论文(来源:https://arxiv.org/abs/2505.05469)

那么,这种新方法有哪些独特的创新呢?

现有大多数 3D 生成方法主要关注视觉效果,包括形状的逼真程度、外观细节等,同时更多聚焦在单个整体,如 3D Mesh。尽管也有一些工作中加入了物理约束,但往往聚焦整体结构性质,如质心位置。这类物理约束相对容易表达且可以被现有的物理引擎模拟出来,因此较容易融入到模型学习过程中。

在 BrickGPT 的工作中,研究团队更多聚焦在拼装结构的物理约束,即单个物体不再是一个整体,而是由多个部件组装而成。这类结构在生活中更普遍存在,如制造、家居、电器等无处不在。

如果忽略物理世界的组装限制,一个看起来完美的模型,在现实中很可能没办法组装,甚至无法存在——要么是结构部位容易倒塌,要么是某些部分悬空没有支撑。这些组装件的物理限制往往更复杂,不容易表示且很难被现有的仿真器模拟出来。

为解决物理分析限制的问题,研究团队借助积木,希望通过拼装结构来探索物理稳定性和可实现性。他们提出一种核心思路:把搭积木变成一个写句子的过程。


图丨BrickGPT 概览(来源:https://avalovelace1.github.io/Bri)

该论文共同第一作者、CMU 博士生邓康乐对 DeepTech 表示:“只要你知道要把哪块积木放到哪个具体的地方,搭积木的每个步骤都可以用文本清晰地表达出来。这样我们就可以用大模型学习如何用语言的形式来表达搭积木的过程。”

但是,要让模型能够理解物理世界,仅靠模型学习是不够的。因此,研究人员在生成过程中还用到了显式物理属性。由于现有物理引擎无法模拟拼装积木的物理特性,他们将积木的物理属性公式转变为一个优化问题,通过求解受力分布,直接把物理属性嵌入到模型中,从而让模型理解积木的物理属性。

需要了解的是,语言模型在写句子的过程中可能会犯错,因为它对物理事实知之甚少,其并不理解搭出来的积木结构背后的物理性质和物理规律。因此,它可能会生成一些在物理世界中不可能存在的积木结构,例如飘在空中的积木或在空间上交叠的积木。

为解决该问题,研究团队首先将搭建积木的过程用结构化表示,即尽可能精简地表达积木块的尺寸,包括长、宽和它的物理空间位置,以让模型可以更好地理解空间上的位置关系。然后,他们还引入了物理约束,用显式的物理分析方法明确告诉模型,所生成的结构是否稳定或在物理世界中是否可能存在。

具体而言,如果模型生成的结构是不稳定的、可能会倒塌的,就需要去掉其中不稳定的结构,让模型更改并重新生成一个能够通过物理判别的结构。通过这样的强制性策略,使模型的结果能够符合物理世界的规律。


(来源:https://avalovelace1.github.io/BrickGPT/)

为确保数据的多样性,研究人员还构建了一个全新数据集 StableText2Brick,包含 4.7 万个稳定的积木结构,涵盖 2.8 万个来自 ShapeNet 数据集的不同 3D 物体。基于该数据集,能够生成不同的积木布局,即便形状相同,也可以通过不同的积木组合来实现。此外,他们还会对每个不同的结构进行稳定性分析,并只保留稳定的结构。

另一方面,由于基于文本来生成积木结构,只有积木结构数据是不够的。所以研究团队使用了 GPT-4o 模型来为每个积木结构匹配高质量文本信息。他们把积木渲染成多角度的 2D 图片,然后利用该多模态的语言模型根据这些图片生成符合的描述文本。

“在这个过程中,我们让语言模型尽可能生成不同长度及维度的描述,比如 10 个词以内、20 个词以内的描述。这样,我们的数据集在文本多样性方面也得到了补充和提升。”该论文共同第一作者、CMU 博士生刘瑞轩告诉 DeepTech。


图丨机器人组装积木(来源:该团队)

该技术为 AI 在实体制造和创意设计的应用提供了新的思路,可应用于创意、设计、教育领域等多个领域。

在教育领域,孩子们可基于 BrickGPT 用语言来描述一个积木模型,并自动生成这个积木模型。不仅能激发其创造力和想象力,还可以同时学习到物理知识和空间结构原理。

在创意设计领域,可能一些人经常会产生不错的机械装置设计创意,但受限于不会画机械图纸,也无法确认这些图纸在物理上是否可行,BrickGPT 便可作为一种高效的工具。需要了解的是,生成模型并不是要取代人类的创意,而是帮助人们显著降低门槛、更高效地实现设计想法。


(来源:https://avalovelace1.github.io/BrickGPT/)

这项研究涉及计算机科学、物理学、机械工程,机器人学等多个领域。巧合的是,其中的两位 PI 都是清华大学和美国加州大学伯克利分校的校友。朱俊彦先后在美国麻省理工学院从事博士后研究以及在 Adobe Research 担任研究员。目前他的研究方向是计算机视觉、图形学、计算摄影和生成模型。在本次研究中,其课题组的重点是为生成模型提供支持。

刘畅流在美国斯坦福大学完成博士后研究后,来到 CMU 任教,并成为 2024 年“35 岁以下科技创新 35 人”(MIT Technology Review Innovators Under 35)中国区入选者之一。她的研究方向包括机器人学习与操作、具身智能、安全控制和形式化方法。在本次研究中,她的课题组聚焦于机器人技术,包括物理分析、机器人操作和制造。

展望未来,该团队表示,他们更长远的目标是探索一种全新的、由生成模型、具身智能驱动的创造范式。这项研究的价值远不止于生成积木,实际上,我们生活中所有的物体本质上都是一种拼装结构。因此,研究团队的终极目标是通过生成模型与机器人技术降低设计门槛和制造门槛,让一切皆可“生成式制造”。

BrickGPT 是该团队向此范式迈出的第一步,他们表示目前也正在积极探索其他方向,例如与 CMU 助理教授李骄阳合作研究多机器人协作的大型复杂装配。同时团队也感谢 Richard King Mellon Foundation 以及 CMU Manufacturing Future Institute 对项目研究的初期支持。

参考资料:

1. 相关论文:https://arxiv.org/abs/2505.05469

2. 代码和模型:https://avalovelace1.github.io/BrickGPT/

3. Ava Pun 个人主页:https://avapun.com/

4. 邓康乐个人主页:https://dunbar12138.github.io/

5. 刘瑞轩个人主页:https://waynekyrie.github.io/

6. Deva Ramanan 个人主页:http://www.cs.cmu.edu/~deva/

7. 朱俊彦个人主页:https://www.cs.cmu.edu/~junyanz/

8. 刘畅流个人主页:https://icontrol.ri.cmu.edu/people/changliu.html

排版:刘雅坤

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
5月1日起高速无感支付落地!ETC不淘汰、补贴600元?附办理指南

5月1日起高速无感支付落地!ETC不淘汰、补贴600元?附办理指南

一口娱乐
2026-04-15 04:02:13
男子持长矛杀邻居后自首,一审被判死刑立即执行!法院:犯罪情节恶劣,罪行极其严重,不足以从轻处罚

男子持长矛杀邻居后自首,一审被判死刑立即执行!法院:犯罪情节恶劣,罪行极其严重,不足以从轻处罚

大风新闻
2026-04-15 13:43:07
约基奇场均27+13+11,却只值3张MVP票?

约基奇场均27+13+11,却只值3张MVP票?

茅塞盾开本尊
2026-04-14 15:07:41
机器人切除肿瘤不彻底,时隔18天二次手术,两年后患者去世;鉴定认为医院担主责

机器人切除肿瘤不彻底,时隔18天二次手术,两年后患者去世;鉴定认为医院担主责

大风新闻
2026-04-15 13:32:16
曾志伟深圳办73岁生日派对,逾百艺人到场,与谭咏麟合唱当场泪崩

曾志伟深圳办73岁生日派对,逾百艺人到场,与谭咏麟合唱当场泪崩

八斗小先生
2026-04-15 11:00:22
新能源车牌绿色变白色?网友称“高级”,还有人发“车牌褪色”教程!交管部门:违法

新能源车牌绿色变白色?网友称“高级”,还有人发“车牌褪色”教程!交管部门:违法

纵相新闻
2026-04-14 21:04:10
新华社18秒视频,让美国前高官“焦虑”了

新华社18秒视频,让美国前高官“焦虑”了

新华社
2026-04-14 20:53:52
54岁班主任带15岁女孩到宾馆开房猥亵被拘10天,家属发声

54岁班主任带15岁女孩到宾馆开房猥亵被拘10天,家属发声

澎湃新闻
2026-04-14 22:03:12
陈根:美国正式封锁霍尔木兹海峡,为什么中国是最受伤的一方?

陈根:美国正式封锁霍尔木兹海峡,为什么中国是最受伤的一方?

陈述智能
2026-04-15 07:45:08
港媒:香港“资深反派”演员江图离世,享年89岁

港媒:香港“资深反派”演员江图离世,享年89岁

界面新闻
2026-04-15 14:23:59
美国参议院民主党领袖舒默:对伊作战是史诗失败行动

美国参议院民主党领袖舒默:对伊作战是史诗失败行动

财联社
2026-04-15 14:28:08
许家印,KTV豪情终成妄念

许家印,KTV豪情终成妄念

哲空空
2026-04-15 11:40:51
郑丽文愿与赖清德沟通但未收到回应,国台办引用《论语》评论

郑丽文愿与赖清德沟通但未收到回应,国台办引用《论语》评论

澎湃新闻
2026-04-15 11:12:26
32岁丹麦羽毛球名将安赛龙自宣退役:我的身体已经无法支撑我继续作战

32岁丹麦羽毛球名将安赛龙自宣退役:我的身体已经无法支撑我继续作战

懂球帝
2026-04-15 13:28:18
有人预测:2026年5月即将迎来四大变化,普通人该如何应对?

有人预测:2026年5月即将迎来四大变化,普通人该如何应对?

老特有话说
2026-04-12 16:11:59
又吹上了:中方不发一枪“封锁”台海,美国人没法退休

又吹上了:中方不发一枪“封锁”台海,美国人没法退休

观察者网
2026-04-15 11:20:11
河南13岁被锁喉男孩赴京治疗后已脱离生命危险,拉绳老人已被采取刑事强制措施

河南13岁被锁喉男孩赴京治疗后已脱离生命危险,拉绳老人已被采取刑事强制措施

极目新闻
2026-04-15 11:11:27
赢麻了!继上次夺冠后,张雪机车再拿第一,国外品牌彻底坐不住

赢麻了!继上次夺冠后,张雪机车再拿第一,国外品牌彻底坐不住

沙雕小琳琳
2026-04-15 13:46:37
深圳开发商降价大逃杀!

深圳开发商降价大逃杀!

樱桃大房子
2026-04-14 22:13:57
“46岁罗志祥在家中猝死”登热搜,经纪人回应

“46岁罗志祥在家中猝死”登热搜,经纪人回应

齐鲁壹点
2026-04-14 14:44:12
2026-04-15 15:32:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16577文章数 514876关注度
往期回顾 全部

科技要闻

手机无死角上网?亚马逊砸百亿硬刚马斯克

头条要闻

浙江61岁男子持长矛杀邻居后自首 被判死刑立即执行

头条要闻

浙江61岁男子持长矛杀邻居后自首 被判死刑立即执行

体育要闻

三球准绝杀戴大金链:轰30+10自我救赎

娱乐要闻

曾志伟办73岁生日派对,逾百艺人到场

财经要闻

业绩失速的Lululemon:"健康"人设崩塌?

汽车要闻

海豹08内饰首秀 大满配“海王”旗舰

态度原创

教育
时尚
艺术
房产
军事航空

教育要闻

超实用!公共俄语四级解题思路,3层渗透法直接套用!

坏事做尽的疯女人,集体翻红了

艺术要闻

这山水,荡涤胸中尘埃

房产要闻

重磅调规!341亩商改住+中小学用地!宝龙城这把稳了?

军事要闻

万斯:对当前美伊局势进展“感到乐观”

无障碍浏览 进入关怀版