网易首页 > 网易号 > 正文 申请入驻

画个框、输入文字,面包即刻出现:AI开始在3D场景「无中生有」了

0
分享至

机器之心报道

编辑:陈萍

现在,通过文本提示和一个 2D 边界框,我们就能在 3D 场景中生成对象。

看到下面这张图了没?一开始,盘子里是没有东西的,但当你在托盘上画个框,然后在文本框中输入文本「在托盘上添加意大利面包」,魔法就出现了:一个看起来美味可口的面包就出现在你的眼前。



房间的地板上看起来太空荡了,想加个凳子,只需在你中意的地方框一下,然后输入文本「在地板上添加一个矮凳」,一张凳子就出现了:



相同的操作方式,在圆桌上添加一个茶杯:



玩具旁边摆放一只手提包统统都可以:



我们可以从以上示例看出,新生成的目标可以插在场景中的任意位置,还能很好地与原场景进行融合。

上述研究来自苏黎世联邦理工学院和谷歌,在论文《InseRF: Text-Driven Generative Object Insertion in Neural 3D Scenes》中,他们提出了一种名为 InseRF 的 3D 场景重建方法。InseRF 能基于用户提供的文本描述和参考视点中的 2D 边界框,在 3D 场景中生成新对象。



  • 论文地址:https://arxiv.org/pdf/2401.05335.pdf
  • 项目地址:https://mohamad-shahbazi.github.io/inserf/
  • 项目主页:https://mohamad-shahbazi.github.io/inserf/

在与其他方法的比较中,对于要求在玩具旁边渲染出一个杯子,I-N2N 直接改变了玩具原来的模样, MV-Inpainting 给出的结果更加糟糕,只有 InseRF 符合要求。



从左到右分别是原场景、 I-N2N 方法、 MV-Inpainting 以及 InseRF

这项研究重点关注在 3D 场景中插入生成对象(generative object insertion),这种方式在跨多个视图的同时还能保持一致,并且新生成的对象可以摆放在场景中的任意位置上。

一般来讲,使用 2D 生成模型在 3D 场景中插入生成对象是一项特别具有挑战性的任务,因为它需要在不同视点中实现 3D 一致的对象生成和放置。一种简单的方法是使用 3D 形状生成模型单独生成所需的对象,并使用 3D 空间信息将它们插入场景中。

然而,这种方法需要 3D 对象的准确位置、方向和比例。此外,与场景无关的对象生成可能会导致场景的样式和外观与插入对象之间的不匹配。

本文提出的 InseRF 很好地解决了上述问题,能够使用对象的文本描述和单视图 2D 边界框作为空间指导,在 3D 场景中进行场景感知生成和插入对象。

方法介绍

本文将 3D 场景的 NeRF 重建、要插入目标对象的文本描述以及 2D 边界框作为输入。输出结果会返回同一场景的 NeRF 重建,并且还包含在 2D 边界框里生成的目标 3D 对象。

值得注意的是,由于研究者还会用扩散模型先验来进行精确的 2D 定位,InseRF 只需要一个粗略的边界框就可以了。

InseRF 由五个主要步骤组成:

1)基于文本提示和 2D 边界框,在选定的场景参考视图中创建目标对象的 2D 视图;

2) 根据生成的参考图像中的 2D 视图重建 3D 对象 NeRF;

3) 借助单目深度估计来估计场景中对象的 3D 位置;

4) 将对象和场景 NeRF 融合成一个包含估计放置物体的单个场景;

5) 对融合的 3D 表示应用细化步骤以进一步改进插入的对象。



编辑参考视图

编辑 pipeline:首先选择场景的一个渲染视图作为参考,并根据用户提供的文本提示和 2D 边界框插入目标对象的 2D 视图。参考视图用于提供参考外观和位置来为 3D 插入奠定基础。

为了确保输入边界框中的局部 2D 插入,本文选择掩码条件修复方法作为 2D 生成模型。具体来说,他们选择 Imagen,这是一种强大的文本到图像扩散模型,并通过使用 RePaint(一种使用扩散模型进行掩码条件修复的方法)进一步使其适应掩码条件。

单视图对象重建

获得参考编辑视图后,本文提取边界框内生成对象的 2D 视图并构建其 3D 重建。本文建议利用最新的单视图对象重建范式,即使用 3D 感知扩散模型。此类重建方法通常在大规模 3D 形状数据集(例如 Objaverse )上进行训练,因此包含对 3D 对象的几何形状和外观的强大先验。

本文使用最近提出的 SyncDreamer 进行对象重建,它在重建质量和效率之间提供了良好的权衡。

实验

该研究在 MipNeRF-360 和 Instruct-NeRF2NeRF 数据集上进行了评估。

此外,该研究还将 InseRF 与基线方法进行了比较,包括 Instruct-NeRF2NeRF (I-N2N) 、 Multi-View Inpainting (MV-Inpainting) 。

为了评估 InseRF 生成插入对象的能力,该研究在图 3 中提供了将 InseRF 应用于不同 3D 场景的可视化示例。如图所示,InseRF 可以在场景中插入 3D 一致的对象。值得注意的是,InseRF 能够在不同表面上插入对象,这在缺乏精确 3D 放置信息的情况下是一项具有挑战性的任务。



图 4 是与基线方法的比较。由结果可知,使用 I-N2N 会导致场景中的全局更改,并且这种改变是更改现有对象而不是创建新对象,例如 I-N2N 把 4a 中的乐高卡车变成了一个马克杯,把 4b 中厨房柜台上的物品变成了一个餐盘。



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
何洁上乘风减掉70斤!美上热搜,从160斤到90斤她是怎么做到的

何洁上乘风减掉70斤!美上热搜,从160斤到90斤她是怎么做到的

小村民
2024-04-27 13:31:08
军中色虎谷俊山,贪污300亿,无人敢动,背靠两大保护伞,被判死缓

军中色虎谷俊山,贪污300亿,无人敢动,背靠两大保护伞,被判死缓

天闻地知
2024-04-25 17:15:16
当老师不吃香了?厦门教师招聘疑因取消编制无人报考,官方回应了

当老师不吃香了?厦门教师招聘疑因取消编制无人报考,官方回应了

阿蒙聊教育
2024-04-26 21:13:21
到底是逻辑重要还是立场重要?

到底是逻辑重要还是立场重要?

手工制作阿爱
2024-04-25 07:30:30
“内控重大缺陷”!会计师事务所出具否定意见,这家A股公司将戴帽!

“内控重大缺陷”!会计师事务所出具否定意见,这家A股公司将戴帽!

证券时报e公司
2024-04-27 08:26:17
小米汽车推出小米SU7 5月限时购车权益

小米汽车推出小米SU7 5月限时购车权益

界面新闻
2024-04-27 10:09:57
最新进展!韩媒:韩国五大医院教授达成一致,决定“每周休诊一天”

最新进展!韩媒:韩国五大医院教授达成一致,决定“每周休诊一天”

环球网资讯
2024-04-26 15:00:19
今日缅甸果敢:往日汉字国门已被更换,现使用缅文已成主流

今日缅甸果敢:往日汉字国门已被更换,现使用缅文已成主流

我是兰兰
2024-04-27 11:47:37
年轻时选择看起来貌似最轻松的捷径,十几年后,子弹才正中眉心

年轻时选择看起来貌似最轻松的捷径,十几年后,子弹才正中眉心

娱乐圈酸柠檬
2024-04-22 21:31:40
其实我们很多人,都还没有意识到,人一旦步入七十岁以后

其实我们很多人,都还没有意识到,人一旦步入七十岁以后

今日养生之道
2024-04-27 12:08:47
湖南卫视知名主持人在美国定居,开保时捷拎爱马仕,成二胎辣妈

湖南卫视知名主持人在美国定居,开保时捷拎爱马仕,成二胎辣妈

娱乐白名单
2024-04-17 14:24:39
判了!“广洲人家”赔偿“广州酒家”200万元

判了!“广洲人家”赔偿“广州酒家”200万元

环球网资讯
2024-04-27 13:19:01
未来3年可能出现的变化:现金、房子会贬值,而这4样却可能升值!

未来3年可能出现的变化:现金、房子会贬值,而这4样却可能升值!

静海
2024-02-19 19:00:40
立陶宛遭欧盟“背叛”,中国赢得胜利,局势反转,棋子成弃子了

立陶宛遭欧盟“背叛”,中国赢得胜利,局势反转,棋子成弃子了

星辰故事屋
2024-04-27 19:07:25
特殊信号!一天发生四件大事:菲律宾可能要对国内的中国人下手了

特殊信号!一天发生四件大事:菲律宾可能要对国内的中国人下手了

清欢渡语
2024-04-25 21:49:17
中国绝不容许!为解除35万亿美债危机,美国欲复刻亚洲金融风暴

中国绝不容许!为解除35万亿美债危机,美国欲复刻亚洲金融风暴

小马哥谈体育
2024-04-27 03:15:45
特斯拉这款车型刚上市几天,就上调价格超7200元!特斯拉又遭调查,啥情况?前高管出手,套现13亿元......

特斯拉这款车型刚上市几天,就上调价格超7200元!特斯拉又遭调查,啥情况?前高管出手,套现13亿元......

每日经济新闻
2024-04-27 09:17:24
俄军本周迎接ATACMS导弹灭顶,唯一可祈祷的就是不要砸向自己

俄军本周迎接ATACMS导弹灭顶,唯一可祈祷的就是不要砸向自己

移光幻影
2024-04-25 10:58:06
我真不是马后炮,早就说了张小斐是“假火”,一个人扛不动票房了

我真不是马后炮,早就说了张小斐是“假火”,一个人扛不动票房了

闻星盼夏
2024-04-26 19:02:24
天蝎座若遇上这三个星座,会输得一败涂地,还放不下,舍不得

天蝎座若遇上这三个星座,会输得一败涂地,还放不下,舍不得

树莓说故事
2024-04-27 14:25:50
2024-04-27 19:50:44
机器之心Pro
机器之心Pro
专业的人工智能媒体
8934文章数 141895关注度
往期回顾 全部

科技要闻

特斯拉这款车型刚上市几天,就上调价格

头条要闻

杨晓明涉嫌违纪违法 曾带队研发全球首款新冠灭活疫苗

头条要闻

杨晓明涉嫌违纪违法 曾带队研发全球首款新冠灭活疫苗

体育要闻

时代要落幕了?詹姆斯杜兰特陷0-3绝境

娱乐要闻

金靖回应不官宣恋情结婚的原因

财经要闻

北京房价回到2016年

汽车要闻

5月上市/智能化丰富 海狮 07EV正式到店

态度原创

艺术
时尚
旅游
教育
房产

艺术要闻

画廊周北京迎来第八年, “漂留” 主题聚集 30 余家艺术机构与 40 场展览

七八十岁男人,尽量别穿“背心+大裤衩”出门,显老油腻、很邋遢

旅游要闻

散装河北,冀北、冀东、冀中、冀南如何划分?

教育要闻

清华大学成立人工智能学院,姚期智任首任院长

房产要闻

海南最新房价出炉,三亚跌价最猛!

无障碍浏览 进入关怀版