网易首页 > 网易号 > 正文 申请入驻

多视图一致性生成神器!北航开源MV-Adapter轻松插拔、功能丰富

0
分享至

现有的多视图图像生成方法往往需要对预训练的文本到图像(T2I)模型进行大幅度的改动,还需要全面微调,这带来了两个主要问题:计算成本高,特别是在处理大型基础模型和高分辨率图像时,这种方法非常耗资源;图像质量下降,由于优化过程困难以及高质量3D数据稀缺,生成的图像质量常常无法达到预期。

基于以上问题,北航提出了第一个基于适配器的多视图图像生成解决方案,名为MV-Adapter。它是一种多功能的即插即用适配器,能够在不改变原有网络结构或特征空间的情况下增强T2I模型及其衍生模型。MV-Adapter 在 Stable Diffusion XL (SDXL) 上实现了高达768分辨率的多视图图像生成,并展示了出色的适应性和多功能性。它还能扩展到任意视角生成,为更广泛的应用打开了新大门。(链接在文章底部)

01 技术原理

MV-Adapter 是一种即插即用的适配器,能够学习多视图的先验知识,并将这些知识迁移到 T2I 模型的不同变体中,无需特别调整。它让 T2I 模型在各种条件下生成多视图一致的图像。

在推理阶段,MV-Adapter 包含一个条件引导器(黄色部分)和解耦注意力层(蓝色部分)。它可以直接插入到定制版或简化版的 T2I 模型中,变身为一个能够生成多视图图像的工具。

MV-Adapter 有两个主要组成部分:

  1. 条件引导器:用于编码相机条件或几何条件,让模型能更好地理解视角或空间信息。
  2. 解耦注意力层:包含多视图注意力层,用来学习多视图的一致性。同时还有可选的图像交叉注意力层,支持基于图像生成的功能。这里用预训练的 U-Net 对参考图像进行编码,提取细致的信息供生成使用。
支持ComfyUI:

02 实际效果

文本到多视图: 图像到多视图: 草图到多视图 (使用 ControlNet):

通过重复自注意力层和并行注意力架构,以及统一的条件编码器,将 3D 几何知识高效融入适配器,实现了基于文本和图像的 3D 生成与纹理化功能。

文本-3D 生成:

图像-3D 生成:

https://github.com/huanngzh/MV-Adapter
https://arxiv.org/abs/2412.03632
https://huggingface.co/spaces/VAST-AI/MV-Adapter-I2MV-SDXL
https://github.com/huanngzh/ComfyUI-MVAdapter

欢迎交流~,带你学习AI,了解AI

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
后续!高校禁止小米汽车入内,雷军沉默,学校回应,大批网友支持

后续!高校禁止小米汽车入内,雷军沉默,学校回应,大批网友支持

谭谈社会
2026-06-29 01:08:53
韩红基金会年入7.6亿,87%靠小额捐款,5毛1块,高管年薪62万

韩红基金会年入7.6亿,87%靠小额捐款,5毛1块,高管年薪62万

小小河
2026-06-28 17:23:37
贪污上亿、假慈善?网友暂停捐助只是冰山一角 韩红更多黑料被扒

贪污上亿、假慈善?网友暂停捐助只是冰山一角 韩红更多黑料被扒

陈意小可爱
2026-06-28 15:31:39
女子高铁上求助,男生拒绝帮搬行李,于是发文网暴,反遭网友骂惨

女子高铁上求助,男生拒绝帮搬行李,于是发文网暴,反遭网友骂惨

谭谈社会
2026-06-28 16:38:04
无视梅西姆巴佩!伊布语出惊人:世界杯新星才是足坛第一人

无视梅西姆巴佩!伊布语出惊人:世界杯新星才是足坛第一人

澜归序
2026-06-29 08:18:12
美媒:美伊同意停止互袭 30日在多哈继续谈判

美媒:美伊同意停止互袭 30日在多哈继续谈判

新华社
2026-06-29 07:11:07
台海变天?赖清德彻底摊牌,让大陆放弃“攻台”,国防部:不惯着

台海变天?赖清德彻底摊牌,让大陆放弃“攻台”,国防部:不惯着

闻识
2026-06-27 14:35:34
世界杯:加拿大1-0南非首进16强 欧斯塔基奥92分钟贴地斩绝杀

世界杯:加拿大1-0南非首进16强 欧斯塔基奥92分钟贴地斩绝杀

狍子歪解体坛
2026-06-29 04:58:03
迎来第一波“失业潮”的不是教师,不是医生,而是这四个行业!

迎来第一波“失业潮”的不是教师,不是医生,而是这四个行业!

职场资深秘书
2026-06-28 14:27:05
俄乌局势逆转,俄罗斯犯下严重战略错误!

俄乌局势逆转,俄罗斯犯下严重战略错误!

一个坏土豆
2026-06-28 19:14:03
月捐扣款失败会上征信?韩红基金会再起波澜,有捐赠人称陷入恐慌

月捐扣款失败会上征信?韩红基金会再起波澜,有捐赠人称陷入恐慌

火山詩话
2026-06-29 06:01:27
比韩国队还惨!取消包机+球员自购机票回国,世界第16轰然倒下

比韩国队还惨!取消包机+球员自购机票回国,世界第16轰然倒下

鸣哥说体育
2026-06-28 13:27:00
乌克兰新玩法!让全球玩家操纵无人机,若消灭俄军将会有现金奖励

乌克兰新玩法!让全球玩家操纵无人机,若消灭俄军将会有现金奖励

爆角追踪
2026-06-28 21:03:53
洪明甫宣布辞职,他带出了本世纪最差的两届韩国队

洪明甫宣布辞职,他带出了本世纪最差的两届韩国队

体坛周报
2026-06-29 01:25:10
凌晨1点起 世界杯3场淘汰赛!日本挑战28年魔咒 世界前8对决

凌晨1点起 世界杯3场淘汰赛!日本挑战28年魔咒 世界前8对决

叶青足球世界
2026-06-29 08:08:06
巴黎两家殡仪馆爆满

巴黎两家殡仪馆爆满

第一财经资讯
2026-06-28 23:36:01
强势美元回归,可怕的暴风雨要来了

强势美元回归,可怕的暴风雨要来了

光远看经济
2026-06-28 19:01:43
繁华后的凄凉:耗资近34亿的鸟巢,如今被用来干嘛了?回本了吗?

繁华后的凄凉:耗资近34亿的鸟巢,如今被用来干嘛了?回本了吗?

非虚构人间
2026-06-29 00:18:18
陈丽华去世2个月后,73岁迟重瑞近况被曝光,难怪550遗产一分不要

陈丽华去世2个月后,73岁迟重瑞近况被曝光,难怪550遗产一分不要

阿纂看事
2026-06-28 12:49:29
上海球迷穿日本球衣庆祝日本大胜!知名教授:汉奸言行应受惩戒

上海球迷穿日本球衣庆祝日本大胜!知名教授:汉奸言行应受惩戒

许三岁
2026-06-29 07:42:49
2026-06-29 09:28:49
带你学AI
带你学AI
分享最前沿AI知识,先进的AI工具
379文章数 8关注度
往期回顾 全部

科技要闻

OpenAI推迟上市,那“Kimi们”呢?

头条要闻

轨道被"晒伤" 德国莱比锡有轨电车停运

头条要闻

轨道被"晒伤" 德国莱比锡有轨电车停运

体育要闻

两周飞5万公里!因凡蒂诺遭环保人士猛批

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

OpenAI推迟上市,那“Kimi们”呢?

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

亲子
健康
游戏
教育
公开课

亲子要闻

她知道自己多快乐吗

“无糖汤圆”是否隐藏着健康陷阱?

IGN揭秘《GTA6》实体版没光盘真相 搞不好大厂都学

教育要闻

河南高考多少分能上清北?多少分上985?600分、500分如何报志愿

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版