网易首页 > 网易号 > 正文 申请入驻

Pippo:一张图生成多视角人像视频?

0
分享至

今天给大家介绍一个新模型-Pippo

Pippo是Meta Reality Labs推出的图像到视频生成模型,能从单张照片生成1K分辨率的多视角高清人像视频。它接受全身或面部照片作为输入,并能很好地将原有照片与新生成的内容结合。

这个模型利用了一种名为多视角扩散变换器的先进技术,经过自我学习和细致的训练,能够快速掌握不同角度的变化,从而制作出既高质量又在3D效果上一致性很强的图像。

下面看几个示例:

演示效果

仅限面部:通过单张图像实现转变

左:从iPhone拍摄的照片中裁剪出面部;右:生成的环绕视频(36帧),分辨率为512x512。

左:从iPhone照片中裁剪出面部;右:生成的16帧短视频,分辨率为1024x1024。

全身:通过单张图像实现转变

左:用iPhone拍摄的全身照片;右:生成的16帧短视频,分辨率为1024x1024。

左:全身的照片;右:生成的14帧特写短视频,分辨率为512x512。

仅头部:通过单张图像实现转变

左:只包含头部的工作室照片;右:根据该照片生成的36帧环绕视频,分辨率为512x512。

全身:从单个视频生成多个视角的视频

  • 上面一行:实际拍摄的画面。

  • 下面一行左边(第1列):人在移动的单个视频片段,分辨率为512x512。

  • 下面一行右边(第2到第7列):使用Pippo根据每个视频帧生成的不同视角的视频。

注意:Pippo可以自动补全每个视频帧中缺失的部分(比如鞋子或脸),并提供多种不同的补全效果!

仅头部视频:从单个视频生成多个视角的视频

  • 上面一行:实际的画面。

  • 下面一行左边(第1列):人在512x512分辨率下讲话的单个视频片段。

  • 下面一行右边(第2到第7列):使用Pippo根据每个视频帧生成的不同视角的视频。

注意:Pippo可以自动补全视频帧中缺失的部分(比如脖子或衣服),并提供多种不同的补全效果!

全身和头部:空间瞄点可视化

  • 带有对应固定3D空间锚点的全身生成图像。

  • 带有对应固定3D空间锚点的仅头部生成图像。

方法与训练

以下是模型流程图,(左边)使用在工作室捕捉的数据来训练一个多视角的扩散模型(右边展示)。训练时,会用到一张完整的参考照片、从中裁剪出来的脸部图像,以及目标视角的相机和指示头部位置及朝向的2D投影空间锚点进行条件设置。需要注意的是,这个空间锚点只在训练模型时使用,在实际应用模型生成图像时,它会被固定在一个预设的位置上。

ControlMLP和注意力偏差

研究人员使用了一种特殊的扩散变换器(DiT),它通过一个叫做ControlMLP的轻量模块进行调节,ControlMLP模块用于在DiT中注入像Plücker射线和空间锚点这样的像素对齐条件。

另外,还解决了模型在处理不同数量元素时可能出现的注意力偏差问题。图中展示了不同数量的tokens下的熵(Y轴)与缩放因子增长(X轴)之间的关系,使用研究人员提出的修复方法可以让生成结果更加稳定和准确。

注意力偏差视觉效果:采用了先前工作的注意力偏置公式,并引入了一个增长因子超参数(γ),将参数设置在1.4到1.6的范围内,以实现最佳的视觉效果。

以上就是今天项目所分享的内容了,感兴趣的 可以前往GitHub一看,地址放在下方了哦~

GitHub地址:

https://github.com/facebookresearch/pippo

end

“肝”一把!万一成了呢,名利双收!

免费的VDB云资源来啦~

这打斗动画艺术成分很高啊

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
37岁门神一战成名!15次扑救创世界杯纪录,4秒3神扑,获评10分

37岁门神一战成名!15次扑救创世界杯纪录,4秒3神扑,获评10分

奥拜尔
2026-06-21 09:58:36
广州两家庭闯入罗浮山野瀑布 一对母子被冲落深潭

广州两家庭闯入罗浮山野瀑布 一对母子被冲落深潭

看看新闻Knews
2026-06-21 10:41:47
特斯拉宣布大量地区上架 FSD 订阅服务,价格有点意外

特斯拉宣布大量地区上架 FSD 订阅服务,价格有点意外

XCiOS俱乐部
2026-06-21 12:41:19
艾草不能挂一整年!记住这个日子一定要取下

艾草不能挂一整年!记住这个日子一定要取下

喵咪文化
2026-06-21 08:22:39
华为员工开炮,痛批老年统治层,完全跟不上AI,预判十年分红暴跌

华为员工开炮,痛批老年统治层,完全跟不上AI,预判十年分红暴跌

谭谈社会
2026-06-20 23:28:52
世界杯1000场里程碑!日本4-0背后5大事实 扛亚洲球队大旗

世界杯1000场里程碑!日本4-0背后5大事实 扛亚洲球队大旗

醉卧浮生
2026-06-21 14:01:37
瑞典媒体:布罗贝像一块会奔跑的混凝土,脖子上肌肉300公斤

瑞典媒体:布罗贝像一块会奔跑的混凝土,脖子上肌肉300公斤

懂球帝
2026-06-21 10:54:11
梅洛尼、高市早苗与特朗普吵起来了

梅洛尼、高市早苗与特朗普吵起来了

新民周刊
2026-06-21 10:06:51
蔡磊真人出镜,用AI复原声音发布《倒计时》演讲:这是他送给渐冻症的倒计时

蔡磊真人出镜,用AI复原声音发布《倒计时》演讲:这是他送给渐冻症的倒计时

齐鲁壹点
2026-06-21 13:49:09
5-1!4-0!疯狂世界杯:2场惨案 3队出线3队出局 日本首胜

5-1!4-0!疯狂世界杯:2场惨案 3队出线3队出局 日本首胜

叶青足球世界
2026-06-21 13:58:53
美国种了一个“蒙大拿州”的玉米,但真正给人吃的只有很小一部分

美国种了一个“蒙大拿州”的玉米,但真正给人吃的只有很小一部分

风向观察
2026-06-21 00:04:38
从“雷布斯”到“雷不群”,雷军到底在演什么?

从“雷布斯”到“雷不群”,雷军到底在演什么?

芳华青年
2026-06-20 19:22:33
随着日本4-0突尼斯,产生三大不可思议,亚洲第一撼动世界杯格局

随着日本4-0突尼斯,产生三大不可思议,亚洲第一撼动世界杯格局

侃球熊弟
2026-06-21 13:59:29
特朗普:如与伊朗不能达成协议 美或收取海峡通行费

特朗普:如与伊朗不能达成协议 美或收取海峡通行费

环球网资讯
2026-06-21 06:25:05
全球4大豆腐渣工程!我国为何独占2席,基建狂魔到底怎么了?

全球4大豆腐渣工程!我国为何独占2席,基建狂魔到底怎么了?

浩渺青史
2026-06-19 21:00:45
泽连斯基发快递,退还国家勋章

泽连斯基发快递,退还国家勋章

上观新闻
2026-06-21 13:22:55
世界杯疯狂一夜:日本5-1躺赢有望战巴西,突尼斯恐出局

世界杯疯狂一夜:日本5-1躺赢有望战巴西,突尼斯恐出局

何揎室内设计
2026-06-21 13:23:18
张颂文在韶关救人认定系见义勇为,获颁奖金证书!好友代发言

张颂文在韶关救人认定系见义勇为,获颁奖金证书!好友代发言

南方都市报
2026-06-20 16:55:40
韩联社:朝鲜无权转播世界杯,报道中刻意删除美日韩消息

韩联社:朝鲜无权转播世界杯,报道中刻意删除美日韩消息

懂球帝
2026-06-21 10:54:11
尴尬!武汉地铁上,一老太身穿印有低俗英文的T恤,自己浑然不知

尴尬!武汉地铁上,一老太身穿印有低俗英文的T恤,自己浑然不知

火山詩话
2026-06-20 06:58:18
2026-06-21 15:12:49
CG世界 incentive-icons
CG世界
分享国内外优秀CG作品,教程
5715文章数 8547关注度
往期回顾 全部

科技要闻

马斯克拿下7800亿元天价薪酬 2028年可兑现

头条要闻

媒体:欧盟"对华特别会议"后 德国对中国立场变化明显

头条要闻

媒体:欧盟"对华特别会议"后 德国对中国立场变化明显

体育要闻

沙特主帅:亚马尔是梅西在巴萨的接班人

娱乐要闻

李乃文带妻子法国购物,2人5个孩子!

财经要闻

蔚来的“暗战”时刻

汽车要闻

惊出冷汗!重庆实测奥迪A5L,华为智驾这波操作绝了…

态度原创

房产
本地
数码
家居
公开课

房产要闻

商业清零式退潮,大量住宅登场!三亚又要大规模调规!

本地新闻

龙腾资江 韵动邵阳

数码要闻

世界杯赛场上的“第四个中国裁判”:海信RGB-Mini LED值守VAR,助中国裁判组同场执裁

家居要闻

绿意盎然 自然之境

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版