网易首页 > 网易号 > 正文 申请入驻

Pippo:一张图生成多视角人像视频?

0
分享至

今天给大家介绍一个新模型-Pippo

Pippo是Meta Reality Labs推出的图像到视频生成模型,能从单张照片生成1K分辨率的多视角高清人像视频。它接受全身或面部照片作为输入,并能很好地将原有照片与新生成的内容结合。

这个模型利用了一种名为多视角扩散变换器的先进技术,经过自我学习和细致的训练,能够快速掌握不同角度的变化,从而制作出既高质量又在3D效果上一致性很强的图像。

下面看几个示例:

演示效果

仅限面部:通过单张图像实现转变

左:从iPhone拍摄的照片中裁剪出面部;右:生成的环绕视频(36帧),分辨率为512x512。

左:从iPhone照片中裁剪出面部;右:生成的16帧短视频,分辨率为1024x1024。

全身:通过单张图像实现转变

左:用iPhone拍摄的全身照片;右:生成的16帧短视频,分辨率为1024x1024。

左:全身的照片;右:生成的14帧特写短视频,分辨率为512x512。

仅头部:通过单张图像实现转变

左:只包含头部的工作室照片;右:根据该照片生成的36帧环绕视频,分辨率为512x512。

全身:从单个视频生成多个视角的视频

  • 上面一行:实际拍摄的画面。

  • 下面一行左边(第1列):人在移动的单个视频片段,分辨率为512x512。

  • 下面一行右边(第2到第7列):使用Pippo根据每个视频帧生成的不同视角的视频。

注意:Pippo可以自动补全每个视频帧中缺失的部分(比如鞋子或脸),并提供多种不同的补全效果!

仅头部视频:从单个视频生成多个视角的视频

  • 上面一行:实际的画面。

  • 下面一行左边(第1列):人在512x512分辨率下讲话的单个视频片段。

  • 下面一行右边(第2到第7列):使用Pippo根据每个视频帧生成的不同视角的视频。

注意:Pippo可以自动补全视频帧中缺失的部分(比如脖子或衣服),并提供多种不同的补全效果!

全身和头部:空间瞄点可视化

  • 带有对应固定3D空间锚点的全身生成图像。

  • 带有对应固定3D空间锚点的仅头部生成图像。

方法与训练

以下是模型流程图,(左边)使用在工作室捕捉的数据来训练一个多视角的扩散模型(右边展示)。训练时,会用到一张完整的参考照片、从中裁剪出来的脸部图像,以及目标视角的相机和指示头部位置及朝向的2D投影空间锚点进行条件设置。需要注意的是,这个空间锚点只在训练模型时使用,在实际应用模型生成图像时,它会被固定在一个预设的位置上。

ControlMLP和注意力偏差

研究人员使用了一种特殊的扩散变换器(DiT),它通过一个叫做ControlMLP的轻量模块进行调节,ControlMLP模块用于在DiT中注入像Plücker射线和空间锚点这样的像素对齐条件。

另外,还解决了模型在处理不同数量元素时可能出现的注意力偏差问题。图中展示了不同数量的tokens下的熵(Y轴)与缩放因子增长(X轴)之间的关系,使用研究人员提出的修复方法可以让生成结果更加稳定和准确。

注意力偏差视觉效果:采用了先前工作的注意力偏置公式,并引入了一个增长因子超参数(γ),将参数设置在1.4到1.6的范围内,以实现最佳的视觉效果。

以上就是今天项目所分享的内容了,感兴趣的 可以前往GitHub一看,地址放在下方了哦~

GitHub地址:

https://github.com/facebookresearch/pippo

end

“肝”一把!万一成了呢,名利双收!

免费的VDB云资源来啦~

这打斗动画艺术成分很高啊

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
缅甸女饲养员被老虎咬死,老虎猛攻26分钟,园长看到监控:不怪老虎

缅甸女饲养员被老虎咬死,老虎猛攻26分钟,园长看到监控:不怪老虎

罪案洞察者
2025-11-18 11:00:31
章子怡太绝了:你帮别人养孩子我不管,但我儿女抚养费必须给全!

章子怡太绝了:你帮别人养孩子我不管,但我儿女抚养费必须给全!

瑛派儿老黄
2025-11-18 17:23:22
九牧王涨停走出7连板

九牧王涨停走出7连板

每日经济新闻
2025-11-20 09:43:50
扎心了,上海一男子,因被裁员清理工位的花,大大小小一拖车

扎心了,上海一男子,因被裁员清理工位的花,大大小小一拖车

小小包工头阿汾
2025-11-20 06:11:01
不满04后小将?被陈熠爆冷,陈梦黑脸,原因找到,谁注意她举动

不满04后小将?被陈熠爆冷,陈梦黑脸,原因找到,谁注意她举动

乐聊球
2025-11-19 14:28:04
出征北极靠加拿大鹅?不,-15℃严寒地区的挪威人穿的是中国造!

出征北极靠加拿大鹅?不,-15℃严寒地区的挪威人穿的是中国造!

英国报姐
2025-11-19 13:09:33
上海哈罗德茶室及俱乐部将于2026年初关闭

上海哈罗德茶室及俱乐部将于2026年初关闭

界面新闻
2025-11-19 18:53:54
广东宏远VS山西男篮!萨林杰首秀,崔永熙出战,杜锋拒绝爆冷

广东宏远VS山西男篮!萨林杰首秀,崔永熙出战,杜锋拒绝爆冷

体坛瞎白话
2025-11-20 10:30:56
乒坛大爆冷!世界亚军浪费2赛点崩盘,单局轰出19-21比分 对手排名167

乒坛大爆冷!世界亚军浪费2赛点崩盘,单局轰出19-21比分 对手排名167

好乒乓
2025-11-20 08:08:38
李一诺:18岁保送清华,27岁博士毕业,4年生3娃,替世界首富花钱

李一诺:18岁保送清华,27岁博士毕业,4年生3娃,替世界首富花钱

毒sir财经
2025-10-08 21:36:11
是否考虑过国家队?朱婷扭头就走:没考虑过 记者疑似爆粗骂人

是否考虑过国家队?朱婷扭头就走:没考虑过 记者疑似爆粗骂人

风过乡
2025-11-20 07:01:16
黑色幽默!电诈园区办公室中文标语,简直是天大的讽刺

黑色幽默!电诈园区办公室中文标语,简直是天大的讽刺

麦大人
2025-11-06 08:32:30
我国有上千万人做肺部CT!院士:做一次肺部CT,或管五年无碍

我国有上千万人做肺部CT!院士:做一次肺部CT,或管五年无碍

荷兰豆爱健康
2025-11-10 12:41:57
柯文哲结局已定,岛内曝退党潮,大陆判断没错,两岸统一大势所趋

柯文哲结局已定,岛内曝退党潮,大陆判断没错,两岸统一大势所趋

起喜电影
2025-11-19 09:17:26
医生发现:天冷坚持戴口罩的人,过不了半年,身体会有4大变化

医生发现:天冷坚持戴口罩的人,过不了半年,身体会有4大变化

宝哥精彩赛事
2025-11-19 10:03:34
央视直播U17亚洲杯预选赛!中国队对阵巴林队,首轮即决战

央视直播U17亚洲杯预选赛!中国队对阵巴林队,首轮即决战

李帕在北漂
2025-11-20 06:48:25
骨裂骨折!踢熊猫杯弄伤了多少人?暴露U22“疲劳期遇上高强度”

骨裂骨折!踢熊猫杯弄伤了多少人?暴露U22“疲劳期遇上高强度”

罗掌柜体育
2025-11-20 11:27:10
取消赴日旅游的中国游客:机酒已全额退款,未来出行仍在观望

取消赴日旅游的中国游客:机酒已全额退款,未来出行仍在观望

南方都市报
2025-11-18 23:22:18
世界中锋身价最贵的十名球员出炉!劳塔罗第七 伊萨克真值1.4亿?

世界中锋身价最贵的十名球员出炉!劳塔罗第七 伊萨克真值1.4亿?

体坛八点半的那些事儿
2025-11-20 15:53:31
日本垄断全球90%!一旦断供中国如何应对?为何他国造不出?

日本垄断全球90%!一旦断供中国如何应对?为何他国造不出?

诗意世界
2025-09-13 18:35:57
2025-11-20 16:08:49
CG世界 incentive-icons
CG世界
分享国内外优秀CG作品,教程
5694文章数 8540关注度
往期回顾 全部

科技要闻

英伟达单季狂揽570亿美元,手握5000亿订单

头条要闻

数名蔚来车主被销售诈骗160万 称对品牌表态特别寒心

头条要闻

数名蔚来车主被销售诈骗160万 称对品牌表态特别寒心

体育要闻

Faker,何以成为Faker

娱乐要闻

胡彦斌易梦玲恋情曝光,相差16岁

财经要闻

霸王茶姬创始人将与“光伏女神”结婚

汽车要闻

一汽丰田发布IT'S TiME 3.0 三款焕新产品同步亮相

态度原创

家居
手机
游戏
数码
公开课

家居要闻

黑白极简 慵懒通透空间

手机要闻

2026 Pantone年度色被曝为Lightest Sky

大腿音游《萌萌夹击》更新限时免费“裤袜”DLC

数码要闻

苹果2026年五大新品前瞻 折叠iPhone、智能眼镜齐登场

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版