网易首页 > 网易号 > 正文 申请入驻

苹果开源新模型!一秒钟让照片变3D世界

0
分享至


智东西
编译 王欣逸
编辑 程茜

智东西12月19日消息,12月11日,苹果发表论文介绍了3D生成模型SHARP,宣称在标准GPU上,该模型能够以不到1秒的时间将单张图像重建为逼真的3D场景。目前,该模型已开源。


用户仅需输入一张普通照片,该模型即可通过神经网络一次性预测出整个场景的3D高斯表示参数,整个生成过程在标准GPU上完成仅需不足一秒,随后还能实时渲染出高分辨率、照片级真实感的相邻视角图像。此外,SHARP生成的3D场景具有绝对尺度的度量特性,能够支持精确的相机位移操作。

定量评估显示,SHARP在不同数据集上展现出强大的零样本泛化能力,在多个数据集上实现了新的技术突破,与现有最佳模型相比,LPIPS指标(感知相似性)降低了25-34%,DISTS指标(结构相似性)降低了21-43%,还将合成时间缩短了三个数量级,并支持以每秒100帧高分辨率渲染邻近视图的3D表征。

不少开发者对该模型进行了体验。其中,有网友将其置于Vision Pro内使用,仅需单张图片就实现了身临其境的效果,生成画面的精细度也比较高。


还有网友上传了一张油画,该模型最终生成了一个位置关系准确、画面完整的3D场景。


其他网友评价称,该模型无法生成场景中不可见的部分,不过它的最大优势在于生成速度,“MacBook Pro 只需几秒钟(就能完成生成)……”。


该模型的详细信息已发布在arXiv上,题为《SHARP:不到一秒的单图像视角合成(Sharp Monocular View Synthesis in Less Than a Second)》。


论文地址:https://arxiv.org/abs/2512.10685

开源地址:

GitHub:https://github.com/apple/ml-sharp

Hugging Face:https://huggingface.co/apple/Sharp

一、保真度提高约20%-40%,合成时间缩短三个数量级

研究人员用多个数据集对SHARP模型进行评估,主要关注模型的两个指标:LPIPS和DISTS,以考察模型的合成图像与真实图像之间的结构相似性,符合人主观感受的程度。这两个数据越小,性能越优。

在基线模型上,研究人员选取了一些现有的前沿模型,分别为:基于3D高斯分布的Flash 3D模型;使用多平面图像的TMPI模型;基于图像回归的LVSM模型;采用扩散模型的稳定虚拟相机(SVC)、ViewCrafter和Gen3C。

定量评估显示,SHARP在所有数据集中的表现均为最佳,打败所有模型。相较现有最佳模型,SHARP的LPIPS指标降低了25-34%,DISTS指标降低了21-43%。


研究人员对该模型的单图像合成任务性能进行了评估,结果显示,在单个GPU上,SHARP在保持高图像保真度的同时,合成时间也位列第一梯队。相较于同等质量的模型,SHARP模型的合成时间缩短了三个数量级,这体现了其在效率和效果上的优势。


在不到1秒的时间里,该模型不仅能生成3D内容,还能以每秒100帧以上的速度渲染高分辨率的局部视图。从结果来看,SHARP细节处理清晰,结构精细,第一张图的主体和背景分离处理得很干净,第二张图颜色和形状稳定性比较出色,第三张图动物的毛发根根分明。


二、能实时渲染、预测高分辨3D表征,无法生成不可见部分

视角合成研究经历了从早期基于多图像几何建模的经典方法,到深度学习时代以神经辐射场为代表的隐式表示突破,再到近年来显式高效渲染技术(如3D高斯泼溅)的发展历程。

此前,大多数高斯泼溅方法需要从不同视角拍摄同一场景的数十甚至数百张图像,SHARP模型则专注于单张图片的3D场景生成,它仅通过神经网络的一次前向传播,就能从单张照片预测出完整的3D高斯场景表征。

SHARP模型的训练过程包括合成数据训练和自监督微调两个阶段:在第一阶段,研究人员使用具有完美图像和深度真实标签的合成数据对模型进行训练,学习3D重建的基本原理。在第二阶段,研究人员让该模型在没有视差合成真实标签的真实图像上进行自监督微调,通过生成伪真实标签来适应真实图像,提高模型在真实世界图像上的性能。

研究团队对SHARP模型做出了三点创新:第一点是一种可进行端到端训练的架构,这一架构可预测高分辨率3D表征;第二是推出了鲁棒高效的损失函数配置,研究人员精心选取了一系列损失函数,在保障训练稳定性、抑制常见视觉伪影的同时,将视角合成质量作为优化重点;第三是引入一个简洁的深度对齐模块,这一模块能够有效解决训练过程中的深度歧义问题。

SHARP模型包含四个可学习模块:一个用于特征提取的预训练编码器、一个生成两个独立深度层的深度解码器、一个深度调整模块以及一个优化所有高斯属性的高斯解码器。可微分高斯初始化器和组合器为最终的3D表示组装高斯元素,预测出的高斯被渲染至输入视图和新颖视图,以进行损失计算。


在优化和评估过程中,SHARP模型使用了多种损失函数来优化合成视图的质量,包括渲染损失、深度损失和正则化损失等。通过这些损失函数的组合,模型能够生成高质量的3D表示,并支持实时渲染。

基于以上技术,SHARP模型实现了无需依赖多张图像或耗时的逐场景优化过程,即可重建出可信的3D场景。不过该方法存在一定的权衡:SHARP能精确渲染邻近视角,但无法合成场景中完全不可见的部分。这意味着用户不能过度偏离原照片的拍摄机位。

结语:3D场景生成门槛再降

SHARP模型在单图像视点合成领域取得了显著进展,该模型在单次前向传播的同时,完成了从2D图片理解、3D几何重建到细节优化的全过程,最终输出一个能实时渲染的3D场景模型。

在应用上,通过实时渲染高保真的3D场景,SHARP模型或将为VR/AR应用提供更加沉浸式的体验,为游戏、电影、建筑等行业提供更多可能性。研究团队称,他们还将拓展现有方法论,通过结合扩散模型等方法,支持更远距离视点的合成。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
梦见与异性发生关系,大都因为这2种原因

梦见与异性发生关系,大都因为这2种原因

艺鉴在线
2026-04-07 12:09:15
破案!杜锋宁愿牺牲家政也要重用麦考尔原因找到,粤迷说出大实话

破案!杜锋宁愿牺牲家政也要重用麦考尔原因找到,粤迷说出大实话

后仰大风车
2026-04-07 08:15:08
被薅头发是因辱骂浙江外援家人?22岁国脚:我连英语都说不明白

被薅头发是因辱骂浙江外援家人?22岁国脚:我连英语都说不明白

念洲
2026-04-06 17:30:32
4月1日起,房子、车子、存款或将迎来大洗牌,普通人该何去何从?

4月1日起,房子、车子、存款或将迎来大洗牌,普通人该何去何从?

复转这些年
2026-04-05 17:57:35
FIFA官方实锤:C罗进球数确认,千球里程碑未缩水

FIFA官方实锤:C罗进球数确认,千球里程碑未缩水

孙譁北漂拍客
2026-04-07 07:40:45
金与正积极评价韩国总统就无人机事件的表态

金与正积极评价韩国总统就无人机事件的表态

新京报
2026-04-07 07:21:05
金与正积极评价韩国总统就无人机事件的表态

金与正积极评价韩国总统就无人机事件的表态

澎湃新闻
2026-04-06 22:52:01
郑丽文带人去大陆,蓝营内部悄悄换人,名单背后全是算计

郑丽文带人去大陆,蓝营内部悄悄换人,名单背后全是算计

小影的娱乐
2026-04-06 19:29:48
老爸测评退一赔三最多30万,而董宇辉要赔偿1.2亿

老爸测评退一赔三最多30万,而董宇辉要赔偿1.2亿

映射生活的身影
2026-04-05 16:59:07
葡国脚马特乌斯:C罗缺阵减轻了我的压力,他在队我会更紧张

葡国脚马特乌斯:C罗缺阵减轻了我的压力,他在队我会更紧张

懂球帝
2026-04-07 12:05:22
美媒热炒:中国异常划设近海空域40天,遏制日本越界?

美媒热炒:中国异常划设近海空域40天,遏制日本越界?

准备好了吗
2026-04-07 10:33:52
河南美女老师被抓,卧室发现一本日记,里面所写内容令人崩溃

河南美女老师被抓,卧室发现一本日记,里面所写内容令人崩溃

可儿故事汇
2024-10-19 18:41:40
勇士输得太冤!火勇大战裁判报告出炉:三次漏判勇士两次吃亏

勇士输得太冤!火勇大战裁判报告出炉:三次漏判勇士两次吃亏

罗说NBA
2026-04-07 05:21:53
上坟发现墓碑被贴欠费通知单 园林回应称:费用含绿化 卫生 安保等

上坟发现墓碑被贴欠费通知单 园林回应称:费用含绿化 卫生 安保等

闪电新闻
2026-04-06 18:40:10
毛主席唯一一个活下来的儿子毛岸青,晚年的时候享受的什么待遇?

毛主席唯一一个活下来的儿子毛岸青,晚年的时候享受的什么待遇?

乐天闲聊
2026-02-13 11:33:46
伊朗给出霍尔木兹海峡收费标准,特朗普要由美国收钱

伊朗给出霍尔木兹海峡收费标准,特朗普要由美国收钱

世家宝
2026-04-07 10:00:30
全省法院第十二届“金法槌”杯优秀案例丨李春明等诉昆山市第一人民医院医疗损害责任纠纷案

全省法院第十二届“金法槌”杯优秀案例丨李春明等诉昆山市第一人民医院医疗损害责任纠纷案

常熟市人民法院
2018-09-13 17:24:22
阿根廷、阿联酋、卡塔尔、黎巴嫩、阿塞拜疆驱逐伊朗大使

阿根廷、阿联酋、卡塔尔、黎巴嫩、阿塞拜疆驱逐伊朗大使

桑未落
2026-04-04 10:14:55
兵分四路发起总攻,世界第二大军事集团归来,美媒:以色列犯大错

兵分四路发起总攻,世界第二大军事集团归来,美媒:以色列犯大错

爱史纪
2026-04-07 09:49:38
印媒:巴基斯坦,再次进口70架歼10CE,凑齐100架编队?

印媒:巴基斯坦,再次进口70架歼10CE,凑齐100架编队?

万里繁华
2026-04-06 11:23:16
2026-04-07 12:40:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11517文章数 117024关注度
往期回顾 全部

科技要闻

满嘴谎言!OpenAI奥特曼黑料大起底

头条要闻

郑丽文今日访陆其彝族背景引发热议 曾回云南祭祖

头条要闻

郑丽文今日访陆其彝族背景引发热议 曾回云南祭祖

体育要闻

官宣签约“AI球员”,这支球队被骂惨了...

娱乐要闻

张艺上浪姐惹争议 黄景瑜前妻发文内涵

财经要闻

2026年,全国租房市场还有波降价潮

汽车要闻

广汽电池独立战,背后的产业链博弈

态度原创

数码
健康
亲子
公开课
军事航空

数码要闻

Intel悄然发布酷睿Ultra X9 378H:规格与X7 368H一模一样!就一点区别

干细胞抗衰4大误区,90%的人都中招

亲子要闻

为什么说养孩子等于“毁容”?看看前后对比照,宝妈们的辛酸泪

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

伊朗:在C-130运输机残骸中发现一具美军士兵遗体

无障碍浏览 进入关怀版