网易首页 > 网易号 > 正文 申请入驻

苹果AI图像处理新突破:一秒2D转3D 还可评价P图效果

0
分享至

【CNMO科技消息】近期,苹果在人工智能(AI)驱动的图像处理领域发布多项重要研究成果。据CNMO了解,这些成功涵盖从单张图像快速生成3D场景、文本引导图像编辑的评估,到对多语言复杂形态的理解测评。


苹果AI

一、SHARP模型:一秒内从2D图像生成3D场景

苹果在2025年12月发布了一项名为《Sharp Monocular View Synthesis in Less Than a Second》的研究,详细介绍了一个名为SHARP的开源AI模型,且已公开在GitHub上。该模型能够在不到一秒的时间内,将单张2D图像转换为3D场景。



SHARP被描述为“从单张图像进行逼真视图合成的方法”。给定一张图像,它会“回归出所描绘场景的3D高斯表示参数”。与使用三角形表示3D场景的传统方法不同,高斯表示通过数百万个椭球体或“斑点”来渲染体积,共同构成3D图像。通常,创建此类3D表示需要从不同角度拍摄同一物体的多张照片,但SHARP仅需单张图像,并通过神经网络的一次前向传播即可完成。



研究人员在大型数据集上训练SHARP,使其能够预测3D场景的深度并生成相应的高斯表示。在多数情况下,模型表现成功,但也存在一些失败案例,例如物体被渲染在错误位置(如蜜蜂被放在花朵后面而非上面),或将天空误判为附近的曲面。



二、GIE-Bench:文本引导图像编辑的评估框架

苹果的研究人员还设计了一个用于评估文本引导图像编辑AI模型的框架。该框架从两个核心维度对模型输出进行评分:

功能正确性:通过自动生成的多选题来验证请求的编辑是否被成功执行。

图像保真度:采用对象感知的掩码技术和保真度评分,确保图像中非目标区域不被意外更改。



研究使用了涵盖20个内容类别的上千个编辑示例,测试了包括MGIE、OmniGen和GPT-Image 1在内的多个模型。研究发现,OpenAI的GPT-Image-1模型综合表现最佳。研究指出,虽然GPT-Image-1在执行核心编辑方面能力很强,但在空间关系的细粒度控制和内容保真度上仍有提升空间。

三、IMPACT:评估AI对多语言形态复杂性的理解

苹果的另一项研究关注AI模型对不同语言,特别是形态丰富语言的理解能力。研究人员指出,AI模型通常难以处理这类语言,且“这些模型在多大程度上真正掌握了这些语言的底层语言复杂性仍不清楚”。

为此,苹果开发了IMPACT框架,专门评估大语言模型在阿拉伯语、俄语、芬兰语、土耳其语和希伯来语中,输出是否符合其屈折形态学规则的能力。屈折形态学涉及通过词缀改变单词以适应特定语法结构(如名词的数、动词的时态)。

研究评估了8个多语言大语言模型。测试分为两种场景:一是让模型预测正确的词形变化(生成任务),二是让模型判断给定语句是否语法正确(判断任务)。模型需要完成填空测试,并扮演“法官”角色。



结果表明,大多数AI模型都难以处理不常见的形态模式,尤其是在判断不合语法的例句时。尽管某些模型在某一种语言上表现相对较好,但在所有测试语言中的表现均逊于其在英语上的表现。这项研究为苹果评估其内部模型(如用于实时翻译的模型)在处理形态复杂语言时的性能提供了工具。

从以上成果来看,虽然苹果AI团队近期有所变动,但公司在人工智能研究上的步伐并未放缓。从快速3D重建、图像编辑评估到多语言理解测评,这些研究不仅推动了技术进步,也为苹果自身产品(如Apple Intelligence、Image Playground图像生成工具及实时翻译功能)的迭代优化提供了坚实基础。市场也期待其结合上下文感知的Siri版本随未来系统更新而推出。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
十分罕见!我国一天出现两次火箭发射失利事件!都是什么原因?

十分罕见!我国一天出现两次火箭发射失利事件!都是什么原因?

科普大世界
2026-01-17 18:07:19
U23国足的“惊叹昊”,这样练就

U23国足的“惊叹昊”,这样练就

足球报
2026-01-18 12:17:11
2026年最大风口?万亿资金大迁徙,一波造富神话刚开始

2026年最大风口?万亿资金大迁徙,一波造富神话刚开始

柏年说政经
2026-01-16 18:00:03
贾国龙活成了堂吉诃德,向着想象中的风车冲锋,老罗都于心不忍

贾国龙活成了堂吉诃德,向着想象中的风车冲锋,老罗都于心不忍

上林院
2026-01-16 21:28:03
2026央视春晚首次彩排明星全名单出炉,网友:咋还有“春晚混子”

2026央视春晚首次彩排明星全名单出炉,网友:咋还有“春晚混子”

梨花黛娱
2026-01-17 14:56:19
范志毅:U23国足半死不活的踢法世界最先进最科学 对手不会踢了

范志毅:U23国足半死不活的踢法世界最先进最科学 对手不会踢了

念洲
2026-01-18 09:41:26
辞职后首秀!张水华无缘前三获2万奖金 朱卿破纪录 夺回大众一姐

辞职后首秀!张水华无缘前三获2万奖金 朱卿破纪录 夺回大众一姐

念洲
2026-01-18 11:36:18
女子公开道歉后续:文言文英语连上,单位切割,高韩二人停职社死

女子公开道歉后续:文言文英语连上,单位切割,高韩二人停职社死

鋭娱之乐
2026-01-17 23:37:22
双输的局面, 罗永浩喊停还追着捅!贾国龙甩锅网暴,结局太扎心

双输的局面, 罗永浩喊停还追着捅!贾国龙甩锅网暴,结局太扎心

你食不食油饼
2026-01-18 01:55:56
“皖西麻黄鸡成本150元,与辉同行卖不足28元”引质疑,官方介入

“皖西麻黄鸡成本150元,与辉同行卖不足28元”引质疑,官方介入

大风新闻
2026-01-17 17:36:24
曝腾讯向GitHub发函,要求下架“用户可获取自己聊天记录”的仓库

曝腾讯向GitHub发函,要求下架“用户可获取自己聊天记录”的仓库

爆角追踪
2026-01-18 14:25:38
反转!北京嫣然天使医院房东要求李亚鹏公开道歉,网友已捐1000万

反转!北京嫣然天使医院房东要求李亚鹏公开道歉,网友已捐1000万

安宁007
2026-01-17 05:31:12
一级政府拒不执行法院判决,是一个非常恶劣的示范

一级政府拒不执行法院判决,是一个非常恶劣的示范

南方都市报
2026-01-17 23:34:06
中国无辜躺枪,特朗普要夺格陵兰岛,丹麦反手禁止中国投资

中国无辜躺枪,特朗普要夺格陵兰岛,丹麦反手禁止中国投资

梁讯
2026-01-18 11:33:07
中国航天重大损失,实践三十二号卫星发射失利,影响有多大

中国航天重大损失,实践三十二号卫星发射失利,影响有多大

社会日日鲜
2026-01-18 09:06:43
美媒:特朗普为“和平委员会”永久席位开价10亿美元

美媒:特朗普为“和平委员会”永久席位开价10亿美元

环球网资讯
2026-01-18 08:51:16
智商税真贵啊!14万买的钻石项链只值200块,女子吐槽欲哭无泪…

智商税真贵啊!14万买的钻石项链只值200块,女子吐槽欲哭无泪…

火山诗话
2026-01-18 06:29:32
开年大瓜!国产女优上岸成功嫁为人妻,拍短视频后遭恶语相向

开年大瓜!国产女优上岸成功嫁为人妻,拍短视频后遭恶语相向

社会酱
2026-01-16 16:54:49
江苏南通一司机加完油未拔油枪驾车离开,油枪被拉断,加油站:断裂油枪已修复,未要求赔偿

江苏南通一司机加完油未拔油枪驾车离开,油枪被拉断,加油站:断裂油枪已修复,未要求赔偿

黄河新闻网吕梁频道
2026-01-17 09:33:12
李湘出大事了,原因是……

李湘出大事了,原因是……

智识漂流
2026-01-17 18:06:56
2026-01-18 14:44:49
手机中国 incentive-icons
手机中国
专业、有态度的手机门户
110702文章数 316211关注度
往期回顾 全部

科技要闻

AI大事!马斯克:索赔9300亿元

头条要闻

一天两枚火箭发射失利 中国航天科技集团发文回应

头条要闻

一天两枚火箭发射失利 中国航天科技集团发文回应

体育要闻

越南媒体:李昊将成为越南U23面临的巨大挑战

娱乐要闻

43岁贾玲退出春晚、解散公司

财经要闻

BBA,势败如山倒

汽车要闻

林肯贾鸣镝:稳中求进,将精细化运营进行到底

态度原创

亲子
家居
本地
艺术
公开课

亲子要闻

沉浸式遛娃,最近的昂萨梅朵越来越可爱啦

家居要闻

岁月柔情 现代品质轻奢

本地新闻

云游内蒙|黄沙与碧波撞色,乌海天生会“混搭”

艺术要闻

海边细沙被他表现得如此真实 | 马克·汉森

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版