网易首页 > 网易号 > 正文 申请入驻

库里被「采访」?别慌!蚂蚁AI鉴真拿下CVPR 2026冠军,专治黑产

0
分享至

机器之心发布

随着深度伪造技术的不断进步,演艺行业的明星们已成为换脸技术的最大受害者。近日,多起演员被换脸、克隆,甚至用于虚假宣传的事件频频曝光,引发了社会的广泛关注。

例如,网友发现 AI 短剧《重生后,我成了娘亲的守护神》第 14 集开头疑似使用了演员杨紫的脸。某短剧平台则在未经许可的情况下,使用 AI 换脸技术伪造了易烊千玺的肖像与声音。



网友称AI短剧《重生后,我成了娘亲的守护神》第14集开头疑似使用了演员杨紫的脸。



某短剧平台多部AI短剧在未经许可的情况下使用AI换脸技术,伪造星易烊千玺的肖像及声音。



演员王劲松也曾就AI虚假代言发声。

不仅演员们纷纷发声,官方也开始出手。

中国广播电视社会组织联合会演员委员会于 4 月 2 日发布严正声明,强烈谴责 AI 换脸、素材滥用及违规训练 AI 模型等行为,发出行业警告:严守法律底线,捍卫视听真实。



随着Nano BananaSeedanceKling等图像和视频生成模型的飞速迭代,人眼已经难以分辨真实与伪造的界限。换脸技术,只是这一技术滥用的冰山一角。

更为严重的是,深度伪造技术滥用的风险急剧上升——从库里采访的 AI 杜撰事件,到 AI 生成的假水果图骗取退款,这些乱象正在严重挑战社会信任和内容平台的生态。



如何让 AI 练就火眼金睛?

在这个技术乱象丛生的时代,如何让 AI 具备火眼金睛成了当务之急。

最近,计算机视觉领域的顶级会议CVPR 2026 的 NTIRE 鲁棒性 AIGC 图像检测挑战赛( Robust AI-Generated Image Detection in the Wild Challenge )结果出炉。蚂蚁集团 AI 安全实验室的队伍MICV凭借在鲁棒性测试样本上 ROC AUC 达到了惊人的 0.9723,成功摘得「复杂真实场景鲁棒性样本测试」挑战赛的冠军。这场挑战赛吸引了全球 500 多支队伍的参与,是全球计算机视觉领域的三大顶级会议之一。





与此同时,蚂蚁团队还发布了业内最全面的 AIGC 图像视频检测资源仓库。

这个仓库整合了最新的热点事件、前沿论文、基准数据集及实用工具,为全球研究人员提供了一个技术参考的宝贵资源。团队将持续更新,确保资源的时效性与前沿性,以应对 AI 生成内容带来的挑战。



开源仓库:Awesome-AIGC-Image-Video-Detection

现实挑战:AIGC 鉴真面临的双重鸿沟

虽然现有的 AI 鉴真技术在标准高质量基准测试中表现不俗,但面对复杂多变的真实开放场景( In-the-wild )时,检测模型的准确率往往会出现断崖式下降。这一现象使得业内急需解决两个核心技术难题。

一个是跨域泛化能力不足。不同生成架构(如扩散模型、自回归模型等)和闭源商业平台的生成机制差异巨大,伪影特征也随之变化。传统检测模型常常对单一训练数据过拟合,一旦遇到新的生成体系,便容易失效,难以识别新型伪造内容。

另一个是真实世界的降质干扰。图像在互联网传播过程中,不可避免地经历压缩、模糊、加噪等降质处理,这些退化现象往往会掩盖微弱的生成痕迹,极大增加了鉴伪的难度。

正是基于这些痛点,本次 CVPR 挑战赛特别聚焦于如何在「未知生成架构」与「复杂退化干扰」双重考验下,依然保持模型的高准确率和高鲁棒性。

解决方案:基于 DINOv3 的鲁棒检测框架

为了应对上述挑战,蚂蚁安全团队提出了一种基于DINOv3 视觉基础模型的鲁棒集成检测框架。

这一框架充分发挥了 DINOv3 在高频细节上的强大表征能力,并结合数据构建、模型架构和优化策略的创新,成功实现了从实验室基准到复杂真实场景的有效迁移。



分层级数据构建:百万级多源训练语料

高质量且多维的数据集是打破过拟合的基石。团队依托深厚的数据积累,构建了包含数百万样本的复杂训练语料库,层次化覆盖四类数据来源:开源学术基准、主流开源生成模型定向合成、商业闭源 API 高保真样本,以及比赛官方数据,确保对当前主流生成生态的全面覆盖。

双流特征融合的集成架构:充分挖掘表征潜力

为充分挖掘 DINOv3 在复杂高频细节上的表征潜力,团队设计了双流并行架构。

架构将多组不同配置的 DINOv3 主干网络划分为两个独立的网络组,每组内部通过多尺度特征融合机制聚合局部空间特征与全局语义信息,最终由 MLP 模块输出分支预测结果。

在决策层面,两个网络组独立执行特征提取与预测,最终通过加权平均完成后融合。这种设计既避免早期特征级联的信息淹没问题,又通过不同配置网络的互补效应,提取出更加全局、立体的图像表征。

难度感知的鲁棒数据增强:模拟真实传播链路的阶梯式退化

真实世界的图像在互联网传播中会经历压缩、模糊、加噪、截取等多级退化,掩盖原有的微弱生成痕迹。为缩小实验室数据与真实场景的分布差异,团队构建了阶梯式的鲁棒数据增强链路:

  • 多类型退化的系统模拟:涵盖模糊、噪声、压缩伪影、色彩偏移及几何畸变等多种退化类型,通过分层强度配置,实现从单一扰动到复杂复合扰动的递进式模拟,深度还原互联网传播链路中的多级退化特征。
  • 高保真感知增强机制:引入 HiFiC、ELIC 等神经网络压缩模型模拟先进编码失真,同时补充社交平台传播压缩、二次翻拍及截屏等非对称退化样本,填补算法模拟与真实边缘场景的分布差异。

模型优化:构建平滑鲁棒的参数空间

  • Focal Loss:针对退化样本检测难易度不均的问题,动态抑制易分类样本权重,强制模型聚焦被严重降质掩盖的困难样本。
  • 随机权重平均(SWA):在训练收敛后期对参数空间内多个权重轨迹平滑平均,引导模型收敛至更平坦的极小值区域,降低过拟合风险。
  • TTA 机制:推理阶段联合原始图像及其水平翻转版本进行结果平均,有效提升推理稳定性。

通过这一系列技术创新,蚂蚁团队不仅解决了当前 AIGC 检测技术在面对多变场景时的诸多挑战,还为未来更高效、更精准的深度伪造检测奠定了基础,进一步推动了 AI 鉴真技术的发展。

产研并进:

打破黑盒瓶颈,拓宽 AIGC 鉴真技术边界

蚂蚁安全团队在 AI 鉴真技术的理论与方法上不断创新,近期在CVPRICLR等国际顶级会议上发布了多项高水平研究成果。这些突破不仅为 AI 鉴真领域带来了新的技术思路,也为破解现有技术瓶颈奠定了基础。

团队的目标是打破传统鉴真模型的黑盒局限,未来的AI鉴真技术将不仅仅是简单的二分类任务,而是具备强大的泛化能力,并能像人类专家一样进行推理。

Veritas 框架便是这一努力的具体体现。通过结合多模态大语言模型( MLLM )和模式感知推理( Pattern-aware Reasoning )机制,团队突破了传统大模型纯文本思维链的限制,使得模型在面对未知生成器时,能展现出更强的适应性和推理能力。

Veritas 框架在跨域、跨操控类型的检测场景中,超越了现有 SOTA 方法的性能,并且能够输出透明且令人信服的推理过程,展示了人工智能在应对深度伪造问题时的巨大潜力。该研究成果被ICLR 2026录用为口头报告,进一步证明了其在学术界的影响力。



与此同时,团队还提出了另一项创新——Locate-Then-Examine。这一两阶段检测新范式通过「先定位可疑区域,再进行细节审查」的方法,极大提升了检测精度,并有效解决了当前模型普遍存在的幻觉问题。这一技术的推出,使得 AI 鉴真在实际应用中更加准确和可靠,标志着 AIGC 检测技术迈向了新的高度。



持续深耕:筑牢 AI 安全防线

多年来,蚂蚁集团在生物识别与安全检测领域不断积累技术优势,参与并主导了多项国际安全标准的制定,积累了超过 50 项国际专利。这些成果为蚂蚁 AI 安全实验室在全球顶级赛事中屡获佳绩提供了坚实基础,至今已斩获 10 余项世界冠军。

随着大模型时代的到来,安全威胁日益复杂,蚂蚁团队始终保持高频创新,自 2024 年以来,已在 AI 鉴真领域发表 8 篇高水平学术论文,开源 4 个具有行业影响力的基准数据集(累计下载超 10 万次),并在相关国际顶级赛事中获得 3 次冠军。

在技术落地方面,同样取得了显著成效。团队为蚂蚁集团旗下多个平台(如短视频、灵光、鲸探等)提供了强大且鲁棒的 AIGC 检测解决方案,服务了数亿用户。更值得一提的是,这些技术已通过 CNAS 认证、iBeta 国际生物安全认证等多项权威认证,标志着其在行业中的领先地位。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我已力竭,我已沉默

我已力竭,我已沉默

求实处
2026-04-08 23:20:40
官方:CCTV5转播U20女足亚洲杯1/4决赛,中国女足vs乌兹女足

官方:CCTV5转播U20女足亚洲杯1/4决赛,中国女足vs乌兹女足

懂球帝
2026-04-10 10:22:09
6月1日起,全国4.5亿司机都要变!公安部:不卡时间,专盯状态!

6月1日起,全国4.5亿司机都要变!公安部:不卡时间,专盯状态!

原广工业
2026-04-10 12:26:07
手感不佳,河村勇辉22分钟6投仅1中得到6分4板4助

手感不佳,河村勇辉22分钟6投仅1中得到6分4板4助

懂球帝
2026-04-10 09:50:22
快过年了,小姑子在家族群通知艾特我:嫂子,今年我们十一口人

快过年了,小姑子在家族群通知艾特我:嫂子,今年我们十一口人

王二哥老搞笑
2026-04-10 15:35:07
涉嫌严重违纪违法,吴政被查

涉嫌严重违纪违法,吴政被查

都市快报橙柿互动
2026-04-10 11:47:01
研究表明:性生活越频繁,射精和勃起问题越少!

研究表明:性生活越频繁,射精和勃起问题越少!

黯泉
2026-04-05 20:40:12
一觉醒来,斯诺克3冠军翻车!丁俊晖克星3-1被逆转,70后名将降级

一觉醒来,斯诺克3冠军翻车!丁俊晖克星3-1被逆转,70后名将降级

刘姚尧的文字城堡
2026-04-10 07:47:34
全球同步收到消息,特朗普拱手让出亚洲,大批涉华精英消失

全球同步收到消息,特朗普拱手让出亚洲,大批涉华精英消失

小影的娱乐
2026-04-10 16:07:11
郑丽文访陆带30岁才女随行,学历惊人,用人格局不一般

郑丽文访陆带30岁才女随行,学历惊人,用人格局不一般

兰妮搞笑分享
2026-04-10 16:29:26
中国不先使用核武器,若美国炸毁北斗卫星,中国是不是就输了?

中国不先使用核武器,若美国炸毁北斗卫星,中国是不是就输了?

无情有思ss
2026-04-10 08:07:27
苹果iPhone 18 Pro Max实锤!9月正式发布

苹果iPhone 18 Pro Max实锤!9月正式发布

叮当当科技
2026-04-09 05:32:27
杭州爱尔眼科医院院长被指猥亵医药公司销售经理,总部:已被停职,等待警方结果

杭州爱尔眼科医院院长被指猥亵医药公司销售经理,总部:已被停职,等待警方结果

第一财经资讯
2026-04-09 22:31:42
老蒋得知毛岸英牺牲,半夜支开宋美龄,向儿子蒋经国吐露心声

老蒋得知毛岸英牺牲,半夜支开宋美龄,向儿子蒋经国吐露心声

历史点行
2026-04-09 23:52:43
近20年被判死刑的大学生(上)

近20年被判死刑的大学生(上)

峰哥跑交通
2026-04-10 09:19:11
李玮锋重返职业联赛执教舞台,率宁波队目标保级

李玮锋重返职业联赛执教舞台,率宁波队目标保级

北青网-北京青年报
2026-04-10 12:12:05
陈丽华葬礼曝光!迟重瑞地位太尴尬?林大庆点破他的真实处境

陈丽华葬礼曝光!迟重瑞地位太尴尬?林大庆点破他的真实处境

一盅情怀
2026-04-10 15:40:48
中美印负债金额差距断崖:美39万亿,印160万亿,中国有多少?

中美印负债金额差距断崖:美39万亿,印160万亿,中国有多少?

户外钓鱼哥阿旱
2026-04-09 18:00:44
1950年剿匪部队搜完尼姑庵要离开时,战士发现不对劲:尼姑太丰满

1950年剿匪部队搜完尼姑庵要离开时,战士发现不对劲:尼姑太丰满

小莜读史
2026-04-08 17:14:13
日本人开始大量迁移人口

日本人开始大量迁移人口

咸説历史
2026-04-08 05:41:13
2026-04-10 17:43:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12725文章数 142621关注度
往期回顾 全部

科技要闻

马斯克狂发大火箭也养不起AI 年亏50亿美元

头条要闻

73岁骑友"抄近路"摔倒身亡 事发路段系村民自发修建

头条要闻

73岁骑友"抄近路"摔倒身亡 事发路段系村民自发修建

体育要闻

17岁赚了一百万美元,25岁被CBA裁员

娱乐要闻

黄景瑜王玉雯否认恋情!聚会细节被扒

财经要闻

创业板改革制度落地 增设第4套上市标准

汽车要闻

搭载第二代刀片电池及闪充技术 腾势N8L闪充版预售35万起

态度原创

游戏
旅游
家居
手机
公开课

前暴雪设计师炮轰《魔兽世界》剧情 像卡通片毫无张力

旅游要闻

跟着演唱会游济宁|凭演唱会票根免门票 畅游微山湖旅游区

家居要闻

复古风格 自然简约

手机要闻

消息称三星上调4月Galaxy S26系列手机产量至300万台

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版