网易首页 > 网易号 > 正文 申请入驻

上交&上海AI Lab提出LEGION:AI图像伪造克星,反哺生成模型进化

0
分享至

本文由上海交通大学,上海人工智能实验室、北京航空航天大学、中山大学和商汤科技联合完成。 主要作者包括上海交通大学与上海人工智能实验室联培博士生康恒锐、温子辰,上海人工智能实验室实习生文思为等。通讯作者为中山大学副教授李唯嘉和上海人工智能实验室青年科学家何聪辉。

AIGC 技术狂奔的脚印后,留下的是满地信任残骸

近年来,文生图模型(Text-to-Image Models)飞速发展,从早期的 GAN 架构到如今的扩散和自回归模型,生成图像的质量和细节表现力实现了跨越式提升。这些模型大大降低了高质量图像创作的门槛,为设计、教育、艺术创作等领域带来了前所未有的便利。然而,随着模型能力的不断增强,其滥用问题也日益严重 —— 利用 AI 生成的逼真图像进行诈骗、造谣、伪造证件等非法行为层出不穷,公众正面临一场愈演愈烈的信任危机

(图源自知乎和多家微信公众号)

不信?猜一猜下列图片中哪些是真实的,哪些则是由 AI 合成伪造的?

(左右滑动查看)

答案是:这些图像全是伪造的

若只是匆匆一瞥,你很可能会毫不察觉 —— 它们几乎天衣无缝。这正是得益于近年来文生图技术的突飞猛进,AI 生成内容已逼近真实。然而,正因如此,公众在毫无防备的情况下被误导的风险也在加剧。面对真假难辨的图像,信任成本正悄然上升,焦虑与不安也随之而来。

  • 论文标题: LEGION: Learning to Ground and Explain for Synthetic Image Detection
  • 作者团队: 上海交通大学、上海人工智能实验室、 北京航空航天大学、中山大学和商汤科技
  • 项目主页: https://opendatalab.github.io/LEGION
  • 关键词: 伪造检测、伪影定位、异常解释、引导图像优化

那么我们该如何破局?在ICCV25 highlight paper《LEGION: Learning to Ground and Explain for Synthetic Image Detection》中,来自上海交通大学、 上海人工智能实验室等组织的研究团队从构建高质量 AI 合成图像数据集、设计可解释伪造分析模型、实现检测与生成的对立统一这三个角度给出了他们的答案。

破局基石:开创性数据集成就伪影图鉴

该团队反思了现有伪造图像数据集的局限性,并且构建了首个针对纯 AI 合成图像,可进行全面伪造分析的数据集 SynthScars,直击现有顶级生成技术的缺陷与 “伤疤”,让看似完美的 AI 图像显露真容,为图像安全研究注入新动力,主要具有以下亮点:

  • 全网顶配生成器:

部分图像来自最新的 AI 创作平台,集齐了 FLUX、SD 系列、各种商用 API 及特定 LoRA 微调后的最新文生图模型,几乎不含 “一眼假” 的老旧低质的伪造图像

  • 专杀超现实画风:

系统性过滤动漫、插画等艺术风格图像,这类样本虽常见但误导性低;数据集中仅保留逼真程度高、最具欺骗性的超现实风格图像,聚焦人类最难分辨的 “视觉死角”

  • 三维解剖级标注

每张图像均附带伪影掩码、异常解释与伪影类型标签三类信息,系统覆盖三大伪影类型:物理矛盾、结构畸形、风格失真,支持定位、诊断与归因的全流程分析

  • 去轮廓依赖魔咒

摒弃依赖物体边界变形的传统篡改范式,专注捕捉 AI 原生生成图像中非结构性、无规则分布的伪影信号,直击深层次建模缺陷遗留的 “蛛丝马迹”

核芯武器:多模态大模型重塑分析范式

作者提出了一个基于多模态大模型(MLLMs)的图像伪造分析框架,主要由全局图像编码器、定位图像编码器、大语言模型、像素解码器和检测分类头组成,能够实现:

多任务架构统一:

伪造检测 + 伪影定位 + 异常解释三位一体,同步完成,无需零散专家拼凑实现。

伪影定位任务在 RichHF-18K 等 3 个数据集上进行了测试,结果如下:

作者指出,现有的一些通用多模态大模型,如 Qwen2-VL 在面对此任务时倾向于预测图片的绝大部分(有时是整张图片)为伪影,这是毫无意义的,这说明了现有 MLLMs 缺乏相关知识和能力

异常解释任务在 LOKI 等两个数据集上进行了测试,结果如下:

LEGION 仅用 8B 参数量就能够在异常解释任务中打败其他同等甚至更大规模的模型。作者还指出诸如 Deepseek-VL2/GPT-4o 这样的模型会输出看似全面的各种可能性,但实际上会导致答案冗杂,评分偏低。

伪造检测任务选择在 UniversalFakeDetect 基准上进行测试:

卓越的鲁棒性:

作者尝试了高斯噪声攻击、JPEG 压缩失真和高斯模糊三种干扰处理,发现 LEGION 性能相较于传统专家模型而言波动较小,具有更强的鲁棒性:

可解释性飞跃:

与传统专家模型仅给出真伪判断不同,LEGION 除此以外还利用视觉掩码直击 “造假部位”,语言能力生成 “打假报告” → 不只判真假,更说清何处假、为何假、有多假

更多的可视化示例请关注项目主页:https://opendatalab.github.io/LEGION

颠覆循环:实现检测与生成的终极共生

一直以来,合成与检测,宛如一对技术 “冤家”,在对抗中推动彼此演进。当合成跑过检测,虚假内容得以轻易伪装,真假难辨的风险骤增;当检测胜过合成,生成模型便被迫进化,朝着更高真实度与隐蔽性迈进。

因此,这篇论文创造性地提出:

LEGION 不仅可以作为图像安全的保卫者,也能是反向促进高质量生成的催化剂

为此,作者从两种不同的角度,提出了利用检测 “反哺” 生成的 pipelines:

全局提示词优化

作者指出,现有生成图片中的伪影部分来源于提示词的模糊。利用 LEGION 的异常解释文本,对全局提示词进行多轮细化后再重新生成能够有效修复一些缺陷,例如能对图片进行现实风格迁移、结构细节调整等。

局部语义修复术

另外一种思路是直接对 LEGION 检测出的伪影区域做局部修复。具体地,可以联合检测得到的伪影掩码和异常解释,利用图像修复模型针对性地消除伪影细节,这种方法的好处在于不对正常区域处理,能够最大程度的保留原图语义。

上例中,原始生成图像的伪影较为隐蔽,乍一眼看去往往会被忽略 —— 房子在水中的倒影与实际的颜色和形状不一致,这是典型的物理定律违反。通过多轮对伪影区域的局部修正,能够逐步得到更高质量、更逼真的合成图片。

此外,我们利用 HPSv2.1 模型对应用上述两种方法前后生成的图像进行了定量的人类偏好评分,能够明显发现在引导图像优化后有较大程度的提升,这说明了用 "打假" 反哺 "造真" 的可行性和有效性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国乒新情报:4月6日,回成都封训,林诗栋出征太原,伦敦名单将定

国乒新情报:4月6日,回成都封训,林诗栋出征太原,伦敦名单将定

八斗小先生
2026-04-06 11:25:33
8连败+7年从未打过季后赛!昔日天才状元被高估,1.93亿真白花了

8连败+7年从未打过季后赛!昔日天才状元被高估,1.93亿真白花了

大卫的篮球故事
2026-04-06 15:20:40
国央企“软裁员”有多狠?不骂不裁不找茬,四招让你主动提离职

国央企“软裁员”有多狠?不骂不裁不找茬,四招让你主动提离职

复转这些年
2026-04-05 17:50:56
俄罗斯断供,中国限制出口!印度菲律宾急眼了:早知今日何必当初

俄罗斯断供,中国限制出口!印度菲律宾急眼了:早知今日何必当初

世界有奇事
2026-04-06 14:29:57
下周好运星座(4/5~4/11)热力提升,但麻烦增多!

下周好运星座(4/5~4/11)热力提升,但麻烦增多!

Pandora占星小巫
2026-04-05 15:38:11
研究发现:一旦做了心脏造影,这4件事一定要注意,别害自己

研究发现:一旦做了心脏造影,这4件事一定要注意,别害自己

白话电影院
2026-04-05 22:46:56
美战机飞行员或被伊朗军方俘虏

美战机飞行员或被伊朗军方俘虏

财联社
2026-04-03 19:22:05
女孩故意穿丑去相亲,本想劝退竟被当场相中,网友:男子太精明了

女孩故意穿丑去相亲,本想劝退竟被当场相中,网友:男子太精明了

观察鉴娱
2026-02-11 15:07:58
张本智和父亲怒斥:请别再骂我儿子,他比99%的中国人都优秀!

张本智和父亲怒斥:请别再骂我儿子,他比99%的中国人都优秀!

拳击时空
2026-04-06 06:37:58
加盟广东队成首选!麦考伊被曝将空降CBA,或被朱芳雨捡漏签下?

加盟广东队成首选!麦考伊被曝将空降CBA,或被朱芳雨捡漏签下?

绯雨儿
2026-04-06 11:05:05
90年代,没有四肢、生长在花瓶里的“花瓶姑娘”,是怎么骗人的?

90年代,没有四肢、生长在花瓶里的“花瓶姑娘”,是怎么骗人的?

兴史兴谈
2026-04-05 11:24:12
扎根合川36年的“不倒翁”倒了!明道贵清明后终被查处

扎根合川36年的“不倒翁”倒了!明道贵清明后终被查处

小陆搞笑日常
2026-04-06 15:10:52
女子被触摸隐私部位后续!衣服全被脱光,商家只开除,拒绝赔偿

女子被触摸隐私部位后续!衣服全被脱光,商家只开除,拒绝赔偿

潮鹿逐梦
2026-03-18 10:26:41
王濛在浪姐快憋出内伤:我按秒表比赛,你们搁这演《人情世故》?

王濛在浪姐快憋出内伤:我按秒表比赛,你们搁这演《人情世故》?

东方不败然多多
2026-04-06 09:12:14
人民日报13字锐评全红婵事件,国家体育总局果断行动

人民日报13字锐评全红婵事件,国家体育总局果断行动

吃青菜长高
2026-04-04 06:08:45
反超世界第1!29岁赵心童成世锦赛最大夺冠热门 若卫冕将破2魔咒

反超世界第1!29岁赵心童成世锦赛最大夺冠热门 若卫冕将破2魔咒

我爱英超
2026-04-06 06:01:12
川崎老员工爆猛料,整个日本摩托圈,现在最怕一个中国修车娃

川崎老员工爆猛料,整个日本摩托圈,现在最怕一个中国修车娃

西莫的艺术宫殿
2026-04-06 10:44:03
84岁日本18禁游戏公司社长病逝,无妻无子快乐打游戏孤独终老

84岁日本18禁游戏公司社长病逝,无妻无子快乐打游戏孤独终老

情报姬
2026-04-05 23:13:53
黄晓明发文道歉:作为父亲,深感愧疚

黄晓明发文道歉:作为父亲,深感愧疚

观察者网
2026-04-06 07:39:05
时隔54年!美国绕月展示的技术差距,中国登月差距到底有多大?

时隔54年!美国绕月展示的技术差距,中国登月差距到底有多大?

林子说事
2026-04-05 21:41:46
2026-04-06 17:07:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12681文章数 142614关注度
往期回顾 全部

科技要闻

前同事被蒸馏成Token,AI能否偷走职场经验

头条要闻

外媒:美国副总统万斯和伊朗外长等人彻夜交流

头条要闻

外媒:美国副总统万斯和伊朗外长等人彻夜交流

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

乔任梁离世10年 父母曝舞台光鲜的背后

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

健康
房产
教育
时尚
本地

干细胞抗衰4大误区,90%的人都中招

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

教育要闻

研究儿童心理20年,这位美国教授却警告我:千万别禁止孩子玩手机...

AI时代,辨别真相的成本变高了

本地新闻

跟着歌声游安徽,听古村回响

无障碍浏览 进入关怀版