网易首页 > 网易号 > 正文 申请入驻

上交大提出ICRDrag:首个上下文区域拖拽模型,精准可控图像编辑

0
分享至



还在用 DragGAN、DragDiffusion 拖拽修图?点选拖拽容易变形、边界割裂、细节丢失的时代落幕了!ECCV 2026 ICRDrag 首创上下文区域拖拽模型,用掩码精准定位局部区域,移动、缩放、变形全都丝滑自然,兼顾精准度与画面真实感。



  • Paper: https://arxiv.org/pdf/2606.25907
  • GitHub: https://github.com/bcmi/ICRDrag-Region-Drag-Editing
  • Demo: https://drag.ustcnewly.com/

效果展示

先看编辑效果,每一组图像左边蓝色掩码是源区域,右边红色掩码是目标区域。拖拽编辑旨在把源区域拖拽到目标区域,其他区域除了必要的跟随性改动 (比如嘴巴动了,下巴也要跟着动) 之外,细节尽量保持不变。可以看出 ICRDrag 对于各种类型图片的姿态和形状调整都能轻松拿捏。



下面视频是 demo 展示,用户可以用不同颜色画出多对源区域和目标区域 (目前最多支持 5 对),把多个源区域拖拽到对应的目标区域。如果其他区域出现了不想要的改动,可以在其他区域增加类似锚点的源区域和目标区域,锁定其他区域。

体验链接:
https://drag.ustcnewly.com/

直击痛点

传统拖拽修图,到底有多难用?玩过 AI 拖拽编辑的朋友一定踩过这些坑:

  • 基于单点拖拽:主流点拖拽模型比如 DragGAN, DragDiffusion 仅靠少量点对控制画面。点对信息模糊,AI 经常猜不透你的想法。点越少歧义越大,想要精准调整物体形态基本靠碰运气,很难严格对齐目标位置。
  • 现有区域拖拽:后来出现的 RegionDrag, DragFlow 等模型改用掩码控制区域,但缺陷依旧明显:物体拖拽后边缘断层,和背景融合生硬;复杂的形状姿态调整完全 hold 不住。



上下文区域拖拽

本次 ECCV2026 提出的 ICRDrag(In-Context Region-based Drag)全新解法:上下文区域拖拽,真正实现「选啥改啥」。

  • 上下文学习框架:基于 DiT 上下文学习框架,一次性输入原图、源区域掩码、目标区域掩码,直接输出编辑完成的图片,从底层解决拖拽编辑的控制难题。
  • 图像 - 掩码注意力一致性约束:目标图像在借鉴原图信息时,注意力分布必须和目标掩码匹配源掩码的分布保持一致。AI 不再割裂看图片和选区,生成画面严格贴合掩码划定的空间轮廓。
  • 源 - 目标双向注意力对应约束:目标物体看向原图对应区域,原图区域也反向关注目标物体,建立编辑前后物体的对应关系。
  • 图片 / 掩码专属模态 LoRA:图像富含纹理细节,掩码仅存储空间轮廓,二者的性质差别很大。ICRDrag 为图像、掩码分支使用独立 LoRA。
  • 分阶段课程式训练:现实使用中,用户勾勒的掩码往往比较粗糙。模型采用两阶段渐进式训练:第一阶段用完整语义掩码训练,让模型学会区域变换逻辑;第二阶段用稀疏不完整掩码训练,随机膨胀模拟手绘粗糙选区,大幅提升模型容错率。哪怕掩码画得潦草,AI 依旧能精准理解你的编辑意图。



区域拖拽大规模数据集

为了训练 ICRDrag 模型,该工作基于百万级视频数据集 OpenVid,打造了首个大规模区域拖拽数据集 PRD (Paired Region Dataset),补齐领域空白:

  • 训练集:28.7 万组「原图 + 源掩码 + 目标图 + 目标掩码」配对样本,如下图所示。下图中,左栏是原图、源掩码、从源掩码采样的部分区域,右栏是目标图、目标掩码、从目标掩码采样的部分区域。
  • 评测基准 PRDBench:1000 组人工校验高质量样本,同时标注掩码 + 关键点,可公平对比点拖拽、区域拖拽两类模型。



应用场景

图像拖拽编辑覆盖多个落地场景,是广大设计师和摄影爱好者的福音。

  • 人像修图:框选人脸、四肢,随意调整身材比例、姿态、五官位置,不变形不失真;
  • 静物 / 产品设计:拖拽商品调整摆放位置、缩放大小,无需重绘光影;
  • 场景构图优化:移动画面中人物、花草、建筑,自动填充背景,画面无缝融合;
  • 创意设计:自由扭曲物体轮廓,实现复杂创意形变,告别生硬拼接。

实验室简介

ICRDrag 出自上海交通大学牛力实验室。该实验室近几年主要工作集中在图像生成和编辑领域,代表性子领域是图像合成 / 物体插入 (image composition/object insertion) 和少样本图像生成 (few-shot image generation),也涉猎过图像填充、图像分层、风格迁移、拖拽编辑等其他子领域。近两年在关注生成模型的后训练和理解生成一体化模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
国家一级文物上现广告字样,中国工艺美术馆回应:已反映给青海省博物馆,会有专人处理

国家一级文物上现广告字样,中国工艺美术馆回应:已反映给青海省博物馆,会有专人处理

潇湘晨报
2026-07-05 13:12:18
家有壁虎,它不轻易进家,进来就是给你传2个信号

家有壁虎,它不轻易进家,进来就是给你传2个信号

超人强动物俱乐部
2026-07-05 13:37:52
俄乌冲突持续升级,专家:战场逻辑和重点发生改变

俄乌冲突持续升级,专家:战场逻辑和重点发生改变

极目新闻
2026-07-05 18:34:17
请客吃早餐花掉12万!全网都在找他

请客吃早餐花掉12万!全网都在找他

环球网资讯
2026-07-05 16:57:11
暗指谁?杨毅怒批男篮老将不愿进国家队,胡金秋一句话揭露现实

暗指谁?杨毅怒批男篮老将不愿进国家队,胡金秋一句话揭露现实

小禾的体育
2026-07-05 17:07:09
本届世界杯,最倒霉的就是佛得角!踢了4场球,遇到3个世界冠军

本届世界杯,最倒霉的就是佛得角!踢了4场球,遇到3个世界冠军

观星娱记
2026-07-05 12:31:18
零跑"神车"官宣:12.98万,新车上市

零跑"神车"官宣:12.98万,新车上市

科技堡垒
2026-07-05 11:25:03
“我来住院不是来军训,天不亮就叫起来!”患者控诉查房太早,医生反呛:住院是为了救命,不是来享福!三甲主任:这不是形式主义,很重要

“我来住院不是来军训,天不亮就叫起来!”患者控诉查房太早,医生反呛:住院是为了救命,不是来享福!三甲主任:这不是形式主义,很重要

梅斯医学
2026-07-05 07:53:45
两支巴西球队有意签下沃齐尼亚

两支巴西球队有意签下沃齐尼亚

潇湘晨报
2026-07-05 21:08:09
最后一舞?每体:C罗姐姐暗示他世界杯后退出国家队

最后一舞?每体:C罗姐姐暗示他世界杯后退出国家队

懂球帝
2026-07-05 20:10:29
TCL回应永乐款菩萨像现其广告:未授权或参与涉事文物展陈

TCL回应永乐款菩萨像现其广告:未授权或参与涉事文物展陈

南方都市报
2026-07-05 21:14:13
仅带队踢了2场世界杯!57岁名帅宣布辞职:球队8人兴奋剂检测异常

仅带队踢了2场世界杯!57岁名帅宣布辞职:球队8人兴奋剂检测异常

风过乡
2026-07-05 05:40:25
4换2!联手弗拉格!西部最被低估的交易

4换2!联手弗拉格!西部最被低估的交易

篮球教学论坛
2026-07-05 20:42:09
佛得角究竟强在哪,“中高收入”意味着什么?

佛得角究竟强在哪,“中高收入”意味着什么?

新民周刊
2026-07-05 08:37:26
中国最后还是松了口?高市早苗访印专机直接从中国领空穿行而过!

中国最后还是松了口?高市早苗访印专机直接从中国领空穿行而过!

阿龙聊军事
2026-07-05 08:22:41
重磅!杜锋下课,卸任广东宏远主教练,焦泊乔或留队,徐昕迎转机

重磅!杜锋下课,卸任广东宏远主教练,焦泊乔或留队,徐昕迎转机

烨侃体育
2026-07-05 16:46:52
以为7座车能带全家出游,入手后才发现,处处都是麻烦

以为7座车能带全家出游,入手后才发现,处处都是麻烦

趣味萌宠的日常
2026-07-04 18:47:13
一箱油半箱税:3 亿油车养全国马路,既大且重的电车还能白蹭多久

一箱油半箱税:3 亿油车养全国马路,既大且重的电车还能白蹭多久

电科技网
2026-07-04 18:12:17
冯德莱恩:如果中国错过10月最后期限,欧盟所有手段都已准备就绪

冯德莱恩:如果中国错过10月最后期限,欧盟所有手段都已准备就绪

故事终将光明磊落
2026-07-05 14:45:58
0-3!输球不可怕,可怕的是加拿大主帅赛后这番话,发布会逆转!

0-3!输球不可怕,可怕的是加拿大主帅赛后这番话,发布会逆转!

田先生篮球
2026-07-05 06:59:16
2026-07-05 21:44:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
13442文章数 142688关注度
往期回顾 全部

科技要闻

华为:逻辑折叠将大幅提升麒麟CPU核心频率

头条要闻

在新疆遭泥石流卷走失联多日的母子被找到 均不幸遇难

头条要闻

在新疆遭泥石流卷走失联多日的母子被找到 均不幸遇难

体育要闻

姆巴佩点走巴拉圭:巴黎三代左锋传承

娱乐要闻

霉霉婚礼照片泄露 有四人违规

财经要闻

揭秘跨境“对敲”换汇黑产

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

时尚
教育
旅游
健康
亲子

3年赚46亿,杨幂喊出一个安徽富豪

教育要闻

热榜!2026大家都想报什么热门专业?一图看清!

旅游要闻

让更多游客留下来过夜,上海主题乐园打响加时赛

听说少吃点能抗衰老?专家讲解!

亲子要闻

奉劝大家:超市里这5种食物少给孩子吃,看似有营养,实则没好处

无障碍浏览 进入关怀版