4月9日消息,京东探索研究院近日正式开源了多模态AI模型JoyAI-Image-Edit。据了解,该模型集成了文生图、图像理解与指令编辑功能,其特点是引入了空间智能,旨在解决AI图像编辑中物体变形、透视失真等空间一致性问题。
据悉,该模型采用统一架构,深度融合图像生成与理解能力。其核心突破在于支持三类空间编辑操作:用户可通过指令调整观察视角、进行虚拟“空间漫游”以生成连贯的多视角图像序列,以及对场景中物体的位置、大小等空间关系进行操控,并保持遮挡、光影合理。
在应用层面,该模型为多个领域提供了新工具。例如,电商领域可基于单张商品图生成多角度展示图;在3D重建、建筑设计等领域,则可帮助用户从有限图片生成几何一致的多视角图像,用于三维展示或创意预览。
目前,JoyAI-Image-Edit模型已在HuggingFace及Github平台开源。(栎行)
