网易首页 > 网易号 > 正文 申请入驻

SDXL 1.0 介绍和优缺点总结

0
分享至

2023年7月26日:Stability. AI 发布SDXL 1.0,这是对其生成模型的又一次重大更新,带来了突破性的变化。

SDXL 1.0包括两种不同的模型:

sdxml -base-1.0:生成1024 x 1024图像的基本文本到图像模型。基本模型使用OpenCLIP-ViT/G和CLIP-ViT/L进行文本编码。

sdxml -refiner-1.0:一个图像到图像的模型,用于细化基本模型的潜在输出,可以生成更高保真度的图像。细化模型只使用OpenCLIP-ViT/G模型。

SDXL 1.0的refiner是基于OpenCLIP-ViT/G的具有6.6B参数模是目前可用的最强大的开放访问图像模型之一。

base模型在第一阶段创建(有噪声的)结果,然后由专门为最后去噪步骤设计的refiner模型进一步处理(基本模型也可以作为一个模块单独使用),以下是一个官方的样例

这种两阶段架构可以在不牺牲速度或要求过多计算资源的情况下实现更高质量图像的生成。在具有8GB VRAM的消费类gpu上SDXL 1.0应该运行良好。

本文不打算介绍更多的模型相关信息,只介绍一些大家可能忽略的问题:

图像质量

默认情况下,SDXL 1.0可以本地生成1024 x 1024的图像。仅这一点就比以前的版本有了很大的改进。SDXL 1.0特别适合鲜艳和准确的颜色。现在还可以生成图像与适当的照明,阴影和对比度,例如:

Prompt:
anime artwork An astronaut riding a white horse . anime style, key visual, vibrant, studio anime, highly detailed
Negative prompt:
photo, deformed, black and white, realism, disfigured, low contrast

除此之外,内容主体通常被放置在图像的中心,使其成为主要焦点。对于初学者来说,这个功能会更加实用,因为生成的图像可以直接使用了。

SDXL 1.0的基础模型要比SD 1.5和SD 2.1更好,特别是在包含艺术风格的提示时。当以提示时,图像的构图基本保持一致,而艺术风格则有所不同。例如:

Prompt:
An astronaut riding a white horse, art by Vincent van Gogh
Negative prompt:
photo, deformed, black and white, realism, disfigured, low contrast

文本编码器和提示

SDXL 1.0现在使用两种不同的文本编码器对输入提示符进行编码。根据他们的论文,该方法已被证明是有效的模型来理解两个不同概念之间的差异。例如:

The Red Square ——一个著名的地点,red square-特定颜色的形状

SDXL 1.0现在只需要几个单词就可以生成高质量的文本。通过调用某些限定词和长提示来获得美观图像的日子已经过去了。

但是CLIP的77个令牌限制仍然是包含在SDXL 1.0中。

高级控制

组合控件(如T2I和ControlNet)目前还不支持,但是官网已经确定正在开发中。在未来用户应该能够在工作流程中无缝地使用这些功能。

水印

SDXL 1.0内置不可见水印功能。如果输入不正确(接受BGR而不是RGB作为输入),水印特性有时会导致不想要的图像伪影。

在使用某些调度器和VAE (0.9 vs 1.0)时,生成的图像中可能会产生问题。但是其中一些问题的原因是已知,所以将来可能会修复。

另外水印这个事会让鉴别更加简单,依靠AI生成内容的行业可能会有很大的影响。

生态

由于SDXL 1.0基于不同的体系结构,所以现有插件必须重新训练和重新集成他们的工作。因此,必须重新构建整个生态系统,这需要大量的时间和资源。

内存消耗

SDXL 1.0的新架构由一个3.5B参数的基本文本到图像模型和一个6.6B参数的图像到图像精细模型组成。虽然8G的GPU可以使用但是相比以前的模型还是需要更高的内存(VRAM)需要图像生成和微调,更多的参数也意味着更长的推理时间

没有标准流程

《Stable Diffusion》的主要问题之一是没有关于正确操作方式的标准。大多数流行的框架和web都有自己的实现,不能跨不同的平台/框架使用。

所以对于新手来说,在自己的工作中适应和使用它是非常复杂的事情。大多数情况下,相同的提示符和设置会在不同的平台/框架上生成两个不同的图像。

陡峭的学习曲线

SD的学习曲线对于普通用户来说是相当陡峭的,特别是对于没有任何编程知识的美工。并且每次个更新后,以前有效的相同提示符现在不再有效。用户必须重新学习构建提示符的新方法,以及如何使用新更新的工具,这也是一个很大的问题。

结论

Stable Diffusion XL 1.0的发布标志着生成人工智能领域的新时代。这也证明了开源项目对社区和背后的公司都有好处。在短短几个月的时间里,它们取得了很大的进步,未来一定会达到一个新的高度。

并且目前看到的好消息是 AUTOMATIC1111的stable-diffusion-webui已经可以支持sdxl1.0了。

https://avoid.overfit.cn/post/9883a9325ffd45e8bfb84546eb9e1b03

作者:Ng Wai Foong

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一人毁一部电影?《飞驰人生3》唯一败笔,观众:看他演戏真别扭

一人毁一部电影?《飞驰人生3》唯一败笔,观众:看他演戏真别扭

何嗀爱捕渔
2026-02-25 07:23:30
荷兰没回头路了!中国子公司宣布:正式换国内供应商,不再合作!

荷兰没回头路了!中国子公司宣布:正式换国内供应商,不再合作!

通鉴史智
2026-02-24 14:19:15
回杭州堵了19小时,女子一下车倒地昏迷!一夜连发两起,都差点没命!医生提醒……

回杭州堵了19小时,女子一下车倒地昏迷!一夜连发两起,都差点没命!医生提醒……

环球网资讯
2026-02-24 19:47:09
华为确实是出现了严重的问题,只是至今官方还没有公开承认

华为确实是出现了严重的问题,只是至今官方还没有公开承认

雪中风车
2026-02-22 20:18:26
四十年前的“圆屏电视”,闲鱼二手卖8000,至今还能使用

四十年前的“圆屏电视”,闲鱼二手卖8000,至今还能使用

科技拌饭
2026-01-26 20:00:34
浓眉:真正的冠军球队,是没有任何东西能动摇其决心的

浓眉:真正的冠军球队,是没有任何东西能动摇其决心的

懂球帝
2026-02-25 01:26:05
给《飞驰人生》演员演技排个名,沈腾垫底,沙溢第4,第1毋庸置疑

给《飞驰人生》演员演技排个名,沈腾垫底,沙溢第4,第1毋庸置疑

翰飞观事
2026-02-24 17:12:40
美国华人直言:中国手机扫码支付是最不智能的发明!

美国华人直言:中国手机扫码支付是最不智能的发明!

阿伧说事
2026-01-20 12:53:01
大批F16出动,美重兵逼近黄海,不到1天,特朗普:中方实力太强大

大批F16出动,美重兵逼近黄海,不到1天,特朗普:中方实力太强大

通文知史
2026-02-22 22:57:13
挺住,乌克兰人!

挺住,乌克兰人!

近距离
2026-02-24 15:17:45
去了一趟潮汕,我被饭桌上的教育震撼:活该人家一代比一代富!

去了一趟潮汕,我被饭桌上的教育震撼:活该人家一代比一代富!

小陆搞笑日常
2026-02-23 22:27:30
宋彬彬晚年回国道歉仍不被原谅,其父宋任穷也不愿提起她,为何

宋彬彬晚年回国道歉仍不被原谅,其父宋任穷也不愿提起她,为何

春秋砚
2026-02-24 12:25:08
一箱油可横跨北美 本田新型小飞机卖爆:购买意向达产能10倍

一箱油可横跨北美 本田新型小飞机卖爆:购买意向达产能10倍

快科技
2026-02-24 08:21:03
一夜蒸发 310 亿美元!Claude 新工具干翻 IBM 摇钱树,AI 正在「清零」人类工位

一夜蒸发 310 亿美元!Claude 新工具干翻 IBM 摇钱树,AI 正在「清零」人类工位

AppSo
2026-02-24 12:20:50
汪小菲妻子马筱梅产子,大方晒出宝宝正面照,张兰盛赞儿媳:把大S两个孩子视为己出,如今又为汪家添了骨血

汪小菲妻子马筱梅产子,大方晒出宝宝正面照,张兰盛赞儿媳:把大S两个孩子视为己出,如今又为汪家添了骨血

都市快报橙柿互动
2026-02-24 20:13:09
央媒对谷爱凌的称呼变了,七字之差释放强烈信号,邓亚萍说得太对

央媒对谷爱凌的称呼变了,七字之差释放强烈信号,邓亚萍说得太对

妙知
2026-02-24 10:47:18
双探花缺阵怀特22+8+8,杰伦格林打铁8中1,绿军送太阳交手5连败

双探花缺阵怀特22+8+8,杰伦格林打铁8中1,绿军送太阳交手5连败

钉钉陌上花开
2026-02-25 12:15:42
一只励志的小黑猪:为了活命,拼命帮主人干活,最终获得免死金牌

一只励志的小黑猪:为了活命,拼命帮主人干活,最终获得免死金牌

狸猫之一的动物圈
2026-02-24 09:00:11
田震再次挂牌悉尼豪宅, 指导价$1550万! 10年前$1165万购入, 内部曝光, 曾降价$400万

田震再次挂牌悉尼豪宅, 指导价$1550万! 10年前$1165万购入, 内部曝光, 曾降价$400万

澳微Daily
2026-02-23 14:46:03
乔布斯诞辰日,苹果公司召开股东大会:库克并未接任董事长,也未释放首款苹果折叠屏手机相关信息

乔布斯诞辰日,苹果公司召开股东大会:库克并未接任董事长,也未释放首款苹果折叠屏手机相关信息

极目新闻
2026-02-25 08:38:15
2026-02-25 12:35:00
deephub incentive-icons
deephub
CV NLP和数据挖掘知识
1930文章数 1456关注度
往期回顾 全部

科技要闻

苹果MacBook Pro要加触摸屏了,还带灵动岛

头条要闻

夫妻8年还清百万元债务:在杭州开饭店 几乎全年无休

头条要闻

夫妻8年还清百万元债务:在杭州开饭店 几乎全年无休

体育要闻

曝雄鹿计划今夏追小卡 字母哥渴望与其并肩作战

娱乐要闻

撒贝宁到沈阳跑亲戚 老婆李白模特身材

财经要闻

春节档"开门黑" 电影票少卖了7000万张

汽车要闻

方程豹首款轿车实车图曝光 就等价格了?

态度原创

亲子
时尚
游戏
旅游
公开课

亲子要闻

上交压岁钱的时候到了

普通人穿衣别太老气横秋!这些穿搭给你灵感,保暖耐看两不误

《漫威金刚狼》正式确认9月15日发售 魔形女等经典角色登场

旅游要闻

昆明市博物馆丨新春游园会与市民欢乐“过大年”

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版