网易首页 > 网易号 > 正文 申请入驻

试完刚刚开源的StableDiffusion3,我觉得能打败它的只有下一代。

0
分享至

Stable Diffusion 3,终于开源了。

当初SD3 API放出来的时候,他的公司Stability AI已经出现大大小小很多的裂缝了。

先是在今年3月23日,Stability AI的CEO Emad Mostaque宣布辞职。

第一季度结束的时候,Stability AI的营收不到500万美元,亏损超过3000万美元。此外,他们还拖欠云计算供应商和其他公司近1亿美元的账单,可以说,Stability AI已经乱成一锅粥了。

即便这样,Stability AI顶着大家评论他商业模式稀烂的舆情压力的情况下,依然不时地开源一些模型,给你一些小惊喜。

比如代码模型Stable Code Instruct 3B、3D视频模型Stable Video 3D、3D模型TripoSR、音频模型Stable Audio Open等等...

不过Stability AI毕竟是以AI绘画出圈的,绘图模型是核心业务,所以大家还是更期望看到他的绘图模型Stable Diffusion发出来。不过看一眼Stability AI的惨状,大家都觉得,SD3开源无望了。

果然,SD3来了,意料之中的是,是付费API的形式。

不过广大网友没有放弃,还是抱着一些微弱的希望,在Stability AI官方推特下面求开源模型哈哈哈。

结果,万万想不到的是,千呼万唤始出来。Stability AI大手一挥说,那行,继续开源!

这次给了一个中型版本的SD3,20亿参数,Stable Diffusion 3 Medium。

有些人可能觉得中型不够意思,但是我觉得刚好,毕竟再大了本地也跑不动啊= =

他们官宣的是6月12号,于是我就等啊等,12号从中午等到晚上,终于,等到了Stability AI把模型放出来了。在huggingface上开源。

网址在此:https://huggingface.co/stabilityai/stable-diffusion-3-medium

第一时间,我跟我我的小伙伴@祁珏瑜 对比了SD1.5,SD2.0,SDXL,SD3 Medium四个基础模型,来给大家看一下SD这么长时间,直观的进化。也给大家看看,SD3 Medium,有多强。

先说一下测试的大背景。

我们知道对于SD的话,需要很多的提示词,一般SD提示词两部分组成:内容描述提示词+画质描述提示词。

之前SD很烦的是,你必须要加一些冗余的画质提示词,比如best quality, high resolution, 8k之类的,正向反向都得加,不加的话则出图质量会差很多。

那我觉得既然SD3了,你就别欺负前面的弟弟了。

所以我给前三个模型SD1.5,SD2.0,SDXL提示词评测都加了正向画质提示词和反向画质提示词,(后面每一个都加了,为了避免重复就不写出来了)

1.5和2.0 的正向反向画质提示词

best quality, high resolution, 8k,masterpiece, highly detailed, UHD, bad proportions, low resolution, bad, ugly, terrible, render, watermark, logo,

sdxl 的正向反向画质提示词(因为xl和之前的画质提示词有些不同)。

score_9, score_8_up, score_7_up score_6, score_5, score_4, source_pony, low quality, normal quality, lowres,logo, watermark,

那SD3呢,我不给他加任何的画质提示词,直接裸奔。

所以其实最开始评测是有些不公平的,不过,真正的强者不需要我们的特殊照顾。直接来看效果。

1. 第一组内容提示词,看一下语义理解能力。

a cat,a destroyed badly damaged space ship,beautiful beach,broken windows, grass and flowers grow around,sunny,ocean(一只猫,一艘被摧毁的严重受损的宇宙飞船,美丽的海滩,破碎的窗户,周围长着草和鲜花,阳光明媚,海洋)

SD1.5:emmmmmm,这怎么成两张了,小猫咪看起来不太高兴啊,挎着个脸,海滩不太美丽雅,阳光呢?

SD2.0:不是,小猫怎么从船里长出来了,还有月亮你是怎么回事儿?不是说好的太阳吗。

SDXL:整体还行,但画面有点昏暗,配色不是很舒服。

SD3:王炸!语义理解能力极强,阳光明媚,美丽的海滩,鲜花……关键细节什么的都很好,画面也很和谐。

2. 再来测一下相对位置关系理解,这个更加考验模型能力。

a dog,hold hot dog,outdoors,grass(一只狗,叼着热狗,户外,草地)

SD1.5:emmmmmm,这小狗的热狗怎么悬空了啊?你的热狗怎么成香肠了?

SD2.0:SD2.0比较聪明,他直接把热狗放到了地上,哈哈这样你就挑不出我毛病了吧,但是语义理解不对啊大哥。

SDXL:基本理解了我的意思,但是这个画风,以及这个舌头衔接太奇怪了吧。

SD3:王炸!光效衔接都非常自然,小狗很可爱,热狗也很有食欲。

3.测试一下二次元动漫人物。

((anime style)),1girl, indoors, sitting on the sofa, living room, pink hair, blue eyes, from back, from above, face towards viewer, playing video games, holding controller, white shirt, short, parted lips, anime production(((动漫风格)),1女孩,室内,坐在沙发上,客厅,粉红色的头发,蓝眼睛,从后面,从上面,脸朝向观众,玩电子游戏,拿着手柄玩游戏,白衬衫,短,分开的嘴唇,动漫制作)

SD1.5:底模过于抽象。。。很多细节都丢失了,对比着看一下吧,从头发到眼睛。

SD1.5:千手观音?

SDXL:有点感觉了,但是你的画风画质很难评

SD3:没的说,依然是王炸!从头发到眼镜,从整体画质,到细节,No1!

动漫还做了另一组对比图。

你懂的= =

4. 再测试一下不同的科幻风格

robot droids, in the desert , colorful, dutch angle(机器人, 在沙漠中, 五颜六色)

SD1.5:这机器人,是营养不良吧?哈哈哈 还有说好的五颜六色呢?

SD2:右边这哥们你的手臂掉了~其他不必多说了,懂得都懂嘿嘿

SDXL:还行,但是这个机器人怎么这么丑呢,三条腿不对称

SD3:同样很Nice,依然是王炸,除了这颜色跟我理解的五颜六色不太一样。

5. 再测一组真人图片,难度也蛮大的,要求在水下。

1boy,underwater,green eyes,white skirt,looking at viewer(1个男孩,水下,绿色眼睛,白色裙子,看着观众)

SD1.5:恐怖片。。。

SD2.0:更恐怖了,有点像泡开的奥特曼。。

SDXL:还可以,凑合能看,就是这绿的啊。

SD3:非常NIce!

再测另一组真人的。

6. 来一组风景。

universe,stars,moon(宇宙、星星、月亮)

SD1.5:有点像我爸的微信头像。。。

SD2.0:凑合,就是构图雪崩。

SDXL:SDXL是真的好容易画卡通。

SD3:这氛围就到位了。

7.最后一个SD3最棒的,文字嵌入。

Cyberpunk style,urban,1 robot,an electronic screen with“ Khazix”(赛博朋克风格,都市,1个机器人,一个带有“卡兹克斯”的电子屏幕)

这个就不评价了,因为过往的SD模型,都不支持文字嵌入,目前SD3是独一份。

上面简单对比完之后,你可以直观感受到SD3的威力了,也能感受到,Stable Diffusion这个模型,一路以来的进化史。

我都不敢想象加了高质量提示词,配合开源社区的微调等强大的生态,这模型可以有多强。

最关键的是,它开源,所以,他免费。现在他可以直接在你自己的电脑里用跑了。

不过我上面的测试都是在ComfyUI里做的,没错是这个样子。

我其实一直都没咋写过ComfyUI,不是觉得他不行,而是他太行了。所以他上手门槛比较高,对于普通用户来说,不如Webui直观好用。

就在我想该怎么让大家更方便用上的时候,小伙伴甩给我了Stability AI官方已经放出的一个Webui,叫做StableSwarmUI。

https://github.com/Stability-AI/StableSwarmUI

他实际上是建立在ComfyUI的基础上进一步封装的一个UI,非常快捷,导入工作流之后就可以直接使用了。

关键是,官方已经提供了一键配置环境文件(甚至提供了mac电脑和linux环境配置文件),也就是模型运行环境什么的都不需要我们自己去配置。

我们在这个的基础上,帮大家下载好了SD3模型并放置好了模型,简单弄了个整合包,可以直接打开使用。

整合包我扔公众号后台了,对着公众号私信“SD3”这个英文字母就有,使用教程太长,我也直接扔整合包里面去了。

实测我的小4060,8GB的显存即可运行。

更骚的是,Stability AI为了让更多人能用上SD3,他们甚至跟AMD谈了合作,现在,AMD的显卡也能跑SD3了。。

真的是非常亲民,从模型本身到模型运行的环境,Stability真的做了很多。

Midjourney虽然确实牛叉,但确实对很多国内的人来说,架起了高高的围栏,很多普通人可能连去给Midjourney支付会员的方式都没有

这时,Stability AI站了出来,说,“我来!”

Stability AI花了极高的成本训练了Stable DIffusion,开源了Stable DIffusion系列。

这也才有了之后灿烂的开源绘画社区,大家才可以把AI绘画模型实实在在下到自己电脑上,切切实实感受绘画的魅力。

昨天有一个小插曲,LUMA发布了他们的AI视频Dream Machine,宣传片是真的酷,激动的我在各大群里乱叫大家别睡了,但是上手一测,好像...也就那样...并没有太多额外的惊喜。

但反过来看SD,我属有点泪目了,每一个工作都是实打实的,从来也不过分宣传,时不时还给你小惊喜,比如前段时间的47s的音频模型也非常好用。

可能商业上,Stability AI做的很一般,被人们所诟病。

但是在开源生态上,他真的极大推动了AI界的发展。

可以这么说:

Stability AI,在我心中。

才是那个真正的。

OpenAI。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
伊朗使用集束弹药轰炸特拉维夫!以色列淡水厂被炸!美国被惹怒了

伊朗使用集束弹药轰炸特拉维夫!以色列淡水厂被炸!美国被惹怒了

说历史的老牢
2026-03-04 10:23:48
没想到,雷军竟因两会前的这一提议,让小米汽车实现“口碑暴增”

没想到,雷军竟因两会前的这一提议,让小米汽车实现“口碑暴增”

观察者海风
2026-03-04 16:18:50
美军超5万名士兵、200架战斗机和两艘航母参战;伊朗:打赢“存亡之战”!

美军超5万名士兵、200架战斗机和两艘航母参战;伊朗:打赢“存亡之战”!

上观新闻
2026-03-04 15:41:05
美国空军部署 A-10 疣猪对地攻击机对伊朗进行第一轮打击

美国空军部署 A-10 疣猪对地攻击机对伊朗进行第一轮打击

深度Militaire
2026-03-04 10:42:27
喜马拉雅山的神秘部落:喜欢吃素,无婚姻制度,其繁衍方式特殊

喜马拉雅山的神秘部落:喜欢吃素,无婚姻制度,其繁衍方式特殊

老谢谈史
2025-12-30 17:23:53
美国前外交官持刀行凶,致1死3伤,当场被警方击毙

美国前外交官持刀行凶,致1死3伤,当场被警方击毙

潇湘晨报
2026-03-04 20:26:13
以媒:库尔德武装开始在伊朗境内开展地面活动

以媒:库尔德武装开始在伊朗境内开展地面活动

澎湃新闻
2026-03-05 08:17:05
美国打仗最怕什么?张召忠:一旦发生这2种情况,美军必然战败

美国打仗最怕什么?张召忠:一旦发生这2种情况,美军必然战败

闻识
2026-03-02 07:35:39
美媒:美以对伊战争推高全球油气价格,俄是唯一赢家,普京:价格确实涨了,正考虑主动给欧洲“断气”

美媒:美以对伊战争推高全球油气价格,俄是唯一赢家,普京:价格确实涨了,正考虑主动给欧洲“断气”

极目新闻
2026-03-05 10:18:55
我存了87万,表姑问存款多少,我说7万,隔天表姑说她要来

我存了87万,表姑问存款多少,我说7万,隔天表姑说她要来

小秋情感说
2026-03-01 10:01:59
一句脏话葬送22年努力!看着满头白发的周炜,郭冬临效应还在继续

一句脏话葬送22年努力!看着满头白发的周炜,郭冬临效应还在继续

姩姩有娱
2026-02-26 14:48:49
王毅外长打了4通电话,特朗普访华的氛围变了,中方已读不回

王毅外长打了4通电话,特朗普访华的氛围变了,中方已读不回

爱下厨的阿酾
2026-03-04 16:47:41
有人好奇,说孙颖莎这么优秀,为什么没人追她呢!

有人好奇,说孙颖莎这么优秀,为什么没人追她呢!

草莓解说体育
2026-03-05 04:36:18
再见开拓者!22.7分5.6篮板新星被裁!杨瀚森呀杨瀚森!说你啥呢

再见开拓者!22.7分5.6篮板新星被裁!杨瀚森呀杨瀚森!说你啥呢

林子说事
2026-03-04 13:19:55
从32人到37人!滞留迪拜邮轮的宁波旅游团将带上5位自由行游客一同回国

从32人到37人!滞留迪拜邮轮的宁波旅游团将带上5位自由行游客一同回国

老五汽车世界
2026-03-05 06:54:54
珠江口贝类检出24毫克-千克神经毒素,中科院团队锁定产毒真凶

珠江口贝类检出24毫克-千克神经毒素,中科院团队锁定产毒真凶

凉了时光人
2026-03-03 22:41:01
等了这么久,广东宏远摩西·布朗已落地香港,内线竞争即将进入残酷地狱模式

等了这么久,广东宏远摩西·布朗已落地香港,内线竞争即将进入残酷地狱模式

生活新鲜市
2026-03-05 10:09:07
张国立:不要再说我儿子是“问题男人”,他43岁未婚是谁的过错?

张国立:不要再说我儿子是“问题男人”,他43岁未婚是谁的过错?

子芫伴你成长
2026-03-04 22:28:34
看到祖国繁荣昌盛,外籍华人想恢复中国国籍?过了这“半年”再说

看到祖国繁荣昌盛,外籍华人想恢复中国国籍?过了这“半年”再说

小嵩
2026-03-03 05:10:09
17天独行以色列,我看懂了他们看我们的复杂眼神

17天独行以色列,我看懂了他们看我们的复杂眼神

汽车通研社
2026-03-03 21:57:07
2026-03-05 12:51:00
数字生命卡兹克 incentive-icons
数字生命卡兹克
反复横跳于不同的AI领域,努力分享一些很酷的AI干货
468文章数 567关注度
往期回顾 全部

科技要闻

阿里内部邮件回应:批准林俊旸辞职

头条要闻

媒体:若"委内瑞拉2.0"情景落空 白宫的经济叙事将崩塌

头条要闻

媒体:若"委内瑞拉2.0"情景落空 白宫的经济叙事将崩塌

体育要闻

2026年中超,为什么值得你多看一眼?

娱乐要闻

谢娜下场撕薛之谦,张杰前女友爆猛料

财经要闻

“十五五”开局之年,这么干!

汽车要闻

鸿蒙智行首款猎装车 尚界Z7/Z7T首发

态度原创

时尚
健康
旅游
游戏
军事航空

打底衫,条纹的最适合春天!

转头就晕的耳石症,能开车上班吗?

旅游要闻

春日赏花季!湖南会同万亩油菜花田竞相绽放

《THE CUBE,SAVE US》3月18日开启Steam抢先体验

军事要闻

伊朗首次使用"哈迪德110"高速无人机

无障碍浏览 进入关怀版