网易首页 > 网易号 > 正文 申请入驻

Stable Diffusion AI绘图,制作LoRA模型教程,从此不当伸手党

0
分享至

前面文章已经介绍了不少Stable Diffusion AI绘图的基本方法,在前面的介绍中,我们都是使用别人训练好的LoRA来进行绘图。使用别人发布的LoRA,会遇到这种情况,那就是比如某个人物或者风格没有对应的LoRA发布,那么就画不了了。人们常说:自己动手丰衣足食,别人没做就自己做吧。学会自己制作LoRA就不用当伸手党,做的好的LoRA还可发布出来供别人使用。

本例将制作蔡徐坤的Lora,并用来进行AI绘图。我们先来看看最后的效果:(我知道可能用其他美女做成LoRA文章点击率更高,但是蔡徐坤更有辨识度)

在开始制作之前,我们先回顾下什么LoRA模型,了解基本原理我们选参数时就不会手足无措。

LoRA: 全名为Low-Rank Adaptation of Large Language Models(大语言模型的低阶适配器),简单来说就是大语言模型的微调小模型。Checkpoint的大模型通过这个小模型可以进行微调。模型存放位置在models\LoRA下。

可以看出LoRA是在某个Stable Diffusion大模型下训练生成的一个小模型,用于微调大模型。LoRA可以调整人物,也可以调整风格。

例如下图是加载了蒂法的LoRA,这是人物LoRA(tifaMeenow_tifaV2.safetensors)

还有改变画面风格的LoRA,例如水彩风格(Colorwater_v4.safetensors沁彩)

目前进行LoRA模型训练只要8G显存就可以了(笔者就是使用1080/8g写的教程,为了适应更多人的需求,实际工作使用的3060/12G),个人推荐进行训练用3060/12G显卡这样避免显存不够的错误。训练使用的程序框架是kohya_ss。kohya_ss是一个All in One的程序包(傻瓜包)整合了训练用的所有软件,还有图形用户界面。所有软件都是在它自己的运行环境里运行,不会干扰其他的程序软件。安装kohya_ss非常简单,唯一要求是可以科学上网。

kohya_ss的地址
https://github.com/bmaltais/kohya_ss

本次例子使用真人大模型ChilloutMix.safetensors,来生成蔡徐坤的Lora,显卡使用1080/8g进行训练。

整个训练过程分为三步:

  • kohya_ss训练环境搭建
  • 图片处理和标注
  • 训练并生成LoRA模型,并用它来进行AI绘图

下面开始依次进行说明:

一. kohya_ss环境搭建,主要按照它官方的教程来,我只说明下需要注意的地方。地址是:(如果出现问题,多半是没有科学上网)

https://github.com/bmaltais/kohya_ss

依赖库安装

  • 安装 Python 3.10,将 Python 加入 'PATH' 环境变量这项打勾
  • 安装 Git
  • 安装Visual Studio 2015, 2017, 2019, and 2022 redistributable
    Visual Studio 2015, 2017, 2019, and 2022 redistributable的地址:
    https://aka.ms/vs/17/release/vc_redist.x64.exe

进行AI绘图的人前两项安装已经装过了,所以直接跳过,只需要装第三项。

装好之后需要更改powerShell的权限,用管理员运行里执行

输入 :Set-ExecutionPolicy Unrestricted
然后输入Y,见下图:

然后关闭它就可以了。如果你windows是管理员运行的这步可以省略。

再开一个窗口,开全局科学上网,依次一行一行复制以下命令执行,一个字都不要改:

git clone https://github.com/bmaltais/kohya_ss.git
cd kohya_ss
python -m venv venv
.\venv\Scripts\activate
pip install torch==1.12.1+cu116 torchvision==0.13.1+cu116 --extra-index-url https://download.pytorch.org/whl/cu116
pip install --use-pep517 --upgrade -r requirements.txt
pip install -U -I --no-deps https://github.com/C43H66N12O12S2/stable-diffusion-webui/releases/download/f/xformers-0.0.14.dev0-cp310-cp310-win_amd64.whl
cp .\bitsandbytes_windows\*.dll .\venv\Lib\site-packages\bitsandbytes\
cp .\bitsandbytes_windows\cextension.py .\venv\Lib\site-packages\bitsandbytes\cextension.py
cp .\bitsandbytes_windows\main.py .\venv\Lib\site-packages\bitsandbytes\cuda_setup\main.py
accelerate config

有2g左右的文件需要下载,依赖网速,可能需要半小时。其中最后一步是一个配置文件,按照你的机器选就行了,我的1080是老显卡很多优化没有,所以大部分选的NO。

你可以随时更改这个配置,只需要执行下面3个命令重新配置(建议第一次都选NO,后面再测试你的显卡能打开哪些开关加速训练)
cd kohya_ss
.\venv\Scripts\activate
accelerate config

安装好后,会有个kohya_ss目录,大小6g左右。然后右键使用powershell执行gui-user.ps1

就会弹出GUI界面,如下图:(建议你关掉已经启动的Stable Diffusion绘图和其他占用显存的程序,训练需要6G以上的显存空间)

到这里,训练环境就搭建好了。

二。图片处理和标注

1.图片下载处理

去网上下载蔡徐坤的图片,各种角度的都找,需要清晰的照片,图片分辨率随便,尽量找他单人照。建一个叫100_cxkimg的文件夹,这里100很重要,它是代表进行100次训练,你写50就是50次训练,例如50_annimg,文件名随便,最好不要用中文。你也可以学我用cxk0.jpg到cxk15.jpg命名这16张照片。

2.标注图片

标注是机器深度学习的重要内容,这里原理不做解释了。标注的越好,模型的泛化就越强。你不标注可能生成就是个没用的模型。标注就是用提示词来说明图片的内容。这里举个例子例如上图cxk4.jpg是个穿西装的蔡徐坤,就标注成:a man in a suit and bow tie。生成标注的办法有多种,例如人工去标注,这里用个简单的办法,让机器自动标注。

科学上网条件下,选择Utilities的BLIP Captioning,填入文件夹名字,点下Caption images,就会生成图片的自动标注。

你也可以采用手动标注,就是人比较累。图片自动标注后,也最好打开每个文件检查下描述的正确性,删掉错误内容描述,确保模型最后生成更加泛化的模型。

一切准备就绪,开始最后一步了,训练模型。

三。训练模型

配置训练参数,选择训练LoRA和基于哪个大模型训练,见下图

填入训练的目录和输出地址

训练参数大部分用默认值就行,其他依据你的显卡来填

这里有几个重要参数,如果显卡比较老用Mixed precision填no,Save precision填bf16,30系列可以试试fp16。

Learning rate:0.0001
Mixed precision:no
Save precision:bf16

配置一切就绪,按最下面的训练模型按钮。

1080/8G显卡,16张图片共1600步花了24分钟训练完成。得到模型caixukun_v1.safetensors。

下面用这个LoRA画的图片(看效果模型的泛化性不错):

制作自己喜爱人物的LoRA吧~~~

今天就介绍到这里,我们下次见,关注我不迷路。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
如果三战爆发,我国必须死守的7座城!竟然还包括一个三线城市?

如果三战爆发,我国必须死守的7座城!竟然还包括一个三线城市?

山茶谈
2024-06-16 22:48:39
从马里乌波尔到哈尔科夫,俄军越打越差,钢铁洪流早已一去不复返

从马里乌波尔到哈尔科夫,俄军越打越差,钢铁洪流早已一去不复返

易同学爱谈娱乐
2024-05-24 08:06:39
上海这夜,耍大牌周也和勒肉张碧晨,都败给了“全裹”出镜的高叶

上海这夜,耍大牌周也和勒肉张碧晨,都败给了“全裹”出镜的高叶

一娱三分地
2024-06-16 08:55:03
终于明白为啥现在的女生都害怕生孩子了,评论让我破大防

终于明白为啥现在的女生都害怕生孩子了,评论让我破大防

阿康四岁啦
2024-06-16 17:26:26
美国一声令下,23国枪口对向中国,不到24小时,中方宣布双反调查

美国一声令下,23国枪口对向中国,不到24小时,中方宣布双反调查

叮当当科技
2024-06-16 16:40:56
湘西龙山被殴打商户发声“有四五人动手”,城管局:我们有队员眼睛受伤

湘西龙山被殴打商户发声“有四五人动手”,城管局:我们有队员眼睛受伤

极目新闻
2024-06-15 21:00:21
对不起❗误解了尚雯婕很多年,终于圈粉啦

对不起❗误解了尚雯婕很多年,终于圈粉啦

综艺拼盘汇
2024-06-15 23:17:29
惊人消息!韦世豪或告别国家队,伊万、郑智的反应引发热议

惊人消息!韦世豪或告别国家队,伊万、郑智的反应引发热议

人生趣事悟语
2024-06-16 03:56:19
朋友圈千万不要设置三天可见!你永远不知道,会有怎样的惊喜

朋友圈千万不要设置三天可见!你永远不知道,会有怎样的惊喜

涛涛生活搞笑
2024-06-13 07:25:05
欧倩怡离婚后首出镜!大谈生病时郭晋安对她自私冷漠,评论一片倒

欧倩怡离婚后首出镜!大谈生病时郭晋安对她自私冷漠,评论一片倒

小徐讲八卦
2024-06-15 08:26:49
下周一6月17日,这 4大具有爆发力板块或有望开启反攻

下周一6月17日,这 4大具有爆发力板块或有望开启反攻

惜别的海岸
2024-06-16 17:48:39
回顾:湖北女子带娃回家,被前夫和现任打,一脚干翻俩:真解气

回顾:湖北女子带娃回家,被前夫和现任打,一脚干翻俩:真解气

佑宛故事汇
2024-06-15 17:12:07
英国第一夫人带俩女儿也去了庆典!穿粉裙好嫩,女儿输给小夏公主

英国第一夫人带俩女儿也去了庆典!穿粉裙好嫩,女儿输给小夏公主

西莫的艺术宫殿
2024-06-16 23:22:53
别让登哥看见!锡安的成人女星炮友室外跑步 臀部大得畸形!

别让登哥看见!锡安的成人女星炮友室外跑步 臀部大得畸形!

直播吧
2024-06-15 15:29:34
皮相相似,骨相差了一大截,吴谨言和艾米互换了造型,却天差地别

皮相相似,骨相差了一大截,吴谨言和艾米互换了造型,却天差地别

喵喵娱乐团
2024-06-14 13:43:59
红色预警!大暴雨!浙江入梅后最强降水来袭

红色预警!大暴雨!浙江入梅后最强降水来袭

鲁中晨报
2024-06-16 10:19:06
华为Pura70Ultra突然降价,这价格真让人发疯!

华为Pura70Ultra突然降价,这价格真让人发疯!

最潮家居评
2024-06-14 06:39:04
亲戚提出最炸裂的要求是什么?网友:表姐找我借钱,说可以陪睡

亲戚提出最炸裂的要求是什么?网友:表姐找我借钱,说可以陪睡

户外阿崭
2024-06-15 19:30:53
肢体语言专家揭示凯特与威廉真实关系,王妃被赞像女王一样坚忍

肢体语言专家揭示凯特与威廉真实关系,王妃被赞像女王一样坚忍

译言
2024-06-16 15:35:29
浙江一地紧急通知:停课!全省几乎都被覆盖,明天出门要警惕……

浙江一地紧急通知:停课!全省几乎都被覆盖,明天出门要警惕……

都市快报橙柿互动
2024-06-16 21:55:41
2024-06-17 01:42:44
GPT人工智能
GPT人工智能
人工智能里一些新奇的玩意。
28文章数 721关注度
往期回顾 全部

科技要闻

iPhone 16会杀死大模型APP吗?

头条要闻

南方医院回应教师因救人迟到:教学差错是最轻档处理

头条要闻

南方医院回应教师因救人迟到:教学差错是最轻档处理

体育要闻

没人永远年轻 但青春如此无敌还是离谱了些

娱乐要闻

上影节红毯:倪妮好松弛,娜扎吸睛

财经要闻

打断妻子多根肋骨 上市公司创始人被公诉

汽车要闻

售17.68万-21.68万元 极狐阿尔法S5正式上市

态度原创

亲子
家居
本地
房产
公开课

亲子要闻

玩这个游戏的都是勇士

家居要闻

空谷来音 朴素留白的侘寂之美

本地新闻

粽情一夏|海河龙舟赛,竟然成了外国人的大party!

房产要闻

万华对面!海口今年首宗超百亩宅地,重磅挂出!

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版