上一篇我们搞定了会"记住"品牌的文案Agent。但社交媒体没图等于没发——而设计师月薪500到1500美元,DALL-E、Midjourney月费20到60美元还听不懂你的品牌,每张图风格都不一样。
解决方案:自建Stable Diffusion+LoRA。边际成本归零,风格高度统一。
![]()
为什么不用DALL-E或Midjourney?
Stable Diffusion把文字变成图,ComfyUI把它变成可自动化的API,LoRA把通用结果变成品牌内容。三步搭建:
第一步:ComfyUI开API模式
GitHub拉代码,装依赖,下载SDXL基础模型放checkpoints目录,启动参数加--api。三个核心端点:POST /api/prompt执行工作流,GET /api/history查结果,GET /api/view下载图片。
第二步:写真正有用的Prompt
不是"好看的技术图",是精确技术指令:质量标签+主体描述+风格指令+灯光设置+色板+构图+负面词。
Guayoyo Tech的实例:masterpiece, best quality, 8k开头,描述现代开发者多屏工位,极简桌面,台灯暖光,蓝青强调色(#1A73E8 #22D3EE),浅景深,1080x1080方图。负面词排除低分辨率、水印、模糊、人物、杂乱桌面。
技术/DevOps内容用等轴视图、蓝图美学、深色UI;商务内容用企业摄影、玻璃办公室、自然窗光;抽象概念用数字艺术、几何渐变。
第三步:LoRA——一致性秘诀
LoRA(低秩适配)是塞进Stable Diffusion的微型模型,教它你的Logo、视觉风格、色板。
方案A:Civitai下载公开LoRA,免费。方案B:自己训练,约2美元GPU云成本,10到15张参考图即可。
Prompt里插入,权重0.8控制强度。训练自己的LoRA需要准备统一风格的参考图集,标注触发词,用Kohya_ss或AI-Toolkit在云端跑训练。
输出路径:ComfyUI生成→自动上传图床→Agent写入文案→定时发布。整套系统跑在自有基础设施,零边际成本,风格百年如一日。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.