品玩4月15日讯,百度文心大模型团队正式开源全新文生图模型ERNIE-Image。
该模型基于单流Diffusion Transformer架构,参数规模仅为8B,仅需24GB显存的消费级显卡即可运行,生成效果媲美顶级商业模型。经国际基准测试验证,ERNIE-Image在通用图像生成、复杂指令跟随及文字渲染等任务中均取得开源模型SOTA成绩,尤其在中英日韩多语言文字渲染能力上表现突出。
目前,模型权重与推理代码已在Hugging Face开源,并上线ComfyUI Workflow及GGUF量化方案。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.