品玩3月12日讯,据豆包大模型团队表示,豆包大模型团队正式发布文生图技术报告,首次公开 Seedream 2.0 图像生成模型技术细节,覆盖数据构建、预训练框架、 后训练 RLHF 全流程。
该报告针对 Seedream 2.0 原生中英双语理解、文字渲染、高美感、分辨率与画幅变换等特性的实现,进行了具体介绍。具体来看,模型支持中英文指令的高精度理解与遵循,能生成高美感度的图像作品。针对字体渲染和海报设计等实际场景,生成文字崩坏率大幅降低,且字体变化呈现更自然、更具美感。对于国风图案与元素,比如国画、泥塑、文玩、旗袍、书法等,Seedream 2.0 也可输出高品质的呈现结果。
通过测试,团队发现 Seedream 2.0 面向英文提示词,其生成内容的结构合理性、文本理解准确性高于主流模型。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.