5月31日消息,近日,快手自研大模型产品“可图”(Kolors)正式对外开放,支持文生图和图生图两类功能,已上线20余种AI图像玩法。
从具体功能上看,一方面,可图提供AI形象定制功能,即图生图功能,通过人像保持技术,可轻松保留人像的自然特征,并一键生成各种风格的人像作品,满足不同社交及营销场景的个性化形象需求。
此外,可图还提供粘土世界、炫彩琉璃、梦幻莫奈等风格化玩法,以及韩式写真、魔法学院等写实风玩法,打造专属的个性化写真。
另一方面,快手可图大模型也提供AI创作功能,即文生图,支持用户自由输入文本,生成风格多样、画质精美、创意十足的绘画作品。同时用户也可以上传参考图,可图将根据参考图像的风格、主题和细节等内容,生成既符合创意描述又与参考图相关的图像作品。
值得注意的是,“可图”降低了AI图像生成的使用门槛:与同类产品需多张照片和较长时间来完成AI生成不同不同,可图只需一张图片和几秒钟时间,便可生成一套效果优秀的AI图像。
据悉,快手大模型团队的技术能力为该产品提供了有力支撑。例如,在中文特色理解方面,可图基于快手自研的知识图谱构建了上亿级别的中文特色图文数据,结合中文大语言模型的文本表征能力,能够精准描绘和表达各类中文场景。
据悉“可图”大模型的参数规模达十亿级,这些数据来自于开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化学习和奖励模型技术(RLHF),解决了文生图大模型在长文本和复杂语义文本输入下的效果问题。
同时,在画质提升方面,可图模型通过优化扩散模型的加噪去噪理论,以实现对高质量、细节丰富的图像生成的训练和推理的精准适配,同时引入了经过优质专家标注的图文数据集,以对齐人类审美偏好,提升模型性能表现。
据报道,去年9月,“可图”大模型平台已在快手开启内测,快手在App评论区推出的“AI玩评”和“AI小快”等多种创新互动玩法,集合了文生图、图生图、扩图等功能,也是基于可图大模型能力。
近日,在2024年一季度财报电话会上,快手CEO程一笑介绍,今年一季度,快手稳步推进自研大模型各项性能的迭代提升,并且加快大模型在各业务场景的应用。随着大模型产品可图的正式发布,快手也将持续为用户带来更丰富有趣的AI互动新体验。(一橙)
本文系网易科技报道,更多新闻资讯和深度解析,关注我们。
