大半夜的,可能是我认为做海报、做 logo、做文字最猛的 AI 绘图产品,Ideogram,更新了他们的 2.0 版本。
把文字嵌入和整个图片的美学质量,又一次推上了巅峰。
可能很多人不知道Ideogram。
在 AI 绘图里面,这个产品确实也有一点冷门。
不过并不妨碍它一直是我心中,做文字生成最厉害的产品。
在我们做 AI 绘图的时候,其实过往一直都有一个痛点是,在图片里面嵌入文字,效果都很差。
比如说,我想生成一张图,大概是一个女生面对着镜子,镜子上面贴着一些纸,上面写着一些鼓励的话语。
Prompt 是这样的:
A captivating vintage-inspired photograph with distressed edges, featuring a strikingly beautiful, young woman gazing into an ovalmirror. The mirror is adorned with four sticky notes displaying positive affirmations in bold text, such as 'I AM AWESOME', 'I AM LOVEABLE', 'I DESERVE RESPECT', and 'I CAN DO HARD THINGS'. Fairy lights encircle the mirror, casting a warm glow over the scene. A wooden sign at the bottom of the image reads, "Talk to yourself like someone you love." The woman sports a messy bun hairstyle adorned with flowers, and wears a verdant dress. The room exudes a cozy ambiance, and the overall mood of the image is uplifting and empowering., typography, photo
(一张充满复古风情的照片,边缘略显磨损,画面中一位美丽的年轻女子凝视着一个椭圆形的镜子。镜子上贴有四张写着积极肯定语的便签,字体醒目,如「我很棒」、「我值得被爱」、「我值得尊重」和「我能应对挑战」。镜子周围环绕着仙女灯,柔和的光线笼罩着整个场景。照片下方有一个木制的标牌,上面写着「像爱自己一样与自己对话」。女子梳着随意的盘发,发髻上点缀着花朵,身穿一袭翠绿色的连衣裙。房间氛围温馨舒适,整张照片传递出积极向上、充满力量的情感。)
这么多还分区域的字,基本没有任何一个 AI,能把这些字完整的、不出错的写到图中,还能保证美感和融合。
Midjourney 直接废了,纸上的字都是错的,镜子里面人都没了宛如鬼片,下面的木质标牌也没了。
而以语义理解闻名天下的 Dalle3,美感极度拉跨,字也写错了,但是大的东西没丢。
我们再来看看 Ideogram。
文字写的非常无敌,全都分区域分块给你写的明明白白,美感也很强,唯一不足的就是镜面的物理规律反了。
从这个 case,应该就能看出,Ideogram 的特点在哪了吧。
极强的文字嵌入能力,还有目前超一线的图片质量,这两个合在一起,就足够让人兴奋了。
过去很多人问我,有没有一些 AI 生成海报 AI 生成 logo 的产品,我只能说,没有。
因为这两个设计类别,都是以信息为主,而信息的核心载体,是文字,只有解决了文字的准确性,同时审美足够在线,你才能说这玩意,可以生成海报生成 logo。
而 Ideogram,终于让它们,成为了可能。
这次的 2.0 更新,重点更新了模型的质量,还有继续究极进化的语义理解能力,我觉得已经是吊打 Dalle3 的级别了。下面给大家看看模型的效果。
网址:https://ideogram.ai/
点击关注,每天更新深度 AI 行业洞察
01语义理解超过 Dalle3,文字生成能力遥遥领先
写实、设计、3D、动漫,这四个类别的质量得到了大幅强化。
而 Ideogram 也贴心的为你设计了风格选择器。
直接选择就行,这几个分类还是我比较喜欢的,因为甩几十个类别出来也没有意义,这四个,足够了。
写实
在写实层面,跟 Flux pro 和 Midjourney 比,我觉得也不遑多让。
设计
没啥可说的,属于断层式领先,完全秒杀全场的级别。
3D
整体差不太多,质感是 OK 的,上限能跟 Midjourney 打平,但是 roll 起来的成功率会低一点。
动漫
给我的一个很大的感觉就是,线条非常干净,以及这个语义理解实在是太强了,什么稀奇古怪的东西都能揉在一起。
Ideogram 整体的模型质量,如果让我评价的话,综合质量在 Flux pro 之上,Midjourney 之下,但同时有两块超长的长板,就是超过 Dalle3 的语义理解能力,以及领先一个世代的文字生成能力。
因为这两个长板,在实用性上,我觉得甚至可以跟 Midjourney 平起平坐了。
而且他们还有一个很有趣很棒的功能,就是 Magic Prompt,跟莱昂纳多的那个 Prompt 优化是一样的,但是 Ideogram,可以写中文,然后他帮你,自动翻译成英文。
比如我就写了简单的几句中文:「摄影棚中的时尚美女,kpop,极度真实」
它就帮我继续精细化了一堆,还翻译成了英文。
最后出来的图,是这样的。
当然,得益于他们的超强的文字嵌入功能,用它来做 Banner 来做海报,也终于,成为了现实。
比如做个气泡酒的 banner。
直接给你把字体设计和排版都做完了,而且画质极佳。
甚至,做个海报,都可以。
把文字能完整的嵌入图片中,替代一大部分的信息设计,我觉得这个才会能进入设计师的工作流,从而产生巨大的潜力。
在价格上,我觉得也还好,完全不贵。
02AI 绘图大战的鲶鱼,Midjourney紧急免费
Ideogram,绝对是当前,AI 绘图大战的一条鲶鱼,他解决了过往关于设计、关于文字、关于实用的巨大痛点,异军突起,发光发亮。
而很好玩的是,在 Ideogram 发布 2.0 模型的 2 小时后。
Midjourney 宣布,网页版向所有人开放,而且曾经的免费试用,再次回归。
新的 AI 绘图军备竞赛,感觉又要开始打响了。
希望接下来的动作, 能给现在这个 AI 行业,卷起一些新的风浪。
转载原创文章请添加微信:founderparker
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.