上方蓝字关注我们
谷歌发布Imagen 2,一款新的AI图像生成工具,旨在为企业用户提供专业服务。尽管面临竞争和深度伪造的担忧,谷歌通过创新功能和安全措施,继续在AI图像生成领域探索新的可能性。
谷歌在图像生成AI领域持续发力,推出Imagen 2,旨在提升企业用户创作体验。
今年二月,谷歌AI驱动的Gemini聊天机器人内置的图像生成器因生成不当图像而引发争议。谷歌迅速撤下该生成器,并承诺改进后重新推出。在这一背景下,谷歌在其Vertex AI开发者平台上推出了Imagen 2,这是继Gemini事件后的新尝试,更侧重于企业用户的需求。
Imagen 2是一系列模型的集合,首次亮相于2023年5月的Google I/O会议,并在12月正式发布。它能够根据文本提示创建和编辑图像,类似于OpenAI的DALL-E和Midjourney。对于企业用户而言,Imagen 2的多语言渲染能力和将文本、徽标叠加到现有图像上的特性尤为实用。
在经过预览期后,Imagen 2新增了图像修复和扩展功能,这些功能在其他图像生成器中已有应用,能够帮助用户移除不需要的图像部分,添加新组件,并扩展图像边界。
Imagen 2的升级亮点在于其“文本到实时图像”功能,能够根据文本提示生成短视频片段,尽管当前分辨率较低,但谷歌已承诺未来将提升。
为了应对深度伪造的担忧,谷歌表示Imagen 2将采用SynthID技术,对生成的图像应用加密水印,同时通过安全过滤机制来避免生成不当内容。谷歌还强调,Vertex AI中的Imagen 2模型已进行了广泛测试,并与客户进行了沟通,以确保其不会重现Gemini应用的问题。
然而,尽管谷歌采取了这些措施,Imagen 2在视频生成领域的竞争力仍然存在疑问。市场上已有如Runway、Stability AI的Stable Video Diffusion等工具提供更高分辨率和更大定制性的视频生成服务。此外,OpenAI的Sora虽然尚未商业化,但其照片真实主义的潜力预示着未来的竞争。
谷歌在视频生成技术方面的进展相对滞后,如Imagen Video和Phenaki等项目仍在实验阶段,分辨率和连贯性有待提高。尽管谷歌首席执行官桑达尔·皮查伊对生成性AI革命的应对策略受到关注,但像实时图像这样的产品仍显不足。
在训练数据方面,谷歌表示Imagen 2主要在公共网络数据上进行训练,但未提供具体细节。尽管谷歌有网络发布者控制工具,但并未承诺发布退出工具或补偿创作者。文本到实时图像功能目前不受谷歌的生成性AI赔偿政策保护,这可能引起企业客户的担忧。
总体而言,谷歌的Imagen 2在图像生成AI领域展现了新的尝试和方向,但其在视频生成和训练数据透明度方面仍需进一步优化和改进。未来,随着技术的成熟和市场的反馈,Imagen 2或许能够在AI图像生成领域占据一席之地。
已有超过2000名
读者加入交流群
我们还在等你
点这里关注我,记得标星哦~
CLICK TO SEE YOU LOOK THE BEST
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.