5月15日消息,谷歌召开I/O 2024开发者大会,正式发布视频生成模型Veo,将成为Sora新的劲敌。
Google发布了两款重量级模型——Veo和Imagen 3,它们分别针对视频生成和文本转图像领域,剑指竞争对手OpenAI的Sora和Dall-E 3,誓要在创意表达的战场上掀起新的波澜。
Veo:让每个人都能成为电影大师
Veo,这款Google最新、最先进的视频生成模型,以其深度理解自然语言和视觉语义的能力,让用户得以创作出超过1分钟的高质量1080p视频。它不仅支持用户自定义视频的光照、镜头语言及色彩风格,还能理解复杂的电影拍摄技术,如延时摄影等,创造出连贯且逼真的视觉叙事。正如与Google合作的艺人Donald Glover所言,“每个人都能成为导演,因为讲述故事的核心就是相互理解。”Veo正逐步向创作者开放,并计划整合进YouTube Shorts等平台,为用户提供前所未有的创意控制体验。
Imagen 3:细节之王,图像生成新高度
另一边,Imagen 3作为Google迄今为止最优质的文本转图像模型,展现出了令人难以置信的细节水平,其生成的图像生动逼真,几乎消除了传统模型常见的视觉伪影。这意味着从细腻的灰狼肖像到奇异的水母漂浮,每一个细节都被精心雕琢,仿佛出自专业摄影师之手。艺术家和设计师们将能够通过Imagen 3轻松实现脑海中的幻想,无论是商业广告还是个人创意作品,都将是质的飞跃。
Music AI Sandbox:音乐创作的新篇章
此外,Google还宣布了与音乐界的深度合作,共同探索AI在音乐创作中的潜力。Music AI Sandbox这一新工具套装的推出,为音乐家、词曲作者和制作人提供了一个全新的创作平台,使他们能够以全新方式构思旋律、编排乐器部分,甚至改变声音质感。格莱美获奖音乐家Wyclef Jean、提名歌曲作者Justin Tranter及电子音乐家Marc Rebillet等已率先使用这一工具发布新作品,展示了AI在音乐领域的无限可能。
责任与安全:技术进步的基石
在追求技术创新的同时,Google强调负责任地使用AI生成内容的重要性。通过SynthID等工具,Google在生成的视频、图像、音频、文本中嵌入难以察觉的数字水印,确保内容的可追溯性和安全性。公司持续与创意社区合作,进行安全测试,确保技术的安全和负责任部署。
Google I/O 2024展示的不仅仅是技术上的突破,更是对未来创意表达方式的重新定义。Veo、Imagen 3及Music AI Sandbox的推出,预示着一个创意民主化的新时代即将到来,每个人都能更自由地表达自我,讲述自己的故事。随着这些工具的逐步普及,我们期待见证全球创作者如何运用这些新模型和工具,将奇思妙想变为令人惊叹的现实。
▲ 滑动查看往期内容
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.