01
图生视频进入生产力变现阶段
在AI视频生成技术爆发的2025年,"开局一张图,故事全靠AI"已成为内容创作者的日常。
在AI视频生成大生态里面,图生视频(Image-to-Video)赛道因技术门槛高、商业化潜力大,很早就成为全球科技巨头与创业公司竞逐的焦点。阿里“Animate Anyone”模型可将静态服装模特图转化为动态走秀视频,极大降低电商广告成本;商汤科技推出的“AI冰冰”数字人,则展示了虚拟主播的逼真表现力。
不过对于大众而言,对“图生视频”的体验更多还停留在抖音、哔哩哔哩等UGC平台,在平台预设模板的帮助下,通过“一张照片+一句话”即可生成创意短视频,但对于想要真正尝试内容创作路线,将自己的想法编成视频内容的用户,通义万相、即梦AI、可灵AI、海螺AI这样的主流“图生视频”创作平台又该如何选择呢?
02
平台定位差异开始
可灵AI愈发专业
从专业视频工作者的角度看,通义万相、即梦AI、可灵AI、海螺AI这四个平台虽在功能表述上接近,但其技术内核却有明显区别的。
通义万相2.1基于自研的高效VAE和DiT架构,其核心创新在于将长视频拆分为“块”(Chunk),通过缓存中间特征降低显存消耗,解决了长视频生成的算力瓶颈,而即梦AI最新推出的OmniHuman多模态模型,该模型为闭源,重点服务于短视频创作者,主打“一键式”高效创作。海螺AI则上线了一个新模型I2V-01-Director,将精准运镜作为主打功能。
而当年凭借时长和高清画面紧追Sora的可灵AI,仅半年多时间已进行20余次更新升级,在迭代速度和可用性上已经和Sora拉开身位。新推出的“多图参考”模式, 能够理解和整合多个图片中的不同主体,根据用户的文字描述,创造性地生成融合视频,进一步攻克了AI视频生成中的一致性难题。
对于用户而言,可灵AI的“图生视频”功能是最为“丰富”的,从首位帧、多图参考到创意特效,用户完全可以根据自己需求选择相应模式,且每个模式下提供了照片描述、参数设置、运镜控制(1.6模型暂不支持),对于有一定创作经验的用户而言,可灵AI明显在UI界面和功能设计上领先。
03
实测
AI离读懂图稍欠火候
笔者原本的意图是想生成一段少女骑龙猫在彩虹上奔跑的视频,给AI提供了一张少女的正脸图片配上详细的提示词。
画面主体 :一位身着轻便衣裙、活力满满的少女,骑在造型憨态可掬、体型稍大且毛茸茸的龙猫身上,龙猫迈开大步欢快奔跑。
场景构图 :脚下是一道色彩鲜艳、横跨天际的彩虹,彩虹有清晰的七彩渐变,周围天空湛蓝如洗,点缀着几朵轻柔的白云,阳光明媚但不刺眼,从合适角度洒下,给画面笼罩一层梦幻暖光。
细节元素 :少女头发随风飘动,脸上洋溢着灿烂笑容,双手紧紧抱着龙猫,龙猫耳朵也被风吹得晃动,彩虹表面有淡淡的光影流转效果,就好像有细小的光芒在跳跃。
氛围营造 :整体氛围轻松愉悦、充满童话梦幻感,画面节奏轻快,仿佛能听到欢快的童话音乐与奔跑时带起的呼吁声。
在测试的四个平台中,即梦AI显然没有明白“骑”龙猫的含义,将少女头像和龙猫身体直接拼接在了一起,简直让人不忍直视,而海螺AI则完全不在乎笔者给出的少女头像照片,倒是按照它自己对提示词的理解生成了一段纯卡通动漫,这样的内容显然 也是不合格的。唯独通义万相将少女头像卡通画后按要求完成了视频的生成,还为龙猫加入了嘴部细节动作,只是整体大背景依旧未能摆脱三毛特效的既视感。
而在前面界面设计表现不错的可灵AI在最终的生成环节却给出“排队中,预计等待大于3小时”的提示,显然,对于单纯想要在朋友圈秀一下或者快速制作短视频内容的用户而言,这样的等待时间明显过长了。
04
按需选择,场景为王
相较文生视频,AI大模型在“图生视频”上的表现多少有些不如人意。当然,可能也是笔者在视频内容设计上较为复杂,目前“图生视频”功能可能更适合“让人物微笑”“湖面水波荡漾”一类相对简单的“动图”模式,只不过恐怕很难同大众脑中的“生产力”工具挂上钩。
事实上,每个AI大模型平台的“图生视频”功能并不止于此。海螺AI就在“图生视频”和“文生视频”两项外,提供了“主体参考”模式,笔者在该模式下上传任务照片和相应描述,其画面生成效果明显更符合笔者所需。即梦AI也提供多种视频模型供用户选择,以满足用户不同风格内容生成的需求。
从这里也可以看出,当下“图生视频”模式的运用,更多还是要用户选择适合的模式。而随着技术迭代,AI视频工具将更注重多模态交互与场景定制化。
当前,通义万相已开源模型推动生态发展,可灵AI推出“AI试衣”等垂直功能,均预示着行业正从通用化向专业化细分。对于创作者而言,选择工具时需权衡生成质量、成本与场景适配性,才能将AI的生产力价值最大化。
欢迎通过邮局渠道订阅2025年《电脑报》
邮发代号:77-19
单价:8元,年价:400元
编辑|张毅
主编|黎坤
总编辑|吴新
爆料联系:cpcfan1874(微信)
壹零社:用图文、视频记录科技互联网新鲜事、电商生活、云计算、ICT领域、消费电子,商业故事。《中国知网》每周全文收录;中国科技报刊100强;2021年微博百万粉丝俱乐部成员;2022年抖音优质科技内容创作者
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.