网易首页 > 网易号 > 正文 申请入驻

文字指令就能“P视频” 实测快手可灵O1:视频版Nano Banana Pro来了?

0
分享至

来源:市场资讯

(来源:每日经济新闻)

一度被誉为“地表最强AI(人工智能)生图模型”的谷歌Nano Banana Pro,其引发的新一轮技术热潮尚有余温,视频生成模型“大混战”又在年末迎来高潮。

先是海外AI视频初创公司Runway发布了新一代视频模型Gen-4.5,并在基准测试中超越谷歌的Veo3登顶。12月1日,快手可灵AI又丢出“王炸”,上线“全球首个统一多模态视频大模型”可灵O1,再次强化了其作为“生产力工具”的一面。

火药味很浓。

一般而言,普通C端(消费者)用户想生成相对较复杂和精细的视频,往往需要使用生图模型、视频生成模型以及剪辑软件等进行制作。实际操作中,多模型、多软件的切换比较耗时且繁琐,视频效果也可能会在流转中出现主体一致性差、动作崩掉等情况,需要重新“抽卡”(需要通过反复尝试、调整提示词或参数来获得理想作品的过程)。

“统一多模态视频大模型”据称主要解决的就是这个问题。

事实上,从去年开始,视频生成领域的竞争就已进入白热化。今年,国外的Sora2、Veo3逐渐确立统治地位,国内有多轮大版本更新且商业化速度一骑绝尘的可灵不断出招。时至年末,新一轮混战来袭,谁是“地表最强视频生成模型”,我们离答案还有多远?《每日经济新闻》记者对可灵O1进行了实测。

支持多模态,输入文字指令就能“P视频”

《每日经济新闻》记者实测发现,可灵O1首次将参考生视频、文生视频、首尾帧生视频、视频内容增删及修改变换等多任务,融合于大一统模型之中。

最重要的是,完成上述任务可以“全流程语义控制”,用一句话就可以生成或修改视频。图片、视频、主体、文字等都可以被视为指令,可灵O1可综合理解用户上传的照片、视频或主体(一个角色的不同视角)的意图,生成视频的各种细节。

具体而言,记者实测发现,在可灵O1模型的多模态指令输入区,可以上传1到7张参考图或主体,自由组合人物、角色、道具、服装、场景等元素,让静态元素在视频中动起来。

视频生成后,也可以在输入区进行指令的变换,对原视频进行主体与背景的增加、修改、删除,也可以修改风格、颜色、材质、视角等。由于支持多模态输入,这个修改的过程可以由文字、图片、主体的输入语言任意组合。

比如,在输入区输入“删除【视频】中道路两侧的路人,保留马车”,修改后的视频保持了主体的一致性,对被删除的内容进行了相对干净的抹除。


图片来源:可灵O1测试截图

除了用文字指令删除、增加内容外,还可以用图片指令修改视频的主体等。比如,输入“将【视频】中的雕像修改为【图片】中的姜饼人”,生成的视频保持了原视频的运镜逻辑、背景一致,主体也按要求进行了替换。


图片来源:可灵O1测试截图

此外,可灵O1还可以改变视频的视角、景别,比如远景变特写、俯拍变仰拍等,并支持用参考视频内容进行新镜头的生成等。

如记者输入图片和视频两段素材,让图片中的静态主体以视频主体的舞蹈方式动起来,结果生成视频对原图片打光、色调以及主体形象的还原度相对较高,但也有一些小瑕疵,如手部细节模糊、人物身体比例不协调等,还需要重复“抽卡”。

视频“一致性”有所提高,指令还可叠加使用

体验时记者注意到,可灵O1强化了输入图像及视频的理解,支持多视角图创建主体。也就是说上传一个角色的多视角照片,其可以在不同镜头、不同光照与风格下保持“同一个人”的特征不变。

比如,记者输入近期大热电影《疯狂动物城》主角“朱迪”的多张不同主体视角图片,在后期进行视频生成时,无论主角、道具、场景以及运镜如何变化,朱迪的主体形象都能够保持相对稳定。

不过,当记者添加了狐狸尼克的图片参考并进行更复杂的视频输出时,主体之外的人物形象出现不合逻辑的动作、形态呈现,甚至有一组舞会成员随着镜头推移,从双人跳舞变成了三人跳舞,需要重复“抽卡”。


图片来源:可灵O1测试截图

此外,记者体验时还发现,不仅限于单个角色或物品,可灵O1还具备多主体融合能力。可以自由组合多个不同主体,或将主体与参考图混搭。这种能力适用于视频里呈现复杂的群像戏或互动场景中,模型能够独立锁定及保持每一个角色或道具的特征。不过,这个功能需要提供高清、主体明确的图片,否则需要重复“抽卡”。而在复杂的互动场景下,多个主体的互动指令也需要更明确地描述,不然就难以避免重复“抽卡”。

在实际场景落地中,如宣传视频就可以直接上传商品图、场景图等,通过多个主体相互组合快速完成视频生成。


图片来源:可灵O1测试截图

记者发现,除单点任务外,可灵O1还支持组合不同的技能,允许把各种指令叠加使用,一次性生成出来。比如,可以组合参考图片和修改视频风格,两个动作同时进行。

这些功能的升级,相对能够拓宽可灵的场景应用,特别是作为“生产力工具”,可应用于影视创作、创意广告、服装穿搭参考视频、视频后期制作等。

不过,有不少网友表示,目前可灵视频O1模型的使用价格较贵,视频生成、修改成本高。据了解,视频价格取决于输入情况和生成视频长度——无视频输入时,8灵感值/秒,有视频输入时,12灵感值/秒。以单次购买一个月的可灵黄金会员价格为例,66元/月、每月有660灵感值。如无视频输入,生成一个高品质5秒视频,大约需要40灵感值。

技术狂欢背后:可灵年收入即将破10亿元,C端市场待垦

视频、图像O1模型上新后,12月3日,可灵又官宣推出视频生成2.6模型。记者注意到,该模型提供了“音画同出”能力,升级了文生音画、图生音画两大功能。目前,语音支持生成中文与英文,生成的视频长度最长可达10秒。

12月4日晚,新一代可灵数字人2.0宣布即日起正式全量上线。上传角色图、添加配音内容、描述角色表现,三步即可生成。相对旧版,新版在表现力、手部及口型精准控制上有提升,且支持最长5分钟的视频时长。

除了在年末迎来“技术周”,前不久三季度财报披露时,可灵宣布2025年收入将达10亿元的商业化进程,再次引起不小的市场反应。

值得一提的是,目前可灵用户构成仍以B端客户为主。而随着Open AI正式发布的第二代AI视频生成模型Sora 2等将视频生成与社交互动深度融合,C端消费级应用的落地进程明显加快。

快手科技创始人兼首席执行官程一笑在三季报电话会上也指出,“当前我们的主要精力依然是面向专业创作者,但未来也会将可灵的技术能力进一步产品化,与社交互动结合,加速C端应用的商业化。”这也回答了可灵未来增长方向的问题。

工信部信息通信经济专家委员会委员盘和林此前接受《每日经济新闻》记者微信采访时表示,视频生成赛道的最终受益者,可能还是内容创作平台,因为这些平台具备两样东西:其一,是最相关的用户群体,未来视频生成可能更多还是为短视频自媒体服务;其二是最大规模的用户受众,生成式AI带来的内容创作上的升级,会进一步影响创作者和观看者。

“未来,快手平台上的创作者,需要借助可灵这样的AI工具来生成内容,或者至少辅助内容创作,这会大大提高平台内容输出的质量,从而更好地吸引用户,扩大快手在内容平台领域的影响力。”盘和林如此补充。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国第一巨人鲍喜顺:不听医生忠告执意生下一子,儿子现身高多少

中国第一巨人鲍喜顺:不听医生忠告执意生下一子,儿子现身高多少

一窥究竟
2025-12-29 00:41:27
重磅消息!新疆男篮连夜开会,疆媒:刘炜下课倒计时,候选人出炉

重磅消息!新疆男篮连夜开会,疆媒:刘炜下课倒计时,候选人出炉

理工男评篮球
2026-01-03 13:30:42
看完张鲁一新剧《长河落日》,终于明白这部剧为何压了7年才播!

看完张鲁一新剧《长河落日》,终于明白这部剧为何压了7年才播!

海绵宝宝的心事
2026-01-02 16:07:24
2026是赤马红羊大劫,唯有一条路能逃生!

2026是赤马红羊大劫,唯有一条路能逃生!

水木然
2026-01-02 22:53:55
“刺杀普京”真相揭开了?不是乌克兰,也不是欧盟,而是一旁的它

“刺杀普京”真相揭开了?不是乌克兰,也不是欧盟,而是一旁的它

风干迷茫人
2026-01-03 13:55:01
这次轮到美国"强烈反对":半个世纪了,就没受过这样的窝囊气!

这次轮到美国"强烈反对":半个世纪了,就没受过这样的窝囊气!

百科密码
2026-01-03 16:44:51
2026门诊开药大调整!这6条规矩没搞懂的人,钱包估计要遭殃了?

2026门诊开药大调整!这6条规矩没搞懂的人,钱包估计要遭殃了?

今朝牛马
2026-01-03 15:24:08
使馆成空壳、签证没地办!立陶宛7人小组带头反水:给口饭吃吧

使馆成空壳、签证没地办!立陶宛7人小组带头反水:给口饭吃吧

真正能保护你的
2026-01-02 15:35:28
拆了又合?退役军人事务局7年后再归民政,是试点还是全国信号?

拆了又合?退役军人事务局7年后再归民政,是试点还是全国信号?

达文西看世界
2026-01-03 14:33:02
鹿晗醉酒跟司晓迪躺一起,更多同款证据被扒,网友喊话关晓彤倒油

鹿晗醉酒跟司晓迪躺一起,更多同款证据被扒,网友喊话关晓彤倒油

萌神木木
2026-01-03 10:37:59
“郭芙蓉”获自由后携“20年积蓄”到瑞蚨祥购物?店方回应:姚晨是1日来的,事前不知情

“郭芙蓉”获自由后携“20年积蓄”到瑞蚨祥购物?店方回应:姚晨是1日来的,事前不知情

极目新闻
2026-01-02 20:15:14
中国暴露致命缺点!西方赚翻了,太恶毒了!

中国暴露致命缺点!西方赚翻了,太恶毒了!

毛豆论道
2026-01-01 18:11:05
伊朗抗议升级为致命血腥冲突,多人死亡学生被捕,民怨彻底爆发

伊朗抗议升级为致命血腥冲突,多人死亡学生被捕,民怨彻底爆发

译言
2026-01-02 06:34:51
特朗普不宣而战,美军已经开火,中俄介入局势,局面开始一边倒

特朗普不宣而战,美军已经开火,中俄介入局势,局面开始一边倒

瓦伦西亚月亮
2025-12-31 21:37:03
预算成本3.5亿港元,《寻秦记》票房扑街,古天乐亏到怀疑人生

预算成本3.5亿港元,《寻秦记》票房扑街,古天乐亏到怀疑人生

电影票房预告片
2026-01-01 23:46:49
70年的同事基本上全部退出领导岗位了

70年的同事基本上全部退出领导岗位了

微微热评
2026-01-02 00:50:13
马斯克预测世界大战时间,大战最可能爆发在两地区

马斯克预测世界大战时间,大战最可能爆发在两地区

妙知
2025-12-29 00:08:32
用黑熊和狮子处理尸体?泰国陆战队攻入柬埔寨赌场后,网友不淡定

用黑熊和狮子处理尸体?泰国陆战队攻入柬埔寨赌场后,网友不淡定

华人星光
2025-12-30 11:50:42
潘江被喊下课不冤!放走一人错信一人最大败笔,水货教练跌落神坛

潘江被喊下课不冤!放走一人错信一人最大败笔,水货教练跌落神坛

篮球看比赛
2026-01-03 13:24:10
47岁刘涛居家瘫坐照杀疯了!黑T白裤配粉拖,普通女人的松弛美

47岁刘涛居家瘫坐照杀疯了!黑T白裤配粉拖,普通女人的松弛美

孤城落日
2025-12-20 12:17:01
2026-01-03 17:28:49
新浪财经 incentive-icons
新浪财经
新浪财经是一家创建于1999年8月的财经平台
1898307文章数 5147关注度
往期回顾 全部

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

头条要闻

委首都突遭美军袭击 事发前"五角大楼披萨指数"上升

头条要闻

委首都突遭美军袭击 事发前"五角大楼披萨指数"上升

体育要闻

快船似乎又行了

娱乐要闻

“国服嫂子”司晓迪,曝与多位男星私照

财经要闻

具身智能抢人大战:毕业一年 年薪300万

汽车要闻

奕派科技全年销量275,752辆 同比增长28.3

态度原创

家居
教育
旅游
数码
健康

家居要闻

无形有行 自然与灵感诗意

教育要闻

“双减”四年 啥变了?——作业写到9点?现在娃半小时就搞定

旅游要闻

“郭芙蓉”重获自由第一站火了 有来京游客专程带糖葫芦来六里桥打卡拍照

数码要闻

苹果首款低价MacBook即将发布:搭载A18 Pro芯片+12.9英寸屏幕

元旦举家出行,注意防流感

无障碍浏览 进入关怀版