网易首页 > 网易号 > 正文 申请入驻

力压OpenAI谷歌,快手掏出最强视频大模型,可灵2.0一句话搞定特效

0
分享至

智东西4月15日报道,就在刚刚,可灵AI面向全球正式发布可灵2.0视频生成模型及可图2.0图像生成模型,继续大幅领先业内前沿模型。可灵2.0在文生视频领域较OpenAI Sora实现367%的胜负比,在图生视频领域较谷歌Veo2实现了182%的胜负比。

与可灵1.6相比,可灵2.0模型在动态质量、语义响应、画面美学等维度有明显进步。在下方案例中,可灵2.0准确呈现了日光从清晨到正午再到傍晚的变化,还使用了延时摄影的风格。

▲右侧为可灵2.0

可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升,色彩和光影更为高级,情绪表达更具感染力,并新增了60余种风格化效果

在本次2.0模型迭代中,可灵AI还正式发布AI视频生成的全新交互理念Multi-modal Visual Language(MVL),让用户能够利用图像参考、视频片段等多模态信息,将脑海中的复杂创意直接高效地传达给AI,或是对视频、图像等多模内容进行编辑。

用户可以将视频、图片等作为元素上传,并直接将其嵌入至提示词中。这些元素能在画面内以合乎逻辑的方式组合,进一步提升画面的可控性。

可灵2.0系列模型发布即上线,用户现在已经可以在可灵AI官网和App内免费体验其生成效果。

体验链接:

https://klingai.com/cn/

一、告别慢动作画面,可灵2.0语义响应、动态质量与美学全面升级

快手高级副总裁、社区科学线负责人盖坤介绍,自去年6月发布以来,可灵AI已累计完成超20次迭代。截至目前,可灵AI全球用户规模突破2200万,过去的10个月里,其月活用户量增长25倍,累计生成超过1.68亿个视频及3.44亿张图片。

然而,现有的视频生成模型仍存在语义遵循能力差、动态质量不佳等问题,妨碍了创作者表达、控制生成结果的能力。可灵AI全系模型进行的本次升级,正是为了解决这些问题。

据快手副总裁、可灵AI负责人张迪介绍,可灵2.0的升级主要有三方面:语义响应、动态质量与画面美学。

升级后的可灵2.0可以更准确地反映人物表情、动作的变化,动作的丰富度、真实性有明显提升。在下方案例中,可灵2.0为准确描绘了提示词中“手锤桌子起身”的效果,而可灵1.6并没有完全还原。


可灵2.0也告别了视频生成模型的通病——运动速度不合理。在下方马飞速奔驰的画面中,可灵2.0的生成结果不再是慢动作,镜头表现更加真实。可灵团队还对其生成画面的复杂动作、动作幅度进行优化。


生成大片感的画面对可灵2.0来说也不是问题。下方这一画面中,无论是人物奔跑的动作,还是后方爆炸的效果,都十分逼真,角色演绎生动。

可灵2.0对时间的理解能力提升,能帮助创作者生成更连贯、更具有故事性、延续性的画面。

图像生成模型可图2.0的升级同样是在指令遵循方面。下方这一案例的提示词中具有“伺服电机”、“机械女神”、“壁画”、“拉斐尔《雅典学院》的古典平衡感”等诸多要素,可图2.0的生成结果很好地还原了相关要素,

可图2.0能更好地展现提示词中对于色彩、光影的表述,对人物情绪的呈现更具感染力。下方4张图片均为可图2.0的生成结果,若未经提示,或许许多人都会认为这是某部电影的截图。

二、打造人与AI交互全新语言,画面元素定制化更容易了

张迪在发布会现场分享了可灵2.0和可图2.0能力升级背后的技术创新。

可灵团队为可灵2.0采用了全新设计的DiT架构,这提升了其视觉、文本模态的信息融合能力。全新设计的VAE架构则使复杂动态场景下画面的过度更顺畅,质感更自然。同时,可灵团队还首次系统性研究了视频生成DiT架构的Scaling Law特性。

在模型训练、推理策略方面,可灵2.0在后训练阶段利用了强化学习技术,这提升了其对复杂运动场景、主体交互的生成能力,也强化对运镜语言、构图术语等专业表达的理解与响应能力。

张迪透露,目前可灵平台上高达85%的视频生成任务为图生视频任务。由此看来,更强的生图能力也成为创作者所需工具。

此次可图2.0的技术创新包括全新升级的文本表征处理链路、全面升级的数据体系和多样性以及全新的提示词工程和去噪策略。

升级后的可图2.0会深度思考用户的提示词,其逐步自适应的Diffusion去噪策略,可以优化出图细节,提升图像质量。

面向视觉创作者,可灵还推出了视频、图像多模态编辑能力,这些能力基于可灵提出的视觉生成交互理念Multi-modal Visual Language(MVL)

盖坤介绍,可灵团队发现,文字不足以向模型准确描述复杂动作、复杂表情等内容,可灵希望定义一种人与AI交互的全新语言,让模型能更好地理解人的想象力。

利用MVL技术,创作者可以利用视频、图像、文字等多模态信息,定义画面内人物的长相、着装、表情以及画面背景等。

在这一过程中,文本扮演了语义骨架的作用,多模态描述子(MMW)能嵌入这一骨架,扩展描述的完备性、准确性。未来,可灵还计划支持文本+MMW动作描述文件,画面角色的运动轨迹也能完全可控。

结语:基础大模型+创作工具全栈升级,快手要打造全球第一AI视频应用

本次可灵AI 2.0的升级,不仅包括基础大模型的能力提升,还有面向创作者日常生产流程的全栈工具优化,盖坤称,可灵AI的愿景是“让每个人都能用AI讲出好故事”。

日前,在快手2025财年电话会议上,快手集团高管也分享了类似的观点,快手认为AI对其发展至关重要,将给予坚定、长期的投入,可灵会在技术升级的同时,进行全球市场和品牌运营活动。快手的目标是,将可灵打造为营收规模世界第一的AI视频应用。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
偷情时,女人的“嗯嗯”声说明什么?

偷情时,女人的“嗯嗯”声说明什么?

思絮
2026-06-22 21:40:14
坎塞洛:C罗无需向任何人证明什么;我们清楚首战中的不足

坎塞洛:C罗无需向任何人证明什么;我们清楚首战中的不足

懂球帝
2026-06-23 10:45:38
特朗普称允许霍尔木兹海峡保持开放

特朗普称允许霍尔木兹海峡保持开放

新华社
2026-06-23 19:30:31
梅西一夜封神!世界杯18球登顶历史第1,国际足联深夜发文祝贺

梅西一夜封神!世界杯18球登顶历史第1,国际足联深夜发文祝贺

徐纗老表哥
2026-06-23 12:52:50
王石致函中央网信办!称遭规模化网暴,已造成重大实际损害

王石致函中央网信办!称遭规模化网暴,已造成重大实际损害

证券时报
2026-06-23 09:03:03
谜底即将揭晓!广东高考明天出分,物理类和历史类的家长心态不同

谜底即将揭晓!广东高考明天出分,物理类和历史类的家长心态不同

侃故事的阿庆
2026-06-23 16:52:55
彻底反常!高市早苗突然跑路!

彻底反常!高市早苗突然跑路!

阿芒娱乐说
2026-06-23 12:20:10
贺晓龙回应王楠丈夫:曝光4点隐情,指出威海基地其实很赚钱

贺晓龙回应王楠丈夫:曝光4点隐情,指出威海基地其实很赚钱

徐纗老表哥
2026-06-22 20:33:34
【环时深度】在对华关系上犯错数年,立陶宛失去了什么

【环时深度】在对华关系上犯错数年,立陶宛失去了什么

环球网资讯
2026-06-23 06:49:10
收藏:2026高考分数25日公布,各分段数据分析!

收藏:2026高考分数25日公布,各分段数据分析!

山东教育
2026-06-23 13:05:41
苹果再次发布 AirPods 新固件更新,终于能用了!

苹果再次发布 AirPods 新固件更新,终于能用了!

XCiOS俱乐部
2026-06-23 20:36:34
慷慨的挪威:自己才38万平方公里,却将216万平方公里给了丹麦

慷慨的挪威:自己才38万平方公里,却将216万平方公里给了丹麦

抽象派大师
2026-06-23 13:41:25
90后极客防长的恐怖KPI:每月消灭5万俄军,这个目标能实现吗?

90后极客防长的恐怖KPI:每月消灭5万俄军,这个目标能实现吗?

寰球经纬所
2026-06-22 19:43:20
ASML向美国保证:中国没任何机会拿到我们最先进EUV光刻机;约5万人将失业!大众宣布大裁员;刘强东:将来不需要快递员,70万兄弟要转行

ASML向美国保证:中国没任何机会拿到我们最先进EUV光刻机;约5万人将失业!大众宣布大裁员;刘强东:将来不需要快递员,70万兄弟要转行

雷峰网
2026-06-22 10:47:07
携手二十年,夏季达沃斯见证开放向上的中国

携手二十年,夏季达沃斯见证开放向上的中国

新华社
2026-06-23 14:04:44
抓特务票房惨淡让冯小刚低头:时代早变了,没有人必须为谁买单

抓特务票房惨淡让冯小刚低头:时代早变了,没有人必须为谁买单

手工制作阿歼
2026-06-23 11:46:19
70-69!常冰玉极限逆转:被罚12分反败为胜,2-0夺赛点,冲开门红

70-69!常冰玉极限逆转:被罚12分反败为胜,2-0夺赛点,冲开门红

刘姚尧的文字城堡
2026-06-23 20:33:48
再上热搜!“小马云”坐百万豪车现身义乌,流量生意彻底玩明白了

再上热搜!“小马云”坐百万豪车现身义乌,流量生意彻底玩明白了

雷科技
2026-06-23 18:15:11
男篮胜荷兰各界说啥?苏群点杨瀚森磨合不够,贾磊提廖三宁隐患!

男篮胜荷兰各界说啥?苏群点杨瀚森磨合不够,贾磊提廖三宁隐患!

篮球资讯达人
2026-06-23 21:58:48
WTA500巴特洪堡站:郑钦文VS陶森,谁能晋级8强?赢球拿多少奖金

WTA500巴特洪堡站:郑钦文VS陶森,谁能晋级8强?赢球拿多少奖金

体育大学僧
2026-06-23 10:53:09
2026-06-24 00:11:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
12101文章数 117111关注度
往期回顾 全部

科技要闻

48名中国开发者联名举报苹果

头条要闻

男孩6岁时被女子挖眼永久失明 如今以721分被高校录取

头条要闻

男孩6岁时被女子挖眼永久失明 如今以721分被高校录取

体育要闻

扬尼斯去了迈阿密:凯尔特人怎么办?

娱乐要闻

内娱95后顶流格局发生潜移默化的变化

财经要闻

AI“算力稀缺”信仰开始动摇?

汽车要闻

施鹏泽:为什么奥迪E7X强调座舱气味安全?

态度原创

亲子
旅游
本地
公开课
军事航空

亲子要闻

雯雯弄坏了豌豆的气球,慌张地把气球藏到身后,豌豆问起来...

旅游要闻

云南旅游市场现存短板,对症给出改善思路,游客商家都适用!

本地新闻

吃一次广东龙舟饭,才懂什么是豪华盛宴

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

以色列总理、国防部长和国防军总参谋长发表联合声明

无障碍浏览 进入关怀版