网易首页 > 网易号 > 正文 申请入驻

5天连更5次,可灵AI年末“狂飙式”升级

0
分享至

允中 发自 凹非寺
量子位 | 公众号 QbitAI

12月伊始,可灵AI接连放出大招。

全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型可灵数字人2.0功能……

5天内5次“上新”,直接让生成式AI领域的竞争“卷”出新高度。

可灵O1,从图片到视频,带来更强的“可控性”

可灵2.0发布的时候,就创新性地提出过一个全新交互理念——Multimodal Visual Language(MVL),让用户能够结合图像参考、视频片段等多模态信息,将脑海中包含身份、外观、风格、场景、动作、表情、运镜在内的多维度复杂创意,直接高效地传达给AI。

基于MVL理念,在最新的一次迭代中,可灵O1将所有生成和编辑任务融合于一个全能引擎之中,为用户搭建全新的多模态创作流,实现从灵感到成品的一站式闭环。

就像a16z投资合伙人Justine Moore在产品发布后第一时间点评的那样:

  • 我们终于迎来了视频界的Nano Banana。



以可灵视频O1模型为例,它打破了传统单一视频生成任务的模型边界,将参考生视频、文生视频、首尾帧生视频、视频内容增删、视频修改变换、风格重绘、镜头延展等多种任务,融合于同一个全能引擎之中,使得用户无需在多个模型及工具间跳转,即可一站式完成从生成到修改的全部创作流程。

无论是创作者们“头疼”已久的主体一致性难题,还是视频画面的可控性问题,都在这次模型迭代里找到了相对完美的解决方案。

在图片生成这件事上,可灵AI也创新性地完成了迭代。

最新上线的图像O1模型,可以实现从基础图像生成到高阶细节编辑全链路无缝衔接,对用户来说,既可通过纯文本生成图像,也可上传最多10张参考图进行融合再创作。

“音画同出”能力也有了!可灵2.6模型完成里程碑式迭代

众所周知,可灵拥有一大批忠实的“发烧友”。他们既是产品的深度使用者,也能从功能层面提出自己的见解。

O1发布之后,就有不少网友排队“许愿”产品功能,排名靠前的,几乎都在关心可灵什么时候会推出伴随视频画面的语音及音效直出功能。

答案很快就揭晓了。

12月3日夜晚,可灵AI接着“放大招”,正式推出2.6模型

这次更新中,可灵AI上线里程碑式的“音画同出”能力,彻底改变了传统AI视频生成模型“先无声画面、后人工配音”的工作流程。

它能够在单次生成中,输出包含自然语言、动作音效以及环境氛围音的完整视频,重构了AI视频创作工作流,极大提升创作效率。

可灵AI海外超级创作者、AI电影导演Simon Meyer制作的这支宣传片,生动诠释了这次可灵2.6的能力创新之处。

对于创作者来说,输入文本或是输入图片结合提示词文本,均可直接生成带有语音、音效及环境音的视频。

语音部分,可灵目前支持生成中文以及英文,生成视频长度最长支持10秒(据说,更多样的语言体系以及固定声线等功能正在研发中)。

通过对物理世界声音与动态画面的深度语义对齐,可灵2.6模型在音画协同、音频质量和语义理解上表现亮眼。

对“音画同出”能力感兴趣的朋友,可以赶快试试,说不定你会和Simon Meyer一样产生强烈共鸣。



密集更新背后,可灵AI在下一盘怎样的大棋?

除了全新推出的可灵O1及2.6模型这两大重磅更新,可灵还在上周相继推出了数字人2.0、可灵O1主体库&对比模板等功能,从AI内容生成的实际流程出发,带来更加便捷的操作体验。

5天内5次“上新”,功能层面的精进背后,是可灵对于生成式AI技术的极致追求。

比如12月1日推出的视频O1模型,就打破了视频模型在生成、编辑与理解上的功能割裂,构建了全新的生成式底座。

融合多模态理解的Multimodal Transformer和多模态长上下文(Multimodal Long Context),实现了多任务的深度融合与统一。

根据可灵AI团队的内部测评,在“图片参考”任务上,可灵AI对Google Veo 3.1的整体效果胜负比为247%;在“指令变换”任务上,与Runway Aleph对比的整体效果胜负比达到230%



尤为难得的是,作为国产视频生成大模型领域的代表,从2024年6月正式推出以来,可灵AI的每一次迭代几乎都能让业界迎来一次“集体兴奋”。

从早期人们津津乐道的吃面条的案例,到特斯拉创始人马斯克的点赞,再到可灵AI这一波“批量上新”操作,视觉生成技术逐步走向成熟的过程里,可灵AI无疑是那个常常唤起共鸣的关键角色。


△X网友Min Choi发布的文章,对比了不同技术能力之下“威尔·史密

在持续引发讨论的同时,能否推进技术的广泛应用落地,也是生成式AI平台不得不面对的问题。

数据显示,可灵AI目前覆盖的企业用户数超过2万家,涵盖影视制作、广告、创意设计、自媒体、游戏、电商等等诸多领域。

多元的行业客户构成,意味着可灵AI必须持续打破技术应用的上限。

就像这次升级的可灵2.6模型,可以支持包括说话、对话、旁白、唱歌、Rap、环境音效、混合音效等多种声音的单独或混合生成,能够广泛地应用于各行各业的实际创作场景中,极大提升创作效率;

再比如数字人2.0功能的迭代,对于创作者而言,只需要上传角色图,添加配音内容并描述角色表现,就可以得到表现力生动的“自定义数字人”,更令人兴奋的是,视频内容最长可达5分钟

快手高级副总裁、可灵AI事业部负责人兼社区科学线负责人盖坤曾在不同场合表示:

  • 我们的初心,是让每个人都能用AI讲出好的故事,我们也真切地希望这一天更快到来。

在可灵AI年末的这一系列更新中,我们感受到,这一天更近了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

二百多名军官被枪毙、撤职、处分,长津湖战役中失职的志愿军88师

云霄纪史观
2026-03-25 12:16:14
张雪峰去世后,第一个被骂的明星出现了!网友强烈呼吁封杀

张雪峰去世后,第一个被骂的明星出现了!网友强烈呼吁封杀

星星没有你亮
2026-03-26 18:26:16
还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

还有谁!杨瀚森100%命中率!20+9+5打出完美一战!

柚子说球
2026-03-26 13:07:05
小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

小小的但有硬派味,丰田酷路泽 FJ 正式发售,约 26.7 万元

爱范儿
2026-03-26 15:27:20
新加坡预测:印度将赶中超美!美印争世界老大,中国将成新阿三

新加坡预测:印度将赶中超美!美印争世界老大,中国将成新阿三

荷兰豆爱健康
2026-03-26 08:26:08
个人公众号“千问”停更近10年,近期接连遭阿里投诉均被驳回,号主:规避风险不发AI文章,如果我不发声,账号就不保了

个人公众号“千问”停更近10年,近期接连遭阿里投诉均被驳回,号主:规避风险不发AI文章,如果我不发声,账号就不保了

中国能源网
2026-03-25 13:53:05
路虎“大揽胜亮相 长5.1米,大6座,售30万起?

路虎“大揽胜亮相 长5.1米,大6座,售30万起?

网上车市
2026-03-26 21:41:53
A股:市场要开始准备了!明天(3月27日)的市场会这样走

A股:市场要开始准备了!明天(3月27日)的市场会这样走

风风顺
2026-03-27 00:00:04
因妈妈姓氏太特殊,全家一致通过“随母姓”,网友:是我也随母姓

因妈妈姓氏太特殊,全家一致通过“随母姓”,网友:是我也随母姓

谭老师地理大课堂
2026-03-24 07:37:08
上海警方发布警情通报:左某某已被警方依法刑事拘留

上海警方发布警情通报:左某某已被警方依法刑事拘留

新京报
2026-03-25 20:46:14
张雪峰去世仅1天,办公室内景曝光,写真照被指像遗照,摆设奇怪

张雪峰去世仅1天,办公室内景曝光,写真照被指像遗照,摆设奇怪

180视角
2026-03-26 08:43:01
李幼平同志逝世

李幼平同志逝世

澎湃新闻
2026-03-26 18:05:03
15名津巴布韦人被俄罗斯骗去乌克兰当炮灰战死,当局怒揭残酷真相

15名津巴布韦人被俄罗斯骗去乌克兰当炮灰战死,当局怒揭残酷真相

老马拉车莫少装
2026-03-27 00:00:37
重磅!新加坡国立大学原副校长,全职加盟清华大学

重磅!新加坡国立大学原副校长,全职加盟清华大学

TOP大学来了
2026-03-26 17:43:56
张雪峰汤建魏华等猝死引起重视,多地卫健委推专题普及心源性疾病知识,国家卫健委官微详解:为何年轻男性发病风险高

张雪峰汤建魏华等猝死引起重视,多地卫健委推专题普及心源性疾病知识,国家卫健委官微详解:为何年轻男性发病风险高

极目新闻
2026-03-26 20:56:20
张雪峰付幸多张合影被扒,每次团建她都偷瞄张雪峰,眼神满是崇拜

张雪峰付幸多张合影被扒,每次团建她都偷瞄张雪峰,眼神满是崇拜

古希腊掌管松饼的神
2026-03-26 16:52:30
CBA焦点战!广东vs北京,赛前带来广东队徐杰、崔永熙、杜峰以及北京队赵睿、周琦最新消息

CBA焦点战!广东vs北京,赛前带来广东队徐杰、崔永熙、杜峰以及北京队赵睿、周琦最新消息

凯丰侃球
2026-03-27 00:10:59
抗炎才能抗癌!哈佛大学《自然》重磅:炎症会在身体留下长期记忆,显著增加未来患癌风险

抗炎才能抗癌!哈佛大学《自然》重磅:炎症会在身体留下长期记忆,显著增加未来患癌风险

医诺维
2026-03-26 17:00:54
Manus两名高管禁止离境? 外交部回应

Manus两名高管禁止离境? 外交部回应

每日经济新闻
2026-03-26 16:36:02
《火遮眼》北美定档,近10年最强动作片,没人能挡住谢苗成为巨星

《火遮眼》北美定档,近10年最强动作片,没人能挡住谢苗成为巨星

阿纂看事
2026-03-26 16:03:34
2026-03-27 00:52:49
量子位 incentive-icons
量子位
追踪人工智能动态
12348文章数 176425关注度
往期回顾 全部

科技要闻

美团发布外卖大战后成绩单:亏损超200亿

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

头条要闻

张雪峰留巨额遗产:二婚妻子或拿50% 剩下的女儿占1/3

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

刘晓庆妹妹发声!称姐姐受身边人挑拨

财经要闻

油价"驯服"特朗普?一到100美元就TACO

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

艺术
本地
时尚
教育
亲子

艺术要闻

都说乌克兰美女多,看完摄影师贝格玛 的作品我信了!

本地新闻

救命,这只酱板鸭已经在我手机复仇了一万遍

400万人爱过的女孩,被黄谣网暴180天后

教育要闻

精准研判,提质增效丨我校召开2026届毕业生就业工作研判会

亲子要闻

看看把孩子吓得哈哈哈

无障碍浏览 进入关怀版