网易首页 > 网易号 > 正文 申请入驻

智谱加入 AI 视频竞赛:使用 DiT 架构,30 秒生成视频片段

0
分享至

30 秒等待一条 AI 视频。


作者 | 连冉
编辑| 郑玄

这两天,AI 视频生成赛道越来越热闹了。

7 月 24 日,快手可灵全面开放内测;同一天,创企爱诗科技发布产品 PixVerse V2,可生成多达 40 秒的高质量短视频;26 日,独角兽智谱 AI 上线 AI 视频生成功能「清影」。

「清影」支持时长 6s 的文生视频/图生视频,清晰度为 1440x960。跟其他家不同,智谱 AI 这次直接推出付费版本——付费 5 元,解锁一天 24 小时的高速权益,付费 199 元,解锁一年的付费高速权益。

当然,所有人还是可以免费使用,不用排队,也不限次数。

一年的 AI 视频生成付费高速权益只要 199 元,跟不少互联网产品的会员包年费用相差无几,AI 视频生成好像真的离普通用户越来越近了。

01


一天 5 元,免费也行

目前,「清影」已上线清言 App,面向所有用户免费开放。在智谱清言 PC/APP 上,点击「清影智能体」,就可以开玩了。

用户只需要输入一段文字,然后选择自己喜欢的风格,再配上「清影」自带的音乐,等待 30 秒左右,就可以生成一段视频。

如果想要输出的视频更符合心中所想,还可以按照结构性原则来写 prompt(提示词),「清影」使用手册里给出了两款公式结构:

  • 简单公式:[摄像机移动]+[建立场景]+[更多细节]

  • 复杂公式:[镜头语言] + [光影] + [主体 (主体描述)] + [主体运动] +[场景 (场景描述)] +[情绪/氛围/风格]

笔者一步到位,按照复杂公式的要求输入了以下提示词:摄影机平移,一个红发小精灵睡在旋转木马的躺椅上,翻了个身。他浑身毛茸茸的,看起来很可爱,背景是璀璨银河,星光洒在精灵身上,随着旋转木马的转动,小精灵露出了满足的笑容。

「清影」文生视频|视频来源:极客公园

从生成效果来看,还是蛮符合设定也蛮可爱的。

文生视频之外,「清影」这次也开放了图生视频的能力,输入一张图片+相应的提示词,或者只输入图片,「清影」就可以生成视频画面。

极客公园养有许多猫猫,笔者随机抓拍了一只眼睛瞪圆溜溜的小猫,把这张图片喂给清影,再输入提示词:图中的猫咪给自己戴上墨镜,动作连贯自然且真实,画质高清。

「清影」图生视频|视频来源:极客公园

智谱 AI CEO 张鹏介绍,「清影」(Ying)底座的视频生成模型是 CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了 Sora 的算法设计,它也是一个 DiT 架构,通过优化,CogVideoX 相比前代(CogVideo)推理速度提升了 6 倍。目前生成 6s 视频,模型花费的理论时间只需要 30s。

02

为什么智谱能做到

为什么包括智谱 AI 在内的各家都在做多模态模型?

核心是为了让机器能够更好地模拟人类的认知和感知机制,从而提升人工智能系统的整体性能和应用范围。

多模态模型能够处理多种类型的数据,如语言、图像和声音等。这与人类大脑的多模态信息处理能力非常相似,因为人类大脑能够同时接收和处理来自不同感官通道的信息,例如视觉、听觉和触觉。

并且,在多模态模型中,注意力机制被广泛使用来识别和融合不同模态的信息,这种机制在人类大脑中也存在。

因此,智谱 AI 在 all in 大模型路线之初,就开始多模态领域的相关布局,这也是他们实现实现全系列产品矩阵对标 Open AI 的重要一环。

从 2021 年开始,智谱 AI 先后研发了 CogView(NeurIPS'21)、 CogView2(NeurIPS'22)、CogVideo(ICLR'23)、Relay Diffusion(ICLR'24)、CogView3(2024)。

智谱 AI 的文生视频模型就是基于 CogView 而来的 CogVideo,张鹏谈到了该模型的三大技术特点:首先,为了解决内容连贯性的问题,智谱 AI 自研了一个 3D VAE 结构,将原视频空间压缩至 2% 大小,大幅减少了视频扩散生成模型的训练成本和训练的难度。

其次,在可控性上,智谱 AI 自研了一个端到端的视频理解模型,用于为海量的视频数据生成详细的贴合内容的描述文本,使得生成的视频能够理解超长的、超复杂的 prompt 指令,更符合用户的输入。

最后,模型采用了将文本、时间、空间三个维度全部融合起来的 Transformer 的架构,可高效利用模型参数将文本信息和视频信息进行混合。

张鹏也谈到,目前,多模态模型的发展还处于相当初级的阶段,一是从生成视频的效果看,多模态模型对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等都有很多地方需要提升;二是从模型本身而言,现有的模型架构还不能高效地压缩视频信息,如果多模态模型继续发展,还是需要有更创新的新模型架构出现。

他判断,未来大模型的技术突破方向之一依然是原生多模态大模型,scaling law 将继续发挥作用。

*头图来源:清影 AI

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你玩过哪些 AI 视频生成应用?

体验如何?

暴雪网易“复合”后首次参展 ChinaJoy,Logo 与网易并排。

点赞关注极客公园视频号

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
央行连续第15个月增持黄金

央行连续第15个月增持黄金

财联社
2026-02-07 10:12:59
中国雷霆反制,巴拿马彻底慌了,他们发现:美国根本救不了自己

中国雷霆反制,巴拿马彻底慌了,他们发现:美国根本救不了自己

呼呼历史论
2026-02-08 17:48:12
北京美女王博谷:嫁小7岁演员巴图,婚后生两子,风光背后有辛酸

北京美女王博谷:嫁小7岁演员巴图,婚后生两子,风光背后有辛酸

夏末moent
2026-02-02 17:42:14
《太平年》最大争议:钱弘俶宁降赵匡胤,却为何拒归明君郭荣?

《太平年》最大争议:钱弘俶宁降赵匡胤,却为何拒归明君郭荣?

长风文史
2026-02-07 15:19:04
于文文这身材太绝了!露背吊带裙杀疯了,饱满曲线谁顶得住?

于文文这身材太绝了!露背吊带裙杀疯了,饱满曲线谁顶得住?

娱乐领航家
2026-01-11 00:00:03
路人曝光手机拍的原图!来!这就是你们爱的朴宝剑的真实长相!

路人曝光手机拍的原图!来!这就是你们爱的朴宝剑的真实长相!

东方不败然多多
2026-02-08 16:26:33
抵制宋佳?警惕取消文化的泛滥

抵制宋佳?警惕取消文化的泛滥

非典型佛教徒
2026-02-07 00:03:36
俄罗斯开始生产宇通旅游巴士

俄罗斯开始生产宇通旅游巴士

居陋室观天下
2026-02-08 19:08:09
罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

来科点谱
2026-01-23 11:08:02
1949年周作人致信毛主席求生路,主席批一语彻底改变了他的命运

1949年周作人致信毛主席求生路,主席批一语彻底改变了他的命运

唠叨说历史
2026-02-02 10:12:16
钱天一王昶领证,准婆婆曾在互联网上这样评价钱天一

钱天一王昶领证,准婆婆曾在互联网上这样评价钱天一

东方不败然多多
2026-02-07 16:06:22
意义重大!亚洲杯蒯曼复仇张本,下一代国乒压制日乒,别只靠孙王

意义重大!亚洲杯蒯曼复仇张本,下一代国乒压制日乒,别只靠孙王

五姑娘说体育
2026-02-08 19:12:42
珠江投资大规模裁员降薪

珠江投资大规模裁员降薪

地产微资讯
2026-02-08 13:01:31
为什么男人普遍关注政变?

为什么男人普遍关注政变?

难得君
2026-02-01 09:43:26
奉劝大家:过年别买这6种年货,全都是科技,白送都别要!

奉劝大家:过年别买这6种年货,全都是科技,白送都别要!

复转这些年
2026-02-03 23:47:02
北京这一夜,被珠圆玉润的奚梦瑶惊艳,胖了一圈秒了干瘪的超模

北京这一夜,被珠圆玉润的奚梦瑶惊艳,胖了一圈秒了干瘪的超模

泪满过眼
2026-01-27 19:06:23
加仓207%,北向资金锁定A股唯一低估真龙,控盘率超84%

加仓207%,北向资金锁定A股唯一低估真龙,控盘率超84%

财报翻译官
2026-02-08 14:58:54
苏-57神话破灭!被吹上天的“隐身战机”,实则是大号三代机

苏-57神话破灭!被吹上天的“隐身战机”,实则是大号三代机

老马拉车莫少装
2026-02-06 00:00:23
下周一2月9日,持有这些个股的要小心了(附个股点评)

下周一2月9日,持有这些个股的要小心了(附个股点评)

股市皆大事
2026-02-08 13:00:38
“呆呆”继摇人按猪之后开直播送春联,近10万网友涌进直播间,当事人:谢谢大家包容,没有嫌弃我字写得丑

“呆呆”继摇人按猪之后开直播送春联,近10万网友涌进直播间,当事人:谢谢大家包容,没有嫌弃我字写得丑

极目新闻
2026-02-08 15:35:40
2026-02-08 19:51:00
极客公园
极客公园
让最棒的创新成为头条
11781文章数 78755关注度
往期回顾 全部

科技要闻

欧盟认定存在"上瘾"设计 TikTok:结论错误

头条要闻

出口民调显示日本执政联盟将获得众议院过半议席

头条要闻

出口民调显示日本执政联盟将获得众议院过半议席

体育要闻

铜牌与苏翊鸣的这四年,他说:我对得起自己

娱乐要闻

曝带女星回老家小区,罗云熙紧急回应

财经要闻

宽基ETF开年大赎回,什么信号?

汽车要闻

VLA司机大模型优化 理想汽车OTA8.3版本更新

态度原创

艺术
亲子
本地
健康
公开课

艺术要闻

何红舟油画作品选

亲子要闻

萌娃让妈妈开门,还送妈妈两个香吻,太可爱了

本地新闻

围观了北京第一届黑色羽绒服大赛,我笑疯了

转头就晕的耳石症,能开车上班吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版