网易首页 > 网易号 > 正文 申请入驻

硬刚马斯克,超越Sora2的国产模型强势登场了!支持16秒声画同出

0
分享至


智东西
作者 江宇
编辑 漠影

智东西1月30日报道,今日,来自生数科技的AI视频模型Vidu Q3 Pro登上国际权威AI基准平台Artificial Analysis榜单,位列中国第一,全球第二。

这是最新榜单内,首个打入国际第一梯队的国产视频生成模型。

它仅次于马斯克旗下xAI的Grok,领先于Runway Gen-4.5、Google Veo 3.1和OpenAI Sora 2。


▲国际权威AI基准平台Artificial Analysis最新榜单

而这项排名的背后,是国产AI视频生成技术迈出的关键一步——模型已经突破“能出画”的门槛,具备“会讲故事的导演感”。

在这个人人都能把文字变成视频的阶段,看似创作门槛降低了,真正想做出一条有情绪、有节奏、有表达的短片,却依然难度不小。

最常见的问题有三:

一是静音哑片,不能同步输出声音,画面与音效相对割裂;

二是镜头语言单一、节奏缺失难以表达复杂情绪

三是文字缺席,没有文字,台词、字幕、广告语全靠后期补救。

它们分别卡在AI生成视频环节的不同节点,直接限制了AI视频模型从生成工具走向内容创作引擎的能力。

如今,这个缺口正被Vidu Q3填补。新一代视频生成模型Vidu Q3,完成了三项关键突破:全球首个支持16s音视频直出的模型、镜头自由切换控制、画面内精准文字渲染——声音、镜头、语言三者齐发。

它不仅能讲出完整的台词、控制好节奏,还能直接在画面中“写”下表达,具备导演级的调度能力,专门为“剧”而生。

自此,一款具备“导演感”的AI视频生成模型来了。

一、从“生成视频”到“调度镜头”,三块短板正被补上

对很多AI视频创作者来说,“把画面做出来”已经不是问题,难的是“怎么让它讲得通顺、看得下去”。

这次,Vidu Q3升级为一款将声音、镜头、节奏与字体渲染打包生成的创作引擎,具备更接近专业导演的视听表达能力,开始补上AI视频创作长期缺失的三块关键能力:

首先,是音画同步这一技术难题的突破,让AI视频终于能“讲完整的话”了。

Vidu Q3支持最长16秒的音视频一体生成,语音、旁白、对话、音效和音乐可以同步输出,还能精准对口型

目前,该模型已覆盖中文、英文、日文,是全球首个在这一时长内实现高质量声画同出的生成模型。

其次,镜头调度不再呆板,开始具备戏剧张力。

Vidu Q3能够根据内容自动切换镜头视角,从远景到特写,不同情绪、动作、节奏的变化都能驱动镜头语言的调整,模拟专业导演的调度方式,让AI生成的故事更有视觉语言,而不只是“画在动”。

最后,长久困扰生成视频的文字渲染问题也得到解决

Vidu Q3可直接在画面中生成中、英、日三种语言的文字内容,支持广告语、环境标识等多种文字场景自然融入画面,无需再靠贴图拼接,整体排版风格统一,省去了大量后期工作。

当这三块短板被补上后,AI视频的表达力开始具备“讲故事”的能力,而不再只是片段的拼贴。

二、实测体验:我们让AI“导”了一支16秒短片

我们设定了一个国漫风格的创意场景,测试Vidu Q3是否能够在“导演视角”下同时调度语音、镜头与画面文字。

提示词:深山竹林中,一男一女两位剑客正在对峙。男性剑客(声音沉缓):“真的没有挽回的余地了吗?”镜头切至女性剑客特写,她一身红衣,嘴角挑起一抹不屑的冷笑。女性剑客(语气桀骜):“你我二人早已恩断义绝,看招!”她身形如闪电般窜出,两人剑光交错,招式行云流水,剑刃碰撞的清脆铮鸣与古风鼓点交织,在竹林间激荡出凌厉的交锋节奏。背景叠加古风氛围音乐以及冷兵器碰撞摩擦的声音。

整体观感上,本次生成节奏自然,镜头切换清晰,角色对白与口型匹配度较高,画面构图和氛围也较为协调,基本还原了古风剑客对峙的场景。

进一步观察细节,不同镜头间的切换能够精准对应动作转换节点,剑光交错、人物移动与镜头运转的节奏保持一致,未出现跳帧、错位等干扰体验的问题。

背景音乐层次分明,冷兵器碰撞声与角色台词均有良好呈现。

在实际生成过程中,出片效率较高,画面渲染稳定,交互过程清晰。用户可通过提示词对人物对白、画面风格、动作节奏等多维度进行控制,可控感明显提升。

综合来看,Vidu Q3已具备基础的“导演感”,能够胜任短剧创作、影视剧情、广告营销等多种场景。

三、能拍短剧、能出广告、也能做动漫,内容创作的地基在悄悄重构

当视频生成开始承担内容生产的完整链条,我们看到的几个实际应用方向,已经能串起从剧本到出片的全过程。

通过声音、动作与镜头的协同生成,Vidu Q3能够还原较为复杂的情节表达,支持分镜与情绪变化,是目前较为适合叙事类创作的应用方向之一,可以被用于制作短剧、漫剧等故事内容。

与此同时,在广告与产品展示场景中,自动出片能力也显著提升了创作效率。

该模型适合带解说的产品视频、人物出镜介绍等形式,“语音+镜头”联动生成,免去了“脚本-拍摄-剪辑”的多轮反复。

此外,Vidu Q3也在自媒体和播客等轻制作领域展现出较强的实用性。

Vidu Q3支持风格设定与人物设定,搭配对白和动态镜头,让播客或短视频内容也具备足够好的观看体验,且能够批量生产

作为新一代专门为“剧”而生的视频模型,Vidu Q3的目标用户就不止是内容创作者,还有广告人、营销人、产品人,创作角色也正在被重新定义。

结语:“导演感”落地了,AI视频进入工业级内容生产新阶段

短短一年时间,AI视频的生成能力完成了从“能动”到“会讲”的关键跨越。

Vidu Q3同样是一种创作方式的升级:从声音、画面、镜头到字幕,它把一个视频创作的完整能力交到创作者的手里。

无论是叙事驱动的短剧、新意爆棚的广告、风格鲜明的动漫,还是自媒体视频等多个领域,AI都正在转向一位合格的创作伙伴。

如果说之前的AI视频模型还像是“摄像机”,那么现在,它开始像个真正的“导演”了。

接下来,它还能讲出怎样的故事,也值得我们继续期待。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
连续三天嫖娼一次嫖俩,花800元毁掉一手女神好牌,他图什么?

连续三天嫖娼一次嫖俩,花800元毁掉一手女神好牌,他图什么?

街上的行人很刺眼
2026-04-25 10:55:49
欧盟再度出手,戳破幻想:西方永远不会接纳中国,中俄只能背靠背

欧盟再度出手,戳破幻想:西方永远不会接纳中国,中俄只能背靠背

南生今世说
2026-05-09 16:24:20
钱天一退役获72万安置费引争议,与何冰娇74万形成对比

钱天一退役获72万安置费引争议,与何冰娇74万形成对比

时间巡查
2026-05-10 18:00:20
巴基斯坦准备用40架歼-35,给中国争取十年战略窗口期

巴基斯坦准备用40架歼-35,给中国争取十年战略窗口期

无心小姐姐
2026-05-10 09:18:12
先访日再访华?美国老套路被看穿,中方回应硬气到底

先访日再访华?美国老套路被看穿,中方回应硬气到底

安珈使者啊
2026-05-10 09:34:13
林彪坠机 22年,西方记者从俄国处找到黑匣子,里面录音内容曝光

林彪坠机 22年,西方记者从俄国处找到黑匣子,里面录音内容曝光

覃仕勇说史
2026-05-10 15:51:52
负债20万的35岁老乡,在深圳租了个850元小单间,开始送外卖还债

负债20万的35岁老乡,在深圳租了个850元小单间,开始送外卖还债

笑看红尘三千客
2026-05-10 18:02:29
震惊!网传南昌某楼盘业主群集体抬价、下架房源,称团结就是力量

震惊!网传南昌某楼盘业主群集体抬价、下架房源,称团结就是力量

火山詩话
2026-05-10 06:17:24
全球十大毒王级垃圾食品曝光, 很多华人天天都在吃! 泡面, 汉堡竟都没上榜

全球十大毒王级垃圾食品曝光, 很多华人天天都在吃! 泡面, 汉堡竟都没上榜

澳微Daily
2026-05-10 15:59:51
躺枪,“中国烧烤店是天价世界杯首个受害者”话题登上热搜

躺枪,“中国烧烤店是天价世界杯首个受害者”话题登上热搜

懂球帝
2026-05-09 19:45:20
郭德纲没想到,《低智商犯罪》播出11集,竟让他陷入了舆论漩涡

郭德纲没想到,《低智商犯罪》播出11集,竟让他陷入了舆论漩涡

草莓解说体育
2026-05-10 12:46:17
腰斩再遇冷:世界杯中国转播费从21亿降至8.5亿,为何还犹豫

腰斩再遇冷:世界杯中国转播费从21亿降至8.5亿,为何还犹豫

西昆仑Bruce
2026-05-10 17:53:47
富士康与新势力联合造车!

富士康与新势力联合造车!

电动知家
2026-05-10 18:05:55
郭德纲、于谦相声再被举报!

郭德纲、于谦相声再被举报!

天津人
2026-05-08 15:12:33
一句“别染发”上热搜,染发产品成抽检不合规榜单“常客”

一句“别染发”上热搜,染发产品成抽检不合规榜单“常客”

新京报
2026-05-08 16:20:47
曝俄军在非洲马里遭遇全面挫败!连续放弃三大基地

曝俄军在非洲马里遭遇全面挫败!连续放弃三大基地

项鹏飞
2026-05-07 20:19:18
巴基斯坦准备用40架歼-35,给中国争取十年战略窗口期

巴基斯坦准备用40架歼-35,给中国争取十年战略窗口期

前行之路
2026-05-10 09:57:19
申花刚战平重庆铜梁龙!斯卢茨基赛后就做出重要决定,已发声确认

申花刚战平重庆铜梁龙!斯卢茨基赛后就做出重要决定,已发声确认

张丽说足球
2026-05-10 16:10:48
中国赢了。这次中国是真的赢了

中国赢了。这次中国是真的赢了

安安说
2026-05-10 11:16:20
亲手给美国送去8000万桶石油的女人,现在带着几十万人,造反了

亲手给美国送去8000万桶石油的女人,现在带着几十万人,造反了

西楼知趣杂谈
2026-05-10 09:49:49
2026-05-10 18:56:49
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11795文章数 117070关注度
往期回顾 全部

科技要闻

DeepSeek融资,改写所有人的估值

头条要闻

面对中方强硬态度 世界杯中国转播费从3亿美元腰斩

头条要闻

面对中方强硬态度 世界杯中国转播费从3亿美元腰斩

体育要闻

那个曾让詹姆斯抱头的兄弟,40岁从大学毕业了

娱乐要闻

大S女儿玥儿开通账号,用烟花缅怀母亲

财经要闻

白酒大逃杀

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

教育
时尚
家居
游戏
数码

教育要闻

小升初必考!梯形面积的计算技巧!

今年最好看的衬衫竟然是它?太减龄了!

家居要闻

菁英人居 全能豪宅

炸裂!熊孩子刮花6张PS5光盘 家长仅200元打发了事

数码要闻

华为智慧屏S7正式开售,300Hz Super MiniLED超清护眼

无障碍浏览 进入关怀版