网易首页 > 网易号 > 正文 申请入驻

国产视频大模型双榜登顶!分数超Runway、Sora,一镜到底运镜丝滑

0
分享至

作者 | ZeR0
编辑 | 漠影

智东西4月22日报道,AI视频生成创企生数科技最新上线的全新Vidu Q1视频大模型,同时登上多个权威文生视频、图生视频基准测试榜单的第一。

该模型可支持生成1080p分辨率5秒视频,生成效果清晰稳定,已在网页端(http://Vidu.cn)、手机端上线。

相较2.0版本,Vidu Q1进一步提升了语义理解、画质、动作、美学、逼真和丝滑程度,首尾帧衔接更加流畅,上传两张图就能生成一镜到底的自然运镜。

性价比也相当高。一个1080p 5秒视频价格最低1.34元,价格低至0.3元/秒,仅为同类产品的1/10

Vidu Q1的动态表现出色,能驾驭特写、特效、微缩镜头,生成即可商用,适用于广告营销、短剧、电商、互动娱乐等场景。比如用它生成耳机、香水的广告:

有海外网友反馈说,Vidu Q1对提示词的遵循表现提升很多,能执行一些复杂的提示词,比Veo2的表现更好。

这位网友晒出了用Vidu Q1做的毛毡风动画。视频中,小狗从虚化到清晰的聚焦转换处理得非常自然。

Vidu Q1已拿下海外权威视频生成评测榜单VBench-1.0和VBench-2.0综合榜单的双冠,分数超越Runway、Sora、Luma AI等国内外知名视频生成模型,并在VBench-1.0的视频质量、视频语义一致性和VBench-2.0的常识推理、物理理解这几个综合维度上达到SOTA水平(即当前最先进的模型)。

同期,Vidu Q1也在国内权威通用大模型综合性测评基准SuperCLUE最新的图生视频榜单中,拿下动漫风格、写实风格双榜单的第一。

生数科技还推出了全新AI音效功能,支持一句话生成专属音效、精细控制每段音频的出现时间点。

一、两张图实现电影级运镜,视频生成风格多元,多人物遮挡也不会崩

Vidu Q1首尾帧功能升级,基于两张图即可实现电影级运镜。

比如上传这两张图,分别作为首帧和尾帧:

输入提示词“女特工手持手枪,射出子弹,子弹穿破玻璃球瞬间爆炸,吉恩·科兰的漫画风格,紧张刺激的动画场景”后,Vidu Q1生成的视频效果是这样的:

在生成电影场景方面,Vidu的画面表现力已经接近以假乱真的水平,而且能够对复杂语义理解到位。

例如,让Vidu Q1按如下提示词生成视频:

提示词:深夜古堡的走廊,身穿西装的男子手持蜡烛转身走在走廊中,两旁的灯光忽明忽暗,紧张刺激的氛围,推进镜头拍摄,镜头定格在男子的脸。

提示词:寂静的车厢里,老人抽着香烟,烟雾弥漫,车厢内的灯光忽明忽暗,镜头推进拍摄,推进到老人的脸部。

提示词:镜头聚焦于一位身穿皮夹克的男子,他独自行走在白天的城市街道上。阳光在人行道上投射出逼真的阴影,背景中是汽车和行人,而模糊的画面则以电影般的照片写实风格呈现。

在主角快速移动且存在遮挡的情景下,Vidu Q1依然能够生成人物运动自然、稳定的视频。

提示词:一张黑白照片,一位优雅的黑发女子穿过人群,动作模糊,从街道拍摄,穿着现代服装,空灵,穿越时空,电影摄影,对比,颗粒

在Vidu模型已经非常擅长的AI动漫场景,Vidu Q1继续保持行业领先并再度升级动漫风格,支持日漫、3D动漫等多元化动漫风格,风格一致性较好,动态表现自然、稳定流畅,画面生动。

提示词:充满活力的动漫风格水下场景,一个睁大眼睛的女孩,有着飘逸的水蓝色双马尾和水手风格的校服,轻轻地悬浮在水中,伸手去够在闪闪发光的气泡和旋转的光束中嬉戏游动的金橙色锦鲤鱼,魔幻的氛围,超细节,吉卜力风格的幻想,16:9 的宽高比

提示词:一个身穿运动服的超现实动漫风格女孩,被特写镜头捕捉到,她满脸雀斑,汗流浃背,脸颊绯红,睁大的眼睛反映出情感和好奇,对着镜头眨眼微笑,慢慢地把手伸向屏幕,广角微距镜头拍摄,超现实的纹理与风格化的柔和相结合,充满情感的时刻,16:9 的宽高比”

由于我们把Vidu Q1生成视频转换成了gif动图格式,画质有所压缩。原视频很高清,可以看到皮肤上清晰逼真的纹理和汗迹。

Vidu Q1同时支持文生视频、图生视频,下方是用图生视频功能生成的日漫风格视频示例。

二、AI音效功能发布:精准控制时间点,可多段音效叠加,率先支持48KHz高保真

除了上线Vidu Q1外,生数科技还推出了全新AI音效(AI Sound Effects)功能。该功能具有三个主要特点:

(1)精准Timing:可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如0-2s风声、3-5s雨声,是商业领域全球首家支持精细化时间控制的文生音效系统。

(2)音效叠加:支持多段音效叠加,比如暴雨天的场景,涉及雨声、风声、打雷声等多种类型声音的混合,可以通过“音效叠加”来实现层次分明且动态变化的音效,具备影视级混音表达力。

例如用它生成键盘声咖啡机的复合音效。

提示词:{“提示”: “@{敲打键盘 & <0.00,8.00>}@{打印机噪声 & <2.00,3.00>}@{咖啡机 & <4.50,5.50>}”,”开始秒数”: 0,”开始秒数”: 8.0}

(3)高采样率音频,高保真音质:行业大部分为16kHz、32kHz,Vidu做出了商业领域全球首家支持48KHz的文生音效系统,解决音效刺耳、压缩失真、声音不自然流畅等问题。

可以感受下用该功能生成的48kHz高保真蟋蟀声、“世界毁灭”氛围感音效:

提示词:蟋蟀声
提示词:形容世界毁灭的音乐

结语:AI视频生成进步提速,正重塑视频制作方式

生成式AI正以前所未有的速度重塑视频制作的方式。AI视频生成工具的迭代升级,有望使动漫、影视、广告、视频剪辑、UGC创作平台等众多行业受益。

近年来,AI视频生成模型的进步日新月异,从只能生成几秒钟的简单视频画面,逐渐发展到能够输出更加复杂、连贯、自然的高质量视频内容,不断为视频内容创作拓宽边界和降低门槛。

从Vidu Q1的发布可以看到,准确的语义理解、拟真的表现力、角色稳定一致、强时空连贯性等特性,是当前视频生成模型提高输出质量的重要优化方向。

与此同时,更好用的AI视频工具还要搭配更丰富、便利的编辑功能。

生数科技最新推出的AI音效功能可与视频生成功能形成互补,根据视频或场景,用一段文字即可自动生成符合氛围、精准匹配视频画面的背景音乐或个性化音效,有助于减少搜索音效库的时间,甚至减少对昂贵版权音乐的依赖。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
我没有退休金,搭伙老伴每月给我存8000元,13年后老伴儿子找到我

我没有退休金,搭伙老伴每月给我存8000元,13年后老伴儿子找到我

第四思维
2025-07-08 13:22:18
特朗普女婿被查,61亿资产99%来自外国,特朗普:中国会感谢我

特朗普女婿被查,61亿资产99%来自外国,特朗普:中国会感谢我

趣文说娱
2026-04-20 19:30:36
不辞职就开除!特朗普彻底摊牌:必须卷铺盖走人,鲍威尔退无可退

不辞职就开除!特朗普彻底摊牌:必须卷铺盖走人,鲍威尔退无可退

小先生笔记
2026-04-20 17:28:25
深大一口气停招26个专业,这些“坑”你还在踩吗?

深大一口气停招26个专业,这些“坑”你还在踩吗?

牛锅巴小钒
2026-04-17 13:18:03
100 日元兑 4.33 元:日本用三十年,把自己熬成了 “廉价国家”

100 日元兑 4.33 元:日本用三十年,把自己熬成了 “廉价国家”

深析古今
2026-03-31 10:10:57
大风突袭,山东一饭店老板霸气喊话“不用结账,直接回家”!老板娘:损失两三千,不心疼钱,只想让顾客安全到家

大风突袭,山东一饭店老板霸气喊话“不用结账,直接回家”!老板娘:损失两三千,不心疼钱,只想让顾客安全到家

大象新闻
2026-04-20 17:43:06
外媒:特多一墓地惊现数十具被丢弃遗骸

外媒:特多一墓地惊现数十具被丢弃遗骸

参考消息
2026-04-20 21:04:06
54岁黎姿海滩照曝光!三个孩子的妈?网友:确定不是AI换脸?

54岁黎姿海滩照曝光!三个孩子的妈?网友:确定不是AI换脸?

今古深日报
2026-04-20 10:16:38
纽约期金突破4840美元/盎司

纽约期金突破4840美元/盎司

每日经济新闻
2026-04-20 20:32:11
把瑜伽裤穿成日常的松弛感美女

把瑜伽裤穿成日常的松弛感美女

只要高兴就好
2026-04-13 14:30:30
首发26分钟7中1,得分没有犯规多,顶薪先生被杜锋用成拖油瓶?

首发26分钟7中1,得分没有犯规多,顶薪先生被杜锋用成拖油瓶?

弄月公子
2026-04-20 22:45:46
王毅通告全世界,53国获零关税特权,唯独一国没得到,中方选边站

王毅通告全世界,53国获零关税特权,唯独一国没得到,中方选边站

触摸史迹
2026-04-20 03:39:03
国际奥委会:沪蓉广均不申办2036奥运令人失望

国际奥委会:沪蓉广均不申办2036奥运令人失望

观察者小海风
2026-04-20 16:34:35
离婚1年,黄圣依最新近况曝光:在瑞士留学,和此前状态差距太大

离婚1年,黄圣依最新近况曝光:在瑞士留学,和此前状态差距太大

喜欢历史的阿繁
2026-04-21 00:07:25
新疆油气资源潜力巨大:或超越中东,新疆油气新篇章即将开启

新疆油气资源潜力巨大:或超越中东,新疆油气新篇章即将开启

叮当当科技
2026-04-20 18:13:19
蓝眼北京人控诉陈丽华20余年,比女首富更该铭记

蓝眼北京人控诉陈丽华20余年,比女首富更该铭记

老蝣说体育
2026-04-19 17:40:22
特朗普开始妥协不打伊朗,转身甩锅中国,10国发布声明打脸美国

特朗普开始妥协不打伊朗,转身甩锅中国,10国发布声明打脸美国

世界有奇事
2026-04-20 22:26:00
巴西手握2100万吨稀土,对中国立新规:想要矿,得拿核心技术来换

巴西手握2100万吨稀土,对中国立新规:想要矿,得拿核心技术来换

霁寒飘雪
2026-04-20 14:44:41
052D穿过日本横当水道!这步棋有多狠?

052D穿过日本横当水道!这步棋有多狠?

牲产队
2026-04-20 22:21:15
首轮G1打完,这5队最有冠军相!火箭队最被高估,这3队基本出局

首轮G1打完,这5队最有冠军相!火箭队最被高估,这3队基本出局

篮球扫地僧
2026-04-20 21:22:45
2026-04-21 01:07:00
智东西 incentive-icons
智东西
智东西,AI产业新媒体,专注报道人工智能的前沿技术发展,和技术应用带来的千行百业产业变革。
11639文章数 117035关注度
往期回顾 全部

科技要闻

HUAWEI Pura X Max发布 售价10999元起

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

头条要闻

19岁女孩挪用自家1700万当"榜一大姐" 亲爹带女儿自首

体育要闻

阿森纳已拼尽全力,但你早干嘛去了...

娱乐要闻

《八千里路云和月》田家泰暗杀

财经要闻

利润暴跌7成,字节到底在做什么

汽车要闻

把天门山搬进厂?开仰望U8冲上45度坡的那刻 我腿软了

态度原创

亲子
艺术
本地
教育
公开课

亲子要闻

【孤独症科普】啥是孤独症,哪些孩子易发生,如何应对?

艺术要闻

沙特官宣:全球最大单体建筑,延期十年!网友:又是画饼?

本地新闻

12吨巧克力有难,全网化身超级侦探添乱

教育要闻

学不会也算违纪?云南一高中生遭劝退,另一位家长的选择太清醒!

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版