网易首页 > 网易号 > 正文 申请入驻

生数科技发布Vidu Q1,“参考生”功能可以让视频模型大规模落地吗?

0
分享至

界面新闻记者 | 伍洋宇
界面新闻编辑 | 文姝琪

7月26日,在WAIC2025(世界人工智能大会)上,生数科技最新视频模型Vidu Q1的参考生视频功能成为它此次重点展示的对象。

这是生数科技在视频生成领域对内容生产流程的一次重新梳理。具体而言,此前的视频生成包含较多复杂的前期分镜制作环节,“Vidu Q1参考生”通过对模型算法层面的调整,跳过了这一环节,只上传人物、道具、场景等参考图,就可以直接将多个参考元素生成为一段视频素材,以“参考图——视频生成——剪辑——成片”流程取代分镜生成工作。

例如,输入提示词“诸葛亮与丘吉尔、拿破仑在会议室面对面坐着讨论”,以及三个人物的人物参考图和会议室场景参考图,就可以生成一段三人在同一个会议室交流对话的视频。

这项功能解决了主体一致性问题,这也是视频模型大规模商业化落地的前提。目前Vidu Q1参考生可最多支持七个主体同时输入并始终保持一致,生数科技方面表示,七个主体可以把绝大部分场景和元素固定下来。

生数科技CEO骆怡航对界面新闻记者表示,参考生视频是对传统内容生产流程的变革。在他看来,根据参考主体一键直出视频,是从线下拍摄视频到线上AI创作一个本质的创作流程和方式的转变。其次,这一改动可以构建更通用的创作方式,可更好落地广告、动漫、影视、文旅、教育等不同商业化场景。

多模态模型是当前所有还在坚持基础模型训练的厂商的重点投入方向,而理解与生成一体化被认为是行业共同追求的目标。不过,在自回归架构、扩散架构等底层算法问题上,行业还没有得到一个有效答案。

骆怡航告诉界面新闻记者,从表面上来看,这是一个技术路线选择问题,但对于需要追求应用落地和商业化进程的创业公司而言,这个问题的最终解决要综合研判。

生数科技目前采用U-ViT架构,也是一种主流的基于扩散(Diffusion)和Transformer相结合的架构,不过团队会对个别算法模块等分支部分进行优化。Vidu模型本身也内置多模态理解能力,落地于视频生成。

团队暂时没有将理解与生成一体化放在优先位置,是因为行业客户更关心内容效果而非技术路线,因此模型的创新迭代还是以产业落地为引导。

生数科技正在将Vidu的多模能力接入具身智能领域。7月25日,清华大学与生数科技联合发布具身智能模型Vidar,通过“视频大模型+具身智能”技术路径,实现低成本、少样本泛化,所需数据量约为RDT的八十分之一,π0.5的一千两百分之一。

骆怡航对界面新闻记者解释称,在视频模型和具身智能领域,无论是数字信息还是物理信息,本质上都是时空信息,并且都采用信息输入、决策输出的交互逻辑,因此视频模型对于物理世界规律的理解与具身智能是通用的。团队可以基于Vidu视频大模型基座,通过少量机器人线下实操视频的训练与微调,将生成的虚拟视频转化为对应的机械臂动作。

相较于强调端到端的VLA(Vision-Language-Action)路线,Vidar想要解决前者数据稀缺和难以大规模泛化的瓶颈问题。

视频模型在具身智能领域的能力延伸是一个重要信号,这可能为该领域厂商开启一个潜在的商业市场。

骆怡航表示,考虑到具身智能大规模商业化还需要时间,Vidu目前最高优先级任务仍是提升视频生成能力,并将具身智能领域涉及数字世界与物理世界结合作为持续的探索方向。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
比国足还惨!意大利已12年未踢世界杯,仅剩33岁维拉蒂踢过世界杯

比国足还惨!意大利已12年未踢世界杯,仅剩33岁维拉蒂踢过世界杯

小金体坛大视野
2026-03-26 11:16:02
中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

中国、俄罗斯、伊朗等123票赞成,美国、以色列等3票反对,联合国认定:最严重反人类罪!英法德日等52国投弃权票

每日经济新闻
2026-03-26 13:25:09
是什么,让这个日本自卫官竟敢对中国大使馆举刀?

是什么,让这个日本自卫官竟敢对中国大使馆举刀?

环球时报国际
2026-03-26 00:13:51
中国禁止AI公司Manus两名高管离境?外交部回应

中国禁止AI公司Manus两名高管离境?外交部回应

澎湃新闻
2026-03-26 15:36:31
上海一女子“闪婚”拿到价值近千万房产99%份额,“闪离”后起诉分割房产,法院判了!

上海一女子“闪婚”拿到价值近千万房产99%份额,“闪离”后起诉分割房产,法院判了!

环球网资讯
2026-03-26 08:13:14
我在小城市,一个人做电商,半年挣300万

我在小城市,一个人做电商,半年挣300万

南风窗
2026-03-26 10:07:51
心酸!湖南某乡镇一位小学教师哭诉年收入73150元,评论区炸锅了

心酸!湖南某乡镇一位小学教师哭诉年收入73150元,评论区炸锅了

火山詩话
2026-03-26 09:24:48
女子在按摩店做理疗时被技师偷走金项链

女子在按摩店做理疗时被技师偷走金项链

新闻晨报随申Hi
2026-03-26 09:56:05
想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

想拿中国尿素救春耕?先把欠中企的百亿欠款还了!否则一粒不售

过期少女致幻录
2026-03-26 11:44:43
快递每次都被邻居大妈拿走,我改成货到付款,不到三天物业打电话

快递每次都被邻居大妈拿走,我改成货到付款,不到三天物业打电话

船长与船1
2026-03-26 09:44:01
万科高管被要求退还薪酬

万科高管被要求退还薪酬

地产微资讯
2026-03-26 12:22:04
外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

外交部发言人反问日媒:“你见过有人未经允许持刀进入使馆与大使交谈的先例吗?”

环球网资讯
2026-03-25 15:39:26
继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

继张雪峰之后,中医大师黄贵华被曝心梗去世,社交账号已变黑白

180视角
2026-03-26 11:52:12
丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

丧夫仅5个月,49岁翁帆突传“喜讯”高调露面,状态好到出人意料

冷紫葉
2026-03-24 19:12:36
新加坡站队了?正式向世界宣布:中方若继续挑衅日本,会让他好看

新加坡站队了?正式向世界宣布:中方若继续挑衅日本,会让他好看

小影的娱乐
2026-03-26 13:45:58
原来她是张雪峰前妻,90后历史学博士‌,两人离婚后曾一起上节目

原来她是张雪峰前妻,90后历史学博士‌,两人离婚后曾一起上节目

大铁猫娱乐
2026-03-25 13:03:57
蔡正元即将入狱,国台办做出回应,内容不寻常,已看透他的真面目

蔡正元即将入狱,国台办做出回应,内容不寻常,已看透他的真面目

小陆搞笑日常
2026-03-26 11:57:06
扎哈罗娃警告日本:任何试图向乌提供致命武器之举,都将招致强硬回应

扎哈罗娃警告日本:任何试图向乌提供致命武器之举,都将招致强硬回应

环球网资讯
2026-03-26 08:55:12
日媒曝光强闯我驻日使馆不法之徒照片;案发前行动轨迹公布:乘坐新干线到达东京,在网吧过夜,现场发现的刀具,其称是在车站附近购买

日媒曝光强闯我驻日使馆不法之徒照片;案发前行动轨迹公布:乘坐新干线到达东京,在网吧过夜,现场发现的刀具,其称是在车站附近购买

大风新闻
2026-03-26 12:13:02
张雪峰遗产分割复杂!11岁女儿面临跟后妈争产,是否立遗嘱成关键

张雪峰遗产分割复杂!11岁女儿面临跟后妈争产,是否立遗嘱成关键

萌神木木
2026-03-25 18:56:27
2026-03-26 16:55:00
界面新闻 incentive-icons
界面新闻
只服务于独立思考的人群
1044108文章数 1332022关注度
往期回顾 全部

科技要闻

Meta高管狂分百亿期权,700名员工却下岗

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

头条要闻

国防部:日本侵略过所有周边国家 至今都没有真正反省

体育要闻

申京努力了,然而杜兰特啊

娱乐要闻

张雪峰家人首发声 不设追思会丧事从简

财经要闻

长护险谁能享受?享受多少?解答来了

汽车要闻

一汽奥迪A6L e-tron开启预售 CLTC最大续航815km

态度原创

数码
家居
游戏
房产
旅游

数码要闻

1599~2499元,英特尔酷睿Ultra 200S Plus处理器发售

家居要闻

傍海而居 静观蝴蝶海

商业互吹or真心话?制作人玩《红色沙漠》忘记工作

房产要闻

质价比标杆!三亚首创浮岛全景舱亮相,还得是万科!

旅游要闻

德阳绵竹:赏花、览文旅精品......沿山旅游“火”起来

无障碍浏览 进入关怀版