网易首页 > 网易号 > 正文 申请入驻

对话生数科技CEO骆怡航:参考生视频让创作回归本质,下一步将推进实时生成

0
分享至

智东西7月30日报道,在2025世界人工智能大会(WAIC 2025)期间,视频生成独角兽生数科技的CEO骆怡航博士与媒体进行深入交流,详细介绍了生数科技视频生成技术的最新进展,并分享了他对视频生成技术未来发展方向的见解。

骆怡航着重谈到今年7月发布的Vidu Q1参考生功能,他认为,与文生视频、图生视频相比,参考生视频才是整个AI视频创作范式的底层功能。这种方式既不会像文生视频那样缺乏一致性,也不会像图生视频那样限制模型的发挥。

生数科技从去年开始研发参考生视频技术,已经迭代4个版本。同时,该公司也在一致性方向不断投入,骆怡航认为一致性对广告、影视等商业创作而言至关重要。

骆怡航也谈到了上周生数科技联合清华大学发布的具身智能模型Vidar,这是国内首个基于视频生成模型的具身基座模型。虽然具身智能的大规模应用还需要时间,但生数科技计划继续探索数字世界与物理世界的结合,并有可能在具身智能产业成熟后加大投入。

采访中,骆怡航还针对生数科技的商业化策略、技术升级方向、AIGC产业趋势等问题进行分享。

值得一提的是,今天恰好是生数科技视频生成模型Vidu全球上线一周年。上线1年,Vidu生成视频总数已超过3亿个,用户数超3000万,B端落地率达到行业第一,这些数据也带动生数科技的年化收入突破2000万美元(约合人民币1.44亿元)

一、参考生回归视频拍摄本质,Vidu架构可扩展至具身智能

视频生成当前有多种实现形式,包括图生视频、文生视频、参考生视频等。其中,图生视频因其给予了创作者更多的控制力,而获得广泛使用。

图生视频需要用户上传完整的首帧图或尾帧图,模型以此为基准,生成画面。但由于图像中的各种元素已经被固定,模型很难对画面中的内容进行调整、修改,无法完全发挥出视频生成模型在创造力上的优势。

骆怡航认为,参考生视频让业界回到了本身视频拍摄的本质:用户可上传人物、道具、场景等元素,无需将其通过P图、生图、融图等繁琐环节,而是直接根据参考图直出视频。

最近推出的Vidu Q1参考生视频能力进一步提升,已经支持了七个主体的参考,基本可以满足大部分场景需求。

Vidu参考生视频同时具备主体库功能,用户可以上传人物或者商品的正面、侧面、背面图,确保元素在不同场景下的主体一致性。

面向专业创作场景,Vidu参考生视频提供了提示词专业模式。用户输入简单的提示词后,模型能够将用户的简单提示词改写为专业提示词,让最终作品质量更高,制作效率提升。

参考生视频这项技术满足了商业化场景对内容创作的需求,已在广告电商、互联网、动漫、影视、文旅、教育、游戏、广电等八大行业落地应用。

在Vidu视频生成模型的基础上,生数科技和清华大学共同打造了具身智能模型Vidar,这一模型与Vidu一脉相承。

骆怡航称,Vidu架构在设计之初就具备一定通用性,可胜任时空信息一致性的生成,在这个基础架构之上,只需进行少量数据、低成本的微调,便可将生成的虚拟视频转化为控制具身智能的动作信息。

Vidar的主要创新在于,能突破原有VLA路线中优质数据难以获取和具身智能难以泛化的问题,实现了具身智能的少样本泛化,所需真机人类操作数据量约为行业典型值的千分之一。

二、视频生成技术分三步走,将优先满足专业用户需求

骆怡航还分享了视频生成技术发展过程中人与AI协作三阶段的观点。

第一个阶段仍是图生视频为主,需要文生图再生视频或者用首尾帧再生视频的复杂流程,虽然它在生产环节、效率上相比传统流程有所进步,但还未达到100%的效率提升。

第二阶段以参考生视频为主要功能,无需中间分镜生成环节,只要把主体选好,就可以直接生成视频。根据生数科技得到的用户反馈,这种方式给效率带来了明显提升。

第三个阶段中,将有大量内容100%由AI生成,内容生产执行的效率和成功率极大提升,创作者可以把大量时间投入到故事创意和关键设计上。

骆怡航称,目前生数Vidu正推动AI视频内容生成由第二个阶段向第三个阶段转变。

生数科技当前最高的优先级依旧是满足视频行业最严格、最复杂的专业要求,其次才是扩展C端用户。

对此,骆怡航解释道,当前视频生成技术尚无法支撑普通用户打造高质量视频,仍需在一致性、速度上实现突破,才能实现AI视频创作的普惠。

生数科技可以在服务B端专业用户的过程中,逐步打磨这些技术,例如根据广告电商客户的需求提升一致性,或是在动画场景针对性地提升风格和生产效率。这些在专业领域的技术积累,最终可以惠及C端用户。

结语:视频生成技术持续迭代,速度与成本仍有突破空间

随着视频生成模型能力的持续迭代,有越来越多的企业开始探索其应用价值,尤其是在影视制作、广告营销、教育培训等场景中。不过,要真正实现规模化落地,仍有很长的路要走。

在采访的最后,骆怡航也分享了他眼中视频生成未来的优化空间。首先,一致性作为基础问题,仍需要进一步提升;解决一致性问题后,下一步就是让视频生成做到“快”、“好”、“省”。

其中,“快”和“省”的部分还有很大突破空间,现在生数科技已经实现普通清晰度几秒钟生成视频片段、分钟级生成1080P视频片段,未来会推进AI视频实时生成。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
黑熊路上打滚“没人敢扶” 阿坝州林草局:没受伤,已救助放归

黑熊路上打滚“没人敢扶” 阿坝州林草局:没受伤,已救助放归

封面新闻
2026-04-06 19:23:02
杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

杜月笙面馆吃饭,一伙地痞流氓找他要保护费,杜月笙:嫌命长吗?

千秋文化
2026-04-01 20:35:51
巴西女生来中国旅游,回国后感叹:巴西与中国的差距一目了然

巴西女生来中国旅游,回国后感叹:巴西与中国的差距一目了然

千秋文化
2026-03-26 21:22:48
撒贝宁一家四口旅游吃早餐被拍,娶李白的选择太明智

撒贝宁一家四口旅游吃早餐被拍,娶李白的选择太明智

仙味少女心
2026-04-05 22:04:05
朝鲜主动把3名中国人写进教科书,并且为他们树立铜像,他们是谁

朝鲜主动把3名中国人写进教科书,并且为他们树立铜像,他们是谁

凡人侃史
2026-04-06 12:10:58
形势已然大变!西方媒体集体改口:中国,已无需再向世界证明什么

形势已然大变!西方媒体集体改口:中国,已无需再向世界证明什么

花寒弦絮
2026-04-06 09:32:15
救援完成,美以大概率明晚开始全面轰炸伊朗、最快8日上午登岛

救援完成,美以大概率明晚开始全面轰炸伊朗、最快8日上午登岛

邵旭峰域
2026-04-06 12:45:36
1979年对越反击战,有10位首长的儿子在越南牺牲,他们分别是谁?

1979年对越反击战,有10位首长的儿子在越南牺牲,他们分别是谁?

冰雅忆史
2026-04-06 09:40:59
周杰伦“3小时演唱会实唱不足90分钟”上热搜,粉丝反驳:在现场,远不止90分钟;此前周杰伦曾表示如有唱得不好的地方,回去会检讨

周杰伦“3小时演唱会实唱不足90分钟”上热搜,粉丝反驳:在现场,远不止90分钟;此前周杰伦曾表示如有唱得不好的地方,回去会检讨

鲁中晨报
2026-04-06 11:29:01
瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

瓦良格号送到中国后有多震撼?专家刮掉表面的锈迹:钢材品质极佳

古书记史
2026-01-06 16:31:56
车市高潮来了,4月8日又有6款王炸新车来袭,起步不到7万!

车市高潮来了,4月8日又有6款王炸新车来袭,起步不到7万!

趣味萌宠的日常
2026-04-06 11:44:12
从敬畏到挑衅!松岛辉空差异化点评国乒双雄,点破王楚钦命门

从敬畏到挑衅!松岛辉空差异化点评国乒双雄,点破王楚钦命门

体育见习官
2026-04-05 13:08:20
CBA焦点战CCTV5直播!广东山东卡位战,广厦拒3连败,北京争4强

CBA焦点战CCTV5直播!广东山东卡位战,广厦拒3连败,北京争4强

老吴说体育
2026-04-06 10:38:04
俄媒:中国车辆耐用度只有德系一半!易生锈、品质不及欧美

俄媒:中国车辆耐用度只有德系一半!易生锈、品质不及欧美

沙雕小琳琳
2026-04-06 01:43:47
教皇利奥罕见发表强硬言论:中东冲突极其恶劣,你们双手沾满鲜血

教皇利奥罕见发表强硬言论:中东冲突极其恶劣,你们双手沾满鲜血

安然有思
2026-04-01 21:31:36
王楚钦夺冠后一举动引发质疑,难怪樊振东、陈梦退出,现在懂了

王楚钦夺冠后一举动引发质疑,难怪樊振东、陈梦退出,现在懂了

宝哥精彩赛事
2026-04-06 18:34:45
美国没想到,俄罗斯也没想到!如今的中国,已经成为世界骄傲

美国没想到,俄罗斯也没想到!如今的中国,已经成为世界骄傲

你是我心中最美星空
2026-04-06 10:31:42
消息称苹果首款折叠屏手机iPhone Fold已在试产

消息称苹果首款折叠屏手机iPhone Fold已在试产

IT之家
2026-04-06 15:54:34
雷军晒了张图,小米把豪车涂装玩成了"隐形联名"

雷军晒了张图,小米把豪车涂装玩成了"隐形联名"

报错免疫体
2026-04-06 16:45:14
“生娃率”持续走低,厦门教授给出建议:不生孩子就下调养老金

“生娃率”持续走低,厦门教授给出建议:不生孩子就下调养老金

大果小果妈妈
2026-04-02 13:16:39
2026-04-06 20:44:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11516文章数 117024关注度
往期回顾 全部

科技要闻

折叠屏iPhone要来了,富士康已在试产!

头条要闻

专家:美动用特种部队营救飞行员 更像是地面进攻预演

头条要闻

专家:美动用特种部队营救飞行员 更像是地面进攻预演

体育要闻

球员系列赛大满贯!赵心童10-3世界第一 加冕赛季第4冠

娱乐要闻

唐嫣罗晋新加坡遛娃,6岁女儿身高抢镜

财经要闻

史诗级暴跌"一周年" A股接下来如何走?

汽车要闻

阿维塔06T快上市了 旅行车还能这么玩?

态度原创

时尚
教育
房产
艺术
军事航空

再见老钱风,今年流行的“新自然主义风”穿搭太时髦了!

教育要闻

中考620,你可以怎么选?

房产要闻

小阳春全面启动!现房,才是这波行情里最稳的上车票

艺术要闻

殊相——中国油画学会创作研修作品展 | 油画选刊(五)

军事要闻

伊朗:在C-130运输机残骸中发现一具美军士兵遗体

无障碍浏览 进入关怀版