2025年3月29日,2025中关村论坛“未来人工智能先锋论坛”上,清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军教授,发布高可控视频大模型 Vidu Q1。
在演讲后,朱军向网易科技等媒体透露,Vidu Q1中的 “Q” 代表 Quality,意味着高质量。他表示,未来生数科技将继续在提升生成质量的同时,追求效率的极致。
据介绍,Vidu Q1在多主体细节控制方面表现突出,能够基于语义和视觉指令,精准控制场景中多主体的动作、位置和布局。其音效同步功能可在画面转换时精确控制音效的出现时间,增强沉浸感。此外,画质增强技术使生成视频更加清晰和逼真。
据了解,好莱坞动漫工作室 Aura Productions 已与生数科技达成合作,未来将基于 Vidu Q1制作50集动画短剧。
此前,3月初,原火山引擎AI解决方案负责人骆怡航加入生数科技,担任CEO一职,全面负责公司研发、产品、商业化及团队管理工作。这一人事变动,也被解读为生数科技开始着力商业化的信号。
对此,朱军也向网易科技表示,生数科技今年仍然会以ToB和ToC并重的形式继续推进。
朱军表示,生数科技的产品目前有两种形态:一种是面对C端的SaaS服务,目前已经支持服务了超过200个国家地区的数千万用户。
另外一种,则是服务B端企业的MaaS服务。目前生数科技已经通过API以及模型微调的服务,服务了大量的头部企业。现在涵盖的行业包括动漫、广告、影视剧、泛互娱、文旅、游戏,等等。
此外,针对视频生成类产品是否会像 GPT-4o 对图片生成类产品产生的冲击一样,最终被大模型吞噬,朱军则向网易科技表示,目前谈这个还相对较早,现在更关注的还是视频生成的质量和效率。(袁宁)