网易首页 > 网易号 > 正文 申请入驻

对话生数科技CEO唐家渝:AI视频到了“普及”节点 提升时长不是产品化的重点

0
分享至

9月11日,生数科技举办媒体开放日活动,发布“主体参照”(Subject Consistency)功能,意在破解视频模型生成主体的“一致性”难题。

活动上,生数科技联合创始人、CEO唐家渝在回应《每日经济新闻》记者关于商业模式的提问时表示,目前行业内有SaaS(软件即服务)订阅和MaaS(模型即服务)两种,7月30日Vidu上线以来,在全球范围内已收到数万个API接入申请。

就底层架构,唐家渝表示旗下产品“VIDU”所用的“U-ViT架构”与Sora所用的“DiT架构”几乎一模一样,差别在于U-ViT作了更多面向落地的设计。在技术路线上,大家现在处于底层架构收敛的状态,但同质化并不代表大家所有进展、能力相同,唐家渝举例说:“例如现在的语言模型,(虽然)大家都使用Transformer架构,但从现实来看,OpenAI还是明显领先的。”

目前,AI视频的主要使用者还是专业用户,如电影工作者等,但唐家渝认为,AI视频已经来到了“普及”的节点。

此外,从当前阶段的收入来说,生数科技在B端市场获得的收入更多,C端的增长曲线则在Vidu产品上市这一个月以来非常“陡峭”。

唐家渝 图片来源:每经记者 李少婷 摄

“最终的目标还是做通用大模型”

唐家渝是清华大学自然语言处理实验室硕士,此前曾任瑞莱智慧副总裁、腾讯优图实验室高级产品经理等。唐家渝目前所在的生数科技于2023年3月成立,今年3月初宣布完成新一轮融资。今年4月底,该公司与清华大学联合研发的原创视频大模型Vidu面向全球发布,7月底正式上线,全面开放使用。

Vidu问世即被称为“中国版Sora”。这种称呼一方面是因为外界对中国视频大模型充满期待,另一方面,从技术架构上说,二者也有异曲同工之处。

据介绍,Vidu的底层基于自研的U-ViT架构,而Sora是基于DiT架构。关于U-ViT与DiT架构的区别,唐家渝介绍:“一句话总结来说,几乎一模一样。”二者都是Diffusion和Transformer的融合,甚至底层一些技术细节也是相同的。不同之处在于,U-ViT架构“做了更多面向落地的优化设计”,简单概括下来,就是在训练同一模型时,相同时间下,U-ViT所需的算力更少。

从整体的技术路线来看,当前国内几家视频大模型都走的是“类Sora路线”,那大家未来是否会愈加同质化?

对此,唐家渝介绍,当前大家是处于底层架构收敛的状态中,“但同质化并不代表大家所有进展、能力都相同”。他以语言模型为例分析道,大家都会使用Transformer架构,但从现实情况来看,OpenAI还是明显领先,这是因为在这一架构基础上仍有诸多环节需要技术技巧、实践经验帮助破解难点,这就导致了不同语言模型在能力上的差距。

当前,业内也在探索新的架构路线,例如将多模态的生成和多模态理解结合起来,但目前仍没有特别好的方案出现。

“我们最终的目标还是做通用大模型,视频生成是多模态生成大模型中间的一个阶段。”唐家渝坦承了开发通用大模型的雄心。

他还表示:“这并不意味着我们完全只在做这一个事情(指视频大模型),我们除了视频以外也有其他模态的生成能力。”

“目前B端市场收入更多”

技术底层逻辑的趋同,也或多或少低导致了市场开发思路相近。

“大家的商业选择上还是比较类似的,即便是像Sora、Runway,都在积极地拥抱好莱坞或者广告合作等方向。”唐家渝认为,AI生成视频领域总的来说还处在发展前期,国际头部玩家在齐头并进,或者叫“共同扩大市场”。

以生数科技为例,唐家渝将落地商业模式分为两个方向:其一是SaaS订阅模式,Vidu每个月有一些免费的额度,但是如果有更多的需求或想使用更高级的能力,就需要支付订阅费用,Vidu也会不断丰富产品功能,以满足用户的创作需求;其二是模型能力输出模式(MaaS),当前不少客户需要视频生成能力,以此作为工作流程的一个环节或者来衍生出有意思的玩法,这些客户希望可以直接调用模型。

从收入角度来看,B端市场在目前这个阶段获得的收入更多。不过Vidu上线一个月来,C端的增长曲线也非常“陡峭”。“我们目前判断下来的话,B端(的需求)是比较明确、比较直接和比较稳定的,所以B端是我们的一个长期、重点方向。C端我们也在不断探索。”唐家渝表示。

当前,国内的视频生成模型和工具已形成“出海潮”,并且表现亮眼,但唐家渝认为:“还不能说国内已经完全领先,国内外头部玩家都属于第一梯队。”

“AI视频来到了一个节点”

视频大模型的受众群体中,影视、动漫从业者居多,他们多被视为“专业受众”,那对“普通人”来说,AI视频何时能成为他们可以驾驭的工具?

唐家渝以摄影为例,从胶片机时代到手机摄影普及,就是一个不断降低创作者门槛的过程。“现在的AI视频来到了一个节点。”唐家渝介绍,9月11日,生数科技发布的“主体参照”功能,正是为降低创作者门槛或者加速创作过程所作的努力。

“技术仍是关键因素,目前的视频生成只是初步符合物理规律,还有很高的天花板需要突破,比如更强的模型能力以及更多模态的协同生成。”唐家渝介绍,这次发布的“主体参照”能力在一致性生成方面确实有了很大提升,但是还有很多地方需要进一步提升。“例如要大模型从生成一个商品变成生成一个工艺品,而这个工艺品上面有繁复花纹和镂空部分,面对如此复杂的结构,目前的生成成功率依旧不高。场景生成包含很多组成因素,例如运动鞋,我就希望它能在更复杂、更动态化的场景中有更好的表现。这些都需要不断提升模型能力。”

这个过程中,技术的原创性和突破性需要与良好的商业化齐头并进,因为商业公司毕竟不是科研机构。

以视频生成的时长为例,拓展生成时长需要提升模型对世界抽象理解的能力、信息压缩和放大的双向能力。当前Vidu最长可以生成32秒的视频,生数科技计划将其扩展得更长,不过,时长还不是生数科技现在重点产品化的部分。

“在实际创作中,粗略地来说,90%以上的片段都是几秒钟。因此,从实用角度来看,我们还没有将时长作为我们的优先发布考虑。”唐家渝强调,但从模型能力角度,公司实际上在持续提升。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
上海街头大量出现!地上、车上、鞋上全都黏糊糊的!网友傻眼:根本擦不干净!

上海街头大量出现!地上、车上、鞋上全都黏糊糊的!网友傻眼:根本擦不干净!

上观新闻
2026-05-14 21:38:10
刘晓庆19套房百亿翡翠全捐!养大外甥分文不给,真相来了

刘晓庆19套房百亿翡翠全捐!养大外甥分文不给,真相来了

一盅情怀
2026-05-13 13:58:32
柳岩持股光线传媒

柳岩持股光线传媒

雷达财经
2026-05-14 10:13:50
炸锅!阿森纳锁定 9000 万皇马未来球王,穆里尼奥或成最大助攻

炸锅!阿森纳锁定 9000 万皇马未来球王,穆里尼奥或成最大助攻

澜归序
2026-05-14 03:10:36
江西省政府副秘书长,省政府办公厅党组成员邓永翔

江西省政府副秘书长,省政府办公厅党组成员邓永翔

汲古知新
2026-05-13 16:48:44
徐子淇老的不忍直视!和李家诚一起看望杨受成,眼袋重皮肤冒油光

徐子淇老的不忍直视!和李家诚一起看望杨受成,眼袋重皮肤冒油光

小娱乐悠悠
2026-05-13 11:14:18
特朗普给中国送上大礼,3000亿美元采购,人民币一举完成历史破局

特朗普给中国送上大礼,3000亿美元采购,人民币一举完成历史破局

可乐谈情感
2026-05-14 19:09:48
A股3亿股民听好了!无论空仓还是满仓,接下来开盘前务必听我一句

A股3亿股民听好了!无论空仓还是满仓,接下来开盘前务必听我一句

夜深爱杂谈
2026-05-14 20:15:50
特朗普先到北京却绕开东京,表面给日本丢面子,实则救了它一命

特朗普先到北京却绕开东京,表面给日本丢面子,实则救了它一命

烟浔渺渺
2026-05-14 21:12:15
小雷:瓜迪奥拉给水晶宫球员做了一番动员,让他们好好踢枪手

小雷:瓜迪奥拉给水晶宫球员做了一番动员,让他们好好踢枪手

懂球帝
2026-05-14 20:15:22
宋佳调侃张嘉益:为何不推荐我试镜《主角》? 张嘉益回复全场笑翻

宋佳调侃张嘉益:为何不推荐我试镜《主角》? 张嘉益回复全场笑翻

娱最资讯
2026-05-14 09:47:07
米切尔绝杀失误被喷上全美热搜!加时赛3中3救赎:延续7连20+纪录

米切尔绝杀失误被喷上全美热搜!加时赛3中3救赎:延续7连20+纪录

颜小白的篮球梦
2026-05-14 11:19:53
《主角》口碑井喷,本是冲着张嘉益刘浩存来的,却被48岁女配惊艳

《主角》口碑井喷,本是冲着张嘉益刘浩存来的,却被48岁女配惊艳

冷紫葉
2026-05-11 23:11:14
重磅!国家正式出手!不生孩子的时代要结束了?

重磅!国家正式出手!不生孩子的时代要结束了?

瓜哥的动物日记
2026-05-14 19:13:53
A股:今天大跌收市,尾盘加速跳水,原因是什么?明天还会下跌?

A股:今天大跌收市,尾盘加速跳水,原因是什么?明天还会下跌?

虎哥闲聊
2026-05-14 15:08:39
当年千手观音的聋哑人领舞,被富商苦追8年,如今她成了这副模样

当年千手观音的聋哑人领舞,被富商苦追8年,如今她成了这副模样

混沌录
2026-05-12 23:09:07
叶珂直播坦言与黄晓明生女后草率分手,男方私生活成关键

叶珂直播坦言与黄晓明生女后草率分手,男方私生活成关键

李虰手工制作
2026-05-14 00:56:02
CBA半决赛赛程公布!胡金秋伤势出炉,上海深圳占优,用外籍裁判

CBA半决赛赛程公布!胡金秋伤势出炉,上海深圳占优,用外籍裁判

老吴说体育
2026-05-13 23:35:39
不懂穷人就别乱拍!看央视《主角》,才知“假穷人”有多离谱!

不懂穷人就别乱拍!看央视《主角》,才知“假穷人”有多离谱!

米果说识
2026-05-14 22:06:58
夏天已至,医生叮嘱糖尿病人:宁可吃西瓜,也别天天吃这5种食物

夏天已至,医生叮嘱糖尿病人:宁可吃西瓜,也别天天吃这5种食物

周哥一影视
2026-05-14 18:40:09
2026-05-14 22:40:49
每日经济新闻 incentive-icons
每日经济新闻
中国主流财经全媒体平台。
1569087文章数 2725971关注度
往期回顾 全部

科技要闻

马斯克说会谈很顺利 黄仁勋点赞 库克比耶

头条要闻

女子称关闭支付宝支付功能被扣款捐赠184万 多方回应

头条要闻

女子称关闭支付宝支付功能被扣款捐赠184万 多方回应

体育要闻

争议抽象天王山,和季后赛最稳定中锋

娱乐要闻

何九华官宣当爸!全程不提孩子妈

财经要闻

李强会见美国工商界代表

汽车要闻

双零重力座椅/AI智能体/调光天幕 启境GT7内饰发布

态度原创

健康
教育
房产
数码
军事航空

专家揭秘干细胞回输的安全风险

教育要闻

中央财政安排5亿元支持提升校园足球特色学校能力水平

房产要闻

海南楼市新政要出!拟调公积金贷款额度,最高可贷168万!

数码要闻

联想2026款拯救者Y7000P / Y9000P / R9000P游戏本配置确认

军事要闻

美以伊战争期间以总理密访阿联酋

无障碍浏览 进入关怀版