网易首页 > 网易号 > 正文 申请入驻

中国版Sora来了!清华打造!

0
分享至

来源:证券时报

时隔两个月,清华团队打造了一个中国版的Sora视频大模型。

4月27日,在中关村论坛未来人工智能先锋论坛上,中国首个长时长、高一致性、高动态性视频大模型Vidu正式发布。这一模型由清华大学和大模型创业公司生数科技联合发布,可以一键生成长度达16秒、分辨率为1080P的高清视频内容。

证券时报记者独家获悉,清华大学人工智能研究院副院长、生数科技首席科学家朱军在Vidu发布后发声表示:“Vidu,we do, we did, we do together!感谢小伙伴们日以继夜的坚持,在实验室架构上开花结果。”据介绍,这也是自OpenAI发布Sora以后,全球率先取得重大突破的视频大模型。

Sora发布后,行业内一直有团队宣称要追赶和复现Sora,而Vidu团队用两个月的时间率先跑出来。记者梳理发现,生数科技在多模态大模型领域已经有较深的积累,也是目前多模态大模型赛道估值最高的初创公司之一。目前公司已完成三轮融资,融资额达数亿元人民币,投资方包括启明创投、智谱AI、BV百度风投、锦秋基金等一众机构。

对标Sora,生成视频连贯高清

“画室里的一艘船驶向镜头”,只需要输入这样一句简单的指令,即可以生成效果逼真、镜头连贯的一段视频。在生数科技发布的Vidu模型生成视频样片中,视频的整体质感几乎可与Sora相媲美。

据生数科技介绍,Vidu模型采用团队原创的Diffusion与Transformer融合的架构U-ViT,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。“U-ViT架构早在2022年9月就由团队提出,早于Sora采用的DiT架构,是全球首个Diffusion与Transformer融合的架构。”生数科技表示。

记者注意到,今年3月生数科技完成新一轮融资后,公司就公开表示,虽然Sora的出现表明美国在多模态大模型领域具有领先性,“但中国也并非完全从零开始的阶段”。据介绍,朱军在2023年1月就提出了基于Transformer的多模态扩散大模型UniDiffuser,采用了U-ViT,该架构与Sora的架构路线完全一致,区别在于UniDiffuser主要应用于图像生成任务,但也可以以此为基础进行视频任务的拓展。

正是基于在机器学习和多模态大模型的长期积累,团队才能够在短短的两个月时间里突破了长视频表示与处理的多项关键技术,成功研发推出Vidu视频大模型。朱军在Vidu模型发布现场表示,Vidu主要有以下方面的特点与优势:

一是模拟真实物理世界,可以生成复杂、细节丰富的场景,光影效果与人物表情都能够符合真实的物理规律。

二是富有想象力,可以虚构场景以及想象超现实主义的画面。

三是具有多镜头语言,不再局限于固定镜头,能够在遵循主体一致性的情况下实现远景、近景、中景、特写等不同镜头的动态切换,还可以实现长镜头、追焦等效果。

四是有出色的视频时长,能支持16秒长度的视频生成,保持镜头和主体的连贯一致。

五是能理解中国元素,可以更好地理解生成熊猫、龙等富有中国文化特色的形象。

Vidu生成的龙、熊猫等中国文化元素视频

背后团队来自清华,已融资数亿元

Vidu的背后,是一家来自清华的明星创业公司生数科技。

公开资料显示,生数科技成立于2023年3月,核心成员来自清华大学人工智能研究院,致力于自主研发世界领先的可控多模态通用大模型。公司的CEO本硕就读于清华大学计算机系的唐家渝,首席科学家由清华人工智能研究院副院长朱军担任,CTO鲍凡则是清华大学计算机系博士生、朱军教授的课题组成员,长期关注扩散模型领域研究。

记者注意到,今年3月,唐家渝曾在沟通会上向媒体表示,今年内公司的大模型一定能达到Sora目前版本的效果,“但很难说是三个月还是半年”。然而,Vidu却提前交出了一份令人惊艳的考卷,这主要得益于团队是国内最早布局多模态大模型的团队之一,多年以来在这一领域形成了深厚的积累。

据唐家渝介绍,生数科技目前采取模型层和应用层两条路走路的模式。一方面,构建覆盖文本、图像、视频、3D 模型等多模态能力的底层通用大模型,面向B端提供模型服务能力;另一方面,面向图像生成、视频生成等场景打造垂类应用,按照订阅等形式收费,应用方向主要是游戏制作、影视后期等内容创作场景。

记者梳理发现,生数科技自成立以来就备受资本关注。天眼查数据显示,生数科技目前共完成3轮融资。2023年6月,完成近亿元人民币天使轮融资,投资方包括蚂蚁集团、BV百度风投、卓源亚洲、卓源资本;2023年8月,完成数千万人民币天使+轮融资,投资方为锦秋基金;2024年3月,完成数亿元人民币A轮融资,投资方除了启明创投、达泰资本、智谱AI等新机构以外,还有BV百度风投、卓源亚洲两个老股东。

在三轮融资总计数亿元人民币的资本加持下,生数科技已成为目前国内多模态大模型中估值最高的初创公司之一。生数科技表示,Vidu的问世不仅是U-ViT融合架构在大规模视觉任务中的又一次成功验证,也代表了生数科技在多模态原生大模型领域的持续创新能力和领先性。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一大批高校,将搬迁!

一大批高校,将搬迁!

吉刻新闻
2026-04-27 16:08:43
泰国工厂突发冲突!中泰工人互相群殴,视频曝光现场一片混乱

泰国工厂突发冲突!中泰工人互相群殴,视频曝光现场一片混乱

暹罗飞鸟
2026-04-28 08:14:15
上海地铁互殴后续:央媒发声定调,女子工作恐不保,知情人曝更多

上海地铁互殴后续:央媒发声定调,女子工作恐不保,知情人曝更多

以茶带书
2026-04-27 19:23:12
055大驱直接发射鹰击-20,当着七国的面开火,解放军反制稳控南海

055大驱直接发射鹰击-20,当着七国的面开火,解放军反制稳控南海

谛听骨语本尊
2026-04-27 19:29:52
Manus,彻底凉凉了

Manus,彻底凉凉了

技术领导力
2026-04-27 20:37:27
太心疼!马筱梅哭到停更,带娃逃回台湾:凭啥要我和孩子遭这罪

太心疼!马筱梅哭到停更,带娃逃回台湾:凭啥要我和孩子遭这罪

小娱乐悠悠
2026-04-28 07:56:17
5月1日起抽烟买烟迎来变化,6条红线碰不得,违规就罚款!

5月1日起抽烟买烟迎来变化,6条红线碰不得,违规就罚款!

老特有话说
2026-04-27 17:43:49
蒸馏这事,美国人自己天天干,为啥到了DeepSeek就成“工业化窃取了”?

蒸馏这事,美国人自己天天干,为啥到了DeepSeek就成“工业化窃取了”?

科学伙伴
2026-04-27 17:36:10
我国最容易叫错的6个城市,念对一个算有文化,认识一半算你厉害

我国最容易叫错的6个城市,念对一个算有文化,认识一半算你厉害

长风文史
2026-04-27 20:19:33
新规落地!5月1日起,饭局、转账或被全程监管,别大意!

新规落地!5月1日起,饭局、转账或被全程监管,别大意!

小谈食刻美食
2026-04-28 07:30:36
名记:杜兰特或已打完火箭生涯最后一场球,下家是纽约和热火

名记:杜兰特或已打完火箭生涯最后一场球,下家是纽约和热火

懂球帝
2026-04-28 09:32:05
场均8失误,坎宁安连续三场季后赛累计24个失误,历史最多

场均8失误,坎宁安连续三场季后赛累计24个失误,历史最多

懂球帝
2026-04-28 11:37:50
徐泽伟已被引渡至美国,连律师都不知情!

徐泽伟已被引渡至美国,连律师都不知情!

意大利华人网0039
2026-04-28 00:06:41
迟到2分钟被取消事业单位体检资格 人社局机械执法败诉

迟到2分钟被取消事业单位体检资格 人社局机械执法败诉

封面新闻
2026-04-27 16:20:23
NBA罚单:斯马特质疑裁判公正性罚3.5万 肯纳德不当言论罚2.5万

NBA罚单:斯马特质疑裁判公正性罚3.5万 肯纳德不当言论罚2.5万

醉卧浮生
2026-04-28 10:04:51
我国这4个著名大镇,名气之大,超过了所属地级市,非常强悍

我国这4个著名大镇,名气之大,超过了所属地级市,非常强悍

长风文史
2026-04-26 21:00:50
印度要下狠手了!精心布局9年,今天一把梭哈!

印度要下狠手了!精心布局9年,今天一把梭哈!

华山穹剑
2026-04-27 20:06:05
战损曝光!中东战火下美军事资产“损失惨重” 五角大楼试图掩盖成本引质疑

战损曝光!中东战火下美军事资产“损失惨重” 五角大楼试图掩盖成本引质疑

财联社
2026-04-28 10:04:12
世锦赛8强落位:吴宜泽vs瓦菲,希金斯vs萝卜,最终4强大概率如下

世锦赛8强落位:吴宜泽vs瓦菲,希金斯vs萝卜,最终4强大概率如下

小火箭爱体育
2026-04-28 08:58:17
巩俐巴黎街头与丈夫争执摔花,77岁老公一个摸头杀,全网破防

巩俐巴黎街头与丈夫争执摔花,77岁老公一个摸头杀,全网破防

茶余饭好
2026-04-27 20:20:50
2026-04-28 11:48:49
中国基金报 incentive-icons
中国基金报
洞察金融市场,传播中国价值——《中国基金报》社官方账号(《中国基金报》社有限公司运营管理)
61879文章数 517449关注度
往期回顾 全部

科技要闻

10亿周活目标落空!传OpenAI爆发内部分歧

头条要闻

美军事资产被指"损失惨重" 修复费用可能高达50亿美元

头条要闻

美军事资产被指"损失惨重" 修复费用可能高达50亿美元

体育要闻

人类马拉松"破二"新纪元,一场跑鞋军备竞赛

娱乐要闻

杨幂险遭蒸汽眼罩毁容!伤照曝光…

财经要闻

俞敏洪再遭重击

汽车要闻

上汽大众“攻山头” ID.ERA 9X剑指细分前三

态度原创

健康
旅游
游戏
艺术
数码

干细胞治疗烧烫伤三大优势!

旅游要闻

蒙山、云冈石窟、北岳恒山、悬空寺景区最新公告

唯美末日剧情向冒险游戏《ARIE:月咏》公布售价,5月13日上线!

艺术要闻

静·观--第二届全国静物油画作品展 作品选刊

数码要闻

首款华为MatePad Pro Max平板曝光,将于5月面向全球发布

无障碍浏览 进入关怀版