网易首页 > 网易号 > 正文 申请入驻

背靠清华,“国产最强”Sora来了!

0
分享至

来源:猎云精选,文/王非

从ChatGPT到Sora,大模型热潮汹涌依旧。

距离Sora发布仅两个多月,“中国版Sora”就已经从概念和口号,成为了现实。

4月27日,生成式人工智能基础设施及应用提供商生数科技,刚刚正式发布了中国首个长时长、高一致性、高动态性视频大模型——Vidu,支持一键生成长达16秒、分辨率高达1080P的高清视频内容。

仅从时长来看,相较于Sora长达60秒的视频生成能力,Vidu已然达到了前者的26.67%的水平。而在视频效果上,Vidu也堪称“媲美”。基于此,生数科技颇有底气地为Vidu,打上了“全面对标Sora”的标签。

值得一提的是,与2023年,清华系占据大模型赛道半壁江山,如出一辙。此次,Vidu的诞生,也和清华关系匪浅。

首先,Vidu正是由生数科技联合清华大学共同发布的。其次,生数科技的首席科学家正是清华大学计算机系教授、人工智能研究院副院长朱军。第三,生数科技的CEO唐家渝本硕就读于清华大学计算机系;CTO鲍凡则是清华大学计算机系博士生、朱军教授的课题组成员。

仅凭强大的团队组成,生数科技就成为了资本市场上炙手可热的存在。

在过去七个月内,刚刚成立一年多的生数科技,接连完成三轮大额融资,蚂蚁集团、百度、锦秋基金、启明创投、智谱AI均已成为该公司股东,并助推其成为目前国内在多模态大模型赛道估值最高的创业团队。

全面对标Sora!16秒+1080P

当地时间2月15日,OpenAI正式发布文生视频模型Sora,并发布了48个文生视频案例和技术报告,宣告入局视频生成领域。自此,国内多模态大模型赛道,热度不断攀升。

早在2023年6月,就明确表示“正积极打造世界领先的可控多模态通用大模型”的生数科技,似乎已然具备了先发优势。

事实,确也如此。据钛媒体消息,今年三月唐家渝曾表示,生数科技的视频生成长度在4-5秒左右,“我们近期将重点突破长视频生成能力……尤其长视频画面的连贯性。”

谈及与Sora的竞争,唐家渝城,“整体上来讲,我们(中国)追赶Sora肯定比追赶GPT-4容易一些。今年一定能达到Sora目前版本的效果,很难说是三个月还是半年。”

一个月过去,唐家渝的目标进度,显然迈进了一大步。

生数科技介绍称,Vidu不仅能够模拟真实物,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。Vidu也是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中。

在时长方面,Vidu能够根据提供的文本描述直接生成长达16秒的高质量视频。换言之,生数科技已经相较于一个月前,有了3-4倍的成长。

除了在时长方面的突破外,Vidu在视频效果方面实现显著提升,主要体现在几个方面:

模拟真实物理世界:能够生成细节复杂的场景,且符合真实的物理规律,例如合理的光影效果、细腻的人物表情等;

具有丰富想象力:能够生成真实世界不存在的虚构画面,创造出具有深度和复杂性的超现实主义内容。


多镜头语言:能够生成复杂的动态镜头,不再局限于简单的推、拉、移等固定镜头,而是能够围绕统一主体在一段画面里就实现远景、近景、中景、特写等不同镜头的切换,包括能直接生成长镜头、追焦、转场等效果,给视频注入镜头语言;


时空一致性高:在16秒的时长上保持连贯流畅,随着镜头的移动,人物和场景在时间、空间中能够保持一致;

理解中国元素:能够生成特有的中国元素,例如熊猫、龙等;


值得一提的是,短片中的片段都是从头到尾连续生成,没有明显的插帧现象,从这种“一镜到底”的表现能够推测出,Vidu采用的是“一步到位”的生成方式,与Sora一样,文本到视频的转换是直接且连续的,在底层算法实现上是基于单一模型完全端到端生成,不涉及中间的插帧和其他多步骤的处理。

清华教授“带队”,“师生共创”2.0

Vidu的诞生,离不开一个灵魂人物,他就是清华大学计算机系博世人工智能冠名教授、IEEE Fellow、清华大学人工智能研究院副院长、计算机系人智实验室主任,曾任卡内基梅隆大学兼职教授的朱军。

学术层面,朱军教授主要从事机器学习研究,发表CCF A类会议/期刊论文百余篇,谷歌学术引用2.5万余次;担任国际著名期刊IEEE TPAMI的副主编,担任ICML、NeurIPS、ICLR等(资深)领域主席20余次。

在国内“科技成果转化”、“教授创业”的热潮下,朱军教授也以首席科学家的身份,在创投圈开辟了一片新天地。

2018年7月,源自于清华大学AI研究院的瑞莱智慧(RealAI)正式创立,并成为清华大学推进人工智能技术与产业的深度融合的产学研示范企业,由毕业于清华大学、曾获清华特等奖学金和西贝尔学者荣誉的田天博士担任公司CEO,清华大学AI研究院首任院长张钹院士与朱军教授共同担任公司首席科学家。

值得一提的是,田天本科毕业后被保送至清华大学计算机系智能技术与系统国家重点实验室继续深造,他的老师正是朱军教授,堪称“师生共创”的又一典范。

今年4月,人工智能安全基础设施提供商瑞莱智慧刚刚完成了新一轮战略融资,北京市人工智能产业投资基金等参与投资。此前,该公司已获蚂蚁集团、百度、中国互联网投资基金、前海母基金等知名机构的多轮融资,已然成为独角兽后备军的一员。

迈入大模型元年的2023年,朱军教授“因时而动”,带领学生火速开辟新战场,于当年3月成立新公司——生数科技,早早地入局多模态大模型赛道。

据悉,生数科技由瑞莱智慧、蚂蚁集团和BV百度风投联合孵化,前瑞莱智慧副总裁唐家渝出任CEO,朱军教授同样担任公司首席科学家。

这一次,同样是“师生共创”模式。与朱军教授并肩作战的,是生数科技CTO鲍凡,清华大学计算机系博士生、朱军教授的课题组成员。CEO唐家渝则毕业于清华大学计算机系,师从NLP组教授孙茂松,曾在腾讯优图实验室工作。

天眼查App信息显示,瑞莱智慧持有生数科技约28.57%股权;朱军教授持股约8.16%,位列第三大股东,最终受益股份约17.17%;高管层面,唐家渝和鲍凡军持股约5.44%,二人的最终受益股份分别约为23.63%、5.44%;此外,瑞莱智慧CEO田天则持股约2.04%,最终受益股份约12.21%。

强大的技术团队背景,也成为生数科技追赶Sora的依仗,进而支撑Vidu的快速突破。早在2022年9月,生数科技团队就提出了Vidu的核心技术U-ViT架构,早于Sora采用的DiT架构。它也是全球首个Diffusion与Transformer融合的架构,完全由团队自主研发。

2023年3月,生数科技团队开源全球首个基于U-ViT架构的多模态扩散大模UniDiffuser,在全球范围内率先完成融合架构的大规模可扩展性(Scaling Law)验证。UniDiffuser是在大规模图文数据集LAION-5B上训练出的近10亿参数量模型,支持图文模态间的任意生成和转换。在架构上,UniDiffuser比同样DiT架构的Stable Diffusion 3领先了一年。

作为国内最早布局多模态通用大模型的团队之一,生数科技基于此前积累,早早地就从0到1打造着产业级的多模态深度生成式大模型,覆盖文本、图像、3D模型、音视频等多个模态。

凭借于此,在今年2月Sora发布推出后,生数科技团队方能基于对U-ViT架构的深入理解以及长期积累的工程与数据经验,在短短两个月进一步突破长视频表示与处理关键技术,研发推出Vidu视频大模型。

启明百度智谱蚂蚁,均已入股

生数科技,孵化自瑞莱智慧。自诞生之日起,这一新公司除了“继承”强大的技术团队背景,在股东层面也一脉相承。

2023年6月,仅仅创立三个月的生数科技,就获得了近亿元天使投资,估值达1亿美元。

股东层面,蚂蚁集团、BV百度风投作为孵化方之一,顺理成章成为生数科技首批股东。此外,卓源资本作为瑞莱智慧的天使投资方,也在生数科技的天使轮融资中,以跟投的方式出现。

短短两个月后,生数科技再次获得数千万元天使+轮融资,由锦秋基金独家投资。锦秋基金,也成为了该公司的首个“新股东”。

2023年,在大模型热潮下,生数科技已然上线了两款工具产品:视觉创意设计平台PixWeaver、3D资产创建工具VoxCraft,面向艺术设计、游戏制作、影视动画、社交娱乐等创意领域提供赋能,提升创作效率。

Sora的出现和火热,则为生数科技开辟新领域,指明了方向——长视频。

凭借在多模态大模型领域的早早布局,生数科技的上述决定,也得到了资本市场的热切回应。

今年3月,生数科技宣布完成新一轮数亿元融资,由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲继续跟投。

据钛媒体消息,谈及智谱AI、百度与生数科技的定位关系时,唐家渝曾表示,两家机构均不会与生数科技起冲突。其中,百度属于All in语言模型,对于多模态模型都是与生数合作,包括3D、图像等层面。

除了腾讯、阿里等巨头,以及智谱AI这个“超级独角兽”,与生数科技处于同一赛道的初创公司还包括梅涛院士创立的HiDream智象未来、前字节跳动AI Lab总监王长虎创立的爱诗科技。

其中,爱诗科技在今年3月接连获得达晨财智、蚂蚁集团的A1、A2轮投资,金额均为1亿元;智象未来则在去年12月,获得中喝大种子一号基金、将门创投、科大讯飞、阿尔法公社等机构的投资。

在获得最新融资后,生数科技并未披露估值。一名熟悉公司业务的人士向财新称,在目前国内走原生多模态路线的初创公司中,生数科技的估值是最高的。

此外,今年2月被爆完成超10亿美元新一轮融资的月之暗面,也同步被爆出其正在研发通用多模态模型。

可以预见的是,紧随生数科技脚步,中国版Sora的大爆发,即将到来。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
3-1胜东南亚劲旅,日本3连胜,以头名进亚洲杯8强+进U17世界杯

3-1胜东南亚劲旅,日本3连胜,以头名进亚洲杯8强+进U17世界杯

侧身凌空斩
2026-05-13 01:56:29
晚节不保72岁濮存昕硬捧外孙女拍戏,网友吐槽:尖嘴猴腮求放过

晚节不保72岁濮存昕硬捧外孙女拍戏,网友吐槽:尖嘴猴腮求放过

漫婷侃娱乐
2026-05-11 22:00:55
《歌手2026》官宣嘉宾揭晓!

《歌手2026》官宣嘉宾揭晓!

情感大头说说
2026-05-12 18:24:03
靠宗教压服全军没用!手握重兵大佬公然叫板,塔利班统治摇摇欲坠

靠宗教压服全军没用!手握重兵大佬公然叫板,塔利班统治摇摇欲坠

三年的老核桃
2026-05-11 23:50:03
辽宁一出租车顶灯亮起“我被打劫,请报警”,警方:未接到相关警情,经与当事司机联系核实,系其误按报警器

辽宁一出租车顶灯亮起“我被打劫,请报警”,警方:未接到相关警情,经与当事司机联系核实,系其误按报警器

鲁中晨报
2026-05-12 20:18:03
“伤害很大,侮辱性更强!山东临沂单身女子因琐事和邻居发生矛盾

“伤害很大,侮辱性更强!山东临沂单身女子因琐事和邻居发生矛盾

网络易不易
2026-05-12 14:05:10
港圈:你可以跟英皇唱反调,但千万给容祖儿难堪!45岁的她凭什么

港圈:你可以跟英皇唱反调,但千万给容祖儿难堪!45岁的她凭什么

她时尚丫
2026-05-11 22:27:40
乘客拒付40元高速费 00后车主又把其拉回起点:可以双输 但不能单赢

乘客拒付40元高速费 00后车主又把其拉回起点:可以双输 但不能单赢

中国能源网
2026-05-11 15:05:05
大连一烧烤店内女子用铁签给狗撸串,还让它坐在卡座上,市监局介入后店铺停业整顿,店主:已销毁全部铁签,向所有顾客致歉

大连一烧烤店内女子用铁签给狗撸串,还让它坐在卡座上,市监局介入后店铺停业整顿,店主:已销毁全部铁签,向所有顾客致歉

大风新闻
2026-05-12 10:08:22
退休后才明白:别人夸你“看起来真年轻”,千万别答“哪有哪有”

退休后才明白:别人夸你“看起来真年轻”,千万别答“哪有哪有”

心理观察局
2026-05-07 08:18:05
中方官宣特朗普访华,行程多了一天,美专家:是他主动想去中国

中方官宣特朗普访华,行程多了一天,美专家:是他主动想去中国

史料布籍
2026-05-11 15:54:56
至暗时刻!本田在华月销仅2.26万辆

至暗时刻!本田在华月销仅2.26万辆

新浪财经
2026-05-12 03:42:26
60岁释永信情妇有多少?央视发文,被他搞惨的4个女明星终于翻身

60岁释永信情妇有多少?央视发文,被他搞惨的4个女明星终于翻身

历史伟人录
2026-04-05 15:52:17
特朗普应邀访华3天,中方准备了高规格礼遇,他想邀中方回访美国

特朗普应邀访华3天,中方准备了高规格礼遇,他想邀中方回访美国

别让往昔的悲伤和对未来的恐惧
2026-05-13 02:30:26
OPPO余某“底裤”被扒光!知情人曝更多 难怪敢嚣张恐被公司开除

OPPO余某“底裤”被扒光!知情人曝更多 难怪敢嚣张恐被公司开除

天天热点见闻
2026-05-12 04:54:10
CBA季后赛!山西男篮vs广厦男篮,赛前带来山西男篮张宁、迪亚洛、潘江以及浙江男篮孙铭徽的最新消息

CBA季后赛!山西男篮vs广厦男篮,赛前带来山西男篮张宁、迪亚洛、潘江以及浙江男篮孙铭徽的最新消息

凯丰侃球
2026-05-13 00:10:56
中交三公局董事长被带走调查

中交三公局董事长被带走调查

地产微资讯
2026-05-12 14:09:05
男子用2条毒蛇泡酒,12年后打开本想品尝美酒,谁知出现惊人现象

男子用2条毒蛇泡酒,12年后打开本想品尝美酒,谁知出现惊人现象

诡谲怪谈
2025-04-01 17:37:59
大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

大伯出狱全家没人接,我开车去接他,他偷偷塞我一张卡说有1200万

千秋文化
2026-05-09 20:08:48
我敢打赌99%的男人会选绿衣服女孩做老婆,看腿型就知道

我敢打赌99%的男人会选绿衣服女孩做老婆,看腿型就知道

娱乐洞察点点
2026-04-21 00:47:32
2026-05-13 03:08:49
猎云网
猎云网
聚焦科技创业创新,钻研产业趋势,用心服务创业者。
59032文章数 327142关注度
往期回顾 全部

科技要闻

宇树发布载人变形机甲,定价390万元起

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

头条要闻

特朗普称将同中方讨论对台军售和黎智英案 外交部回应

体育要闻

骑士终于玩明白了?

娱乐要闻

白鹿风波升级!掉粉20万评论区沦陷

财经要闻

利润再腰斩 京东干外卖后就没过过好日子

汽车要闻

吉利银河“TT”申报图曝光 电动尾翼+激光雷达

态度原创

艺术
数码
本地
时尚
公开课

艺术要闻

震惊!他竟用镜头看透了所有女人的秘密!

数码要闻

看电视的人越来越多了 3亿台电视在线 小米第一

本地新闻

用苏绣的方式,打开江西婺源

普通人真该学学如何穿搭!多穿裙子比裤子更时髦,大方提气质

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版