网易首页 > 网易号 > 正文 申请入驻

中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发

0
分享至

文 | 周鑫雨

编辑 | 邓咏仪

全球首家发布Sora同款底层架构的清华系模型公司,近期完成了新一轮融资。投资名单中,也出现了大模型独角兽智谱AI的身影。

36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模态基础大模型的研发迭代、应用产品创新及市场拓展。

2023年成立的生数科技,在创立当年已经完成了近亿元的天使轮融资。基于自主研发的多模态通用大模型,生数科技对外提供To B的MaaS(模型即服务)服务和To C的应用产品。

生数科技的核心团队成员,出自清华大学人工智能研究院。联合创始人兼CEO唐家渝出身清华大学自然语言处理实验室,曾任瑞莱只会副总裁、腾讯优图实验室高级产品经理。CTO鲍凡在清华大学计算机系获得博士学位,在加速推理、可控生成、基础架构、训练策略等方面已发表十余篇顶会论文。首席科学家为清华大学计算机系人工智能实验室主任、智源研究院首席科学家朱军。

可以说,2023年是国内大语言模型狂飙的元年。2024年,OpenAI携可生成60秒视频的模型Sora再次登场,立刻带动了国内AI行业对视频、音频、图像、3D等多模态生成技术的探索。

目前,生数科技自研的多模态通用大模型,已经初步具备短视频的生成能力。

短视频生成效果。图源:生数科技

但Sora的空降,也让生数科技立刻调整了战略。以往AI生成视频的长度天花板,是Runway Gen-3的18秒,如今Sora将天花板抬高到了60秒。

唐家渝坦言,长视频生成需要高昂的入场费,A100、A800的卡可能要上万张。资源投入的压力,让团队并没有立刻投入长视频生成的训练。如今长视频生成的路径,已经被OpenAI验证,生数科技决定提高突破长视频能力的优先级。

生数团队对多模态模型的探索最早开始于2013年。在清华实验室阶段,团队早期成员就开始了生成式模型理论基础、高效学习和推理算法,以及音乐生成、人脸合成等多方面的研究工作。

自2020年扩散模型应用于图像生成领域以来,生数团队也是业内首批开展扩散概率模型基础理论和算法研究的队伍,于ICML、NeurIPS、ICLR等顶会发表扩散概率模型领域相关论文20余篇。团队先后推出自研的无训练推理框架Analytic-DPM、全球最快采样算法DPM-Solver,被DALL-E 2、Stable Diffusion等国际项目所采用。

2022年9月,生数科技就发布了9.5亿参数规模的U-ViT网络架构,这也是全球首个Diffusion Transformer架构——1个月后,Stable Diffusion发布了初代DiT架构U-Net,后被应用于Sora的研发

依托于U-ViT架构,生数科技推出了基于统一的多模态多任务框架的通用基础大模型,可实现图像、视频、3D多种模态的生成。

图像生成效果。图源:生数科技

比如在3D生成的效果上,生数科技模型可以将生成速度压缩到10秒级。与此同时,模型还支持360度全景4D动画生成,以及对3D生成场景的编辑。

3D生成效果。图源:生数科技

3D生成效果。图源:生数科技

在3D等多模态训练数据稀缺的当下,据唐家渝介绍,生数科技多模态模型的训练数据主要来源于两块:互联网上大量公开的数据,通过向版权方购买的私有数据,两者共同完善训练数据的丰富性。

相较于同等参数规模的语言模型,多模态模型的训练,前期的投入更为高昂。为了节省成本,提高训练效率,生数科技构建了完整的工程与数据体系,并在大规模GPU集群上实现更高效、低成本、强兼容的模型训练。唐家渝表示,去年团队花了近一个月的时间做完了华为昇腾训练架构的适配,芯片的国产替代帮助节省了不少成本。

目前,生数科技采取的是To B和To C两条腿走路的商业化模式:对B端提供MaaS服务,对C端提供多模态生成应用。

目前,生数科技已经与多家游戏公司、个人终端厂商、互联网平台等B端机构展开合作。比如在和某头部车企的合作中,生数科技将图像生成能力应用在了车载大屏的壁纸生成。

在C端产品的布局上,生数科技在2023年上线了两款工具型产品:视觉创意设计平台PixWeaver、3D资产创建工具VoxCraft。先面向海外市场推出的VoxCraft,在辅助3D游戏角色开发场景中经过了市场的验证,通过基于VoxCraft生成粗模、底模,游戏开发效率能够提升30%

唐家渝认为,追赶Sora对模型公司而言,仍然拥有巨大的挑战。这份挑战不仅来源于训练数据的数量和质量,也在于对多模态训练数据的处理方式——在OpenAI披露更多训练细节之前,Sora的数据集仍然是个“黑箱”。但乐观的是,多模态模型,已经到了可以走出实验室和机房,落地到更多应用场景的阶段。

以下是投资人评价:

启明创投合伙人周志峰 如今的大模型已经从原来的纯语言模态,逐步走向多模态的探索。生数科技从去年成立之初就选择多模态赛道,是国内这个领域起步最早、积累最深的团队,大量工作被OpenAI、Stable Diffusion团队引用。生数科技推出的U-ViT架构作为全球Diffusion Transformer架构的首创,不仅具有前瞻的技术视野,更是经过了大规模训练的验证,展现出强大的技术可行性。这种兼具开拓性和成熟度的核心工作,让我们对生数科技在多模态大模型方向的长期发展充满信心。 今年过年期间,Sora的亮相不仅展示出视频生成技术的巨大潜力,而且增强了人们对于多模态生成未来发展的信心。随着Scaling Law在视频生成领域的进一步加强,我们预期多模态技术将引领一系列令人瞩目的创新和令人惊叹的成果。在这一过程中,生数科技无疑将扮演一个关键的推动角色!
达泰资本合伙人姚承 在当下大模型赛道的竞争中,生数科技在多方面都脱颖而出。不仅敏锐洞察到多模态的前沿趋势,而且作为国内最早投身多模态赛道的公司,生数科技在过去短短一年的时间内就取得了令人瞩目的成绩单,从基础设施、模型算法、数据资源到场景化应用积累了独特的竞争优势。同时生数科技也是国内极少拥有“从零开始、自主训练”大模型能力的公司,具备深厚理论基础和实践经验,拥有突破主流框架技术难点和瓶颈的技术实力,因此我们坚持在人工智能领域的布局,并对生数科技未来发展充满期待。
智谱AI CEO 张鹏 智谱AI CEO 张鹏表示:作为清华系的创业团队,生数科技是国内最早开展深度生成式AI研究的组织之一。从对抗生成网络到扩散模型,生数科技敏锐洞察到融合架构的重要性,将其作为原生多模态的技术核心和重要支撑。智谱AI很高兴同生数科技展开深入合作,助力生数科技多模态核心技术研发与商业化探索,一同推动多模态大模型技术落地应用,更好惠及千行百业。
华兴资本董事总经理、华兴资本集团联席总裁 王力行 我们身为生数科技的亲密战友,见证了公司的厚积薄发和无限潜力。作为全球顶尖的研发团队,生数科技在基础理论架构和工程实现等层面展现出了超群的创新力和前瞻性,率先提出U-ViT架构并一以贯之,引领了多模态行业的发展;同时团队以极强的执行力和落地速度,陆续在图像、3D、视频生成等领域贡献了艺术级的作品。作为未来数字世界的天才建筑师,生数将率先攻克多模态生成瓶颈,把人类的创造力和艺术构想一一落为现实,始于科学、忠于创新、迈向未来。

欢迎交楼!

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
97年我在广东打工,娶了离异的女同事,新婚当晚才知她真实身份

97年我在广东打工,娶了离异的女同事,新婚当晚才知她真实身份

兰姐说故事
2025-08-24 05:05:05
初次相亲遇上极品幼师,拉我去公园树下谈条件适配

初次相亲遇上极品幼师,拉我去公园树下谈条件适配

艺鉴在线
2026-05-21 11:13:14
记者:与新月达成一致,努涅斯将抵达蒙得维的亚备战世界杯

记者:与新月达成一致,努涅斯将抵达蒙得维的亚备战世界杯

懂球帝
2026-05-23 11:15:08
悟空已接入阿里最新旗舰模型 Qwen3.7-Max

悟空已接入阿里最新旗舰模型 Qwen3.7-Max

产业家
2026-05-22 23:14:05
武契奇访华前强硬表态:不惜一切代价铲除军中黑恶势力

武契奇访华前强硬表态:不惜一切代价铲除军中黑恶势力

标体
2026-05-23 23:17:30
《呼啸山庄》:男人真正害怕的,从来不是你不爱了、不闹了、甚至转身离开,而是你最终做出的这两个决定

《呼啸山庄》:男人真正害怕的,从来不是你不爱了、不闹了、甚至转身离开,而是你最终做出的这两个决定

心理观察局
2026-05-23 07:22:26
挂车尾部挂低俗标语博眼球?成都警方:罚!网友:丢人现眼

挂车尾部挂低俗标语博眼球?成都警方:罚!网友:丢人现眼

金子从天降
2026-05-23 16:27:40
美国对全世界下逐客令:想拿绿卡?先滚回去排队

美国对全世界下逐客令:想拿绿卡?先滚回去排队

浪子的烟火人间
2026-05-24 00:05:14
官方:帕纳辛奈科斯主帅贝尼特斯下课

官方:帕纳辛奈科斯主帅贝尼特斯下课

懂球帝
2026-05-23 12:07:23
深度长文:宇宙为何锁死光速?

深度长文:宇宙为何锁死光速?

宇宙时空
2026-05-22 14:05:07
普京到如今终于明白,怪不得俄军苦战三年,还是打不赢乌克兰!

普京到如今终于明白,怪不得俄军苦战三年,还是打不赢乌克兰!

阿尢说历史
2026-05-22 19:48:53
西安的面食为什么都用很大的碗?这是噱头吗?

西安的面食为什么都用很大的碗?这是噱头吗?

向航说
2026-05-18 00:25:03
两性关系:如果你曾有过一个情人,悄无声息地断了,那你很幸运

两性关系:如果你曾有过一个情人,悄无声息地断了,那你很幸运

加油丁小文
2026-05-20 05:30:03
郭士强又出手了!放弃3个人,徐杰刚来一周就走人,他俩即将回归

郭士强又出手了!放弃3个人,徐杰刚来一周就走人,他俩即将回归

萌兰聊个球
2026-05-23 22:10:38
灵动岛缩减35% 史上颜值巅峰iPhone要来了?

灵动岛缩减35% 史上颜值巅峰iPhone要来了?

PChome电脑之家
2026-05-23 22:24:29
赫尔城补时绝杀米堡,九年后重返英超

赫尔城补时绝杀米堡,九年后重返英超

日常碎碎念啊
2026-05-24 00:58:50
省 6100 万!曼联卡里克首签来了 3900 万拿下自己的安德森

省 6100 万!曼联卡里克首签来了 3900 万拿下自己的安德森

奶盖熊本熊
2026-05-23 03:20:07
津门虎1-1海港:3个不可思议与2个事实

津门虎1-1海港:3个不可思议与2个事实

刘笤说体坛
2026-05-23 21:20:08
广西皮卡坠落漫水桥的背后:妇女老人留守大山就近打零工|封面深镜

广西皮卡坠落漫水桥的背后:妇女老人留守大山就近打零工|封面深镜

封面新闻
2026-05-23 11:54:07
深度科普:狗交配过程为何会很难分开?下次看到狗交配请默默离开

深度科普:狗交配过程为何会很难分开?下次看到狗交配请默默离开

宇宙时空
2026-05-18 17:30:14
2026-05-24 01:15:00
36氪 incentive-icons
36氪
让一部分人先看到未来
151462文章数 2848772关注度
往期回顾 全部

财经要闻

股价暴跌!富途老虎是什么来头?

头条要闻

媒体:针对两岸关系 郑丽文最新表态说了句很直白的话

头条要闻

媒体:针对两岸关系 郑丽文最新表态说了句很直白的话

体育要闻

少年意气,正在改变中国足球

娱乐要闻

《浪姐7》三公,王濛赢麻了,张月实惨

科技要闻

爆炸声中又迈一步!拆解马斯克“十二飞”

汽车要闻

2027款星途瑶光上市 把"全球车"标准卷进13万级市场

态度原创

游戏
房产
艺术
教育
亲子

LCK第二赛段:让一追二,HLE三局战胜NS,Scout尽力了

房产要闻

疯抢511轮!今年海南最魔幻的地块,被福建能源企业抢了!

艺术要闻

5.5亿!上海第二工业大学的新地标,路过都得多看两眼!

教育要闻

变了!南京小升初“剧本”已改写.......

亲子要闻

现在有活干了,我家七岁姐姐上岗,照顾刚出生三天的妹妹,还伺候月子里的妈妈

无障碍浏览 进入关怀版