网易首页 > 网易号 > 正文 申请入驻

北大发起 Open-Sora计划:旨在复现Sora模型「承认与OpenAI差距巨大只因缺资源」

0
分享至

  

   本文为 879 ,建议阅读 2分钟

  北京大学Yuangroup团队发起了一个 Open-Sora开源计划,旨在复制OpenAI(close AI)的视频生成模型sora‍

本项目希望通过开源社区的力量复现Sora,由北大-兔展AIGC联合实验室共同发起,当前资源有限仅搭建了基础架构,无法进行完整训练,希望通过开源社区逐步增加模块并筹集资源进行训练,当前版本离目标差距巨大,仍需持续完善和快速迭代

  Open-Sora框架由以下组成部分组成

  1.Video VQ-VAE:这是一个压缩视频到时间和空间维度的潜在表示的组件。它可以将高分辨率视频压缩成低维度的表示,便于后续的处理和生成。

  2.Denoising Diffusion Transformer:去噪扩散变换器(Denoising Diffusion Transformer)这个组件用于从潜在表示中生成视频,通过逐步减少噪声来恢复视频的详细内容。

  3.Condition Encoder:条件编码器(Condition Encoder)支持多种条件输入,允许模型根据不同的文本描述或其他条件生成视频内容。

  

  Open sora 实现细节
1.可变长宽比

  北大团队参考FIT实施了一种动态掩码策略, 以并行批量训练的同时保持灵活的长宽比。具体来说, 将高分辨率视频在保持长宽比的同时下采样至最长边为256像素, 然后在右侧和底部用零填充至一致的256x256分辨率。这样便于videovae以批量编码视频, 以及便于扩散模型使用注意力掩码对批量潜变量进行去噪。

  

  2.可变分辨率

  在推理过程中, 尽管目前是在固定的256x256分辨率上进行训练, 但北大团队使用位置插值可以实现可变分辨率采样。将可变分辨率噪声潜变量的位置索引从[0, seq_length-1]下调到[0, 255],以使其与预训练范围对齐。这种调整使得基于注意力的扩散模型能够处理更高分辨率的序列

  3.可变时长

  北大团队使用VideoGPT中的Video VQ-VAE, 将视频压缩至潜在空间, 并且支持变时长生成。同时扩展空间位置插值至时空维度, 实现对变时长视频的处理

  

  结语

  该项目旨在创建一个简单且可扩展的存储库,以重现Sora(OpenAI,但我们更喜欢称其为“CloseAI”)。然而,北大团队的资源有限,研究人员衷心希望所有开源社区都能为这个项目做出贡献

  目前训练代码现已发布!在github项目页面了解更多信息。请随时关注此资源库以获取最新更新

  项目地址:

  https://pku-yuangroup.github.io/Open-Sora-Plan/blog_cn.html

  Github地址:

  https://github.com/PKU-YuanGroup/Open-Sora-Plan

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
庚欣:赖清德“台独自白”,美国怎么想?

庚欣:赖清德“台独自白”,美国怎么想?

直新闻
2024-05-22 22:42:43
中超昨晚再现罕见1幕:当红外援不满被换下,拒绝与教练握手!

中超昨晚再现罕见1幕:当红外援不满被换下,拒绝与教练握手!

中超球评
2024-05-23 11:10:00
惨烈!上海又一芯片公司破产!被强制清算!

惨烈!上海又一芯片公司破产!被强制清算!

感知芯视界
2024-05-23 09:19:35
美军官员称中方围绕台湾地区军演“令人担忧”,外交部回应

美军官员称中方围绕台湾地区军演“令人担忧”,外交部回应

澎湃新闻
2024-05-23 15:38:27
本周重大事件:多地上演“高校外迁潮”,近半数银行人均薪酬下降

本周重大事件:多地上演“高校外迁潮”,近半数银行人均薪酬下降

一周财经观察
2024-05-22 18:23:45
中方是否计划在台湾地区周围举行更多惩戒性演习?外交部回应

中方是否计划在台湾地区周围举行更多惩戒性演习?外交部回应

澎湃新闻
2024-05-23 15:42:26
侯佩岑坚定表明立场!台湾省网友破防评论区围攻,扬言抵制其事业

侯佩岑坚定表明立场!台湾省网友破防评论区围攻,扬言抵制其事业

萌神木木
2024-05-23 12:56:02
辽宁庄河发生重大刑事案件:6人死亡,更多内幕曝光令人唏嘘不已

辽宁庄河发生重大刑事案件:6人死亡,更多内幕曝光令人唏嘘不已

白马惊天剑
2024-05-23 12:54:03
国家已经很不容易了!希望全体中国人认清形势,不要再人云亦云

国家已经很不容易了!希望全体中国人认清形势,不要再人云亦云

星辰故事屋
2024-05-22 20:15:28
外贸熄火,内需不足,中国经济面临的问题,究竟是谁的责任?

外贸熄火,内需不足,中国经济面临的问题,究竟是谁的责任?

庞明说财经
2024-05-22 22:15:23
美国宣布将自8月1日开始对中国电动汽车、电池和芯片加征关税

美国宣布将自8月1日开始对中国电动汽车、电池和芯片加征关税

界面新闻
2024-05-23 08:38:05
大学校园兴起“奶头乐”,不少大学生深陷其中,家长却浑然不知!

大学校园兴起“奶头乐”,不少大学生深陷其中,家长却浑然不知!

财经要参
2024-05-23 08:18:49
仁至义尽!只要巴萨承诺教练组成员的薪资,哈维愿放弃大部分薪水

仁至义尽!只要巴萨承诺教练组成员的薪资,哈维愿放弃大部分薪水

直播吧
2024-05-23 16:14:14
解放军无预兆包围台岛?东部战区突然行动,究竟是演训还是实战

解放军无预兆包围台岛?东部战区突然行动,究竟是演训还是实战

懂体育的小吖头
2024-05-23 10:13:39
众星转发“台湾不是一个国家”,蔡依林等人沉默:台艺人都哑了?

众星转发“台湾不是一个国家”,蔡依林等人沉默:台艺人都哑了?

拾娱先生
2024-05-22 23:25:35
香港大学这几百内地生惨了,几百万打水漂还可能面临最高刑罚14年的监禁,伙同黑中介学历造假最终害人害己!

香港大学这几百内地生惨了,几百万打水漂还可能面临最高刑罚14年的监禁,伙同黑中介学历造假最终害人害己!

澳门月刊
2024-05-23 07:44:26
520当天结婚1.4万对,比去年1.6万激增13.4%?四川民政闹出个数学笑话

520当天结婚1.4万对,比去年1.6万激增13.4%?四川民政闹出个数学笑话

可达鸭面面观
2024-05-23 16:35:02
哈佛拒绝向13名支持巴勒斯坦的学生颁发毕业证

哈佛拒绝向13名支持巴勒斯坦的学生颁发毕业证

花非花008
2024-05-23 12:15:16
英伟达,爆了!黄仁勋直呼:下一场工业革命已开始

英伟达,爆了!黄仁勋直呼:下一场工业革命已开始

华尔街见闻官方
2024-05-23 09:29:02
官宣!丘索维金娜受伤基本无缘巴黎奥运会,理论可能:拿外卡参赛

官宣!丘索维金娜受伤基本无缘巴黎奥运会,理论可能:拿外卡参赛

体坛扒客
2024-05-23 17:05:05
2024-05-23 18:06:44
AI寒武纪
AI寒武纪
专注于人工智能,科技领域
187文章数 80关注度
往期回顾 全部

科技要闻

黄仁勋业绩会万字实录:我们的压力太大了

头条要闻

美军官称中方围绕台湾地区军演"令人担忧" 外交部回应

头条要闻

美军官称中方围绕台湾地区军演"令人担忧" 外交部回应

体育要闻

CBA最有价值球员,为何在总决赛迷失?

娱乐要闻

大S儿子被学校退学,张兰称孙子没人管

财经要闻

宗馥莉接棒100天,钟睒睒站在大门外

汽车要闻

上汽大通大家7超混/大家9超混将于6月7日正式上市

态度原创

健康
艺术
亲子
手机
教育

在中国,到底哪些人在吃“伟哥”?

艺术要闻

穿越时空的艺术:《马可·波罗》AI沉浸影片探索人类文明

亲子要闻

妈妈比爸爸厉害的家庭,后来都怎样了

手机要闻

OPPO Reno12 Pro图赏:金属流动,紫色幻想

教育要闻

“护士vs教师”,都是事业编差距却不是一星半点,幸好当初没选错

无障碍浏览 进入关怀版