网易首页 > 网易号 > 正文 申请入驻

OpenAI发布新模型sCM,生成速度提升50倍,两位华人担任论文作者

0
分享至

扩散模型(Diffusion Model)如今已被广泛应用于 AI 多媒体生成领域。

虽然它在生成逼真的图像、3D 模型、音频和视频方面取得了令人瞩目的成果,但其最大的短板在于采样和生成速度过慢。

为了应对这一挑战,业界已提出了多种扩散蒸馏技术,例如直接蒸馏、对抗蒸馏、渐进蒸馏和变分分数蒸馏等。

然而,这些方法要么需要大量样本、计算成本高昂,要么训练复杂度较高、样本多样性有限。

近日,OpenAI 的研究团队发布了一项新研究成果,旨在为这一问题提供新的解决方案。

他们探索了一种可简化、稳定化和可扩展的新模型,OpenAI 官网更新了该成果的简介,相关论文发表在预印本平台arXiv上。

在论文中,研究人员介绍了一种全新的“连续时间一致性模型(sCM,continuous-time consistency model)”。

该模型可以让 AI 生成多媒体内容的速度提升 50 倍,为未来更快速、更高效的实时 AI 生成应用开辟了广阔前景。

简单来说,sCM 是基于传统扩散模型改进的新模型。通常情况下,这些模型在产出一个样本之前,必须经历数十至数百个连续的步骤,这种低效率严重限制了其在实时应用场景中的使用。

而 OpenAI 新提出的 sCM 模型改变了这一局面,它只需要两个采样步骤就能生成出与传统扩散模型相媲美的高质量内容,使高效 AI 生成应用成为可能。

据介绍,sCM 是在一致性模型(CM,Consistency Model)的基础上开发的。

研究人员吸取了 EDM 流匹配(Flow Matching)技术的优点,提出了 TrigFlow。这是一个统一的框架,大大简化了模型的构建过程。

研究团队还分析了 CM 训练不稳定的根本原因,基于此他们提出解决方案,例如改进网络架构中的时间调节和自适应组规范化。

此外,他们还重新制定了连续时间 CM 的训练目标,结合了关键词的自适应加权和规范化,配合渐进退火,进而实现稳定且可扩展的训练。

值得一提的是,该论文作者之一、 OpenAI 战略探索团队负责人宋飏(Yang Song)曾与 OpenAI 前首席科学家伊利亚·萨茨克维尔(Ilya Sutskever)合作,在 2023 年首次提出了 CM 的概念。如前文所说,这一概念为本次研究奠定了重要基础。

这种创新方法的效果惊艳。研究人员在 CIFAR-10、ImageNet 64×64 和 ImageNet 512×512 上训练 sCM 模型,最大的模型拥有 15 亿个参数,是迄今为止训练的最大 CM 模型。

这个模型仅需 0.11 秒就能在单个 A100 图形处理器(GPU,Graphics Processing Unit)上生成一个样本。

相比之下,传统扩散模型需要超过 5 秒。这种显著的速度提升不仅提高了生产效率,还为实时交互应用创造了可能。


(来源:OpenAI)

在图像质量评估方面,该模型在 ImageNet 512×512 上实现了 1.88 的 FID(Fréchet Inception Distance,一种评估生成模型性能的指标)评分,与需要数百个采样步骤的最佳扩散模型相比,质量差距只有不到 10%。

在 CIFAR-10 和 ImageNet 64×64 等数据集上,sCM 同样表现出色,分别获得了 2.06 和 1.48 的 FID 评分。

这些成绩证明,快速生成与高质量输出并非不可兼得,sCM 成功实现了两者的平衡,同时保证了通用性,也展示了其在不同场景下的适应能力。

OpenAI 介绍称,从技术原理来看,传统扩散模型实现生成样本通常有大量去噪步骤的过程,这也是其速度慢的主要原因。

而 sCM 模型则采用了更直接的方式,可以在一至两个步骤内直接把噪声转成高质量样本,从而大幅降低了计算成本和时间。

更令人兴奋的是,研究发现 sCM 的性能会随着“教师扩散模型(Teacher Diffusion Model,用于知识蒸馏的预训练模型)”的规模扩大而同步提升。

两者的规模在都扩大的情况下,它们的样本质量差距将逐渐缩小,而增加 sCM 的采样步骤则能够进一步减小该差异。这种可扩展性为未来模型的进一步优化提供了明确的方向。

尽管如此,这项技术仍存在一些局限性。最好的 sCM 模型仍然需要依赖预训练的扩散模型来进行初始化和蒸馏,这导致其在样本质量上与“教师模型”之间仍有一定差距。

此外,FID 评分作为样本质量的衡量标准也有其自身的局限性,评分的接近并不总能完全反映实际的样本质量,这些问题也将成为未来的改进方向。

研究团队对媒体表示,通过系统优化,sCM 的性能还有提升空间。这种优化可能包括更高效的计算方法、更先进的架构设计,以及更优的训练策略。

这些潜在的改进将使 sCM 在更多领域发挥作用,以满足不同行业的具体需求。

“我们将继续致力于开发更好的生成模型,提高推理速度和样本质量。”

OpenAI 写道,“我们相信,这些进步将为更广泛的实时、高质量生成式 AI 应用带来新的可能性。”

参考资料:

https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

https://arxiv.org/pdf/2410.11081

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
今日!CCTV5直播孙颖莎王楚钦领衔国乒出战,5+转CBA,网络转NBA

今日!CCTV5直播孙颖莎王楚钦领衔国乒出战,5+转CBA,网络转NBA

晚池
2026-05-07 00:26:26
男人搞定50岁女人最好方法,喂饱了她两个需求,她就会主动依你

男人搞定50岁女人最好方法,喂饱了她两个需求,她就会主动依你

心理观察局
2026-05-04 08:20:08
警惕,日本向南海发射两枚反舰导弹,精准命中一艘军舰

警惕,日本向南海发射两枚反舰导弹,精准命中一艘军舰

爱吃醋的猫咪
2026-05-06 20:48:49
游客坠落前喊了两遍“没绑紧”,视频中有人笑,整个过程不到20秒

游客坠落前喊了两遍“没绑紧”,视频中有人笑,整个过程不到20秒

魔都姐姐杂谈
2026-05-05 22:13:52
女邻居让我帮她接电线,黑暗中我们抱到了一起,但她没有松手

女邻居让我帮她接电线,黑暗中我们抱到了一起,但她没有松手

千秋文化
2026-05-04 18:34:54
16岁女子玩悬崖秋千坠亡:生前17秒视频曝光,旁人哄笑,错失救援

16岁女子玩悬崖秋千坠亡:生前17秒视频曝光,旁人哄笑,错失救援

李晚书
2026-05-06 10:46:28
湖北恩施州委书记胡超文,被查

湖北恩施州委书记胡超文,被查

大风新闻
2026-05-06 12:24:23
球员通道画面流出!利物浦四大球星遭怒斥:不尊重曼联太轻浮

球员通道画面流出!利物浦四大球星遭怒斥:不尊重曼联太轻浮

夜白侃球
2026-05-06 09:25:01
三星899美元清库存,这操作我看不懂

三星899美元清库存,这操作我看不懂

Ping值焦虑
2026-05-05 20:09:35
伊朗常驻联合国代表团提出解决霍尔木兹海峡问题的可行方案:永久结束战争,解除海上封锁,恢复正常通行

伊朗常驻联合国代表团提出解决霍尔木兹海峡问题的可行方案:永久结束战争,解除海上封锁,恢复正常通行

财联社
2026-05-07 01:10:29
丹麦最美小公主14岁了!获三位亲哥哥“举高高”合影

丹麦最美小公主14岁了!获三位亲哥哥“举高高”合影

世界王室那些事
2026-05-06 15:57:09
三星宣布停止在中国大陆市场销售所有家电产品

三星宣布停止在中国大陆市场销售所有家电产品

叮当当科技
2026-05-07 01:57:51
C罗购入全球限量20台定制奔驰G63敞篷版,车门踏板镶嵌CR7

C罗购入全球限量20台定制奔驰G63敞篷版,车门踏板镶嵌CR7

衔春信
2026-05-06 16:59:27
黑尾酱,彻底消失了?

黑尾酱,彻底消失了?

生如稗草
2026-03-15 08:48:11
20+23+22+30!这就是活塞给他5200万美金大合同的原因

20+23+22+30!这就是活塞给他5200万美金大合同的原因

世界体育圈
2026-05-06 16:12:48
3名儿童在“泾渭分明”渭河侧落水,多方回应:或走“野路”去的河边,其中2人被找到时已无生命体征,暂无失联人员确切位置

3名儿童在“泾渭分明”渭河侧落水,多方回应:或走“野路”去的河边,其中2人被找到时已无生命体征,暂无失联人员确切位置

极目新闻
2026-05-06 18:37:39
上海G1胜山东发布会!卢伟点赞关键球发挥,古德温仍在自我反思!

上海G1胜山东发布会!卢伟点赞关键球发挥,古德温仍在自我反思!

篮球资讯达人
2026-05-06 23:32:02
《低智商犯罪》被观众要求下架!理由:主演招人烦、演技尴尬

《低智商犯罪》被观众要求下架!理由:主演招人烦、演技尴尬

林轻吟
2026-05-06 19:40:05
吴宜泽夺冠,最激动的除卖房托举他的父母,还有敢扑进他怀里的她

吴宜泽夺冠,最激动的除卖房托举他的父母,还有敢扑进他怀里的她

林轻吟
2026-05-06 17:00:10
日本刚收到“天大好消息”,转身发现中国通告全球,不怕把事闹大

日本刚收到“天大好消息”,转身发现中国通告全球,不怕把事闹大

说历史的老牢
2026-05-06 03:41:33
2026-05-07 06:27:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16668文章数 514923关注度
往期回顾 全部

科技要闻

“马斯克不懂AI”:OpenAI当庭戳老底

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

头条要闻

伊朗:美动用所有军事手段也无法开通霍尔木兹海峡

体育要闻

活塞1比0骑士:坎宁安不再是一个人了

娱乐要闻

谢娜演唱会暗藏惊喜 何炅瞒天过海现身

财经要闻

估值450亿美元 大基金被曝将投资DeepSeek

汽车要闻

领克10/领克10+ 无论能源形式 领克都要快乐

态度原创

时尚
教育
本地
手机
军事航空

有些路,不必每一步都走得那么用力

教育要闻

女学霸发明“咯噔字体”,老师低分警告:别用个性挑战考试底线

本地新闻

用青花瓷的方式,打开西溪湿地

手机要闻

红米Turbo 6 Max硬刚iQOO Neo12,谁才是卷王?

军事要闻

实施不到48小时 特朗普紧急喊停"霍尔木兹自由计划"

无障碍浏览 进入关怀版