网易首页 > 网易号 > 正文 申请入驻

OpenAI发布新模型sCM,生成速度提升50倍,两位华人担任论文作者

0
分享至

扩散模型(Diffusion Model)如今已被广泛应用于 AI 多媒体生成领域。

虽然它在生成逼真的图像、3D 模型、音频和视频方面取得了令人瞩目的成果,但其最大的短板在于采样和生成速度过慢。

为了应对这一挑战,业界已提出了多种扩散蒸馏技术,例如直接蒸馏、对抗蒸馏、渐进蒸馏和变分分数蒸馏等。

然而,这些方法要么需要大量样本、计算成本高昂,要么训练复杂度较高、样本多样性有限。

近日,OpenAI 的研究团队发布了一项新研究成果,旨在为这一问题提供新的解决方案。

他们探索了一种可简化、稳定化和可扩展的新模型,OpenAI 官网更新了该成果的简介,相关论文发表在预印本平台arXiv上。

在论文中,研究人员介绍了一种全新的“连续时间一致性模型(sCM,continuous-time consistency model)”。

该模型可以让 AI 生成多媒体内容的速度提升 50 倍,为未来更快速、更高效的实时 AI 生成应用开辟了广阔前景。

简单来说,sCM 是基于传统扩散模型改进的新模型。通常情况下,这些模型在产出一个样本之前,必须经历数十至数百个连续的步骤,这种低效率严重限制了其在实时应用场景中的使用。

而 OpenAI 新提出的 sCM 模型改变了这一局面,它只需要两个采样步骤就能生成出与传统扩散模型相媲美的高质量内容,使高效 AI 生成应用成为可能。

据介绍,sCM 是在一致性模型(CM,Consistency Model)的基础上开发的。

研究人员吸取了 EDM 流匹配(Flow Matching)技术的优点,提出了 TrigFlow。这是一个统一的框架,大大简化了模型的构建过程。

研究团队还分析了 CM 训练不稳定的根本原因,基于此他们提出解决方案,例如改进网络架构中的时间调节和自适应组规范化。

此外,他们还重新制定了连续时间 CM 的训练目标,结合了关键词的自适应加权和规范化,配合渐进退火,进而实现稳定且可扩展的训练。

值得一提的是,该论文作者之一、 OpenAI 战略探索团队负责人宋飏(Yang Song)曾与 OpenAI 前首席科学家伊利亚·萨茨克维尔(Ilya Sutskever)合作,在 2023 年首次提出了 CM 的概念。如前文所说,这一概念为本次研究奠定了重要基础。

这种创新方法的效果惊艳。研究人员在 CIFAR-10、ImageNet 64×64 和 ImageNet 512×512 上训练 sCM 模型,最大的模型拥有 15 亿个参数,是迄今为止训练的最大 CM 模型。

这个模型仅需 0.11 秒就能在单个 A100 图形处理器(GPU,Graphics Processing Unit)上生成一个样本。

相比之下,传统扩散模型需要超过 5 秒。这种显著的速度提升不仅提高了生产效率,还为实时交互应用创造了可能。


(来源:OpenAI)

在图像质量评估方面,该模型在 ImageNet 512×512 上实现了 1.88 的 FID(Fréchet Inception Distance,一种评估生成模型性能的指标)评分,与需要数百个采样步骤的最佳扩散模型相比,质量差距只有不到 10%。

在 CIFAR-10 和 ImageNet 64×64 等数据集上,sCM 同样表现出色,分别获得了 2.06 和 1.48 的 FID 评分。

这些成绩证明,快速生成与高质量输出并非不可兼得,sCM 成功实现了两者的平衡,同时保证了通用性,也展示了其在不同场景下的适应能力。

OpenAI 介绍称,从技术原理来看,传统扩散模型实现生成样本通常有大量去噪步骤的过程,这也是其速度慢的主要原因。

而 sCM 模型则采用了更直接的方式,可以在一至两个步骤内直接把噪声转成高质量样本,从而大幅降低了计算成本和时间。

更令人兴奋的是,研究发现 sCM 的性能会随着“教师扩散模型(Teacher Diffusion Model,用于知识蒸馏的预训练模型)”的规模扩大而同步提升。

两者的规模在都扩大的情况下,它们的样本质量差距将逐渐缩小,而增加 sCM 的采样步骤则能够进一步减小该差异。这种可扩展性为未来模型的进一步优化提供了明确的方向。

尽管如此,这项技术仍存在一些局限性。最好的 sCM 模型仍然需要依赖预训练的扩散模型来进行初始化和蒸馏,这导致其在样本质量上与“教师模型”之间仍有一定差距。

此外,FID 评分作为样本质量的衡量标准也有其自身的局限性,评分的接近并不总能完全反映实际的样本质量,这些问题也将成为未来的改进方向。

研究团队对媒体表示,通过系统优化,sCM 的性能还有提升空间。这种优化可能包括更高效的计算方法、更先进的架构设计,以及更优的训练策略。

这些潜在的改进将使 sCM 在更多领域发挥作用,以满足不同行业的具体需求。

“我们将继续致力于开发更好的生成模型,提高推理速度和样本质量。”

OpenAI 写道,“我们相信,这些进步将为更广泛的实时、高质量生成式 AI 应用带来新的可能性。”

参考资料:

https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

https://arxiv.org/pdf/2410.11081

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1公斤铀-235释放出的能量有多大?地球上的铀,人类还能用多久?

1公斤铀-235释放出的能量有多大?地球上的铀,人类还能用多久?

魅力科学君
2025-11-07 19:44:51
排队给郭士强道歉?林葳的表现,戳穿了多少伪球迷的真实面目

排队给郭士强道歉?林葳的表现,戳穿了多少伪球迷的真实面目

何咯说
2025-11-19 00:55:40
杨亚洲大儿子一句话:“搬出去住”,倪萍当场落泪

杨亚洲大儿子一句话:“搬出去住”,倪萍当场落泪

青史楼兰
2025-11-18 11:56:35
王思聪成功和懒懒分手,回国的懒懒被曝变卖奢侈品,网友吐槽太贵

王思聪成功和懒懒分手,回国的懒懒被曝变卖奢侈品,网友吐槽太贵

娱乐团长
2025-11-16 15:45:42
几块钱一瓶的维生素B12,或有助改善4种病症,早了解早受益

几块钱一瓶的维生素B12,或有助改善4种病症,早了解早受益

二大爷观世界
2025-11-18 11:43:51
1号线“小心站台间隙”丢了“小”字,北京地铁回应

1号线“小心站台间隙”丢了“小”字,北京地铁回应

新京报
2025-11-18 13:47:03
灯光下灰穿针织衫的美女

灯光下灰穿针织衫的美女

喜欢历史的阿繁
2025-11-19 01:50:59
中国正在上演的诡异经济

中国正在上演的诡异经济

难得君
2025-10-29 19:26:55
中央定调,房地产已经完全明牌了!

中央定调,房地产已经完全明牌了!

山丘楼评
2025-11-12 18:29:13
福特智趣烈马预售22.98万起!网友:内饰很有吸引力

福特智趣烈马预售22.98万起!网友:内饰很有吸引力

汽车网评
2025-11-18 21:04:09
同事天天蹭我午饭,我刚被公司裁员,抱着纸箱出门,他却拦住我

同事天天蹭我午饭,我刚被公司裁员,抱着纸箱出门,他却拦住我

小秋情感说
2025-10-24 14:50:28
收官战还有4天开打,海港却连迎两个坏消息,取胜大连英博有点悬

收官战还有4天开打,海港却连迎两个坏消息,取胜大连英博有点悬

零度眼看球
2025-11-18 08:51:55
文昌阁火灾原因找到了,游客或面临天价赔偿,管理方也难逃追责

文昌阁火灾原因找到了,游客或面临天价赔偿,管理方也难逃追责

可爱的罗
2025-11-15 06:09:33
44岁董洁和男友大连聚餐时被人偶遇 可是纯素颜,那模样简直美翻了

44岁董洁和男友大连聚餐时被人偶遇 可是纯素颜,那模样简直美翻了

阿废冷眼观察所
2025-11-18 06:05:17
截至2025年11月15日,俄罗斯占领乌领土19.3%,涉及8个州1个地区

截至2025年11月15日,俄罗斯占领乌领土19.3%,涉及8个州1个地区

山河路口
2025-11-16 19:18:02
丈夫出轨8年时间向大8岁情人转账超125万,妻子起诉全额返还!二审判决来了

丈夫出轨8年时间向大8岁情人转账超125万,妻子起诉全额返还!二审判决来了

红星新闻
2025-11-18 00:02:11
仇恨才是主流——20%的PA官方报纸文章宣扬反犹太主义

仇恨才是主流——20%的PA官方报纸文章宣扬反犹太主义

老王说正义
2025-11-19 00:03:29
研究发现:常年吃降糖药的人,到70岁后,很多都面临6种健康困扰

研究发现:常年吃降糖药的人,到70岁后,很多都面临6种健康困扰

白宸侃片
2025-11-16 11:31:14
不出意外的话!苏林会成为第二个黎笋

不出意外的话!苏林会成为第二个黎笋

近史谈
2025-11-02 18:54:35
脱钩了?河北社平工资下降0.19%,社保缴费基数却上涨了2.2%

脱钩了?河北社平工资下降0.19%,社保缴费基数却上涨了2.2%

财话连篇
2025-11-18 23:03:32
2025-11-19 04:48:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15873文章数 514306关注度
往期回顾 全部

科技要闻

谷歌CEO警告:若AI泡沫破裂,没公司能幸免

头条要闻

27岁女孩家门口遇害 妈妈痛哭:墙上还有女儿血迹

头条要闻

27岁女孩家门口遇害 妈妈痛哭:墙上还有女儿血迹

体育要闻

结束最后一次对决,陈梦和朱雨玲笑着相拥

娱乐要闻

宋佳夺影后动了谁的奶酪

财经要闻

中美机器人爆发了一场论战

汽车要闻

硬核配置旗舰气场 岚图泰山售37.99万起

态度原创

亲子
艺术
数码
家居
游戏

亲子要闻

程晓玥展示大肚子,二胎4个多月就显怀,孕中期胃口大开才92斤

艺术要闻

你绝对没见过!黎雄才山水画的独特魅力!

数码要闻

华为MatePad系列平板“PC多屏协同”功能正式回归

家居要闻

彰显奢华 意式经典风格

魔兽世界:时光服正式开服,排队时间增加,联盟成香饽饽!

无障碍浏览 进入关怀版