网易首页 > 网易号 > 正文 申请入驻

OpenAI发布新模型sCM,生成速度提升50倍,两位华人担任论文作者

0
分享至

扩散模型(Diffusion Model)如今已被广泛应用于 AI 多媒体生成领域。

虽然它在生成逼真的图像、3D 模型、音频和视频方面取得了令人瞩目的成果,但其最大的短板在于采样和生成速度过慢。

为了应对这一挑战,业界已提出了多种扩散蒸馏技术,例如直接蒸馏、对抗蒸馏、渐进蒸馏和变分分数蒸馏等。

然而,这些方法要么需要大量样本、计算成本高昂,要么训练复杂度较高、样本多样性有限。

近日,OpenAI 的研究团队发布了一项新研究成果,旨在为这一问题提供新的解决方案。

他们探索了一种可简化、稳定化和可扩展的新模型,OpenAI 官网更新了该成果的简介,相关论文发表在预印本平台arXiv上。

在论文中,研究人员介绍了一种全新的“连续时间一致性模型(sCM,continuous-time consistency model)”。

该模型可以让 AI 生成多媒体内容的速度提升 50 倍,为未来更快速、更高效的实时 AI 生成应用开辟了广阔前景。

简单来说,sCM 是基于传统扩散模型改进的新模型。通常情况下,这些模型在产出一个样本之前,必须经历数十至数百个连续的步骤,这种低效率严重限制了其在实时应用场景中的使用。

而 OpenAI 新提出的 sCM 模型改变了这一局面,它只需要两个采样步骤就能生成出与传统扩散模型相媲美的高质量内容,使高效 AI 生成应用成为可能。

据介绍,sCM 是在一致性模型(CM,Consistency Model)的基础上开发的。

研究人员吸取了 EDM 流匹配(Flow Matching)技术的优点,提出了 TrigFlow。这是一个统一的框架,大大简化了模型的构建过程。

研究团队还分析了 CM 训练不稳定的根本原因,基于此他们提出解决方案,例如改进网络架构中的时间调节和自适应组规范化。

此外,他们还重新制定了连续时间 CM 的训练目标,结合了关键词的自适应加权和规范化,配合渐进退火,进而实现稳定且可扩展的训练。

值得一提的是,该论文作者之一、 OpenAI 战略探索团队负责人宋飏(Yang Song)曾与 OpenAI 前首席科学家伊利亚·萨茨克维尔(Ilya Sutskever)合作,在 2023 年首次提出了 CM 的概念。如前文所说,这一概念为本次研究奠定了重要基础。

这种创新方法的效果惊艳。研究人员在 CIFAR-10、ImageNet 64×64 和 ImageNet 512×512 上训练 sCM 模型,最大的模型拥有 15 亿个参数,是迄今为止训练的最大 CM 模型。

这个模型仅需 0.11 秒就能在单个 A100 图形处理器(GPU,Graphics Processing Unit)上生成一个样本。

相比之下,传统扩散模型需要超过 5 秒。这种显著的速度提升不仅提高了生产效率,还为实时交互应用创造了可能。


(来源:OpenAI)

在图像质量评估方面,该模型在 ImageNet 512×512 上实现了 1.88 的 FID(Fréchet Inception Distance,一种评估生成模型性能的指标)评分,与需要数百个采样步骤的最佳扩散模型相比,质量差距只有不到 10%。

在 CIFAR-10 和 ImageNet 64×64 等数据集上,sCM 同样表现出色,分别获得了 2.06 和 1.48 的 FID 评分。

这些成绩证明,快速生成与高质量输出并非不可兼得,sCM 成功实现了两者的平衡,同时保证了通用性,也展示了其在不同场景下的适应能力。

OpenAI 介绍称,从技术原理来看,传统扩散模型实现生成样本通常有大量去噪步骤的过程,这也是其速度慢的主要原因。

而 sCM 模型则采用了更直接的方式,可以在一至两个步骤内直接把噪声转成高质量样本,从而大幅降低了计算成本和时间。

更令人兴奋的是,研究发现 sCM 的性能会随着“教师扩散模型(Teacher Diffusion Model,用于知识蒸馏的预训练模型)”的规模扩大而同步提升。

两者的规模在都扩大的情况下,它们的样本质量差距将逐渐缩小,而增加 sCM 的采样步骤则能够进一步减小该差异。这种可扩展性为未来模型的进一步优化提供了明确的方向。

尽管如此,这项技术仍存在一些局限性。最好的 sCM 模型仍然需要依赖预训练的扩散模型来进行初始化和蒸馏,这导致其在样本质量上与“教师模型”之间仍有一定差距。

此外,FID 评分作为样本质量的衡量标准也有其自身的局限性,评分的接近并不总能完全反映实际的样本质量,这些问题也将成为未来的改进方向。

研究团队对媒体表示,通过系统优化,sCM 的性能还有提升空间。这种优化可能包括更高效的计算方法、更先进的架构设计,以及更优的训练策略。

这些潜在的改进将使 sCM 在更多领域发挥作用,以满足不同行业的具体需求。

“我们将继续致力于开发更好的生成模型,提高推理速度和样本质量。”

OpenAI 写道,“我们相信,这些进步将为更广泛的实时、高质量生成式 AI 应用带来新的可能性。”

参考资料:

https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

https://arxiv.org/pdf/2410.11081

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
输在关键球!上海男篮不敌深圳男篮,9连胜遭终结

输在关键球!上海男篮不敌深圳男篮,9连胜遭终结

五星体育
2026-01-13 21:46:55
美方通告全球,中方大幅抛售美债,特朗普终于动手,美联储将换人

美方通告全球,中方大幅抛售美债,特朗普终于动手,美联储将换人

史料布籍
2026-01-13 23:09:06
杭州保姆纵火案通灵实录:通灵人与被害人交流,得知朱小贞真实死因

杭州保姆纵火案通灵实录:通灵人与被害人交流,得知朱小贞真实死因

可儿故事汇
2024-08-29 12:50:53
刘亦菲内衣照被骂上热搜:她的胸,碍了谁的眼?

刘亦菲内衣照被骂上热搜:她的胸,碍了谁的眼?

吃瓜党二号头目
2026-01-13 11:53:55
广西一精神小妹结婚,身上多处纹身新郎小她10岁,网友:相当炸裂

广西一精神小妹结婚,身上多处纹身新郎小她10岁,网友:相当炸裂

唐小糖说情感
2026-01-07 16:37:28
目标小组第一!U23国足踢泰国前瞻,安东尼奥表态,两人缺席

目标小组第一!U23国足踢泰国前瞻,安东尼奥表态,两人缺席

祥谈体育
2026-01-13 20:02:27
徐帆回应离婚5个月,冯小刚近况曝光,他的“小心思”再藏不住了

徐帆回应离婚5个月,冯小刚近况曝光,他的“小心思”再藏不住了

李健政观察
2026-01-13 09:23:56
高雄市长挺谁?最新深绿区街头民调结果一面倒

高雄市长挺谁?最新深绿区街头民调结果一面倒

新时光点滴
2026-01-13 03:37:40
中国舰队开进好望角,美式霸权开始打颤,南方国家要自己说话了

中国舰队开进好望角,美式霸权开始打颤,南方国家要自己说话了

勇志歌
2026-01-12 20:16:31
董卓巅峰时阵容有多牛?麾下两个顶级谋士、三位元帅、十余名猛将

董卓巅峰时阵容有多牛?麾下两个顶级谋士、三位元帅、十余名猛将

铭记历史呀
2025-12-16 18:54:04
新华社消息|美国国务院要求美国公民立即离开伊朗

新华社消息|美国国务院要求美国公民立即离开伊朗

新华社
2026-01-13 09:49:13
退休10年后被查的“老虎”:8万元入股张家界大峡谷,退居“二线”后获利数千万元

退休10年后被查的“老虎”:8万元入股张家界大峡谷,退居“二线”后获利数千万元

上观新闻
2026-01-13 13:04:18
官方:巴萨租借坎塞洛至赛季末,据悉租借费400万欧

官方:巴萨租借坎塞洛至赛季末,据悉租借费400万欧

懂球帝
2026-01-13 20:33:07
不是意外!中国女导演坠亡前遭暴力,监控曝细节,嫌疑人竟是恩师

不是意外!中国女导演坠亡前遭暴力,监控曝细节,嫌疑人竟是恩师

墨印斋
2026-01-12 17:24:01
传奇名宿怒批大师赛球桌引热议!戴维斯:球桌袋口大,根本不公平

传奇名宿怒批大师赛球桌引热议!戴维斯:球桌袋口大,根本不公平

世界体坛观察家
2026-01-13 17:32:01
最担心的还是来了!呆呆家刨猪汤结束不到一天,反成了众矢之的

最担心的还是来了!呆呆家刨猪汤结束不到一天,反成了众矢之的

好贤观史记
2026-01-13 16:33:19
最多领先33分!恩比德27+8+7失误76人轻取猛龙 马克西33分

最多领先33分!恩比德27+8+7失误76人轻取猛龙 马克西33分

醉卧浮生
2026-01-13 10:58:37
你知道女性的阴道有多长吗?或许与你所想,完全不同!

你知道女性的阴道有多长吗?或许与你所想,完全不同!

战争茶馆
2025-11-26 10:33:50
砸60亿!广西贺州这座“沉睡的巨人”终于要醒了?

砸60亿!广西贺州这座“沉睡的巨人”终于要醒了?

GA环球建筑
2026-01-12 19:42:19
香港知名女星生日大解放,中门大开,大秀火辣身材,公开要招桃花

香港知名女星生日大解放,中门大开,大秀火辣身材,公开要招桃花

不甜的李子
2026-01-10 18:52:46
2026-01-13 23:51:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16120文章数 514482关注度
往期回顾 全部

科技要闻

每年10亿美元!谷歌大模型注入Siri

头条要闻

员工被辞退索赔89万遭公司反诉索赔214万 历时2年判了

头条要闻

员工被辞退索赔89万遭公司反诉索赔214万 历时2年判了

体育要闻

他带出国乒世界冠军,退休后为爱徒返场

娱乐要闻

蔡卓妍承认新恋情,与男友林俊贤感情稳定

财经要闻

"天量存款"将到期 资金会否搬入股市?

汽车要闻

限时9.99万元起 2026款启辰大V DD-i虎鲸上市

态度原创

教育
艺术
时尚
数码
本地

教育要闻

最惨英国大学!

艺术要闻

书法争议再起:拙与妍孰优孰劣引发热议

今年春天,外套长一点会更美!

数码要闻

苹果推出Apple Creator Studio,汇聚系列Apple创意类App

本地新闻

云游内蒙|到巴彦淖尔去,赴一场塞上江南的邀约

无障碍浏览 进入关怀版