网易首页 > 网易号 > 正文 申请入驻

OpenAI发布新模型sCM,生成速度提升50倍,两位华人担任论文作者

0
分享至

扩散模型(Diffusion Model)如今已被广泛应用于 AI 多媒体生成领域。

虽然它在生成逼真的图像、3D 模型、音频和视频方面取得了令人瞩目的成果,但其最大的短板在于采样和生成速度过慢。

为了应对这一挑战,业界已提出了多种扩散蒸馏技术,例如直接蒸馏、对抗蒸馏、渐进蒸馏和变分分数蒸馏等。

然而,这些方法要么需要大量样本、计算成本高昂,要么训练复杂度较高、样本多样性有限。

近日,OpenAI 的研究团队发布了一项新研究成果,旨在为这一问题提供新的解决方案。

他们探索了一种可简化、稳定化和可扩展的新模型,OpenAI 官网更新了该成果的简介,相关论文发表在预印本平台arXiv上。

在论文中,研究人员介绍了一种全新的“连续时间一致性模型(sCM,continuous-time consistency model)”。

该模型可以让 AI 生成多媒体内容的速度提升 50 倍,为未来更快速、更高效的实时 AI 生成应用开辟了广阔前景。

简单来说,sCM 是基于传统扩散模型改进的新模型。通常情况下,这些模型在产出一个样本之前,必须经历数十至数百个连续的步骤,这种低效率严重限制了其在实时应用场景中的使用。

而 OpenAI 新提出的 sCM 模型改变了这一局面,它只需要两个采样步骤就能生成出与传统扩散模型相媲美的高质量内容,使高效 AI 生成应用成为可能。

据介绍,sCM 是在一致性模型(CM,Consistency Model)的基础上开发的。

研究人员吸取了 EDM 流匹配(Flow Matching)技术的优点,提出了 TrigFlow。这是一个统一的框架,大大简化了模型的构建过程。

研究团队还分析了 CM 训练不稳定的根本原因,基于此他们提出解决方案,例如改进网络架构中的时间调节和自适应组规范化。

此外,他们还重新制定了连续时间 CM 的训练目标,结合了关键词的自适应加权和规范化,配合渐进退火,进而实现稳定且可扩展的训练。

值得一提的是,该论文作者之一、 OpenAI 战略探索团队负责人宋飏(Yang Song)曾与 OpenAI 前首席科学家伊利亚·萨茨克维尔(Ilya Sutskever)合作,在 2023 年首次提出了 CM 的概念。如前文所说,这一概念为本次研究奠定了重要基础。

这种创新方法的效果惊艳。研究人员在 CIFAR-10、ImageNet 64×64 和 ImageNet 512×512 上训练 sCM 模型,最大的模型拥有 15 亿个参数,是迄今为止训练的最大 CM 模型。

这个模型仅需 0.11 秒就能在单个 A100 图形处理器(GPU,Graphics Processing Unit)上生成一个样本。

相比之下,传统扩散模型需要超过 5 秒。这种显著的速度提升不仅提高了生产效率,还为实时交互应用创造了可能。


(来源:OpenAI)

在图像质量评估方面,该模型在 ImageNet 512×512 上实现了 1.88 的 FID(Fréchet Inception Distance,一种评估生成模型性能的指标)评分,与需要数百个采样步骤的最佳扩散模型相比,质量差距只有不到 10%。

在 CIFAR-10 和 ImageNet 64×64 等数据集上,sCM 同样表现出色,分别获得了 2.06 和 1.48 的 FID 评分。

这些成绩证明,快速生成与高质量输出并非不可兼得,sCM 成功实现了两者的平衡,同时保证了通用性,也展示了其在不同场景下的适应能力。

OpenAI 介绍称,从技术原理来看,传统扩散模型实现生成样本通常有大量去噪步骤的过程,这也是其速度慢的主要原因。

而 sCM 模型则采用了更直接的方式,可以在一至两个步骤内直接把噪声转成高质量样本,从而大幅降低了计算成本和时间。

更令人兴奋的是,研究发现 sCM 的性能会随着“教师扩散模型(Teacher Diffusion Model,用于知识蒸馏的预训练模型)”的规模扩大而同步提升。

两者的规模在都扩大的情况下,它们的样本质量差距将逐渐缩小,而增加 sCM 的采样步骤则能够进一步减小该差异。这种可扩展性为未来模型的进一步优化提供了明确的方向。

尽管如此,这项技术仍存在一些局限性。最好的 sCM 模型仍然需要依赖预训练的扩散模型来进行初始化和蒸馏,这导致其在样本质量上与“教师模型”之间仍有一定差距。

此外,FID 评分作为样本质量的衡量标准也有其自身的局限性,评分的接近并不总能完全反映实际的样本质量,这些问题也将成为未来的改进方向。

研究团队对媒体表示,通过系统优化,sCM 的性能还有提升空间。这种优化可能包括更高效的计算方法、更先进的架构设计,以及更优的训练策略。

这些潜在的改进将使 sCM 在更多领域发挥作用,以满足不同行业的具体需求。

“我们将继续致力于开发更好的生成模型,提高推理速度和样本质量。”

OpenAI 写道,“我们相信,这些进步将为更广泛的实时、高质量生成式 AI 应用带来新的可能性。”

参考资料:

https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

https://arxiv.org/pdf/2410.11081

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
存款达到这个数,你的家就算稳了!2026年最新家庭安全感自查表

存款达到这个数,你的家就算稳了!2026年最新家庭安全感自查表

白浅娱乐聊
2026-07-04 21:05:39
点射打破僵局!姆巴佩5场7球追平梅西 世界杯淘汰赛11球历史第1人

点射打破僵局!姆巴佩5场7球追平梅西 世界杯淘汰赛11球历史第1人

风过乡
2026-07-05 06:41:39
小糯米五官长开后,完全复刻了年少时期杨幂的模样,灵动眉眼

小糯米五官长开后,完全复刻了年少时期杨幂的模样,灵动眉眼

小椰的奶奶
2026-07-04 16:10:15
43岁上海女子每晚都找2个男模,3个月花450万,女子老板讨要说法

43岁上海女子每晚都找2个男模,3个月花450万,女子老板讨要说法

汉史趣闻
2026-07-04 20:19:50
韩红要崩溃了!央视重温播放《天路》,是原唱巴桑版本,评论炸锅

韩红要崩溃了!央视重温播放《天路》,是原唱巴桑版本,评论炸锅

火山詩话
2026-07-03 08:34:47
我国为什么有两个中央军委?

我国为什么有两个中央军委?

荷兰豆爱健康
2026-07-05 01:57:06
曾志伟单干拍新剧,TVB老将集体出走,港娱生态悄悄变了

曾志伟单干拍新剧,TVB老将集体出走,港娱生态悄悄变了

乡野小珥
2026-07-04 17:44:35
我买房后,父母在隔壁买套小两居给弟弟,隔天回家看房本我傻了!

我买房后,父母在隔壁买套小两居给弟弟,隔天回家看房本我傻了!

麦子情感故事
2026-07-05 00:23:10
日本3小时两震,高市正在访印,自卫队击沉美军军舰,俄发出警告

日本3小时两震,高市正在访印,自卫队击沉美军军舰,俄发出警告

青衫书生本尊
2026-07-04 15:20:34
哈梅内伊遗体告别仪式上,伊朗议长哭到身体不停颤抖,穆杰塔巴未出席,其岳父现身仪式

哈梅内伊遗体告别仪式上,伊朗议长哭到身体不停颤抖,穆杰塔巴未出席,其岳父现身仪式

极目新闻
2026-07-04 13:39:08
糯康临刑吐露实情,金三角毒枭不惧武警枪械,唯独忌惮尘封密令

糯康临刑吐露实情,金三角毒枭不惧武警枪械,唯独忌惮尘封密令

唠叨说历史
2026-07-03 17:01:04
真正的学霸分水岭在高中:语文定江山!英语稳江山!数学得天下!

真正的学霸分水岭在高中:语文定江山!英语稳江山!数学得天下!

娱乐的宅急便
2026-07-03 03:08:50
8000万成本,《万米危机》夺冠,释小龙差一个机会,就和谢苗一样

8000万成本,《万米危机》夺冠,释小龙差一个机会,就和谢苗一样

电影票房预告片
2026-07-04 19:05:44
2026年是改革开放以来留给普通人最后一次翻身的机会

2026年是改革开放以来留给普通人最后一次翻身的机会

流苏晚晴
2026-07-04 19:03:13
WTT美国大满贯:单打4人进半决赛!王艺迪速胜,早田出局林德惨败

WTT美国大满贯:单打4人进半决赛!王艺迪速胜,早田出局林德惨败

全言作品
2026-07-05 06:14:37
钱再多有啥用!“展昭”何家劲的现状,给所有老年男性提了个醒

钱再多有啥用!“展昭”何家劲的现状,给所有老年男性提了个醒

元宝课堂
2026-06-22 20:49:31
哈梅内伊葬礼,一个“死去”的人突然现身,让美以脊背发凉

哈梅内伊葬礼,一个“死去”的人突然现身,让美以脊背发凉

怎挽怎挽
2026-07-04 05:37:26
日本人准备登钓鱼岛,就等高市发话?美国也介入了,中方动作更快

日本人准备登钓鱼岛,就等高市发话?美国也介入了,中方动作更快

优趣纪史记
2026-07-04 19:24:13
哈马斯白麻雀被永久掩埋!以军耗时3个月摧毁加沙最大地下工事

哈马斯白麻雀被永久掩埋!以军耗时3个月摧毁加沙最大地下工事

北山战史
2026-07-04 15:38:29
美国大满贯:火力全开痛击韩国华裔名将!王艺迪4-0朱芊曦晋级4强

美国大满贯:火力全开痛击韩国华裔名将!王艺迪4-0朱芊曦晋级4强

钉钉陌上花开
2026-07-05 05:37:01
2026-07-05 06:59:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16924文章数 515078关注度
往期回顾 全部

科技要闻

韬定律论文V2版,充工程细节和实测数据

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

头条要闻

老人被一次拔12颗牙种10颗:能刷的钱都刷走 只剩30块

体育要闻

揭法国锋线最大优势 有人比姆巴佩还快?

娱乐要闻

白鹿打戏抠图惹非议 连累丞磊遭扒皮

财经要闻

韩国股市杠杆失控:450亿美元资金狂飙

汽车要闻

方程豹钛9内饰曝光 用上了长联屏设计/下半年上市

态度原创

时尚
教育
旅游
艺术
手机

别再说"露肩衣服 "难驾驭!看看这几组日常穿搭,大方有回头率

教育要闻

内蒙古一名小学生被同学嘲笑穿假鞋,班主任即兴德育课触动无数网友

旅游要闻

山野逐夏 乐享清凉!五莲黑虎山盛夏欢乐季火热启幕

艺术要闻

八大山人迷之印章 你认得几个?

手机要闻

华为和苹果霸榜前二,小米仅排第五名!

无障碍浏览 进入关怀版