网易首页 > 网易号 > 正文 申请入驻

OpenAI发布新模型sCM,生成速度提升50倍,两位华人担任论文作者

0
分享至

扩散模型(Diffusion Model)如今已被广泛应用于 AI 多媒体生成领域。

虽然它在生成逼真的图像、3D 模型、音频和视频方面取得了令人瞩目的成果,但其最大的短板在于采样和生成速度过慢。

为了应对这一挑战,业界已提出了多种扩散蒸馏技术,例如直接蒸馏、对抗蒸馏、渐进蒸馏和变分分数蒸馏等。

然而,这些方法要么需要大量样本、计算成本高昂,要么训练复杂度较高、样本多样性有限。

近日,OpenAI 的研究团队发布了一项新研究成果,旨在为这一问题提供新的解决方案。

他们探索了一种可简化、稳定化和可扩展的新模型,OpenAI 官网更新了该成果的简介,相关论文发表在预印本平台arXiv上。

在论文中,研究人员介绍了一种全新的“连续时间一致性模型(sCM,continuous-time consistency model)”。

该模型可以让 AI 生成多媒体内容的速度提升 50 倍,为未来更快速、更高效的实时 AI 生成应用开辟了广阔前景。

简单来说,sCM 是基于传统扩散模型改进的新模型。通常情况下,这些模型在产出一个样本之前,必须经历数十至数百个连续的步骤,这种低效率严重限制了其在实时应用场景中的使用。

而 OpenAI 新提出的 sCM 模型改变了这一局面,它只需要两个采样步骤就能生成出与传统扩散模型相媲美的高质量内容,使高效 AI 生成应用成为可能。

据介绍,sCM 是在一致性模型(CM,Consistency Model)的基础上开发的。

研究人员吸取了 EDM 流匹配(Flow Matching)技术的优点,提出了 TrigFlow。这是一个统一的框架,大大简化了模型的构建过程。

研究团队还分析了 CM 训练不稳定的根本原因,基于此他们提出解决方案,例如改进网络架构中的时间调节和自适应组规范化。

此外,他们还重新制定了连续时间 CM 的训练目标,结合了关键词的自适应加权和规范化,配合渐进退火,进而实现稳定且可扩展的训练。

值得一提的是,该论文作者之一、 OpenAI 战略探索团队负责人宋飏(Yang Song)曾与 OpenAI 前首席科学家伊利亚·萨茨克维尔(Ilya Sutskever)合作,在 2023 年首次提出了 CM 的概念。如前文所说,这一概念为本次研究奠定了重要基础。

这种创新方法的效果惊艳。研究人员在 CIFAR-10、ImageNet 64×64 和 ImageNet 512×512 上训练 sCM 模型,最大的模型拥有 15 亿个参数,是迄今为止训练的最大 CM 模型。

这个模型仅需 0.11 秒就能在单个 A100 图形处理器(GPU,Graphics Processing Unit)上生成一个样本。

相比之下,传统扩散模型需要超过 5 秒。这种显著的速度提升不仅提高了生产效率,还为实时交互应用创造了可能。


(来源:OpenAI)

在图像质量评估方面,该模型在 ImageNet 512×512 上实现了 1.88 的 FID(Fréchet Inception Distance,一种评估生成模型性能的指标)评分,与需要数百个采样步骤的最佳扩散模型相比,质量差距只有不到 10%。

在 CIFAR-10 和 ImageNet 64×64 等数据集上,sCM 同样表现出色,分别获得了 2.06 和 1.48 的 FID 评分。

这些成绩证明,快速生成与高质量输出并非不可兼得,sCM 成功实现了两者的平衡,同时保证了通用性,也展示了其在不同场景下的适应能力。

OpenAI 介绍称,从技术原理来看,传统扩散模型实现生成样本通常有大量去噪步骤的过程,这也是其速度慢的主要原因。

而 sCM 模型则采用了更直接的方式,可以在一至两个步骤内直接把噪声转成高质量样本,从而大幅降低了计算成本和时间。

更令人兴奋的是,研究发现 sCM 的性能会随着“教师扩散模型(Teacher Diffusion Model,用于知识蒸馏的预训练模型)”的规模扩大而同步提升。

两者的规模在都扩大的情况下,它们的样本质量差距将逐渐缩小,而增加 sCM 的采样步骤则能够进一步减小该差异。这种可扩展性为未来模型的进一步优化提供了明确的方向。

尽管如此,这项技术仍存在一些局限性。最好的 sCM 模型仍然需要依赖预训练的扩散模型来进行初始化和蒸馏,这导致其在样本质量上与“教师模型”之间仍有一定差距。

此外,FID 评分作为样本质量的衡量标准也有其自身的局限性,评分的接近并不总能完全反映实际的样本质量,这些问题也将成为未来的改进方向。

研究团队对媒体表示,通过系统优化,sCM 的性能还有提升空间。这种优化可能包括更高效的计算方法、更先进的架构设计,以及更优的训练策略。

这些潜在的改进将使 sCM 在更多领域发挥作用,以满足不同行业的具体需求。

“我们将继续致力于开发更好的生成模型,提高推理速度和样本质量。”

OpenAI 写道,“我们相信,这些进步将为更广泛的实时、高质量生成式 AI 应用带来新的可能性。”

参考资料:

https://openai.com/index/simplifying-stabilizing-and-scaling-continuous-time-consistency-models/

https://arxiv.org/pdf/2410.11081

运营/排版:何晨龙

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
偷情发生关系时,女性为何主动要男人说一些“下流话”?

偷情发生关系时,女性为何主动要男人说一些“下流话”?

文雅笔墨
2025-09-17 01:04:38
县委书记的女儿逛庙会,不小心撞了镇长的女儿,镇长说要她赔钱

县委书记的女儿逛庙会,不小心撞了镇长的女儿,镇长说要她赔钱

乔生桂
2025-09-18 19:01:41
没有捞快钱,拒绝国乒安排,退役4年,丁宁年薪曝光,级别意外

没有捞快钱,拒绝国乒安排,退役4年,丁宁年薪曝光,级别意外

体育有点水
2025-09-18 14:23:31
琼瑶自杀真相大揭秘,根本不是因为身体的原因

琼瑶自杀真相大揭秘,根本不是因为身体的原因

介知
2025-09-10 11:42:24
0-4垫底!欧冠头号大礼包出炉:7场1胜崩盘,6000万核心盼投国米

0-4垫底!欧冠头号大礼包出炉:7场1胜崩盘,6000万核心盼投国米

小火箭爱体育
2025-09-18 11:02:40
高速能跑140km/小时?网传新政引热议

高速能跑140km/小时?网传新政引热议

大象新闻
2025-09-16 12:47:03
他是原上海市委书记,坚决反对两个凡是,1983年当选人大副委员长

他是原上海市委书记,坚决反对两个凡是,1983年当选人大副委员长

秀心文雅
2025-09-17 18:46:38
腾讯、阿里、百度集体发行!

腾讯、阿里、百度集体发行!

证券时报
2025-09-18 21:12:02
痛心!陈树棋因公牺牲,年仅27岁……

痛心!陈树棋因公牺牲,年仅27岁……

鲁中晨报
2025-09-18 13:35:18
穆里尼奥:我的愿望是履行完两年合同,并且让本菲卡愿意续约

穆里尼奥:我的愿望是履行完两年合同,并且让本菲卡愿意续约

懂球帝
2025-09-19 01:15:10
入秋后,建议糖尿病患者:早饭切记“4不吃”,血糖平稳一整天

入秋后,建议糖尿病患者:早饭切记“4不吃”,血糖平稳一整天

坠入二次元的海洋
2025-09-17 11:45:33
大批星链卫星坠落!中国空间站还有3名航天员,罪魁祸首和它有关

大批星链卫星坠落!中国空间站还有3名航天员,罪魁祸首和它有关

粤语音乐喷泉
2025-09-18 12:53:55
4种茶尽量别喝,严重可致癌,很多人还经常喝

4种茶尽量别喝,严重可致癌,很多人还经常喝

DrX说
2025-09-18 14:09:35
一眼醉!洋河把“酒瓶”立在南京,近百米高!

一眼醉!洋河把“酒瓶”立在南京,近百米高!

GA环球建筑
2025-09-16 09:16:52
一个简单的蹲下,国乒队员却很费劲的需要双手撑地缓冲才能完成!

一个简单的蹲下,国乒队员却很费劲的需要双手撑地缓冲才能完成!

大昆说台球
2025-09-19 01:18:09
山本五十六在偷袭珍珠港成功后,仰天长叹:日本已经输掉了战争。

山本五十六在偷袭珍珠港成功后,仰天长叹:日本已经输掉了战争。

抽象派大师
2025-09-18 14:34:22
樊振东下周亮相德甲第四轮,此前连赢两场,球队排名攀升至第三

樊振东下周亮相德甲第四轮,此前连赢两场,球队排名攀升至第三

夕落秋山
2025-09-19 03:41:48
陈梦霸气回归!态度很明确,目标不止是冠军,孙颖莎王曼昱压力大

陈梦霸气回归!态度很明确,目标不止是冠军,孙颖莎王曼昱压力大

白面书誏
2025-09-18 11:14:11
孟婆劝告:如果身边人身上有这个味道,立马远离,他们不属于人间

孟婆劝告:如果身边人身上有这个味道,立马远离,他们不属于人间

古怪奇谈录
2025-08-30 11:46:59
网友反映湖南一学校将公共厕所改成宿舍让学生居住,屋内四个蹲便都是半敞开,校方、教育局回应

网友反映湖南一学校将公共厕所改成宿舍让学生居住,屋内四个蹲便都是半敞开,校方、教育局回应

极目新闻
2025-09-18 13:33:07
2025-09-19 05:36:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
15638文章数 514088关注度
往期回顾 全部

科技要闻

英伟达50亿美元投资英特尔,但代工免谈

头条要闻

男子给小35岁情人转1340万 妻子:第三者生活极度奢侈

头条要闻

男子给小35岁情人转1340万 妻子:第三者生活极度奢侈

体育要闻

身高170的他,让196的博尔特坐不住了

娱乐要闻

最美央视才女,甩掉孙红雷嫁给张嘉益

财经要闻

起底多校“发臭午餐”供应商绿捷

汽车要闻

女神代言/新增配色/智能升级 26款腾势N9售38.98万起

态度原创

艺术
数码
本地
公开课
军事航空

艺术要闻

故宫珍藏的墨迹《十七帖》,比拓本更精良,这才是地道的魏晋写法

数码要闻

揭秘!Meta最新AI眼镜,用了多少颗艾为芯?

本地新闻

云游中国|谁懂!在天下第一关拍到史诗感大片

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

哈马斯高层在多哈遇袭后首次现身

无障碍浏览 进入关怀版