网易首页 > 网易号 > 正文 申请入驻

OpenAI研究人员研究新模型:将多媒体生成速度提高50倍

0
分享至

鞭牛士报道,10月24日消息,据外电报道,OpenAI 的两位研究人员发表了一篇论文,描述了一种新型模型——具体来说是一种新型的连续时间一致性模型 (sCM)——与传统扩散模型相比,该模型将人工智能生成图像、视频和音频等多媒体的速度提高了 50 倍,生成图像只需近十分之一秒,而常规扩散则需要 5 秒以上的时间。

通过引入 sCM,OpenAI 仅通过两个采样步骤就实现了相当的样本质量,提供了一种在不影响质量的情况下加速生成过程的解决方案。

该项创新在arXiv.org 上发表的预同行评审论文和今天发布的博客文章中进行了描述,作者是程璐和杨松,该项创新使这些模型仅需两步即可生成高质量样本——比以前需要数百步的基于扩散的模型快得多。

Song 还是OpenAI 研究人员(包括前首席科学家 Ilya Sutskever)于2023 年发表的一篇论文的主要作者,该论文提出了一致性模型的概念,即同一轨迹上的点映射到同一初始点。

虽然扩散模型在生成逼真的图像、3D 模型、音频和视频方面取得了出色的效果,但其采样效率低下(通常需要数十到数百个连续步骤)使其不太适合实时应用。

从理论上讲,该技术可以为 OpenAI 的近实时 AI 图像生成模型提供基础。正如 VentureBeat 记者Sean Michael Kerner在我们的内部 Slack 频道中沉思的那样,「DALL-E 4 还会远吗?」

保持高质量,同时加快采样速度

传统的扩散模型需要大量的去噪步骤来生成样本,导致其速度较慢。

相比之下,sCM 可在一两步内直接将噪声转换为高质量样本,从而减少了计算成本和时间。

OpenAI 最大的 sCM 模型拥有 15 亿个参数,可以在单个 A100 GPU 上仅用 0.11 秒生成一个样本。

与扩散模型相比,这使得挂钟时间加快了 50 倍,从而使实时生成 AI 应用更加可行。

使用更少的计算资源达到扩散模型质量

sCM 背后的团队在 ImageNet 512×512 上训练了一个连续时间一致性模型,可扩展至 15 亿个参数。

即使在这种规模下,该模型仍能保持与最佳扩散模型相媲美的样本质量,在 ImageNet 512×512 上实现了 1.88 的 Fréchet 初始距离 (FID) 分数。

这使得样本质量与扩散模型的差异在 10% 以内,而扩散模型需要更多的计算工作量才能获得类似的结果。

基准测试显示性能强劲

OpenAI 的新方法已经与其他最先进的生成模型进行了广泛的对比测试。

通过使用 FID 分数和有效采样计算来测量样本质量,研究表明 sCM 能够以更少的计算开销提供顶级结果。

虽然以前的快速采样方法一直受到样本质量下降或训练设置复杂的困扰,但 sCM 成功克服了这些挑战,兼具速度和高保真度。

sCM 的成功还归功于它能够随着从中提炼知识的教师传播模型按比例扩展。

随着 sCM 和教师扩散模型规模的扩大,样本质量的差距进一步缩小,而 sCM 中采样步骤数的增加会进一步缩小质量差异。

应用和未来用途

sCM 模型的快速采样和可扩展性为跨多个领域的实时生成 AI 开辟了新的可能性。

从图像生成到音频和视频合成,sCM 为需要快速、高质量输出的应用程序提供了实用的解决方案。

此外,OpenAI 的研究暗示了进一步系统优化的潜力,可以进一步提高性能,并根据各个行业的特定需求定制这些模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
24岁小伙爱上51岁大妈,大妈性欲高还虐待他,结果被小伙砍成5段

24岁小伙爱上51岁大妈,大妈性欲高还虐待他,结果被小伙砍成5段

胖胖侃咖
2024-04-22 08:00:09
反转?记者:本泽马即将加盟新月,恩-内斯里即将加盟吉达联合

反转?记者:本泽马即将加盟新月,恩-内斯里即将加盟吉达联合

懂球帝
2026-02-03 03:03:30
新首相基本确定?高市就赌中国会认栽,话音刚落,俄出手教训日本

新首相基本确定?高市就赌中国会认栽,话音刚落,俄出手教训日本

妙知
2026-02-02 16:15:49
发一张教室女生走光图!

发一张教室女生走光图!

果粉之家
2026-01-30 12:23:03
一个产自浙江的保温杯,在美国被炒到天价,甚至排长队抢购?

一个产自浙江的保温杯,在美国被炒到天价,甚至排长队抢购?

普陀动物世界
2026-02-02 20:39:07
语文很好的孩子,数学可以很差,但数学很好的孩子,语文却不会差

语文很好的孩子,数学可以很差,但数学很好的孩子,语文却不会差

好爸育儿
2026-02-01 22:19:26
罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

罪有应得!官方彻查后,闫学晶再迎噩耗,她最担心的事还是发生了

来科点谱
2026-01-23 11:08:02
这菜隔天吃一次,一降血脂、二降血糖、三降胆固醇,中老年人多吃

这菜隔天吃一次,一降血脂、二降血糖、三降胆固醇,中老年人多吃

江江食研社
2026-02-01 16:30:06
大局已定,今年的返乡潮可能彻底消失了!

大局已定,今年的返乡潮可能彻底消失了!

达文西看世界
2026-01-29 19:30:48
2026春晚阵容封神 近十年最强,爷青回杀疯了,网友:终于能放下手机了

2026春晚阵容封神 近十年最强,爷青回杀疯了,网友:终于能放下手机了

小椰的奶奶
2026-02-02 16:22:13
程潇,奶潇之名已名不符实了

程潇,奶潇之名已名不符实了

阿废冷眼观察所
2026-01-31 15:29:15
鲫鱼立大功!医生研究发现:鲫鱼对这6种疾病有好处,可以常吃

鲫鱼立大功!医生研究发现:鲫鱼对这6种疾病有好处,可以常吃

岐黄传人孙大夫
2026-01-31 15:40:03
华工科技:“下一代超高速光模块研发中心暨高速光模块生产基地建设项目”已于去年8月投产

华工科技:“下一代超高速光模块研发中心暨高速光模块生产基地建设项目”已于去年8月投产

每日经济新闻
2026-02-02 16:53:06
相亲吃饭后男方失联,女方花8000元独自买单,律师:男子行为或构成不当得利

相亲吃饭后男方失联,女方花8000元独自买单,律师:男子行为或构成不当得利

环球网资讯
2026-02-01 13:52:32
三星堆不是没法解释,而是不好解释:再挖下去《山海经》就成真了

三星堆不是没法解释,而是不好解释:再挖下去《山海经》就成真了

铭记历史呀
2026-01-27 18:16:58
男人喝白酒,一定要做到“三不要”

男人喝白酒,一定要做到“三不要”

书写传奇
2026-02-02 07:06:23
阿韦洛亚要下课?穆里尼奥重返伯纳乌 前提只有一个

阿韦洛亚要下课?穆里尼奥重返伯纳乌 前提只有一个

澜归序
2026-02-02 06:51:20
征服中年女人,无需套路:两颗真心,一生相守

征服中年女人,无需套路:两颗真心,一生相守

青苹果sht
2025-11-04 06:10:40
辽宁省管干部任前公示

辽宁省管干部任前公示

黄河新闻网吕梁频道
2026-02-02 14:17:13
不结婚怎么解决生理需求?56岁的歌唱家张也,用行动给出了答案

不结婚怎么解决生理需求?56岁的歌唱家张也,用行动给出了答案

娱说瑜悦
2026-01-24 13:34:35
2026-02-03 03:19:00
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
103444文章数 61685关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

头条要闻

周生生足金挂坠戴1天被刮花 检测后发现含铁、银、钯

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

亲子
教育
艺术
公开课
军事航空

亲子要闻

萌娃哄生气的妈妈,人小鬼大逗得妈妈生不起气来了

教育要闻

俞敏洪说“一大半老师不合格”?别急着骂,先听他说完

艺术要闻

2026年,中国最值得期待的20个新建筑

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版