网易首页 > 网易号 > 正文 申请入驻

OpenAI研究人员研究新模型:将多媒体生成速度提高50倍

0
分享至

鞭牛士报道,10月24日消息,据外电报道,OpenAI 的两位研究人员发表了一篇论文,描述了一种新型模型——具体来说是一种新型的连续时间一致性模型 (sCM)——与传统扩散模型相比,该模型将人工智能生成图像、视频和音频等多媒体的速度提高了 50 倍,生成图像只需近十分之一秒,而常规扩散则需要 5 秒以上的时间。

通过引入 sCM,OpenAI 仅通过两个采样步骤就实现了相当的样本质量,提供了一种在不影响质量的情况下加速生成过程的解决方案。

该项创新在arXiv.org 上发表的预同行评审论文和今天发布的博客文章中进行了描述,作者是程璐和杨松,该项创新使这些模型仅需两步即可生成高质量样本——比以前需要数百步的基于扩散的模型快得多。

Song 还是OpenAI 研究人员(包括前首席科学家 Ilya Sutskever)于2023 年发表的一篇论文的主要作者,该论文提出了一致性模型的概念,即同一轨迹上的点映射到同一初始点。

虽然扩散模型在生成逼真的图像、3D 模型、音频和视频方面取得了出色的效果,但其采样效率低下(通常需要数十到数百个连续步骤)使其不太适合实时应用。

从理论上讲,该技术可以为 OpenAI 的近实时 AI 图像生成模型提供基础。正如 VentureBeat 记者Sean Michael Kerner在我们的内部 Slack 频道中沉思的那样,「DALL-E 4 还会远吗?」

保持高质量,同时加快采样速度

传统的扩散模型需要大量的去噪步骤来生成样本,导致其速度较慢。

相比之下,sCM 可在一两步内直接将噪声转换为高质量样本,从而减少了计算成本和时间。

OpenAI 最大的 sCM 模型拥有 15 亿个参数,可以在单个 A100 GPU 上仅用 0.11 秒生成一个样本。

与扩散模型相比,这使得挂钟时间加快了 50 倍,从而使实时生成 AI 应用更加可行。

使用更少的计算资源达到扩散模型质量

sCM 背后的团队在 ImageNet 512×512 上训练了一个连续时间一致性模型,可扩展至 15 亿个参数。

即使在这种规模下,该模型仍能保持与最佳扩散模型相媲美的样本质量,在 ImageNet 512×512 上实现了 1.88 的 Fréchet 初始距离 (FID) 分数。

这使得样本质量与扩散模型的差异在 10% 以内,而扩散模型需要更多的计算工作量才能获得类似的结果。

基准测试显示性能强劲

OpenAI 的新方法已经与其他最先进的生成模型进行了广泛的对比测试。

通过使用 FID 分数和有效采样计算来测量样本质量,研究表明 sCM 能够以更少的计算开销提供顶级结果。

虽然以前的快速采样方法一直受到样本质量下降或训练设置复杂的困扰,但 sCM 成功克服了这些挑战,兼具速度和高保真度。

sCM 的成功还归功于它能够随着从中提炼知识的教师传播模型按比例扩展。

随着 sCM 和教师扩散模型规模的扩大,样本质量的差距进一步缩小,而 sCM 中采样步骤数的增加会进一步缩小质量差异。

应用和未来用途

sCM 模型的快速采样和可扩展性为跨多个领域的实时生成 AI 开辟了新的可能性。

从图像生成到音频和视频合成,sCM 为需要快速、高质量输出的应用程序提供了实用的解决方案。

此外,OpenAI 的研究暗示了进一步系统优化的潜力,可以进一步提高性能,并根据各个行业的特定需求定制这些模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女子称退150多元大衣时不慎寄走奔驰钥匙,“配一把6000元”!网店工作人员:若看到会给她

女子称退150多元大衣时不慎寄走奔驰钥匙,“配一把6000元”!网店工作人员:若看到会给她

极目新闻
2026-02-01 10:11:45
从低谷到逆袭!妃光莉靠“贵妇气质”征服全网,38岁依旧风情万种

从低谷到逆袭!妃光莉靠“贵妇气质”征服全网,38岁依旧风情万种

小飞爱生活1987
2026-02-02 07:27:56
2月开始,走出低谷,事业爱情同步回暖的三个星座

2月开始,走出低谷,事业爱情同步回暖的三个星座

小晴星座说
2026-01-30 19:06:54
一个很明显的事实:国产DDR5芯片,已救不了全球内存市场了

一个很明显的事实:国产DDR5芯片,已救不了全球内存市场了

科技专家
2026-02-01 19:34:24
国防部说的“You wish”,是什么意思?

国防部说的“You wish”,是什么意思?

大象新闻
2026-01-31 15:13:02
10个普通地级市GDP过万亿,徐州距离万亿城市只差“一点”

10个普通地级市GDP过万亿,徐州距离万亿城市只差“一点”

第一财经资讯
2026-02-02 12:34:14
军权交接仪式刚结束,委代总统就收到命令:立刻驱逐中国外交官

军权交接仪式刚结束,委代总统就收到命令:立刻驱逐中国外交官

诗酒趁的年华
2026-02-01 19:48:09
大蒜塞耳朵里太厉害了,10个人9个都用得到,看完赶快叮嘱家人

大蒜塞耳朵里太厉害了,10个人9个都用得到,看完赶快叮嘱家人

妙招酷
2025-12-02 00:06:08
军权刚到手,委代总统就收命令,立即驱逐中方外交官,是真是假?

军权刚到手,委代总统就收命令,立即驱逐中方外交官,是真是假?

影孖看世界
2026-01-31 18:05:26
沪昆高速衢州段又堵了!江西刚通8车道就堵,网友说治低速车才行

沪昆高速衢州段又堵了!江西刚通8车道就堵,网友说治低速车才行

离离言几许
2026-02-02 12:00:39
李亚鹏找到医院新址,直播眼里泛泪,房东心态崩了,只求过个好年

李亚鹏找到医院新址,直播眼里泛泪,房东心态崩了,只求过个好年

子芫伴你成长
2026-01-25 08:10:03
演员李嘉明自曝一天片酬1500元!称靠这个养家糊口,早就饿死了

演员李嘉明自曝一天片酬1500元!称靠这个养家糊口,早就饿死了

小徐讲八卦
2026-01-31 12:23:49
第一代小米SU7停产,雷军吓了车圈一跳

第一代小米SU7停产,雷军吓了车圈一跳

李东阳朋友圈
2026-02-02 14:35:48
住建部副部长李晓龙,赴山东履新,任副省长

住建部副部长李晓龙,赴山东履新,任副省长

上观新闻
2026-02-02 13:19:39
43岁姚笛近况曝光!演话剧复出状态好,嫁富商再次遭辜负让人唏嘘

43岁姚笛近况曝光!演话剧复出状态好,嫁富商再次遭辜负让人唏嘘

代军哥哥谈娱乐
2026-02-01 12:41:42
30年前黄金80一克,女子囤了几公斤,工行、建行等多家银行发布风险

30年前黄金80一克,女子囤了几公斤,工行、建行等多家银行发布风险

东方豪侠
2026-02-01 19:49:40
刘炜之后,上海男篮终于迎来了新的后场核心?

刘炜之后,上海男篮终于迎来了新的后场核心?

新民晚报
2026-02-02 10:38:25
千万遗产拱手让给俩孩,具俊晔回韩国倒计时,这一次不再是软饭男

千万遗产拱手让给俩孩,具俊晔回韩国倒计时,这一次不再是软饭男

琴声飞扬
2026-01-31 14:39:50
退伍士兵因档案丢失找不到工作,28年后惊觉,自己的国企工作名额竟被堂弟冒名顶替

退伍士兵因档案丢失找不到工作,28年后惊觉,自己的国企工作名额竟被堂弟冒名顶替

史海孤雁
2026-01-21 17:05:08
真不识货!被易立弃用的2名球员,如今在新东家,都成了球队大腿

真不识货!被易立弃用的2名球员,如今在新东家,都成了球队大腿

金山话体育
2026-02-02 09:42:25
2026-02-02 16:24:49
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
103444文章数 61685关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

武契奇预测:48小时内伊朗遇袭

头条要闻

武契奇预测:48小时内伊朗遇袭

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

周杰伦带王俊凯陈奕迅聚餐 畅聊音乐

财经要闻

沪银、钯、铂等十几个品种集体跌停

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

房产
亲子
健康
游戏
军事航空

房产要闻

狂卖1548亿后,海南又上演疯狂抢地!

亲子要闻

孩子在你身边一天天长大的样子

耳石症分类型,症状大不同

被腾讯辜负的动作网游奠基者,至今仍坚挺营运,如今携S1版本归来

军事要闻

委内瑞拉外长会见美外交使团团长

无障碍浏览 进入关怀版