网易首页 > 网易号 > 正文 申请入驻

OpenAI研究人员研究新模型:将多媒体生成速度提高50倍

0
分享至

鞭牛士报道,10月24日消息,据外电报道,OpenAI 的两位研究人员发表了一篇论文,描述了一种新型模型——具体来说是一种新型的连续时间一致性模型 (sCM)——与传统扩散模型相比,该模型将人工智能生成图像、视频和音频等多媒体的速度提高了 50 倍,生成图像只需近十分之一秒,而常规扩散则需要 5 秒以上的时间。

通过引入 sCM,OpenAI 仅通过两个采样步骤就实现了相当的样本质量,提供了一种在不影响质量的情况下加速生成过程的解决方案。

该项创新在arXiv.org 上发表的预同行评审论文和今天发布的博客文章中进行了描述,作者是程璐和杨松,该项创新使这些模型仅需两步即可生成高质量样本——比以前需要数百步的基于扩散的模型快得多。

Song 还是OpenAI 研究人员(包括前首席科学家 Ilya Sutskever)于2023 年发表的一篇论文的主要作者,该论文提出了一致性模型的概念,即同一轨迹上的点映射到同一初始点。

虽然扩散模型在生成逼真的图像、3D 模型、音频和视频方面取得了出色的效果,但其采样效率低下(通常需要数十到数百个连续步骤)使其不太适合实时应用。

从理论上讲,该技术可以为 OpenAI 的近实时 AI 图像生成模型提供基础。正如 VentureBeat 记者Sean Michael Kerner在我们的内部 Slack 频道中沉思的那样,「DALL-E 4 还会远吗?」

保持高质量,同时加快采样速度

传统的扩散模型需要大量的去噪步骤来生成样本,导致其速度较慢。

相比之下,sCM 可在一两步内直接将噪声转换为高质量样本,从而减少了计算成本和时间。

OpenAI 最大的 sCM 模型拥有 15 亿个参数,可以在单个 A100 GPU 上仅用 0.11 秒生成一个样本。

与扩散模型相比,这使得挂钟时间加快了 50 倍,从而使实时生成 AI 应用更加可行。

使用更少的计算资源达到扩散模型质量

sCM 背后的团队在 ImageNet 512×512 上训练了一个连续时间一致性模型,可扩展至 15 亿个参数。

即使在这种规模下,该模型仍能保持与最佳扩散模型相媲美的样本质量,在 ImageNet 512×512 上实现了 1.88 的 Fréchet 初始距离 (FID) 分数。

这使得样本质量与扩散模型的差异在 10% 以内,而扩散模型需要更多的计算工作量才能获得类似的结果。

基准测试显示性能强劲

OpenAI 的新方法已经与其他最先进的生成模型进行了广泛的对比测试。

通过使用 FID 分数和有效采样计算来测量样本质量,研究表明 sCM 能够以更少的计算开销提供顶级结果。

虽然以前的快速采样方法一直受到样本质量下降或训练设置复杂的困扰,但 sCM 成功克服了这些挑战,兼具速度和高保真度。

sCM 的成功还归功于它能够随着从中提炼知识的教师传播模型按比例扩展。

随着 sCM 和教师扩散模型规模的扩大,样本质量的差距进一步缩小,而 sCM 中采样步骤数的增加会进一步缩小质量差异。

应用和未来用途

sCM 模型的快速采样和可扩展性为跨多个领域的实时生成 AI 开辟了新的可能性。

从图像生成到音频和视频合成,sCM 为需要快速、高质量输出的应用程序提供了实用的解决方案。

此外,OpenAI 的研究暗示了进一步系统优化的潜力,可以进一步提高性能,并根据各个行业的特定需求定制这些模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
10战6负!许利民赛后:长达7分钟反思,浓缩6字整改狠招

10战6负!许利民赛后:长达7分钟反思,浓缩6字整改狠招

话体坛
2026-01-29 01:38:34
北京输球揪出最大毒瘤!他上场9分钟,球队输19分,打的太差了

北京输球揪出最大毒瘤!他上场9分钟,球队输19分,打的太差了

篮球专区
2026-01-28 22:30:34
日本选举黑马胜出,新首相对华态度成最大看点

日本选举黑马胜出,新首相对华态度成最大看点

史鹷的生活科普
2026-01-28 21:11:26
财政压力的下半场:退休人员占比近四成,才是硬账

财政压力的下半场:退休人员占比近四成,才是硬账

超先声
2026-01-09 16:45:39
64岁男子心梗猝死,生前坚持散步五年,医生摇头:3个坏毛病要命

64岁男子心梗猝死,生前坚持散步五年,医生摇头:3个坏毛病要命

路医生健康科普
2026-01-28 13:40:18
伊朗打造“军营互联网”:让8500万民众被锁在国境防火墙之后

伊朗打造“军营互联网”:让8500万民众被锁在国境防火墙之后

cnBeta.COM
2026-01-26 16:49:03
曝涉案俱乐部罚分不降级 国安名宿上禁足名单 苏宁名将或就此退役

曝涉案俱乐部罚分不降级 国安名宿上禁足名单 苏宁名将或就此退役

我爱英超
2026-01-28 22:27:22
78岁路都走不稳还开演唱会捞金,全网恶评如潮,她却扬言回馈粉丝

78岁路都走不稳还开演唱会捞金,全网恶评如潮,她却扬言回馈粉丝

冷紫葉
2026-01-27 15:07:16
iOS 26.3 突然更新,限制跟踪!

iOS 26.3 突然更新,限制跟踪!

黑猫科技迷
2026-01-28 23:17:06
三毛扮演者孟智超回应拍短剧:自己外形不好没钱,只有短剧有机会

三毛扮演者孟智超回应拍短剧:自己外形不好没钱,只有短剧有机会

韩小娱
2026-01-27 16:41:35
男子千里送发动机后续:客户正脸曝光 全款已退不再合作 警方介入

男子千里送发动机后续:客户正脸曝光 全款已退不再合作 警方介入

离离言几许
2026-01-28 00:13:38
贝克汉姆14岁女儿挎香奈儿,却也比父母节俭,“不上学”引发争议

贝克汉姆14岁女儿挎香奈儿,却也比父母节俭,“不上学”引发争议

译言
2026-01-28 08:36:25
格雷茨卡:若拜仁对我像最终对待穆勒那样,我会感到失望

格雷茨卡:若拜仁对我像最终对待穆勒那样,我会感到失望

懂球帝
2026-01-29 02:36:04
尼帕病毒气势汹汹!对我们春节有影响吗?它害怕这5件事,记住了

尼帕病毒气势汹汹!对我们春节有影响吗?它害怕这5件事,记住了

现代小青青慕慕
2026-01-28 09:11:03
“感谢你给浙江生这么多廉价劳工”,贵州妈妈炫耀,尴尬的是自己

“感谢你给浙江生这么多廉价劳工”,贵州妈妈炫耀,尴尬的是自己

泽泽先生
2026-01-23 21:37:21
“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

“戏混子”没走,比资本家丑孩子更可怕的是“星二代”开始世袭了

流史岁月
2026-01-26 10:58:30
特朗普闯下大祸,总统位将不保?奥巴马重出江湖,克林顿联手逼宫

特朗普闯下大祸,总统位将不保?奥巴马重出江湖,克林顿联手逼宫

墨印斋
2026-01-28 15:43:03
汪小菲接俩娃回北京,玥儿长高超像大S,打雪仗时一个动作好暖心

汪小菲接俩娃回北京,玥儿长高超像大S,打雪仗时一个动作好暖心

无心小姐姐
2026-01-27 00:44:27
邮报:斯特林何错之有?挥霍无度的切尔西才是足坛反面教材

邮报:斯特林何错之有?挥霍无度的切尔西才是足坛反面教材

懂球帝
2026-01-29 02:46:03
曾是上海申花队长,退役后全家移居美国,没想到他早已回国再就业

曾是上海申花队长,退役后全家移居美国,没想到他早已回国再就业

泠泠说史
2026-01-28 18:40:58
2026-01-29 03:15:00
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
103447文章数 61684关注度
往期回顾 全部

科技要闻

它是神也是毒!Clawdbot改名卷入千万诈骗

头条要闻

俄总统助理:泽连斯基若愿与普京会晤 可来莫斯科

头条要闻

俄总统助理:泽连斯基若愿与普京会晤 可来莫斯科

体育要闻

没天赋的CBA第一小前锋,秘诀只有一个字

娱乐要闻

金子涵拉黑蔡徐坤,蔡徐坤工作室回应

财经要闻

从万科退休20天后,郁亮疑似失联

汽车要闻

新手必看!冰雪路面不敢开?记住这4点 关键时刻真能保命

态度原创

教育
旅游
艺术
手机
时尚

教育要闻

回龙观二小赴南农小学做“三自”课堂分享会

旅游要闻

普陀:城市亲水公园美丽景色等你来解锁

艺术要闻

沙特醒悟,“全球最大单体建筑”停止施工!

手机要闻

HyperOS 3.1淘汰名单:REDMI K60、POCO F5在列,有你的手机吗

想年前用3周“刷新”好状态?做第一点就够

无障碍浏览 进入关怀版