网易首页 > 网易号 > 正文 申请入驻

OpenAI研究人员研究新模型:将多媒体生成速度提高50倍

0
分享至

鞭牛士报道,10月24日消息,据外电报道,OpenAI 的两位研究人员发表了一篇论文,描述了一种新型模型——具体来说是一种新型的连续时间一致性模型 (sCM)——与传统扩散模型相比,该模型将人工智能生成图像、视频和音频等多媒体的速度提高了 50 倍,生成图像只需近十分之一秒,而常规扩散则需要 5 秒以上的时间。

通过引入 sCM,OpenAI 仅通过两个采样步骤就实现了相当的样本质量,提供了一种在不影响质量的情况下加速生成过程的解决方案。

该项创新在arXiv.org 上发表的预同行评审论文和今天发布的博客文章中进行了描述,作者是程璐和杨松,该项创新使这些模型仅需两步即可生成高质量样本——比以前需要数百步的基于扩散的模型快得多。

Song 还是OpenAI 研究人员(包括前首席科学家 Ilya Sutskever)于2023 年发表的一篇论文的主要作者,该论文提出了一致性模型的概念,即同一轨迹上的点映射到同一初始点。

虽然扩散模型在生成逼真的图像、3D 模型、音频和视频方面取得了出色的效果,但其采样效率低下(通常需要数十到数百个连续步骤)使其不太适合实时应用。

从理论上讲,该技术可以为 OpenAI 的近实时 AI 图像生成模型提供基础。正如 VentureBeat 记者Sean Michael Kerner在我们的内部 Slack 频道中沉思的那样,「DALL-E 4 还会远吗?」

保持高质量,同时加快采样速度

传统的扩散模型需要大量的去噪步骤来生成样本,导致其速度较慢。

相比之下,sCM 可在一两步内直接将噪声转换为高质量样本,从而减少了计算成本和时间。

OpenAI 最大的 sCM 模型拥有 15 亿个参数,可以在单个 A100 GPU 上仅用 0.11 秒生成一个样本。

与扩散模型相比,这使得挂钟时间加快了 50 倍,从而使实时生成 AI 应用更加可行。

使用更少的计算资源达到扩散模型质量

sCM 背后的团队在 ImageNet 512×512 上训练了一个连续时间一致性模型,可扩展至 15 亿个参数。

即使在这种规模下,该模型仍能保持与最佳扩散模型相媲美的样本质量,在 ImageNet 512×512 上实现了 1.88 的 Fréchet 初始距离 (FID) 分数。

这使得样本质量与扩散模型的差异在 10% 以内,而扩散模型需要更多的计算工作量才能获得类似的结果。

基准测试显示性能强劲

OpenAI 的新方法已经与其他最先进的生成模型进行了广泛的对比测试。

通过使用 FID 分数和有效采样计算来测量样本质量,研究表明 sCM 能够以更少的计算开销提供顶级结果。

虽然以前的快速采样方法一直受到样本质量下降或训练设置复杂的困扰,但 sCM 成功克服了这些挑战,兼具速度和高保真度。

sCM 的成功还归功于它能够随着从中提炼知识的教师传播模型按比例扩展。

随着 sCM 和教师扩散模型规模的扩大,样本质量的差距进一步缩小,而 sCM 中采样步骤数的增加会进一步缩小质量差异。

应用和未来用途

sCM 模型的快速采样和可扩展性为跨多个领域的实时生成 AI 开辟了新的可能性。

从图像生成到音频和视频合成,sCM 为需要快速、高质量输出的应用程序提供了实用的解决方案。

此外,OpenAI 的研究暗示了进一步系统优化的潜力,可以进一步提高性能,并根据各个行业的特定需求定制这些模型。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
茅台紧急制动:谁敢超过1499指导价就关店!五粮液:新建850家直营

茅台紧急制动:谁敢超过1499指导价就关店!五粮液:新建850家直营

户外钓鱼哥阿旱
2025-11-17 13:54:38
11月17日俄乌:俄罗斯的巨大失败

11月17日俄乌:俄罗斯的巨大失败

山河路口
2025-11-17 17:42:58
越来越疯了!高市早苗再有新动作,日本准备拥核,中俄要早做准备

越来越疯了!高市早苗再有新动作,日本准备拥核,中俄要早做准备

头条爆料007
2025-11-16 21:21:37
学习通今日故障,网友喊话“修慢点”,平台回应:不行,已紧急修复

学习通今日故障,网友喊话“修慢点”,平台回应:不行,已紧急修复

极目新闻
2025-11-17 17:30:02
11月17日俄乌最新:历史性的协议

11月17日俄乌最新:历史性的协议

西楼饮月
2025-11-17 15:06:37
震撼!杨兰兰澳洲案庭审惊天逆转,律师发言掀起轩然大波

震撼!杨兰兰澳洲案庭审惊天逆转,律师发言掀起轩然大波

热点菌本君
2025-11-17 15:53:13
太难了!佛山一工厂发布春节放假通知,网友:回家不用抢火车票了

太难了!佛山一工厂发布春节放假通知,网友:回家不用抢火车票了

火山诗话
2025-11-17 05:42:07
北京最大山姆11月21日开业!排队线已架好,代购火速拉群

北京最大山姆11月21日开业!排队线已架好,代购火速拉群

北京商报
2025-11-17 12:45:44
吉林白城一河道铺设地砖引质疑,当地水利局回应:将调查核实

吉林白城一河道铺设地砖引质疑,当地水利局回应:将调查核实

大风新闻
2025-11-17 15:34:08
荒诞!雷军再遭小米产品反噬:40米潜水手表,小字免责又引火烧身

荒诞!雷军再遭小米产品反噬:40米潜水手表,小字免责又引火烧身

娜乌和西卡
2025-11-17 16:22:27
泰王访华实属无奈?开口就是三大需求,中国不会轻易松口

泰王访华实属无奈?开口就是三大需求,中国不会轻易松口

古事寻踪记
2025-11-17 07:28:16
高市早苗的面相:阴阳蛇相三角克夫克家,所以丈夫瘫痪,没有子女

高市早苗的面相:阴阳蛇相三角克夫克家,所以丈夫瘫痪,没有子女

风月观主
2025-11-17 11:54:57
拔出萝卜带出泥!王曼昱战胜孙颖莎夺冠才发现她和樊振东同病相怜

拔出萝卜带出泥!王曼昱战胜孙颖莎夺冠才发现她和樊振东同病相怜

阿纂看事
2025-11-17 09:01:23
全运会50米仰泳:徐嘉余24秒40夺冠,斩获第4金+仰泳金牌全包揽

全运会50米仰泳:徐嘉余24秒40夺冠,斩获第4金+仰泳金牌全包揽

全景体育V
2025-11-17 19:13:15
多地发文!立即解散约车群、拼车群,否则追究群主法律责任!

多地发文!立即解散约车群、拼车群,否则追究群主法律责任!

网约车焦点
2025-11-17 12:00:54
京东三季报出炉:基本盘稳健,新业务拓展边界

京东三季报出炉:基本盘稳健,新业务拓展边界

陆玖商业评论
2025-11-15 13:08:37
李连杰风波后再发声,动作奇怪口音都变了,外媒披露基因疗法

李连杰风波后再发声,动作奇怪口音都变了,外媒披露基因疗法

古希腊掌管月桂的神
2025-11-17 13:59:26
员工在同事群,八卦领导“彩旗飘飘”被开除!员工委屈诉至法院

员工在同事群,八卦领导“彩旗飘飘”被开除!员工委屈诉至法院

极目新闻
2025-11-17 12:27:20
赣锋锂业董事长惊天预言:2026年碳酸锂价格有望突破15甚至20万元一吨!

赣锋锂业董事长惊天预言:2026年碳酸锂价格有望突破15甚至20万元一吨!

新浪财经
2025-11-17 13:43:16
学生网购40件演出服,7天后成功退货,校方回应来了!商家:都脏得没法再次销售;有商家防“蹭穿”绝招亮了

学生网购40件演出服,7天后成功退货,校方回应来了!商家:都脏得没法再次销售;有商家防“蹭穿”绝招亮了

每日经济新闻
2025-11-17 16:51:08
2025-11-17 19:28:49
鞭牛士 incentive-icons
鞭牛士
准确、快速、有深度的科技媒体
100419文章数 61606关注度
往期回顾 全部

科技要闻

有了通义和夸克,阿里为何再推千问App?

头条要闻

媒体:日本着急派高官来华背后 中方回应有两罕见用词

头条要闻

媒体:日本着急派高官来华背后 中方回应有两罕见用词

体育要闻

当家球星受伤后,球迷乐翻了天?

娱乐要闻

金鸡奖是“照妖镜”,揭露人情冷暖?

财经要闻

疯狂的"吸金村":村民大肆盗采地下水

汽车要闻

新增CDC后变化大吗? 试驾特斯拉model Y L

态度原创

时尚
家居
游戏
本地
数码

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

家居要闻

回廊通道 强化空间秩序

首日全球玩家总数已突破200万,网易这款武侠游戏让老外真香了!

本地新闻

这档古早综艺,怎么就成了年轻人的哆啦A梦?

数码要闻

锐龙AI Max+ 395领衔!AMD启动中国高校AI教育“春雨”计划

无障碍浏览 进入关怀版