网易首页 > 网易号 > 正文 申请入驻

中国大模型里程碑!智源Emu3登《自然》正刊封面,攻克多模态“大一统”难题

0
分享至

由 文心大模型 生成的文章摘要

这篇文章主要介绍了中国智源研


近日,国际顶级学术期刊《自然》(Nature)正刊封面迎来一项来自中国的人工智能突破性成果——智源研究院研发的多模态大模型Emu3,以“通过预测下一个词元进行多模态学习”的核心研究,成为我国科研机构主导的大模型成果中首个登上该刊正刊封面的案例。据悉,该研究成果于1月28日在线上线,预计2月12日正式刊发纸质版,不仅证明了“预测下一个词元”范式可统一处理文本、图像、视频三大模态,更以单一Transformer架构实现了多模态“大一统”,其后续迭代版本Emu3.5更具备物理世界模拟能力,为通用人工智能(AGI)奠定坚实理论基础,标志着中国多模态大模型研究正式跻身国际第一梯队,打破了国际顶尖AI研究的格局。

自2018年以来,“预测下一个词元”(Next-token prediction,NTP)的自回归路线凭借ChatGPT等突破性成果,彻底改变了语言大模型的发展轨迹,开启了生成式人工智能的浪潮,也引发了全球关于通用人工智能早期迹象的广泛讨论。但长期以来,这一高效范式的潜力始终局限于语言领域,多模态模型的发展则陷入“分治”困境——图像生成依赖扩散模型、视觉语言理解依赖CLIP与大语言模型的组合架构,不同模态采用截然不同的技术路线,导致模型设计复杂、训练成本高昂,且难以实现多任务性能的协同提升,“自回归路线能否成为多模态学习的通用路线”成为困扰全球AI科研界的未解之谜。

智源研究院团队的Emu3模型,正是针对这一核心难题的颠覆性突破。不同于传统多模态模型的“组合式”设计,Emu3采用“单Transformer + 纯下一个词元预测”的极简思路,将文本、图像、视频三大模态统一离散化到同一个表示空间中,从零开始在多模态序列混合数据上进行联合训练,无需依赖扩散模型、对比学习等专门路线,仅通过单一Transformer架构,就实现了多模态生成与感知任务的端到端统一。《自然》编辑对该成果给予高度评价,认为Emu3仅基于“预测下一个词元”,便实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线的成熟模型相当,对构建可扩展、统一的多模态智能系统具有里程碑式的重要意义。

作为这项创新范式的核心支撑,Emu3的技术设计展现出极强的简洁性与高效性。研究团队研发了一款稳定且通用的视觉分词器(tokenizer),可将连续的图像、视频信号高效转换为离散词元,与文本词元实现统一编码——该分词器能够将512×512图像或4×512×512视频片段编码为4096个离散词元,同时具备时空增强、多分辨率适配等特性,在720×720分辨率下的视频重建质量优异,PSNR达24.30、SSIM达0.771。在模型架构上,Emu3沿用大语言模型的解码器架构,仅针对多模态场景进行少量适配,通过RMSNorm归一化、GQA注意力机制等优化,平衡了性能与计算效率,无需为不同模态设计专用分支,真正实现了“大一统”的架构设计。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
大跌19.36%!福石控股50岁董事长兼总经理被留置

大跌19.36%!福石控股50岁董事长兼总经理被留置

红星资本局
2026-02-03 09:29:04
国投白银LOF今日复牌再度跌停

国投白银LOF今日复牌再度跌停

财联社
2026-02-03 10:34:28
马克西29分5篮板6助76人击败快船4连胜,恩比德24分小卡29分6助攻

马克西29分5篮板6助76人击败快船4连胜,恩比德24分小卡29分6助攻

湖人崛起
2026-02-03 13:31:38
重返休城?曝火箭有意交易回哈登 有望第三次联手杜兰特冲冠

重返休城?曝火箭有意交易回哈登 有望第三次联手杜兰特冲冠

醉卧浮生
2026-02-03 12:53:01
广东“女儿卧室47秒”事件冲上热搜,评论区炸了:这不就是我爸吗?

广东“女儿卧室47秒”事件冲上热搜,评论区炸了:这不就是我爸吗?

脆皮先生
2026-02-02 20:03:58
中国成功研制出一款星链干扰器

中国成功研制出一款星链干扰器

跟着老李看世界
2026-02-03 00:02:33
官宣!38岁本泽马加盟利雅得新月+签约1年半 C罗罢赛抗议遭到无视

官宣!38岁本泽马加盟利雅得新月+签约1年半 C罗罢赛抗议遭到无视

风过乡
2026-02-03 05:33:03
程序员高广辉猝死后续!他早逝有原因,父亲一直不赞成他的婚姻

程序员高广辉猝死后续!他早逝有原因,父亲一直不赞成他的婚姻

细品名人
2026-02-03 07:48:27
收评:深成指探底回升涨超2% 全市场超4800只个股上涨

收评:深成指探底回升涨超2% 全市场超4800只个股上涨

财联社
2026-02-03 15:02:25
周生生回应“足金挂坠检出铁银钯”:高度重视顾客反映的相关事宜,相关进展将及时同步

周生生回应“足金挂坠检出铁银钯”:高度重视顾客反映的相关事宜,相关进展将及时同步

界面新闻
2026-02-03 11:19:37
爱泼斯坦案最新文件曝光,西方“吃人”社会大揭秘!

爱泼斯坦案最新文件曝光,西方“吃人”社会大揭秘!

枫冷慕诗
2026-02-02 13:35:20
惊!2026年立春不一般!2月4日这4类人必须躲春,做错白忙一场

惊!2026年立春不一般!2月4日这4类人必须躲春,做错白忙一场

老特有话说
2026-01-30 22:51:04
周生生足金挂坠戴一天就被刮花,检测后发现含铁、银、钯

周生生足金挂坠戴一天就被刮花,检测后发现含铁、银、钯

都市快报橙柿互动
2026-02-02 22:03:00
8.7万亿!史上最贵独角兽诞生

8.7万亿!史上最贵独角兽诞生

智东西
2026-02-03 08:50:21
5年前在美舰上用中文警告中国海军的华裔女兵,如今再也嚣张不起来了

5年前在美舰上用中文警告中国海军的华裔女兵,如今再也嚣张不起来了

老杉说历史
2026-02-03 00:39:13
离婚7年,王小玮高调官宣喜讯,让前夫王小海和凤凰传奇沉默了

离婚7年,王小玮高调官宣喜讯,让前夫王小海和凤凰传奇沉默了

白面书誏
2026-02-02 23:12:00
大S雕像仪式刚结束,葛斯齐深夜爆其猛料,许雅钧表现逆转口碑!

大S雕像仪式刚结束,葛斯齐深夜爆其猛料,许雅钧表现逆转口碑!

古希腊掌管月桂的神
2026-02-03 10:20:14
哈登被曝申请离队 美媒晒四次交易申请图:哥们儿在哪都不开心

哈登被曝申请离队 美媒晒四次交易申请图:哥们儿在哪都不开心

Emily说个球
2026-02-03 14:27:07
2死3失联!这座桥为何在众目睽睽之下突然垮塌?

2死3失联!这座桥为何在众目睽睽之下突然垮塌?

民言民语
2026-02-03 08:45:05
精神病院骗保内幕:收正常人住院,有人进不来自杀

精神病院骗保内幕:收正常人住院,有人进不来自杀

剥洋葱people
2026-02-03 08:21:38
2026-02-03 15:19:00
侃故事的阿庆
侃故事的阿庆
几分钟看完一部影视剧,诙谐幽默的娓娓道来
303文章数 7528关注度
往期回顾 全部

科技要闻

1.25万亿美元!xAI员工赢麻了

头条要闻

女子为大17岁老公怀孕11次逃离 首次发生关系时仅14岁

头条要闻

女子为大17岁老公怀孕11次逃离 首次发生关系时仅14岁

体育要闻

“也许我的一小步,会成为中国足球的一大步”

娱乐要闻

小S致词:感谢具俊晔陪伴大S的最后3年

财经要闻

精神病医院骗保内幕调查:住院相当于坐牢

汽车要闻

问界M6官图首发 以年轻化设计叩击25-30万级市场

态度原创

房产
健康
本地
家居
公开课

房产要闻

顶豪热潮再起!2026抢入城市恒产,一场独属远见者的红利

耳石症分类型,症状大不同

本地新闻

云游中国|拨开云雾,巫山每帧都是航拍大片

家居要闻

极简木艺术 典雅自在

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版