网易首页 > 网易号 > 正文 申请入驻

京产大模型成果登上国际顶级期刊

0
分享至

  当地时间1月28日,北京智源人工智能研究院的一项突破性研究成果在国际顶级学术期刊《自然》(Nature)上线,这是我国科研机构主导的大模型成果首次在《自然》正刊发表。

  2018年以来,GPT采用“预测下一个词元(Next-token prediction,NTP)”的自回归路线,实现了语言大模型重大突破,开启了生成式人工智能浪潮。而擅长同时处理文字、图片、视频等多种形态信息的多模态模型主要依赖对比学习、扩散模型等专门路线。在此背景下,一个重要问题困扰行业数年:能否用一种简单、统一的方法即自回归路线,让AI(人工智能)同时学会高效地处理文字、图片和视频?

  智源这项名为“通过预测下一个词元进行多模态学习的多模态大模型”的成果给出了肯定的答案。该成果表明,只采用自回归路线,就可以统一多模态学习,训练出优秀的原生多模态大模型,这对于确立自回归成为生成式人工智能统一路线具有重大意义。

  据了解,长期以来,AI在学习不同类型的“感官”信息时,往往需要“分科而治”——理解文字用一套方法,生成图片用另一套,处理视频又需要不同的专业模型,过程复杂且协同起来较为困难。而智源研究院研发的Emu3模型,借鉴了GPT成功的关键思路“预测下一个词元”,成功统一了对文本、图像及视频的理解与生成能力。打个比方,就如同给AI找到了一个“万能学习法”,无论面对的是一段文字、一张照片,还是一段动态影像,AI都用同一种逻辑去分析和创造。实验表明,这种统一方法在图片生成、图文理解和视频创作等多个任务上,达到了与当前各类专用模型相当的水平,且具备更强的扩展潜力和通用性。

  《自然》编辑点评这项研究时表示,基于“预测下一个词元”,Emu3实现了大规模文本、图像和视频的统一学习,其在生成与感知任务上的性能可与使用专门路线相当,这一成果对构建可扩展、统一的多模态智能系统具有重要意义。

  值得一提的是,基于这一核心路径的迭代版本Emu3.5模型,已展现出对物理世界运行规律的初步学习与模拟能力,能够尝试预测场景的下一步变化,为发展更通用、更接近人类认知方式的大模型与智能体奠定了基础。

  据悉,自2020年启动“悟道”大模型研究以来,智源研究院持续聚焦大模型的原始创新与长期技术路径探索。2025年6月,智源发布新一代大模型系列成果“悟界”,目标是构建人工智能从数字世界迈向物理世界的关键能力,打造物理世界的人工智能基座模型。该系列模型包括:Emu系列多模态世界模型、RoboBrain跨本体具身大脑、数字孪生心脏、Brainμ脑科学多模态基础模型以及OpenComplex全原子生命模型等,共同构建起覆盖宏观具身智能、介于宏观和微观尺度的生命系统到微观构象动力学的多层次技术基座。(孙奇茹)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
华人自曝: 中国手机在澳洲不能用了!? 已收到通知, 即将变板砖, 刚买的也不行

华人自曝: 中国手机在澳洲不能用了!? 已收到通知, 即将变板砖, 刚买的也不行

澳微Daily
2026-01-30 11:25:50
【紫牛头条】对话"当保安的武汉理工大学毕业生":为顺应妻子要求,摆稳心态

【紫牛头条】对话"当保安的武汉理工大学毕业生":为顺应妻子要求,摆稳心态

扬子晚报
2026-01-29 23:19:43
斯塔默游故宫导游火了!导游大哥穿黑衣沉稳大气,全英文解说获赞

斯塔默游故宫导游火了!导游大哥穿黑衣沉稳大气,全英文解说获赞

八八尚语
2026-01-30 11:21:52
百年基业,一夜丧尽

百年基业,一夜丧尽

我是历史其实挺有趣
2026-01-29 16:49:07
阿富汗永久禁止女性读书,更可怕的是那些为恶辩护的人

阿富汗永久禁止女性读书,更可怕的是那些为恶辩护的人

清书先生
2026-01-29 16:08:09
金晨出事前曾灵魂发问春晚为啥不邀请她,这下一语成谶了

金晨出事前曾灵魂发问春晚为啥不邀请她,这下一语成谶了

娱乐小丸子
2026-01-30 09:51:02
争议!澳网不和谐一幕:乌克兰名将拒合影 萨巴伦卡赛后霸气回应

争议!澳网不和谐一幕:乌克兰名将拒合影 萨巴伦卡赛后霸气回应

大秦壁虎白话体育
2026-01-30 00:34:40
特朗普,退缩了?

特朗普,退缩了?

中国新闻周刊
2026-01-30 07:28:04
中国公民东京街头约4.2亿日元现金遭劫 我使馆再次提醒近期避免前往日本

中国公民东京街头约4.2亿日元现金遭劫 我使馆再次提醒近期避免前往日本

上游新闻
2026-01-30 13:03:03
美国大军逼近!特朗普发出最后通牒……伊朗:随时准备扣动扳机

美国大军逼近!特朗普发出最后通牒……伊朗:随时准备扣动扳机

新民周刊
2026-01-29 20:05:51
2架美军机在南海坠毁,最新进展!

2架美军机在南海坠毁,最新进展!

环球时报国际
2026-01-30 00:10:58
中国将对英国免签!

中国将对英国免签!

环球旅讯
2026-01-30 00:08:21
末轮0-3出局!46岁名帅怒交辞职信:球员集体造反 执教13年第1次

末轮0-3出局!46岁名帅怒交辞职信:球员集体造反 执教13年第1次

风过乡
2026-01-30 08:03:11
国家出手,金晨恐彻底凉凉!多方再添猛料,不止肇事逃逸这么简单

国家出手,金晨恐彻底凉凉!多方再添猛料,不止肇事逃逸这么简单

李健政观察
2026-01-30 10:33:04
杜兰特31分5篮板火箭终结老鹰4连胜,申京9分13篮板4助攻

杜兰特31分5篮板火箭终结老鹰4连胜,申京9分13篮板4助攻

湖人崛起
2026-01-30 11:14:49
从文学造诣上来看,《滕王阁序》和《岳阳楼记》,到底谁更胜一筹

从文学造诣上来看,《滕王阁序》和《岳阳楼记》,到底谁更胜一筹

铭记历史呀
2026-01-29 18:29:43
1986年,我娶了268斤的胖闺女,洞房夜,她从身上取下172斤的沙袋

1986年,我娶了268斤的胖闺女,洞房夜,她从身上取下172斤的沙袋

程哥讲堂
2026-01-29 17:02:03
廖锡龙同志生平

廖锡龙同志生平

新京报政事儿
2026-01-30 08:26:37
“小婉君”金铭45岁现状:个子太矮事业受挫,住北京豪宅不婚不育

“小婉君”金铭45岁现状:个子太矮事业受挫,住北京豪宅不婚不育

削桐作琴
2026-01-29 00:03:53
全线大跌,超22万人爆仓!刚刚,黄金、白银,直线跳水

全线大跌,超22万人爆仓!刚刚,黄金、白银,直线跳水

中国基金报
2026-01-30 09:29:21
2026-01-30 14:39:00
首都之窗 incentive-icons
首都之窗
dwz.win/avJ9
43835文章数 56696关注度
往期回顾 全部

科技要闻

单季狂赚3000亿;iPhone 17 全球卖疯了!

头条要闻

美智库民调:近四分之三美国人预计中国将超越美国

头条要闻

美智库民调:近四分之三美国人预计中国将超越美国

体育要闻

敢揍多尔特,此子必成大器?

娱乐要闻

金晨出事前 曾灵魂发问未收到春晚邀请

财经要闻

血铅超标工人,挡在“劳动关系”门槛外

汽车要闻

全面科技化 新款梅赛德斯-奔驰S级发布

态度原创

房产
亲子
艺术
数码
公开课

房产要闻

跨海高铁,四大新机场,G98扩容…封关元年,海南配套大爆发!

亲子要闻

“孩子掉下去了”,6天婴儿摔致颅内出血,涉事月子中心突然宣布破产要关停

艺术要闻

风景画选刊 | 中国油画学会三十年艺术展

数码要闻

机构:Meta Ray-Ban Display预估带动今年全球AR眼镜95万台出货量

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版