网易首页 > 网易号 > 正文 申请入驻

颠覆GPT!Meta推出大型概念模型LCM: 从“猜词”到“理解”

0
分享至


Meta FAIR 的最新重磅研究:大型概念模型(LCM)是一种完全不同的语言建模范式,它将推理与语言表征分离,灵感来源于人类能够通过规划高层次思维来进行交流的方式

今天要跟大家分享一个来自Meta AI的重磅消息:他们开发了一种全新的语言模型——大型概念模型(LCM),它有可能会彻底改变我们对语言模型的理解!

现在市面上的语言模型,比如大家熟悉的GPT,虽然能写诗、写代码、聊天,但它们本质上还是一个字一个字地“猜”出来的。想象一下,就像一个只会背诵但不懂意思的鹦鹉,虽然能流利地说话,但缺乏真正的理解。LCM的出现,就是要打破这个局面

LCM的核心在于它不再执着于预测下一个词,而是在更高的语义层级——“概念”上进行思考。它把句子看作一个概念单元,并用一种叫做SONAR的句子嵌入技术来表示这些概念。这意味着LCM处理的不再是单个的词语,而是整句话的含义

Meta整的新活,我们来看看究竟是什么

核心创新:概念空间中的语言建模

LCM的最大特点在于,它不再像传统语言模型那样逐词预测,而是在句子表征空间中进行建模。这意味着,LCM将句子视为一个概念单元,并利用句子嵌入(sentence embeddings)来表示这些概念。LCM的目标是预测下一个句子的嵌入向量,也就是下一个“概念”。这种方法能够更好地捕捉文本的整体语义结构,使模型能够在更高的抽象层面上进行推理

SONAR:LCM的基石

LCM的核心组件是句子嵌入模型SONAR。SONAR是一个强大的多语言、多模态句子表征模型,支持超过200种语言和语音输入。LCM在SONAR嵌入空间中进行操作,这意味着LCM的输入和输出都是SONAR嵌入向量,而不是离散的词语。这种基于连续向量空间的建模方式,为LCM带来了诸多优势,例如:

  • 跨语言泛化:由于SONAR本身的多语言特性,LCM可以在未经专门训练的情况下处理不同语言的文本

  • 多模态融合:SONAR支持语音输入,未来还可以扩展到图像和视频等其他模态,为LCM的多模态应用奠定了基础

  • 语义相似度计算:在SONAR嵌入空间中,可以直接计算句子之间的语义相似度,这对于文本摘要、信息检索等任务非常重要

LCM架构的多样性:从基础模型到扩散模型

为了探索在SONAR空间中进行语言建模的最佳实践,Meta AI的研究人员设计了多种LCM架构变体:

  1. 1.Base-LCM:这是一个基于Transformer解码器的基础模型。它将前一个句子的SONAR嵌入作为输入,并预测下一个句子的嵌入。这种架构简单直接,易于理解和实现

  2. 2.One-Tower Diffusion LCM:该模型引入了扩散模型(Diffusion Model)的思想,通过逐步添加噪声然后去噪的方式来生成下一个句子的嵌入。这种方法可以生成更具多样性和创造性的文本

  3. 3.Two-Tower Diffusion LCM:该模型将编码器和解码器分离,编码器负责处理上下文信息,解码器负责生成下一个句子的嵌入。这种架构更类似于传统的序列到序列模型,可以更好地捕捉长距离依赖关系

  4. 4.Quant-LCM:为了提高计算效率,该模型对SONAR空间进行量化,将连续的嵌入向量转换为离散的码本。这种方法可以在不损失太多性能的情况下显著降低计算成本

训练与评估:30亿文档的庞大数据集

LCM在包含30亿个文档的庞大数据集上进行了预训练,这保证了模型的泛化能力。研究人员使用多种指标对LCM进行了评估,包括:

  • 预训练评估:使用L2距离、Round-trip L2距离、对比准确率、互信息等指标,评估模型在SONAR空间中预测下一个句子嵌入的准确性

  • 摘要生成:使用ROUGE、OVL、BEP-1、CoLA等指标,评估模型生成摘要的质量

  • 长上下文摘要:评估模型在处理长文本时的性能

  • 文本扩展:评估模型扩展文本的能力

  • 零样本跨语言泛化:评估模型在未经专门训练的情况下处理不同语言文本的能力

实验结果:超越传统LLM的性能

实验结果表明,LCM在多项任务上取得了令人瞩目的成绩,尤其是在处理长上下文信息和跨语言泛化方面,表现优于传统的LLM。这证明了LCM在概念层级进行语言建模的有效性

概念层级建模的无限可能

LCM的出现,为语言模型的研究开辟了一个全新的方向。未来,可以进一步探索以下方向:

  • 更丰富的概念表征:探索结合句法、语义、知识等信息的更丰富的概念表征方式

  • 更精细的句子分割:研究更精细的句子分割技术,以更好地处理复杂的文本结构

  • 更高效的训练和推理算法:开发更高效的训练和推理算法,降低计算成本,提高模型的实用性

  • 更广泛的应用场景:探索LCM在问答、机器翻译、对话系统等更多自然语言处理任务中的应用

LCM的局限性

虽然LCM展现了巨大的潜力,但也存在一些局限性:

  • 对SONAR的依赖:LCM的性能很大程度上依赖于SONAR嵌入的质量。

  • 句子分割的挑战:准确的句子分割对于LCM至关重要,但目前的技术还无法完美地处理所有情况

  • 概念粒度的选择:如何选择合适的概念粒度是一个开放性问题


参考:

https://scontent-lax3-2.xx.fbcdn.net/v/t39.2365-6/470149925_936340665123313_5359535905316748287_n.pdf?_nc_cat=103&ccb=1-7&_nc_sid=3c67a6&_nc_ohc=2cTPBi8EFtgQ7kNvgF-QEbC&_nc_zt=14&_nc_ht=scontent-lax3-2.xx&_nc_gid=AivRX-2rQlUYPKK0BXcdhRp&oh=00_AYAfY9WnhUJv6G-ufbDCF1x7zgg0SWIytCF9efpKJmTOsA&oe=676FC252

https://github.com/facebookresearch/large_concept_model

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
61岁大爷将17cm红薯塞进屁股,半夜开腹取出!医生:这个洞,不是这么玩的

61岁大爷将17cm红薯塞进屁股,半夜开腹取出!医生:这个洞,不是这么玩的

消化石医生
2026-05-09 18:58:53
苦等13年!深圳巨无霸城中村旧改规划公示,周边房价要变天

苦等13年!深圳巨无霸城中村旧改规划公示,周边房价要变天

童童聊娱乐啊
2026-05-08 14:16:35
“明天下雨,面试能改天吗”:角色定位不清,是成年人最大的灾难

“明天下雨,面试能改天吗”:角色定位不清,是成年人最大的灾难

精读君
2026-04-24 09:00:18
普京时代进入倒计时,中国必须警惕俄罗斯政策突变。

普京时代进入倒计时,中国必须警惕俄罗斯政策突变。

阿七说史
2026-05-09 05:10:06
网友匿名爆料自己身边的八卦,你永远也想不到,到底能有多炸裂!

网友匿名爆料自己身边的八卦,你永远也想不到,到底能有多炸裂!

夜深爱杂谈
2026-05-03 11:22:10
国家免费电视已开通!不用缴费,动手调好就能看

国家免费电视已开通!不用缴费,动手调好就能看

小柱解说游戏
2026-05-08 16:59:21
薪酬改革后扎心!有的央国企员工,已经连续几个月只拿基本工资了

薪酬改革后扎心!有的央国企员工,已经连续几个月只拿基本工资了

职场资深秘书
2026-05-09 22:57:54
马筱梅直播时儿子意外出镜,白皮肤肉嘟嘟的,筱梅满眼爱意藏不住

马筱梅直播时儿子意外出镜,白皮肤肉嘟嘟的,筱梅满眼爱意藏不住

日不西沉
2026-05-10 04:17:07
乡镇女大学生晒“低审美”穿搭,网友眼前一黑:求求你都扔了吧!

乡镇女大学生晒“低审美”穿搭,网友眼前一黑:求求你都扔了吧!

妍妍教育日记
2026-05-09 10:34:34
尴尬!俞敏洪与陈行甲的公开互动争议升级,堪称董宇辉事件的复刻

尴尬!俞敏洪与陈行甲的公开互动争议升级,堪称董宇辉事件的复刻

火山詩话
2026-05-09 06:34:45
为什么全国人民都在拒接电话?

为什么全国人民都在拒接电话?

黯泉
2026-04-18 17:00:56
特朗普摊牌:切断石油供应就滚出美元体系!多国连夜倒向伊朗

特朗普摊牌:切断石油供应就滚出美元体系!多国连夜倒向伊朗

江湖百晓生MJ
2026-05-09 21:00:09
这就是公开辱华的后果!取消冠军头衔只是开始,职业生涯也全毁了

这就是公开辱华的后果!取消冠军头衔只是开始,职业生涯也全毁了

阿凫爱吐槽
2025-12-17 17:24:39
浙江东阳,33 岁的男子,在母亲长眠的公墓旁,在车里结束了生命

浙江东阳,33 岁的男子,在母亲长眠的公墓旁,在车里结束了生命

魔都姐姐杂谈
2026-03-30 19:25:57
国产“新伟哥”!效力是西地那非8倍,副作用却更少

国产“新伟哥”!效力是西地那非8倍,副作用却更少

鬼菜生活
2026-05-09 11:20:07
媒体人:FIFA最初版权要4亿美元,央视最终报价远远不止6000万

媒体人:FIFA最初版权要4亿美元,央视最终报价远远不止6000万

懂球帝
2026-05-10 02:48:07
内幕,名记透露马德鲁加离队真因,被贵宾点名,以为他是少数民族

内幕,名记透露马德鲁加离队真因,被贵宾点名,以为他是少数民族

体坛风之子
2026-05-10 07:03:51
“寻天”商标注册!小米欲成立汽车独立子品牌?官方未作回应

“寻天”商标注册!小米欲成立汽车独立子品牌?官方未作回应

每日经济新闻
2026-05-09 19:47:07
巴恩斯和娇妻近照,离开勇士也赚2.2亿,劳模典范,妻子黑人美女

巴恩斯和娇妻近照,离开勇士也赚2.2亿,劳模典范,妻子黑人美女

大西体育
2026-05-09 21:41:17
哈登19分7助攻,骑士主场116:109险胜活塞

哈登19分7助攻,骑士主场116:109险胜活塞

本泽体育
2026-05-10 05:56:25
2026-05-10 07:51:00
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1040文章数 396关注度
往期回顾 全部

科技要闻

美国政府强力下场 苹果英特尔达成代工协议

头条要闻

伊朗宣布:没收262处“叛国者”房产

头条要闻

伊朗宣布:没收262处“叛国者”房产

体育要闻

成立128年后,这支升班马首夺顶级联赛冠军

娱乐要闻

50岁赵薇脸颊凹陷沧桑得认不出!

财经要闻

多地号召,公职人员带头缴纳物业费

汽车要闻

轴距加长/智驾拉满 阿维塔07L定位大五座SUV

态度原创

艺术
教育
数码
时尚
军事航空

艺术要闻

阳光,此刻醉美

教育要闻

26高考选专业,普通家庭该避开哪些坑?

数码要闻

TCL华星t8项目提前封顶 印刷OLED规模化量产提速

伊姐周六热推:电视剧《喀什恋歌》;电视剧《低智商犯罪》......

军事要闻

美伊突然再次交火 伊朗外长:战争准备程度是1000%

无障碍浏览 进入关怀版