网易首页 > 网易号 > 正文 申请入驻

神经-符号相结合的认知网络模型简介

0
分享至


认知模型既包括模拟人脑神经元工作的亚符号模型,也包括着眼于抽象心智能力的符号模型。而符号模型正是由计算机科学中的知识推理系统演化而来的。在面向认知的预训练框架中,如何将知识这种符号信息与神经网络结合是一个重要的研究课题,也就是所谓的神经-符号结合模型。
ERNIE
预训练语言模型是典型的数据驱动模型,通过在大规模数据上进行学习,该类模型在许多自然语言处理任务上取得了十分优秀的成绩。数据、算法、算力、知识是组成人工智能的四大基础,现有的数据驱动模型在未来的发展当中需要将知识考虑进来,使数据驱动和知识驱动结合起来,做到更有深度的语义理解与推理。
清华大学自然语言处理与社会人文计算实验室在该方向上已作出一系列具有影响力工作。针对预训练语言模型对低频实体建模能力不佳的问题,有研究者提出了使用信息实体增强的语言表示模型(Enhanced Language Representation with Informative Entities,ERNIE),通过引入外部的知识信息:知识图谱(Knowledge Graph,KG)来改善预训练模型。


例如,“鲍勃·迪伦写了《在风中飘》,并写了《摇滚记》”,在这一句话里有两个“写”的描述,但从字面上来看无法了解到“写”的真正意思。在得知“在风中飘”是指一首歌“,摇滚记”是指一本书之后,人们才能知道第一个“写”的意思是写歌,第二个“写”的意思是写书。理解两个“写”的意思可以帮助模型进行关系分类和实体分类:对于关系分类来说,在第一句中人们可以得出“鲍勃·迪伦”和“在风中飘”的关系是作曲者,在第二句中人们可以得出“鲍勃·迪伦”和“摇滚记”的关系是作者;对于实体分类来说,人们可以得出第一句中“鲍勃·迪伦”是一名作曲家,在第二句中“鲍勃·迪伦”是一名作家。由上述例子可以得出外部知识确实能有效地帮助模型对句子的建模,其具体的优势如下:首先,在文本中存在着一些低资源的实体,利用外部的知识图谱可以准确地将其识别;其次,知识图谱可以帮助引入句子相关的额外事实,帮助原文本的理解。
为了抽取和编码知识信息,ERNIE首先在给定的文本中识别出命名实体的对应词汇,然后将这些出现的实体词汇与知识图谱中的实体构建对应关系。考虑到模型不方便直接使用图结构的知识图谱信息,ERNIE选用了知识表示的算法(如TransE)对知识图谱编码,获得实体的表示和关系的表示,然后将实体的表示作为ERNIE的输入。在这里,假设实体的表示携带了知识图谱中相关的事实信息,可以有效增强模型的语言建模能力。通过构建文本和知识图谱之间的对齐关系,ERNIE将知识信息整合入预训练语言模型的语义模型当中。
与BERT类似,ERNIE采用了遮蔽语言模型(Masked Language Model),将下句预测任务作为ERNIE的预训练任务。除此之外,为了能够更好地融合文本特征和知识特征,我们设计了一个新的预训练任务——降噪实体自编码机。实体自编码机首先输入实体的序列,在输出的时候使用词的向量将输入的实体序列还原出来,在自编码机的训练过程中将实体的信息融合到词的向量当中。除此之外,考虑到下游的实体链接结果来自其他模型,可能会存在一些错误,ERNIE在输入的实体序列中随机加入了一些噪声,目的是增强自编码机的鲁棒性。与仅利用上下文来预测单词的现有预训练语言表示模型不同,ERNIE需要融合上下文的信息以及相关的事实信息,以获得一个融合知识的语言表示模型。


KEPLER
从文本中识别出相关实体需要额外的开销,并且存在一定的噪声。研究者们设想如果模型能够同时对文本进行语言模型训练并对符号化知识图谱进行学习,便可以有效学习文本中可能出现的相关图谱知识,因此提出了知识嵌入(Knowledge Embedding,KE)的统一模型和预训练的语言表示(KEPLER),它不仅可以将事实知识更好地整合到预训练语言模型中,而且还可以通过丰富的知识有效地学习KE文字信息。与现有方法相比,作为预训练语言模型,KEPLER具有以下优势:(1)能有效地将事实知识整合到预训练语言模型中;(2)从遮蔽语言模型学习中具备强大的语言理解能力;(3)加入KE的学习目标,增强了KEPLER从文本中获取知识的能力。作为KE模型,KEPLER的优势在于:(1)可以更好地利用来自实体描述的丰富信息;(2)可以对未见过的实体产生表示。
KEPLER是一个联合知识嵌入和文本预训练的模型,它将将事实知识和语言理解结合到一个模型中,使用遮蔽语言模型和图谱表示模型两个训练目标进行联合训练。KEPLER主要针对如何使用预训练模型进行知识表示学习进行了适配。它将实体描述输入文本编码器,得到对应实体的表示向量,再根据知识图谱中的实体三元组(头实体,关系,尾实体),使用文本实体表示和对应的关系表示向量,计算知识嵌入的训练目标函数。如何进一步构建文本和图谱的联系,推动知识在认知计算中的发展仍是一个重要的研究方向。
CorefBERT
人类总结的抽象知识也可以用于指导模型的预训练。语言学家认为指代消解是长文本处理的重要问题,然而现有的模型没有显式地考虑指代信息,使得它们在一些指代相关的任务中表现不佳。为此,有研究者提出CorefBERT,在预训练阶段引入指代消解知识的学习。在自然语言文本中,存在许多由实体重复出现而产生的指代。研究者认为一个实体在一段文本第二次出现时,大概率地与它第一次出现时指代的是同一个事物。基于这个远程监督的假设,研究者进而提出了提及指代预测任务(Mention Reference Prediction,MRP),遮盖重复出现名词的其中一个出现位置,并通过基于拷贝机制的损失函数显式地建立它与其他出现位置的指代联系。使用一个基于拷贝机制的损失函数建立其词与上下文之间的联系,更容易对指代关系进行建模。此外,与遮盖语言建模任务相比,提及指代预测训练任务更鼓励模型建立长距离的指代联系,使模型更好地理解全文。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
报告114伤1死,中国企业的血糖仪遭FDA警告

报告114伤1死,中国企业的血糖仪遭FDA警告

健识局
2026-02-25 20:07:55
戏子误国!2026年刚开年,就有3位明星相继塌房,个个荒唐

戏子误国!2026年刚开年,就有3位明星相继塌房,个个荒唐

不似少年游
2026-02-24 19:24:23
“艳照门”17年后,她再度翻红,自曝曾3年没拍戏,做了12次试管

“艳照门”17年后,她再度翻红,自曝曾3年没拍戏,做了12次试管

白面书誏
2026-02-26 14:13:40
这些习惯,可能影响你啪啪时的表现(女生勿入)

这些习惯,可能影响你啪啪时的表现(女生勿入)

许超医生
2026-02-26 10:06:41
就是一整块屏!广东新闻联播提前展示OPPO Find N6:微距展示肉眼几乎看不到折痕

就是一整块屏!广东新闻联播提前展示OPPO Find N6:微距展示肉眼几乎看不到折痕

快科技
2026-02-27 10:42:00
曾志伟儿女现状:长子不生娃,次子离婚,小女儿远嫁,她至今未婚

曾志伟儿女现状:长子不生娃,次子离婚,小女儿远嫁,她至今未婚

冷紫葉
2026-02-11 17:08:41
《王牌特工》男主演“秃”然亮相惊呆网友,此前被称为“英伦男神”,头发茂密

《王牌特工》男主演“秃”然亮相惊呆网友,此前被称为“英伦男神”,头发茂密

红星新闻
2026-02-26 20:22:15
天生一张娃娃脸都已经46了,你敢想

天生一张娃娃脸都已经46了,你敢想

超人强动物俱乐部
2026-02-25 19:21:58
62岁何政军现状:老态尽显,不拍戏时爱做饭,女儿长相甜美是学霸

62岁何政军现状:老态尽显,不拍戏时爱做饭,女儿长相甜美是学霸

白面书誏
2026-02-26 19:23:28
爱泼斯坦案再曝猛料!女星指控献祭,证人曝狩猎派对像饥饿游戏

爱泼斯坦案再曝猛料!女星指控献祭,证人曝狩猎派对像饥饿游戏

小徐讲八卦
2026-02-25 07:05:52
爱泼斯坦案曝光霍金与身穿比基尼女子合影,霍金家人:系护理人员;曾辟谣照片为合成伪造

爱泼斯坦案曝光霍金与身穿比基尼女子合影,霍金家人:系护理人员;曾辟谣照片为合成伪造

新民周刊
2026-02-26 18:57:36
1952年郑洞国赴京就任,她嫌弃北京苦寒毅然改嫁富商

1952年郑洞国赴京就任,她嫌弃北京苦寒毅然改嫁富商

磊子讲史
2025-12-29 16:25:39
9队全晋级!英超统治欧战的3大真相,真不只是有钱!

9队全晋级!英超统治欧战的3大真相,真不只是有钱!

落夜足球
2026-02-27 10:43:31
五代最可惜的政权:拥兵30万控制江南,却无法灭吴越,统一中原!

五代最可惜的政权:拥兵30万控制江南,却无法灭吴越,统一中原!

小松历史菌
2026-02-26 23:12:36
春天吃一瓜,中药不用抓!一降火、二润肠、三强免疫,鲜嫩营养高

春天吃一瓜,中药不用抓!一降火、二润肠、三强免疫,鲜嫩营养高

阿龙美食记
2026-02-25 13:18:07
梅婷大年初九在北京别墅宴客,和德华刘琳同框,吃海鲜大口喝酒

梅婷大年初九在北京别墅宴客,和德华刘琳同框,吃海鲜大口喝酒

离离言几许
2026-02-26 16:19:11
成本2亿,日票房仅1100万,71岁成龙懵了:内地观众凭啥不买账?

成本2亿,日票房仅1100万,71岁成龙懵了:内地观众凭啥不买账?

糊咖娱乐
2026-02-25 18:38:49
小伙娶48岁大妈,新婚第二天大妈赖床不起,小伙掀开被子愣住了

小伙娶48岁大妈,新婚第二天大妈赖床不起,小伙掀开被子愣住了

一根香烟的少妇
2026-02-23 15:00:03
卫星图像显示美国11架F-22隐形战机抵达以色列

卫星图像显示美国11架F-22隐形战机抵达以色列

环球网资讯
2026-02-27 06:21:11
连8岁孩子都不放过!武契奇险遭灭门,幕后黑手太狠了

连8岁孩子都不放过!武契奇险遭灭门,幕后黑手太狠了

头条爆料007
2026-02-26 10:43:43
2026-02-27 11:31:00
我是天边飘过一朵云
我是天边飘过一朵云
科技改变未来,未来生活更美好
903文章数 895关注度
往期回顾 全部

科技要闻

英伟达业绩亮眼仍跌5% 两大因素成核心隐忧

头条要闻

媒体:骄傲十年后 德国不得不正视中国

头条要闻

媒体:骄傲十年后 德国不得不正视中国

体育要闻

从排球少女到冰壶女神,她在米兰冬奥练出6块腹肌

娱乐要闻

继网暴谷爱凌后 美国欲没收其全部收入

财经要闻

魅族手机,终成弃子?

汽车要闻

40岁的吉利,不惑于内外

态度原创

游戏
健康
房产
公开课
军事航空

绝美容颜!疑似《生化危机:安魂曲》雪莉新面模曝光

转头就晕的耳石症,能开车上班吗?

房产要闻

2.2万/m²起!三亚主城性价比标杆 海垦·桃花源实景现房春节被疯抢

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美国11架F-22隐形战机抵达以色列

无障碍浏览 进入关怀版