网易首页 > 网易号 > 正文 申请入驻

【专利解密】文字工作者福音 科大讯飞发明语义级语病识别方案

0
分享至

【嘉勤点评】科大讯飞发明的语病识别方案,能够结合语义信息和句法信息对待识别语句中的句法结构问题和语义问题进行病句识别,进而准确得到病句识别结果。

集微网消息,我们日常在文本输入的过程中,经常会由于各种原因导致输入的文本存在语病,例如拼写别字、搭配不当、成分残缺等均可能导致文本中存在语法错误、语义不明等问题。

目前,相关自动纠错软件大多通过语言表示模型(BERT)对待识别语句进行语病识别,但是该方法对于语义性病句的识别精度很低,无法满足人们的日常使用需求。为此,科大讯飞在2021年12月3日申请了一项名为“语病识别方法、装置、电子设备和存储介质”的发明专利(申请号:202111467935.7),申请人为科大讯飞河北科技有限公司。

根据该专利目前公开的相关资料,让我们一起来看看这项技术方案吧。

如上图,为该专利中发明的语病识别方法的流程示意图,首先,系统确定待识别语句,待识别语句通常为户直接输入的,或者是将采集所得的音频进行语音转写后得到的。其次,提取待识别语句中各分词的分词表示,分词表示用于表征对应分词的上下文语义和对应分词与待识别语句中其余分词间的句法依赖关系。

该方案中设置了设置“父亲‑孩子关系”,“孩子‑父亲关系”,“兄弟关系”和“无直接关系”四种句法依赖关系。例如,对于待识别语句“他的家乡是福建省福州市”,“他”与“家乡”是父亲‑孩子关系,“是”与“市”是孩子‑父亲关系,“家乡”与“市”是兄弟关系,“市”与“他”无直接关系。

此外,在提取待识别语句中各分词的分词表示时,可以将待识别语句输入至预训练语言模型,由预训练语言模型挖掘各分词的上下文语义信息,以及各分词与其余分词间的句法依赖关系。从而能够准确得到表征对应分词的上下文语义信息和对应分词与其余分词间的句法依赖关系的分词表示。

最后,基于待识别语句中各分词的分词表示,以及待识别语句的句法结构,对待识别语句进行语病识别。例如待识别语句“帮我开卧室风扇静音风”经句法分析可知,分词“帮”、“我”、“开”、“卧室”、“风扇”、“静音风”分别是动词、代词、动词、名词、名词、名词。

其中,“帮”是文本中的核心关系HED,“我”是“帮”的兼语DBL,“帮”和“开”之间存在动宾关系VOB,“开”和“静音风”之间存在动宾关系VOB,“风扇”和“静音风”之间、“卧室”和“风扇”之间存在定中关系ATT。由此可见,待识别语句的句法结构可以从各分词的词性以及各分词之间的句法结构层面上表征待识别语句中各分词之间的句法依赖关系。

因此,相较于传统方法中采用语言表示模型仅能对结构性病句进行识别,该方案融合了各分词表示中的对应分词的上下文语义和对应分词与待识别语句中其余分词间的句法依赖关系,以及句法结构中的各分词之间的句法依赖关系。从而能够结合语义信息和句法信息对待识别语句中的句法结构问题和语义问题进行病句识别,进而准确得到病句识别结果。

如上图,为该专利中发明的预训练语言模型训练方法的流程示意图,首先,将第一样本语句输入至初始语言模型,得到初始语言模型输出的第一样本语句中各分词的预测分词表示。其次,将第一样本语句中各分词的预测分词表示输入至句法依赖关系分类模型,得到句法依赖关系分类模型输出的第一样本语句中各分词间的预测句法依赖关系。

最后,基于第一样本语句中各分词间的预测句法依赖关系以及第一样本语句中各分词间的句法依赖关系标签,对初始语言模型和句法依赖关系分类模型进行联合训练,得到预训练语言模型。

最后,我们来看看该专利中提供的句法结构确定方法的流程示意图,如上图所示。首先,对待识别句子进行句法分析,得到待识别句子中各分词之间的句法依赖关系。接着,基于各分词之间的句法依赖关系,构建表征待识别句子中每个分词与其它分词之间的句法依赖关系结构树,作为句法结构。

具体来说,通过句法分析得到的每个分词之间的句法依赖关系,然后各分词之间的句法依赖关系,构建表征待识别句子中每个分词与其它分词之间的句法依赖关系结构树,作为句法结构。例如,可以基于每个分词之间的句法依赖关系,确定其中一个分词与其余各个分词之间是否存在句法依赖关系,进而生成表征该分词中的每个字与其余各个分词中的每个字之间句法依赖关系的结构树,即可得到结构树形式的句法结构。

以上就是科大讯飞发明的语病识别方案,该方案能够结合语义信息和句法信息对待识别语句中的句法结构问题和语义问题进行病句识别,进而准确得到病句识别结果。

(校对/holly)

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
FIBA更新女篮最新实力榜:美国稳居第一 中国保持第五不变

FIBA更新女篮最新实力榜:美国稳居第一 中国保持第五不变

狼叔评论
2026-03-20 11:42:02
高市早苗这趟美国之行,真是把“尴尬”俩字写脸上了!

高市早苗这趟美国之行,真是把“尴尬”俩字写脸上了!

达文西看世界
2026-03-19 09:44:52
乌克兰连续摧毁红军村南北指挥所!城中俄军遭友军误袭

乌克兰连续摧毁红军村南北指挥所!城中俄军遭友军误袭

项鹏飞
2026-03-17 19:55:07
伊朗突然对沙特宣战:巴铁如果帮助盟国沙特,中国武器会登场吗?

伊朗突然对沙特宣战:巴铁如果帮助盟国沙特,中国武器会登场吗?

影像温度
2026-03-19 09:52:35
杨幂写真大秀"漫画腿",这谁顶得住?

杨幂写真大秀"漫画腿",这谁顶得住?

健身迷
2026-03-20 12:30:02
网红日料创始人道歉!广州太古汇店监控画面公开

网红日料创始人道歉!广州太古汇店监控画面公开

南方都市报
2026-03-19 17:11:06
沃日多瓦茨官方:张家鸣获得中国U19征召,祝他在国家队一切顺利

沃日多瓦茨官方:张家鸣获得中国U19征召,祝他在国家队一切顺利

懂球帝
2026-03-20 00:58:27
全新宝马X5实车曝光!历代进化全梳理

全新宝马X5实车曝光!历代进化全梳理

爱驾天下
2026-03-19 17:36:14
詹姆斯19+15+10创历史!湖人客场逆转热火豪取8连胜

詹姆斯19+15+10创历史!湖人客场逆转热火豪取8连胜

阿晞体育
2026-03-20 12:37:46
贾浅浅《我的娘》才是最正宗“尿”诗,极具画面感,您觉得如何?

贾浅浅《我的娘》才是最正宗“尿”诗,极具画面感,您觉得如何?

读睡
2026-03-10 20:58:12
原来自己身上的“老师味”这么明显!网友:脱口而出就是宝贝

原来自己身上的“老师味”这么明显!网友:脱口而出就是宝贝

另子维爱读史
2026-02-27 20:59:03
三星悄悄亮出底牌:OneUI9这波操作,让我重新审视Galaxy的含金量

三星悄悄亮出底牌:OneUI9这波操作,让我重新审视Galaxy的含金量

明美无限
2026-03-19 19:19:55
巴铁又输惨了?印媒:S400首次击落1架枭龙,原本瞄准的是歼-10CE

巴铁又输惨了?印媒:S400首次击落1架枭龙,原本瞄准的是歼-10CE

趣文说娱
2026-03-19 16:53:48
中国绝不当滥好人!牢记中企的深刻教训,此刻拉印度一把就是资敌

中国绝不当滥好人!牢记中企的深刻教训,此刻拉印度一把就是资敌

百科密码
2026-03-20 12:17:27
等不到特朗普访华,美军提前对华摊牌,已盯上中国23个港口

等不到特朗普访华,美军提前对华摊牌,已盯上中国23个港口

安珈使者啊
2026-03-20 11:57:49
60亿债务压顶,贱卖豪车,拍蒜失败的“张小泉”晚节不保

60亿债务压顶,贱卖豪车,拍蒜失败的“张小泉”晚节不保

毒sir财经
2026-02-17 17:30:51
眼镜妹为何是系列里面人气第一女主?

眼镜妹为何是系列里面人气第一女主?

挪威森林
2026-02-11 12:09:26
油价一夜突变!3月19日全国油价调整后92/95汽油价格、0号柴油价格最新公布

油价一夜突变!3月19日全国油价调整后92/95汽油价格、0号柴油价格最新公布

沙雕小琳琳
2026-03-19 15:51:07
卡里克暗示德里赫特赛季报销!马奎尔提高续约要求,曼联只有接受

卡里克暗示德里赫特赛季报销!马奎尔提高续约要求,曼联只有接受

罗米的曼联博客
2026-03-20 11:00:23
油价调整:注意,预计上调2000元/吨,下周油价要大涨!

油价调整:注意,预计上调2000元/吨,下周油价要大涨!

金投网
2026-03-20 11:18:00
2026-03-20 13:16:49
爱集微 incentive-icons
爱集微
集微网官方账号
109211文章数 98339关注度
往期回顾 全部

教育要闻

育儿思路 学习的本质是专注模式和发散模式的来回切换

头条要闻

美媒:若伊方所言属实 系F-35战机在实战中首次被击中

头条要闻

美媒:若伊方所言属实 系F-35战机在实战中首次被击中

体育要闻

6年前的一场悲剧,造就了“法国瓦尔迪”

娱乐要闻

蔡康永小S“康熙合体”,两人拥抱落泪

财经要闻

黄金、白银、铝、铜……大宗商品巨震

科技要闻

新SU7只涨4千!雷军:真怕交车慢挨骂

汽车要闻

体验岚图泰山L3公开上路 896线激光雷达实测如何?

态度原创

亲子
艺术
手机
数码
公开课

亲子要闻

享福啦!又可以练字了!

艺术要闻

吴昌硕『圆扇花卉』清新俊逸

手机要闻

6999元,红魔11 Pro+鸣潮限定版手机再发售

数码要闻

四年磨一剑!小米笔记本Pro 14回归后线上全部售罄:卖疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版