网易首页 > 网易科技 > 网易科技 > 正文

超越华为盘古千亿模型,搜狗搜索再创中文语言理解评测CLUE世界第一

0
分享至

(原标题:超越华为盘古千亿模型,搜狗搜索再创中文语言理解评测CLUE世界第一)

近日,搜狗搜索技术团队在CLUE(中文语言理解测评基准)的任务比赛中,基于自研的中文预训练模型击败了包括华为盘古在内的一众强劲对手,在CLUE总榜、分类总榜、阅读理解榜再次获得第一名,刷新业界记录。

“BERTSG”为搜狗搜索自研模型,“HUMAN”为人类成绩(不计入选手)

不惧业内强劲挑战 搜狗搜索用技术与算法彰显实力

作为中文语言理解领域最具权威性的测评基准之一,CLUE基于原始的中文文本语料共开设了8个方向的比赛,由文本相似度、分类、上下文推理、阅读理解等共11个子任务组成。此前,搜狗搜索曾长期霸榜CLUE多个任务比赛冠军宝座,但在今年4月遭遇到来自华为、阿里达摩院等竞争对手的强劲挑战,华为更是利用其两千亿参数模型盘古一度取得领先。

就在近日,搜狗搜索技术团队基于自研的中文预训练模型,一举超越华为盘古,再度在CLUE总榜、分类总榜、阅读理解榜获得冠军,展示了其在自然语义理解领域强大的技术创新实力和领先的AI算法能力。

据了解,搜狗搜索技术团队近一年来在预训练模型研发上加强投入,已完成从亿级到百亿级中文预训练模的研发,目前正开展千亿级中文预训练模型及多模态预训练模型的研发工作。搜狗搜索技术团队自研的预训练模型之所以能够比参数量更大的华为盘古在CLUE榜单取得更好的效果,主要是在训练语料、模型结构、训练方法三个方面进行了创新突破。

训练语料方面,凭借自身作为第二大搜索引擎的基础优势,搜狗搜索技术团队首先从万亿网页中筛选出10T优质语料,依托搜狗搜索的内容理解技术、大规模聚类等系统,进而从10T优质语料中精选出2T最终语料,这样在保证语料内容质量的同时,还可以确保内容的多样性,从训练语料上提升了模型的训练效率和泛化能力。

模型结构方面,原始的BERT模型使用了Post-LN的结构,该结构的弊端是在训练超大模型时,若没有设置好warmup,会导致收敛效果变差。而搜狗的预训练模型在结构上采用了Pre-LN的方式,大大提升了训练效率。

而在训练方法方面,搜狗搜索技术团队做了两方面的创新优化。第一,采用了cross thought预训练方法,同时引入对比学习训练方法,解决原始BERT模型学习出来的cls token向量存在各向异性的问题,大大增强预训练模型的表征能力,使得下游任务效果得到明显提升。第二,加入了根据文章标题生成和段落顺序预测两个任务,进一步增强预训练模型的文章理解能力。具体而言,在标题生成任务上,输入一篇文章的内容和标题,并且对文章和标题都做词语级别的mask操作,文章mask策略与Roberta-wwm采用的策略一样,标题则mask超过80%的词。而段落顺序预测任务的目标是预测段落之间的上下文关系,在加入这两种预测任务后,预训练模型的效果得到明显提升。

搜狗搜索NLP技术长期领先,成功落地产品、加速赋能行业

与此同时,此次搜狗搜索自研预训练模型在CLUE总榜、分类总榜、阅读理解榜再度获得冠军,也意味着搜狗搜索在自然语言预训练、语义理解、长文本和短文本分类、阅读理解、问答等领域皆持续处于业界领先水平,展现了其在NLP的超群实力。在此之前,搜狗搜索还曾在国际阅读理竞赛CoQA等竞赛中取得了冠军的成绩。

事实上,搜狗搜索之所以在NLP领域长期处于领先地位,与搜狗公司长期专注在自然语言处理领域进行深耕细作密不可分。作为一家将AI作为企业基因的公司,搜狗基于搜狗搜索、搜狗输入法等核心产品,一直坚持其以语言为核心的AI战略,并成功进行了一系列AI技术创新和产品落地实践。

据了解,搜狗自研的预训练模型已在搜狗搜索产品中落地,大幅提升了用户的搜索效率和体验。此外,相关技术在语言翻译、聊天机器人、知识图谱等领域也具有广泛的应用空间。

相关推荐
热点推荐
美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

美国也没想到,转为中国籍仅6年,谷爱凌竟已成美国头号劲敌

青烟小先生
2026-01-31 19:10:22
35岁妈妈除夕提新车,大年初二猝然离世,真相让无数人破防

35岁妈妈除夕提新车,大年初二猝然离世,真相让无数人破防

社会日日鲜
2026-02-22 04:46:11
初中生扶老人被讹22万,真相不是你想象的那样

初中生扶老人被讹22万,真相不是你想象的那样

科学发掘
2026-02-21 22:40:26
欧洲央行:中国绕过了特朗普的关税墙

欧洲央行:中国绕过了特朗普的关税墙

参考消息
2026-02-21 19:01:12
业绩暴增715.70%!商业航天+可控核聚变双王炸,6大核心龙头个个不可替代

业绩暴增715.70%!商业航天+可控核聚变双王炸,6大核心龙头个个不可替代

Thurman在昆明
2026-02-20 22:32:08
台湾即将有望统一!5大信号正在释放:武力统一或将进入倒计时?

台湾即将有望统一!5大信号正在释放:武力统一或将进入倒计时?

触摸史迹
2026-02-20 19:51:48
王宝强也没料到,释永信毁灭牵出前妻马蓉旧事,自己差点“垫背”

王宝强也没料到,释永信毁灭牵出前妻马蓉旧事,自己差点“垫背”

阿讯说天下
2026-02-19 17:27:11
这组照片是张学良软禁时真实生活,奢华至极,完全不像囚徒生活!

这组照片是张学良软禁时真实生活,奢华至极,完全不像囚徒生活!

芊芊子吟
2026-02-19 12:00:06
悬赏10000元!全网都在“找鳌鱼”!一条长21米、高7米的巨型鳌鱼,意外被大风吹走

悬赏10000元!全网都在“找鳌鱼”!一条长21米、高7米的巨型鳌鱼,意外被大风吹走

新民晚报
2026-02-21 20:03:11
玻璃纤维短缺加剧 制造商将掀起第二轮涨价潮

玻璃纤维短缺加剧 制造商将掀起第二轮涨价潮

财联社
2026-02-21 22:26:19
史诗级封杀!2000万网红“听风的蚕”彻底凉了

史诗级封杀!2000万网红“听风的蚕”彻底凉了

互联网品牌官
2026-02-12 01:17:23
明日正月初六,早上做好两件事,讨个一顺百顺万事顺!

明日正月初六,早上做好两件事,讨个一顺百顺万事顺!

时尚的弄潮
2026-02-21 16:52:03
原来主动可以打破很多规则,后悔没早看到!网友:脸皮厚能吃肉

原来主动可以打破很多规则,后悔没早看到!网友:脸皮厚能吃肉

夜深爱杂谈
2026-02-11 18:31:18
整个西方都炸了,中国男人,全球最高级的一群人

整个西方都炸了,中国男人,全球最高级的一群人

毛豆论道
2026-02-20 20:49:13
一个补锅匠写了一首小诗,短短4句,竟成古今经典,连小孩都会背

一个补锅匠写了一首小诗,短短4句,竟成古今经典,连小孩都会背

长风文史
2026-02-17 12:20:23
特朗普和民主党人吵起来了

特朗普和民主党人吵起来了

新华社
2026-02-21 14:26:38
窦唯和王菲年轻时候的照片,你们从没见过的照片

窦唯和王菲年轻时候的照片,你们从没见过的照片

草莓解说体育
2026-02-21 22:32:06
为何欧洲在美俄乌谈判中的态度越来越强硬?

为何欧洲在美俄乌谈判中的态度越来越强硬?

高博新视野
2026-02-21 18:17:09
去不了?俄伊军演尴尬收场,亚丁湾的中国军舰宁可干看着也不参加

去不了?俄伊军演尴尬收场,亚丁湾的中国军舰宁可干看着也不参加

解锁世界风云
2026-02-22 00:41:55
陈毅去世后,江青诬陷他“不会打仗,只会下棋”,叶飞:我要发言

陈毅去世后,江青诬陷他“不会打仗,只会下棋”,叶飞:我要发言

帝哥说史
2026-02-21 06:30:03
2026-02-22 07:47:00

科技要闻

智谱上市1月涨5倍,市值超越京东、快手

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

头条要闻

贝加尔湖7名遇难者身份全部确认 1家4口仅1人生还

体育要闻

徐梦桃:这是我第一块铜牌 给我换个吉祥物

娱乐要闻

黄晓明澳门赌博输十几亿 本人亲自回应

财经要闻

一觉醒来,世界大变,特朗普改新打法了

汽车要闻

比亚迪的“颜值担当”来了 方程豹首款轿车路跑信息曝光

态度原创

家居
本地
时尚
公开课
军事航空

家居要闻

本真栖居 爱暖伴流年

本地新闻

春花齐放2026:《骏马奔腾迎新岁》

冬天穿衣尽量别露腿,这些基础穿搭可尝试,简单大方又不挑人

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

硬核揭秘!福建舰“一马当先”底气何在

无障碍浏览 进入关怀版
×