网易首页 > 网易号 > 正文 申请入驻

1370亿参数,谷歌带来新语言模型LaMDA,将实现更安全更高质量对话

0
分享至


如今,语言模型的能力越来越强,在各种任务中都发挥了很大的作用。其中,开放域对话(Open-Domain Dialog)可能是最难以完成的一类任务,需要做到能够就任何主题进行对话。

在对话任务中,除了生成人类认为合理、有趣且特定于上下文的响应之外,语言模型还须按照负责任的人工智能(Responsible AI)框架工作,以免生成无信息源证实的内容。

近日,谷歌在以《LaMDA:对话应用程序的语言模型》(LaMDA: Language Models for Dialog Applications )为题的一篇论文中介绍了语言模型 LaMDA 在安全、可靠和高质量的对话方面取得的最新进展。

据悉,LaMDA 模型具有 1370 亿个参数,通过微调采用 Transformer 架构的专用对话神经语言模型而构建,可以利用外部知识源展开对话。

对于训练对话模型来说,定义目标和指标至关重要。LaMDA 模型具有质量、安全和扎实性三个关键目标,每个目标有各自的衡量指标。

质量上,谷歌将其拆分为合理性、特异性和趣味性(Sensibleness, Specificity, Interestingness,SSI)这三个方面。

其中,合理性是指模型在对话中作出有实际意义的回应,如回应中没有出现常识性错误;特异性是指模型在对话中针对特定的上下文来响应,而不是在常规情形下的通用响应;趣味性是指模型作出了富有洞察力和智慧的回应。

图 | LaMDA 模型对话(来源:谷歌)

安全上,谷歌在开发和部署负责任的人工智能方面有很大的进步。为避免出现各种偏见以及可能对用户造成伤害的内容,其用一组可限制模型输出对话的安全目标来组成安全指标。

由于语言模型有时会输出貌似合理实际却与已知事实相悖的内容,谷歌对 LaMDA 模型的扎实性展开了研究。

扎实性是指在外部世界声明上能够获得权威外部信息来源支持的百分比。但是,在这些来源中建立的 LaMDA 模型也无法完全保证所生成响应的准确性,所以谷歌允许用户及外部系统来源的可靠性来判断响应有效与否。

此外,谷歌在论文介绍了 LaMDA 模型的预训练和微调阶段。

预训练阶段,谷歌做了一个包含 1.56T 词汇的数据集,并将该数据集中的词汇标记为 2.81T SentencePiece token,接着通过 GSPMD 系统对 LaMDA 模型进行预训练。

据了解,谷歌将经过预训练的 LaMDA 模型用于其自然语言处理的研究中,包括程序合成、零样本学习和风格迁移等。

微调阶段,谷歌让 LaMDA 模型执行两类任务,一类是作出面向指定上下文自然语言回应的混合生成任务,另一类响应是否安全和高质量的分类任务,从而成为一个多任务模型。

对话时,LaMDA 生成器会对面向的上下文生成几个候选回应,然后 LaMDA 分类器预测每个候选回应的 SSI 和安全分数,最后根据这两项数据的排名选出最佳回应。

图 | LaMDA 模型对话(来源:谷歌)

人类可以通过现存的工具和知识库来明确事实,而语言模型仅能依靠其内部参数来得到讯息。

为此,谷歌做了一个人类与 LaMDA 模型交流的数据集,并通过该数据集对 LaMDA 模型的生成器和分类器进行微调,让其在与对话期间调用外部信息检索系统,以提高回应的扎实性。

谷歌表示,“在对 LaMDA 模型进行评估后得出,其在每个维度和所有模型大小情况下都显著优于预先训练的模型。无论微调与否,合理性、特异性和趣味性等质量指标通常会随模型参数量而提升。而安全性虽然无法仅根据模型缩放变化,但可以通过微调来提升。”

此外,LaMDA 模型的扎实性会因模型大小的增加而不断提升。造成的原因可能是,模型越大,其记住不常见知识的能力越强,且微调允许模型访问外部知识源,并将记住知识的负载转移到外部知识源。

不过,微调虽然缩小了语言模型与人类之间的差距,但该模型在安全性和扎实性上的水平依然弱于人类。

LaMDA 模型的出现为完成开放域对话开辟了新的途径,同时表明了神经语言模型面临的关键挑战,如安全指标的使用和扎实性的提高,以及如何通过更大的模型和更清晰标记的数据来进行微调。

但是,这还是一项非常早期的工作,且具有很大的局限性。未来,谷歌将探索新的方法来进一步改进安全指标和 LaMDA 模型的扎实性,并与其人工智能原则保持一致。

-End-

参考:
https://ai.googleblog.com/2022/01/lamda-towards-safe-grounded-and-high.html

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中央社会工作部:坚决拥护党中央决定

中央社会工作部:坚决拥护党中央决定

新京报
2026-06-28 09:21:39
扎心痛啊!70岁赵雅芝舞台无美颜生图曝光,手臂衰老的状态太真实

扎心痛啊!70岁赵雅芝舞台无美颜生图曝光,手臂衰老的状态太真实

火山詩话
2026-06-28 14:53:04
彝族姑娘查分后转头先喂猪,她心仪的武汉大学回应了!

彝族姑娘查分后转头先喂猪,她心仪的武汉大学回应了!

环球网资讯
2026-06-28 08:09:11
缴费通知:7月1日实施!退休人员也需缴纳

缴费通知:7月1日实施!退休人员也需缴纳

锦绣太原
2026-06-27 18:36:16
韩媒:洪明甫将开发布会总结韩国队表现,并表明未来执教计划

韩媒:洪明甫将开发布会总结韩国队表现,并表明未来执教计划

懂球帝
2026-06-28 16:20:11
巴西VS日本!谁能赢?罗纳尔多给出了1个答案

巴西VS日本!谁能赢?罗纳尔多给出了1个答案

体育哲人
2026-06-27 22:04:01
随着阿根廷3-1,奥地利3-3,世界杯32强全部诞生:亚洲仅2队

随着阿根廷3-1,奥地利3-3,世界杯32强全部诞生:亚洲仅2队

侧身凌空斩
2026-06-28 12:04:42
倒闭潮来袭!一深耕东莞15年、近500员工的大型电子厂宣告解散

倒闭潮来袭!一深耕东莞15年、近500员工的大型电子厂宣告解散

火山詩话
2026-06-28 07:42:30
电影《抓特务》票房扑街,这个时代的观众不喜欢任何人通过电影“夹带私货”

电影《抓特务》票房扑街,这个时代的观众不喜欢任何人通过电影“夹带私货”

明叔杂谈
2026-06-27 20:18:56
因工作矛盾,男子在手机搜索“密闭空间丙烷爆炸”等内容后,凌晨反锁宿舍并排放丙烷气体,欲炸死熟睡工友,但未能点着,最终获刑两年半

因工作矛盾,男子在手机搜索“密闭空间丙烷爆炸”等内容后,凌晨反锁宿舍并排放丙烷气体,欲炸死熟睡工友,但未能点着,最终获刑两年半

都市快报橙柿互动
2026-06-28 17:47:19
广州高校禁止小米汽车入校!车主怒:特斯拉能进,小米为啥不行?

广州高校禁止小米汽车入校!车主怒:特斯拉能进,小米为啥不行?

听心堂
2026-06-28 16:28:35
美媒警告美国只有两条路:要么核战,要么接受中国统一

美媒警告美国只有两条路:要么核战,要么接受中国统一

近史博览
2026-06-28 11:36:45
记者:乌拉圭足协决定取消包机,球员将乘坐普通航班返回

记者:乌拉圭足协决定取消包机,球员将乘坐普通航班返回

懂球帝
2026-06-28 04:02:02
延迟退休舆论降温的背后,不是黄了,是卡住了

延迟退休舆论降温的背后,不是黄了,是卡住了

大道微言
2026-06-28 09:09:49
韩国伊朗出局!亚洲9队参赛,7队被淘汰,亚足联8.5个名额太多了

韩国伊朗出局!亚洲9队参赛,7队被淘汰,亚足联8.5个名额太多了

侃球熊弟
2026-06-28 12:05:35
清远落龙潭女子溯溪玩水遇难后续,实拍细节曝光,野溪真相太吓人

清远落龙潭女子溯溪玩水遇难后续,实拍细节曝光,野溪真相太吓人

社会日日鲜
2026-06-28 08:42:14
四川男子被骗园区后续!姐姐赴泰挖出猛料,多方勾结,根本防不住

四川男子被骗园区后续!姐姐赴泰挖出猛料,多方勾结,根本防不住

辉哥说动漫
2026-06-27 15:39:30
彻底凉凉!黄一鸣案判了,结果大快人心,难怪王思聪不认孩子

彻底凉凉!黄一鸣案判了,结果大快人心,难怪王思聪不认孩子

赵昉是个热血青年
2026-06-27 19:49:44
中国若退出本届亚运会

中国若退出本届亚运会

小马姨
2026-06-28 13:43:53
香港史上首位在日本AV业出道的香港女子被重案组拘捕,出道时曾因“恭贺新闻稿”惊动港府亲自出面辟谣!

香港史上首位在日本AV业出道的香港女子被重案组拘捕,出道时曾因“恭贺新闻稿”惊动港府亲自出面辟谣!

澳门月刊
2026-06-26 15:43:09
2026-06-28 19:04:49
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16890文章数 515059关注度
往期回顾 全部

科技要闻

DeepSeek最新论文:如何让大模型跑得更快

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

头条要闻

中央巡视后不久副部级官员任上落马 其上任不到一年半

体育要闻

韩国可算确定被淘汰了

娱乐要闻

曾沛慈拿下《乘风2026》年度总冠军

财经要闻

两只股票撑起的韩国股市,半年熔断 33 次

汽车要闻

搭载华为乾崑六件套 东风奕派M8预售19.98万起

态度原创

手机
家居
本地
旅游
军事航空

手机要闻

与高端、中端有关,荣耀传来三大喜讯

家居要闻

绿意盎然 自然之境

本地新闻

世界杯球迷节:比球赛更好玩的派对

旅游要闻

老君山门票及优惠政策指南

军事要闻

特朗普又发文威胁:伊朗将不复存在

无障碍浏览 进入关怀版