网易首页 > 网易号 > 正文 申请入驻

可令 AI 自我判断输出内容正确性,谷歌公布模型训练框架 ASPIRE

0
分享至

IT之家 1 月 23 日消息,谷歌日前发布新闻稿,介绍了一款专为大语言模型设计的 ASPIRE 训练框架,该框架号称可以增强 AI 模型的选择性预测能力。

谷歌提到,当下大语言模型在自然语言理解和生成内容方面发展迅速,已被用于构建各种创新应用,但要应用于高风险决策类场合依然不妥。这是由于模型预测具有不确定性及“幻觉”可能,因此谷歌开发了一款 ASPIRE 训练框架,为系列模型引入了“可信度”机制,即 —— 模型会输出一系列答案,每个答案都会具有正确概率评分。

▲ 图源 谷歌新闻稿(下同)

在技术层面,IT之家注意到该训练框架主要分为三阶段,分别为“特定任务调整”、“答案采样”和“自我评估学习”。

其中“特定任务调整”阶段是对已接受过基础训练的大型语言模型进行深入训练,专注于强化模型的预测能力。研究人员主要为模型引入一系列可调参数,在特定任务的训练数据集上微调预训练语言模型,从而提升模型预测性能,让模型能够更好地解决特定问题。

第二阶段为“答案采样”,经过特定微调后,模型可以利用先前学习到的可调参数,为每个训练问题生成不同的答案,并创建用于自我评估学习的数据集,生成一系列可信度较高的答案。研究人员同时使用“集束搜索(Beam Search)”方法及 Rouge-L 算法来评估答案的质量,并将生成的答案及评分重新输入给模型开启第三阶段。

而在第三阶段“自我评估学习”中,研究人员为模型添加一组可调参数,专门用于提升模型自我评估能力。该阶段的目标是让模型学会“自己判断输出的答案准确性”,从而让大语言模型在生成答案时,还会附上答案的正确概率评分。

谷歌研究人员使用 CoQA、TriviaQA 和 SQuAD 三个问答数据集来验证 ASPIRE 训练框架的成果,据称“经过 ASPIRE 调整的 OPT-2.7B 小模型,表现远超更大的 OPT-30B 模型”。而这项实验结果也同时表明,只要经过适当的调整,即使是小语言模型,在部分场景下也可以超越大语言模型。

研究人员总结称,ASPIRE 框架训练能够显著提升大语言模型输出准确率,即使是较小的模型,也可以在经过微调后进行“准确且有自信”的预测。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
别被“某音”前凸后翘的网红骗了

别被“某音”前凸后翘的网红骗了

健身S叔
2026-03-22 11:12:04
陈赫第二任老婆张子萱,红毯大翻车!双马尾配白裙,被嘲又老又小

陈赫第二任老婆张子萱,红毯大翻车!双马尾配白裙,被嘲又老又小

一盅情怀
2026-03-28 15:39:06
1982年血色使馆:中国外交官唐健生为了生存杀光了所有同事

1982年血色使馆:中国外交官唐健生为了生存杀光了所有同事

阿校谈史
2026-03-20 11:03:27
3月下旬,贵人悄然入局,事业迎来关键转机的三个星座

3月下旬,贵人悄然入局,事业迎来关键转机的三个星座

小晴星座说
2026-03-29 16:19:45
收银员不识货!网友白菜价捡漏64GB内存惹人羡慕

收银员不识货!网友白菜价捡漏64GB内存惹人羡慕

游民星空
2026-03-29 19:05:19
逼上梁山6:抛尸掩罪证,风雪葬少年

逼上梁山6:抛尸掩罪证,风雪葬少年

金昔说故事
2026-03-29 14:20:30
郑裕彤当年在恒大身上赚了多少钱?

郑裕彤当年在恒大身上赚了多少钱?

担扑
2026-03-29 14:45:27
张雪峰遗容黑眼圈遮不住,曝前妻已再婚生子,沈南忆10年好友泪崩

张雪峰遗容黑眼圈遮不住,曝前妻已再婚生子,沈南忆10年好友泪崩

壹月情感
2026-03-29 16:17:43
反穆情绪高涨,伊斯兰教在印度还能传播开吗?

反穆情绪高涨,伊斯兰教在印度还能传播开吗?

阿讯说天下
2026-03-28 16:16:05
恩比德29分6板76人险胜黄蜂,马克西复出26+7+8鲍尔失扳平球

恩比德29分6板76人险胜黄蜂,马克西复出26+7+8鲍尔失扳平球

湖人崛起
2026-03-29 08:36:28
外国明明也有高酒精度的烈酒,为啥老外还是会喝不惯中国的白酒?

外国明明也有高酒精度的烈酒,为啥老外还是会喝不惯中国的白酒?

向航说
2026-03-16 00:40:03
不服就干!比利时打响反华第一枪,通告全球,断的就是中方退路

不服就干!比利时打响反华第一枪,通告全球,断的就是中方退路

策前论
2026-03-29 21:12:53
包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

包养10位情妇,睡觉翻牌生下11个私生子,75岁还在拼命生娃!

来科点谱
2026-02-16 07:12:06
师徒重逢赛场,克洛普举牌邀蒂亚戈合影

师徒重逢赛场,克洛普举牌邀蒂亚戈合影

懂球帝
2026-03-29 17:53:09
看了“秦岚”的穿搭,我悟了:灰色不配亮色、白色,才更时髦减龄

看了“秦岚”的穿搭,我悟了:灰色不配亮色、白色,才更时髦减龄

蓓小西
2026-03-23 08:31:26
张水华与“冠军车”合影,接受采访尽显高情商,宠粉狂人超接地气

张水华与“冠军车”合影,接受采访尽显高情商,宠粉狂人超接地气

杨华评论
2026-03-29 12:51:29
中国正加速抛售美债,美专家:中国用了新抛售方式,完全无法干预

中国正加速抛售美债,美专家:中国用了新抛售方式,完全无法干预

似水流年忘我
2026-01-29 01:24:08
张作霖的厨子晚年坦言:大帅饭桌上有个不成文的规矩,谁碰谁倒霉

张作霖的厨子晚年坦言:大帅饭桌上有个不成文的规矩,谁碰谁倒霉

千秋文化
2026-02-15 19:32:40
当年劝乌克兰“为民生投降”,如今同一番话,原封不动送给伊朗

当年劝乌克兰“为民生投降”,如今同一番话,原封不动送给伊朗

老马拉车莫少装
2026-03-18 13:51:32
离谱!网传张雪峰生前最后一瓶水被下料有问题,真相曝光

离谱!网传张雪峰生前最后一瓶水被下料有问题,真相曝光

不八卦掌门人
2026-03-29 15:06:38
2026-03-30 00:35:00
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
336537文章数 607097关注度
往期回顾 全部

科技要闻

马斯克承认xAI"建错了",11位创始人均离职

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

头条要闻

中国警告美国:勿将"冲突战乱"引入亚太地区

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

汪峰定律再现!李荣浩喊话单依纯侵权

财经要闻

Kimi、Minimax 们的算力荒

汽车要闻

岚图泰山X8配置曝光 四激光雷达/华为新一代座舱

态度原创

艺术
数码
房产
手机
家居

艺术要闻

耗资4亿!天津第三殡仪馆改成了“公园”样,不阴森了

数码要闻

仅花48元!成功捡漏64GB DDR5内存:血赚好几千

房产要闻

首日430组来访,单日120组认筹!海口首个真四代,彻底爆了!

手机要闻

苹果重返第一,华为微弱差距屈居第二,OPPO稳居第三!

家居要闻

曲线华尔兹 现代简约

无障碍浏览 进入关怀版