网易首页 > 网易号 > 正文 申请入驻

谷歌推出DataGemma,解决“幻觉”问题并提升AI模型数据可靠性

0
分享至

近日,谷歌推出了一项名为 DataGemma 的创新技术,旨在解决大型语言模型在处理统计数据时容易产生“幻觉”的问题。

这一技术的出现,是 AI 领域在提高模型准确性和可靠性方面的新尝试。

大模型作为近年来 AI 领域的重大突破之一,已经在代码生成、内容生成等多个领域得到广泛应用,为个人和企业节省了宝贵的时间和资源。

然而,即便取得了显著的进展,这些模型在处理涉及数值、统计数据或其他事实相关的问题时,仍然存在产生“幻觉”的倾向。所谓“幻觉”,是指模型有时会呈现不准确的信息。

谷歌的研究人员指出:“(我们)已经识别出造成这些现象的几个原因,包括大模型生成的本质上具有概率性,以及训练数据中缺乏足够的事实覆盖等。”

即便是传统的事实验证方法,在处理涉及逻辑、算术或比较操作的统计查询时,效果也往往不佳。这是因为统计数据分布在各种不同的模式和格式中,需要相当多的背景(上下文)知识才能正确解释。

为了解决这些问题,谷歌研究人员用到了 Data Commons 平台。该平台是公开可用的知识图谱,共包括 2400 亿多个可信组织丰富数据点,它们来自联合国、世界卫生组织、疾病控制与预防中心和人口普查局等。

他们通过两种不同的方法将其与 Gemma 系列语言模型结合,从而开发出了新的 DataGemma 模型。

该模型采用两种独特的方法,来提高其在处理统计数据时的准确性:检索交错生成(RIG,Retrieval Interleaving Generation)方法和检索增强生成(RAG,Retrieval Augmented Generation)方法。

其中,RIG 方法通过比较模型的原始生成结果与存储在 Data Commons 中的相关统计数据,来提高事实准确性。

具体来说,经过微调的大模型会生成描述性的自然语言查询。

然后,一个多模型后处理管道将这个查询转换为结构化数据查询,执行后就能从 Data Commons 中检索相关的统计答案,从而支持或纠正大模型的生成结果,并提供相关引用(证据)。

另一种 RAG 方法是许多公司已经在使用的技术,用于帮助模型整合训练数据之外的相关信息。

在 DataGemma 中,经过微调的 Gemma 模型使用原始统计问题来提取相关变量,并为 Data Commons 数据库生成自然语言查询。执行这个查询指令,就会得到相关的统计数据或表格。

一旦提取了这些值,它们就会与原始用户查询一起被当做提示的一部分,输入到一个长上下文大模型(在这种情况下是 Gemini 1.5 Pro)中,进而生成具有高度准确性的最终答案。

在对 101 个人工生成的查询进行测试时,使用 RIG 方法微调的 DataGemma 将基线模型 17% 的事实准确率提高到了约 58%。虽然使用 RAG 方法的结果略显逊色,但仍然比基线模型有所改进。

DataGemma 模型能够回答 24-29% 的查询,提供来自 Data Commons 的统计响应。对于这些响应中的大多数,大模型在数字方面的回应通常是准确的(99%)。

然而,在正确推断这些数字的含义时,它仍然有 6% 到 20% 的失误率。

尽管如此,RIG 和 RAG 都能有效地提高模型在处理统计查询时的准确性,特别是与研究和决策相关的查询。

它们各有优缺点,RIG 速度更快但细节较少(因为它检索单个统计数据并验证),而 RAG 提供更全面的数据,但受到数据可用性和处理大量上下文能力的限制。

通过公开发布 DataGemma 及其 RIG 和 RAG 方法,谷歌希望推动这两种方法的进一步研究,并为构建更强大、更有根据的模型开辟道路。

该公司对媒体表示:“我们的研究正在进行中,我们致力于在扩大这项工作规模、对其进行严格测试,并最终将这种增强功能整合到 Gemma 和 Gemini 模型中时进一步完善这些方法,最初将通过分阶段的限制访问方式推出。”

通过将这一最新的 Gemma 模型变体再次作为开放模型共享,谷歌希望促进这些技术的广泛采用,并在事实数据基础上对大模型进行验证,更好地应对大模型的“幻觉”问题。

总体来说,提高大模型的可靠性和可信度是确保它们成为每个人不可或缺工具的关键,也为 AI 能够提供准确信息、促进明智决策和加深对周围世界的理解建立基础。

参考资料:

https://blog.google/technology/ai/google-datagemma-ai-llm/

https://venturebeat.com/ai/datagemma-googles-open-ai-models-mitigate-hallucination-on-statistical-queries/

运营/排版:何晨龙

01/

02/

03/

04/

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
“文嘎之交”冲上B站热榜,这场世纪连麦算和解吗?

“文嘎之交”冲上B站热榜,这场世纪连麦算和解吗?

四味毒叔
2026-07-01 15:29:45
李春平好莱坞百亿遗产神话破灭,2002年承德文物大案将其拉下神坛

李春平好莱坞百亿遗产神话破灭,2002年承德文物大案将其拉下神坛

磊子讲史
2026-07-02 11:30:07
人去楼空!仅剩一家门店!不少人懵了:要退出杭州吗?

人去楼空!仅剩一家门店!不少人懵了:要退出杭州吗?

北青网-北京青年报
2026-07-02 10:34:04
德州爆发反伊斯兰风潮!穆斯林被歧视为扼杀文明的恐怖分子!

德州爆发反伊斯兰风潮!穆斯林被歧视为扼杀文明的恐怖分子!

罐头告诉猫迷
2026-07-01 12:26:11
朗尼克:如果问我今天的西班牙谁是全场最佳,那只能是罗德里

朗尼克:如果问我今天的西班牙谁是全场最佳,那只能是罗德里

懂球帝
2026-07-03 07:48:08
韩红再惹争议,援蒙现场护腰带外穿被指作秀,她的公益要被否定?

韩红再惹争议,援蒙现场护腰带外穿被指作秀,她的公益要被否定?

娱乐团长
2026-07-01 11:12:59
美股,突变!黄金、白银,直拉!乌克兰首都遭空袭!

美股,突变!黄金、白银,直拉!乌克兰首都遭空袭!

证券时报e公司
2026-07-03 07:56:30
赚着中国人钱,毒害中国人身体,日企在华收割万亿,至今仍在售卖

赚着中国人钱,毒害中国人身体,日企在华收割万亿,至今仍在售卖

云舟史策
2026-07-02 07:09:53
暗黑心理学:一个男人可以花钱去嫖一个长期卖淫的女人,却始终不肯原谅出轨悔罪回家的老婆。这是怎么回事呢?

暗黑心理学:一个男人可以花钱去嫖一个长期卖淫的女人,却始终不肯原谅出轨悔罪回家的老婆。这是怎么回事呢?

心理观察局
2026-06-17 06:38:26
公司新招了个211的研究生,结果培训一结束,他就辞职了。只因公司停车场没有30万以上的车,这种公司虽然大,但是对员工抠门,没前途

公司新招了个211的研究生,结果培训一结束,他就辞职了。只因公司停车场没有30万以上的车,这种公司虽然大,但是对员工抠门,没前途

不二大叔
2026-07-01 00:48:40
考上海交大奖200万,复旦奖100万!浙江一校高考奖励政策,引争议

考上海交大奖200万,复旦奖100万!浙江一校高考奖励政策,引争议

火山詩话
2026-07-02 15:09:45
墨西哥球迷狂欢震动地球:地震仪捕捉到强烈信号 狂欢导致三人死亡

墨西哥球迷狂欢震动地球:地震仪捕捉到强烈信号 狂欢导致三人死亡

红星新闻
2026-07-02 17:59:23
WTT美国大满贯第4天,张本美和栽了,蒯曼的话让日本队员心寒

WTT美国大满贯第4天,张本美和栽了,蒯曼的话让日本队员心寒

爱体育的小悠悠
2026-07-03 00:14:54
斯诺克决出20席32强!中国双星连日突围,刘宏宇新赛季赚17万奖金

斯诺克决出20席32强!中国双星连日突围,刘宏宇新赛季赚17万奖金

刘姚尧的文字城堡
2026-07-03 08:28:55
精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

精神小妹的生活原来是这样的!网友:终于知道她们为啥都这么瘦了

深度报
2026-02-11 23:35:03
伊最高领袖没料到,老哈梅灵车还没到圣城,以色列先准备斩首行动

伊最高领袖没料到,老哈梅灵车还没到圣城,以色列先准备斩首行动

时光流转追梦人
2026-07-03 02:03:12
苏州一医院现低矮“丁义珍式”窗口,院方回应

苏州一医院现低矮“丁义珍式”窗口,院方回应

界面新闻
2026-07-02 18:46:01
前所未有!NBA两周!!送走3位冠军FMVP!

前所未有!NBA两周!!送走3位冠军FMVP!

柚子说球
2026-07-03 01:33:37
西安赛格商户坠楼,曾因“拆券”被罚千万,详情披露

西安赛格商户坠楼,曾因“拆券”被罚千万,详情披露

中国新闻周刊
2026-07-02 18:40:49
四川一名大学生发了几条短信被广州电信“保护性停机” 多个App受影响 要想恢复得奔波数千公里线下办理

四川一名大学生发了几条短信被广州电信“保护性停机” 多个App受影响 要想恢复得奔波数千公里线下办理

信网
2026-07-01 16:29:16
2026-07-03 09:11:00
DeepTech深科技 incentive-icons
DeepTech深科技
麻省理工科技评论独家合作
16914文章数 515071关注度
往期回顾 全部

科技要闻

特斯拉交付超预期7.4万辆,股价却大跌7.5%

头条要闻

母亲腿疾 上海孝顺女儿自费装"电梯"给全楼用却遭抵制

头条要闻

母亲腿疾 上海孝顺女儿自费装"电梯"给全楼用却遭抵制

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

数码
艺术
手机
公开课
军事航空

数码要闻

卓威同步发布XQ2766X显示器:27" QHD 360Hz TN

艺术要闻

世界上最惊险的10个地方,中国竟然有3个!

手机要闻

千元机将消失了吗?卢伟冰:手机行业正经历近十年来最严峻时刻

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军“航母杀手”首次公开 此前从未展示

无障碍浏览 进入关怀版