网易首页 > 网易号 > 正文 申请入驻

2800亿参数语言模型Gopher开始测试

0
分享至

说到语言模型,毫无疑问是自然语言处理(NLP)领域的核心环节,也是人工智能和机器学习的重要开发基础之一。各大科技公司争相开发更强大的模型,以便从大量数据存储中生成准确和可用的文本。

来自Alphabet(谷歌母公司)旗下的DeepMind于12月8日公布了名为Gopher(金花鼠)的2800亿参数语言模型,同期发布的还有几个较小的模型,这些项目旨在为快速增长的人工智能和机器学习领域提供更强大的支持。

根据一份118页的实验结果报告,DeepMind的研究人员在大多数测试中都取得了先进的成果表现。

研究论文称随着语言模型的扩大,尤其是在阅读理解、事实核查和识别“有毒”语言等领域,性能有所提高。与此同时,逻辑推理和数学推理从大模型中获益较少。本次研究对训练数据集和模型行为进行了整体分析,包括模型规模、偏差和毒性的交集。部分研究还将语言模型应用于诸如人工智能安全以及减轻该技术造成的下游危害等主题。

12月8日,DeepMind发布了三篇研究论文,其中一篇描述了Gopher的结果。其他的论文是一篇关于与大型语言模型相关的伦理和社会风险的研究,以及一篇研究具有更好培训效率的新架构的论文。

作者写道,他们的实验发现,Gopher在几个任务上的性能超过了现有的语言模型,包括在大规模多任务语言理解(MMLU)基准测试上。在MMLU基准上,“Gopher在人类专家表现方面取得了显著进步。”同时还进行了Gopher的定量评估,包括通过直接互动探索模型。“我们的主要发现之一是,当Gopher被提示走向对话互动(比如聊天)时,该模型有时可以提供惊人的一致性。”

按类别划分的海量多任务语言理解(MMLU)基准测试的性能,Gopher在几个类别上改进了之前的工作。例如,研究人员指出,在一个实验中,Gopher能够讨论细胞生物学,并提供正确的引用,尽管所涉及的对话没有进行具体的微调。

“然而,我们的研究也详细说明了在模型大小范围内持续存在的几种失败模式,其中包括重复的倾向、刻板偏见的反映和错误信息的自信传播。”

然而,这些失败可能是有帮助的,研究人员写道。“这种类型的分析很重要,因为理解和记录失败模式让我们了解到大型语言模型如何可能导致下游危害,并向我们展示了研究中缓解努力应该关注的地方,以解决这些问题。”

这种语言建模工作是至关重要的,“因为开发和研究更强大的语言模型——预测和生成文本的系统——有巨大的潜力来构建更先进的人工智能系统”,通过总结信息造福人类,通过自然语言提供专业意见和指导。“开发有益的语言模型需要研究它们的潜在影响,包括它们带来的风险。这包括来自不同背景的专家之间的合作,深思熟虑地预测和解决训练算法在现有数据集上可能产生的挑战。”

近期OpenAI、英伟达、浪潮等公司也在进行类似的语言建模项目。

OpenAI的GPT-3项目是一个巨大的自然语言模型,只在微软Azure上运行。GPT-3(即生成预训练转换器3)是一个具有1750亿个参数的自回归语言模型,OpenAI声称这是以往任何非稀疏语言模型的十倍。第一个版本GPT-1于2018年推出,第二个版本GPT-2于2019年推出。随着2020年GPT-3的发布,自然语言处理(NLP)在企业中获得了比以往任何时候都更强大的功能和用例。

去年11月,英伟达在GTC21大会上发布了新的NeMo Megatron大型语言框架以及最新的5300亿参数的可定制 Megatron-Turing 模型。英伟达表示,Megatron框架使用数万亿个参数来训练语言模型,而 Megatron-Turing NLG(自然语言生成器)的5300亿个可定制大型语言模型将可用于新的领域和语言。

今年10月,总部位于中国的浪潮人工智能研究公司公布了其源1.0语言模型的可用性,该模型拥有2457亿个参数,并使用了5TB的数据集进行了训练。据浪潮人工智能研究公司称,“源1.0”是作为汉语的一个模型从头开始构建的,与英语相比,汉语很复杂,需要一种独特的开发方法。(延展阅读:)

DeepMind是一家总部位于英国的人工智能研究公司,谷歌的母公司Alphabet在2014年收购了该公司。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
用大白话翻译一下“韬定律”,你也能看清这芯片成色如何

用大白话翻译一下“韬定律”,你也能看清这芯片成色如何

基本常识
2026-05-27 17:55:54
华为韬定律到底含金量如何?现在的舆论环境,就是不让人说实话

华为韬定律到底含金量如何?现在的舆论环境,就是不让人说实话

担扑
2026-05-27 16:17:14
诬告朱军性骚扰的“弦子”,终于被封禁了

诬告朱军性骚扰的“弦子”,终于被封禁了

韬闻
2026-05-27 12:46:12
特朗普警告盟友阿曼:不守规矩会被炸飞

特朗普警告盟友阿曼:不守规矩会被炸飞

环球网资讯
2026-05-28 06:17:15
高志凯预判:12至18个月内全球或将爆发金融危机

高志凯预判:12至18个月内全球或将爆发金融危机

凤凰网财经
2026-05-27 20:16:20
未经审批,私自赈灾,河南三支救援队造成极其恶劣的社会影响

未经审批,私自赈灾,河南三支救援队造成极其恶劣的社会影响

齐天候
2026-05-27 18:20:39
全民不接电话!中国要成首个抛弃电话的国家,真相太扎心

全民不接电话!中国要成首个抛弃电话的国家,真相太扎心

番外行
2026-05-25 15:19:56
原版身材就是顶!伊芙体模亲自下场cos

原版身材就是顶!伊芙体模亲自下场cos

奶凶的小霸王
2026-05-26 15:47:03
小米集团总裁卢伟冰:近八成用户在试驾对比YU7标准版与特斯拉Model Y后驱版后,选择了小米

小米集团总裁卢伟冰:近八成用户在试驾对比YU7标准版与特斯拉Model Y后驱版后,选择了小米

鲁中晨报
2026-05-27 14:20:18
知名演员无戏可拍,和母亲街边卖鱼意外走红,今选择拍视频当网红

知名演员无戏可拍,和母亲街边卖鱼意外走红,今选择拍视频当网红

白面书誏
2026-05-27 20:46:32
中国被曝限制AI人才出境,阿里DeepSeek核心人员出国要先获批

中国被曝限制AI人才出境,阿里DeepSeek核心人员出国要先获批

桂系007
2026-05-26 23:43:08
每秒可击落30多只蚊子 众筹超250万美元 中国造“激光灭蚊神器”海外爆单

每秒可击落30多只蚊子 众筹超250万美元 中国造“激光灭蚊神器”海外爆单

封面新闻
2026-05-27 15:24:09
市值3万亿的味精厂,卡了英伟达的脖子,给全世界上了逆袭一课!

市值3万亿的味精厂,卡了英伟达的脖子,给全世界上了逆袭一课!

小陆搞笑日常
2026-05-28 00:00:18
为什么往死里扫黄?网友分享太真实了,一次说透

为什么往死里扫黄?网友分享太真实了,一次说透

另子维爱读史
2026-05-27 20:16:03
“白天正常上班,晚上陪领导睡觉!”

“白天正常上班,晚上陪领导睡觉!”

阿振观点
2026-05-27 21:06:55
湖北大娘硬讹收割机后续!当地人再曝恶行,根本不敢惹,警方介入

湖北大娘硬讹收割机后续!当地人再曝恶行,根本不敢惹,警方介入

削桐作琴
2026-05-27 15:21:19
彻底社死!女子白嫖外卖出圈,海外播放量超2000万,已被公司处理

彻底社死!女子白嫖外卖出圈,海外播放量超2000万,已被公司处理

青梅侃史啊
2026-05-27 14:28:37
突发意外!中国金花独苗晋级法网第三轮

突发意外!中国金花独苗晋级法网第三轮

安评聊网球
2026-05-28 02:54:12
突发!美军对伊朗实施新的打击,伊朗南部连续传出爆炸声!霍尔木兹大消息,特朗普警告盟友:不守规矩会被炸飞;国际油价直线拉升

突发!美军对伊朗实施新的打击,伊朗南部连续传出爆炸声!霍尔木兹大消息,特朗普警告盟友:不守规矩会被炸飞;国际油价直线拉升

每日经济新闻
2026-05-28 07:43:07
年薪2000万的许垚,为什么要毒死身家百亿的林奇?

年薪2000万的许垚,为什么要毒死身家百亿的林奇?

林小明商业评说
2026-05-27 13:24:59
2026-05-28 08:51:00
Ai时代前沿
Ai时代前沿
人工智能新闻动态及应用案例。
1750文章数 512关注度
往期回顾 全部

科技要闻

拼多多股价跌10%:管理层称业绩难免波动

头条要闻

台媒:特朗普就台湾问题表态后 没人敢提“台独”了

头条要闻

台媒:特朗普就台湾问题表态后 没人敢提“台独”了

体育要闻

这群老阿姨,是最硬核的马刺球迷

娱乐要闻

王鹤棣风波连累父亲炸串店遭差评?

财经要闻

一线调查丨燃油车“甩卖”也难卖

汽车要闻

限时补贴价9.28-10.98万 MG 4X正式上市

态度原创

旅游
亲子
本地
时尚
公开课

旅游要闻

在山东,一趟旅程可以处处皆是风景

亲子要闻

专家:别在小事上消耗孩子!网友:瞎扯!硬控自己情绪,满身结节

本地新闻

用剪纸的方式,打开江苏扬州

丑到离谱的牛马鞋,新中产抢疯了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版