网易首页 > 网易科技 > 网易科技 > 正文

谷歌 PaLM 2训练所用文本数据量是初代的近5倍

0
分享至

5月17日消息,谷歌上周在2023年I/O开发者大会上推出最新大型语言模型PaLM 2。公司内部文件显示,自2022年起训练新模型所使用的文本数据量几乎是前一代的5倍。

据悉,谷歌最新发布的PaLM 2能够执行更高级的编程、运算和创意写作任务。内部文件透露,用于训练PaLM 2的token数量有3.6万亿个。

所谓的token就是字符串,人们会将训练模型所用文本中的句子、段落进行切分,其中的每个字符串通常被称为token。这是训练大型语言模型的重要组成部分,能教会模型预测序列中接下来会出现哪个单词。

谷歌于2022年发布的上一代大型语言模型PaLM在训练中使用了7800亿个token。

尽管谷歌一直热衷于展示其在人工智能技术领域的实力,说明如何将人工智能嵌入到搜索引擎、电子邮件、文字处理和电子表格中,但一直不愿公布训练数据的规模或其他细节。微软支持的OpenAI也对最新发布的GPT-4大型语言模型细节保密。

两家公司都表示,不披露这些信息的原因是人工智能行业存在激烈竞争。谷歌和OpenAI都想要吸引那些希望使用聊天机器人而不是传统搜索引擎搜索信息的用户。

但随着人工智能领域竞争的白热化,研究界要求提高透明度。

自推出PaLM 2以来,谷歌一直表示,新模型比之前的大型语言模型更小,这意味着该公司技术在完成更复杂任务时能变得更高效。参数(parameters)通常用于说明语言模型的复杂性。根据内部文件,PaLM 2接受了3400亿个参数的训练,初代的PaLM接受了5400亿个参数的训练。

谷歌没有立即发表评论。

谷歌在一篇关于PaLM 2的博客文章中表示,新模型使用了一种名为“计算最优缩放”(compute-optimal scaling)的“新技术”,能使得PaLM 2“更高效,整体性能更好,比如推理更快、服务参数更少,服务成本也更低。”

在发布PaLM 2时,谷歌透露新模型接受了100种语言的训练,并能胜任各种各样的任务。包括谷歌试验性聊天机器人Bard在内的25项功能和产品用的都是PaLM 2。PaLM 2按参数规模有四个不同的版本,从小到大依次是Gecko(壁虎)、Otter(水獭)、Bison(野牛)和Unicorn(独角兽)。

根据谷歌公开披露的信息,PaLM 2比任何现有模型都更强大。Facebook在今年2月份宣布推出名为LLaMA的大型语言模型,其在训练中用了1.4万亿个token。OpenAI发布GPT-3时披露了相关训练规模,当时公司表示,这一模型接受了3000亿个token的训练。今年3月份,OpenAI发布新模型GPT-4,并表示在许多专业测试中表现出“人类水平”。

根据最新文件,谷歌两年前推出的语言模型接受了1.5万亿个token的训练。

随着新的生成式人工智能应用迅速成为科技行业主流,围绕底层技术的争议也越来越激烈。

今年2月份,谷歌研究部门高级科学家埃尔·马赫迪·埃尔·马哈迪(El Mahdi El Mhamdi)因公司缺乏透明度而辞职。周二,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)在美国参议院司法小组委员会关于隐私和技术的听证会上出庭作证,也同意用新系统来应对人工智能。

“对于一项非常新的技术,我们需要一个新的框架,”奥尔特曼说,“当然,像我们这种公司对自己推出的工具负有很大责任。”(辰辰)

延伸阅读
相关推荐
热点推荐
上海猎头大佬庄华猝死:白天谈完千万大单,晚上人就没了,值吗?

上海猎头大佬庄华猝死:白天谈完千万大单,晚上人就没了,值吗?

卷史
2025-12-14 11:18:07
何晴去世更多细节公开,被曝手术后智商像儿童,许亚军评论区沦陷

何晴去世更多细节公开,被曝手术后智商像儿童,许亚军评论区沦陷

古希腊掌管月桂的神
2025-12-14 12:00:03
暴跌98%、停产关店!又一巨头败走中国,曾获比尔·盖茨投资

暴跌98%、停产关店!又一巨头败走中国,曾获比尔·盖茨投资

财经八卦
2025-12-13 19:50:42
何晴唯一的儿子许何已从中央戏剧学院毕业,不久前和父亲许亚军合体亮相杂志

何晴唯一的儿子许何已从中央戏剧学院毕业,不久前和父亲许亚军合体亮相杂志

扬子晚报
2025-12-14 14:29:49
何晴离世年仅61岁!生前因脑瘤淡出娱乐圈,后患癌恶化无法手术

何晴离世年仅61岁!生前因脑瘤淡出娱乐圈,后患癌恶化无法手术

萌神木木
2025-12-14 10:38:04
公开道歉也没用?东京爆发抗议,高市或被迫下台,日本开始找帮手

公开道歉也没用?东京爆发抗议,高市或被迫下台,日本开始找帮手

博览历史
2025-12-13 14:38:17
特朗普在亚非调停均失败,美方发声

特朗普在亚非调停均失败,美方发声

上观新闻
2025-12-14 15:23:06
万亿顺差背后,为什么“扩大内需”成了最紧迫的事?

万亿顺差背后,为什么“扩大内需”成了最紧迫的事?

知本设
2025-12-13 10:32:01
我们都低估了中证A500

我们都低估了中证A500

智谷趋势
2025-12-11 12:49:10
活久见!重庆10人聚餐消费1262元无人买单,参与者全部被曝光…

活久见!重庆10人聚餐消费1262元无人买单,参与者全部被曝光…

火山詩话
2025-12-13 06:07:52
何晴去世:一代美人离去,古今多少事,都付笑谈中

何晴去世:一代美人离去,古今多少事,都付笑谈中

红星新闻
2025-12-14 12:06:22
人民日报:早睡一小时,是性价比最高的投资

人民日报:早睡一小时,是性价比最高的投资

洞见
2025-12-13 21:13:09
远离!无锡常州交界处,突然出现!

远离!无锡常州交界处,突然出现!

江南晚报
2025-12-14 13:25:31
WTT香港总决赛:男女单打决赛赛程公布

WTT香港总决赛:男女单打决赛赛程公布

极目新闻
2025-12-14 09:37:32
战满7局惜败!林诗栋3-4不敌张本智和,遗憾无缘总决赛男单决赛

战满7局惜败!林诗栋3-4不敌张本智和,遗憾无缘总决赛男单决赛

全景体育V
2025-12-14 14:46:42
边斗地主边吸氧?沪上富豪周末新玩法,业内:有钱男人的新宠

边斗地主边吸氧?沪上富豪周末新玩法,业内:有钱男人的新宠

金错刀
2025-12-14 08:41:16
曝何晴去世细节!10年前确诊脑癌,去年做了手术,5月份转移扩散

曝何晴去世细节!10年前确诊脑癌,去年做了手术,5月份转移扩散

180视角
2025-12-14 11:48:55
魔法打败魔法!银行办业务被“刁难”,男子报警要求反查职员身份

魔法打败魔法!银行办业务被“刁难”,男子报警要求反查职员身份

火山詩话
2025-12-14 06:33:29
不会真有人信《永乐大典》里有蒸汽机吧?

不会真有人信《永乐大典》里有蒸汽机吧?

雷斯林
2025-12-14 12:06:34
何晴生前最大谣言!没有再婚嫁廖京生,唯一一段婚姻是和许亚军

何晴生前最大谣言!没有再婚嫁廖京生,唯一一段婚姻是和许亚军

萌神木木
2025-12-14 11:44:44
2025-12-14 16:31:00

科技要闻

当人形机器人有了App Store,宇树在赌什么

头条要闻

中国留学生亲历美大学枪击案:当时在想美国水泥厚不厚

头条要闻

中国留学生亲历美大学枪击案:当时在想美国水泥厚不厚

体育要闻

梅西致谢球迷:荣幸在印度共度这些日子

娱乐要闻

“仙女归班”!演员何晴去世,享年61岁

财经要闻

重大违法强制退市!10人被判刑

汽车要闻

硬核敞篷巴士?掷弹兵Game Viewer 2026年初量产

态度原创

教育
本地
亲子
数码
公开课

教育要闻

五年级数学:解方程详解,必须必会

本地新闻

云游安徽|阜阳三朝风骨,传承千年墨香

亲子要闻

“天王嫂”方媛产后坐月子生活曝光!夜晚给女儿读诗听好温馨

数码要闻

乔思伯D401隐士机箱发布:双侧透玻璃设计,兼容背插主板

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版
×