网易首页 > 网易号 > 正文 申请入驻

【扎克伯格面向AGI开源】Llama 3重磅发布:全球最强开源大模型,GPT4级别开源权重

0
分享至

前几天某度CEO刚刚说完开源模型会越来越落后,今天扎克伯格就放出开源王炸:‍‍‍‍‍‍‍‍‍‍Meta Llama 3横空出世,这是人工智能发展一个历史性时刻

Llama 3系列首发两款模型:80亿参数(Llama 3 8B)和700亿参数(Llama 3 70B)版本,更为强大的版本4000亿参数(Llama 3 400B)还在训练,未来几个月将会发布‍‍‍‍‍‍‍‍‍‍

Llama 3不仅在性能上超越了Llama 2,更在推理、代码生成和指令遵循等方面实现了突破,成为了目前最强大的开源大语言模型

Llama 3的优势

Llama 3的主要优势包括:


  • 性能领先: Llama 3在多个行业基准测试中展现了最先进的性能,其8B和70B参数模型在同等规模模型中处于领先地位


  • 推理能力提升: Llama 3在推理、代码生成和指令遵循等方面取得了显著进步,使其更具实用性和可控性


  • 错误拒绝率降低: Llama 3的错误拒绝率大幅降低,使其成为迄今为止最“乐于助人”的模型

  • 开放性: Llama 3秉承开源精神,将模型代码和资源向社区开放,推动人工智能领域的创新和发展。

Llama 3的技术细节

Llama 3的技术细节包括:


  • 模型架构: Llama 3采用标准的解码器Transformer架构,并引入了分组查询注意力机制(GQA)和更大的词汇表(128K tokens),提升了模型的效率和性能


  • 训练数据: Llama 3使用了超过15万亿个token的训练数据,其中包含高质量的非英语数据,覆盖了30多种语言


  • 数据过滤: Llama 3采用了一系列数据过滤机制,包括启发式过滤、NSFW过滤、语义重复数据删除和文本分类器,确保训练数据的质量


  • 规模化训练: Llama 3使用了先进的训练技术,包括数据并行、模型并行和流水线并行,并在定制的24K GPU集群上进行训练,实现了高效的模型训练

  • 指令微调: Llama 3采用了监督微调(SFT)、拒绝采样、近端策略优化(PPO)和直接策略优化(DPO)等技术进行指令微调,提升了模型的性能和安全性。

Llama 3的发布,业内人士也给予了高度评价

Llama 3的发布引发了人工智能社区的热烈讨论,专家和开发者纷纷表达了对Llama 3的期待和赞誉:

Jim Fan博士:

他认为即将推出的Llama 3-400B+模型将是社区获得GPT-4级别模型的重要里程碑,将改变许多研究和初创企业的发展方向。他期待Llama 3-400B+模型在未来几个月内变得更加完善,并相信它将释放巨大的研究潜力,推动整个生态系统的发展

Cameron R. Wolfe博士:

他指出Llama 3证明了训练优秀大语言模型的关键在于数据质量。他详细分析了Llama 3在数据方面做出的努力,包括:

1)15万亿个token的预训练数据: 比Llama 2多7倍,比DBRX的12万亿个还要多

2)更多代码数据: 预训练过程中包含更多代码数据,提升了模型的推理能力

3)更高效的tokenizer: 拥有更大的词汇表(128K tokens),提高了模型的效率和性能。

4)先进的数据质量过滤: 包括启发式过滤、NSFW过滤、语义重复数据删除和文本分类器等,确保训练数据的质量‍

5)对数据混合的实证分析: 寻找最佳的数据混合方式,确保模型在各个任务上的表现‍

6)对后训练数据的质量过滤: 包括SFT、RLHF、DPO等阶段的数据质量,这对模型的性能至关重要

Aston Zhang(Llama 3开发者):

他分享了Llama 3开发过程中的挑战和经验,强调了数据、计算、基础设施、模型、推理、安全和评估等方面的协同作用。他还透露了Llama 3的一些关键技术细节,例如:

1)最大的模型超过400B参数,且仍在训练中‍

2)选择了8B而不是7B模型,主要原因是升级了tokenizer,词汇表从32K扩展到128K,提高了模型的效率和性能‍

3)预训练上下文窗口设置为8K tokens,未来将发布更长上下文窗口的模型‍

4)除了自动评估,还进行了精心设计的人工评估,以更全面地评估模型的性能。

Bindu Reddy: 她认为Llama 3 70B模型的性能令人惊叹,开源社区将在几周内超越GPT-4

Rowan Cheung

他预测Meta将把GPT-4级别的模型免费提供给超过30亿用户,这将对人工智能的普及和发展产生巨大影响。 他认为,这比人们意识到的更重要,因为大多数人甚至还没有使用过ChatGPT,或者只使用过GPT 3.5一次。 如果Meta执行得当,他们可以让数十亿人觉得Llama 3比ChatGPT更好,因为他们只尝试过GPT 3.5

结语

Llama 3的发布无疑是Meta在大型语言模型领域取得的又一重大突破。凭借海量的高质量训练数据、先进的模型架构、创新的微调技术以及对安全性的重视,Llama 3展现出了卓越的性能,并有望在未来进一步提升,挑战行业巨头。Meta公司坚持开源开放的理念,也必将推动整个AI生态系统的快速发展

Meta推出了新的网站meta.ai已经集成了Llama 3,现在就可以开始使用了‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

Llama 3详细信息:

https://ai.meta.com/blog/meta-llama-3/?utm_source=twitter&utm_medium=organic_social&utm_content=video&utm_campaign=llama3

https://llama.meta.com/llama3/

⭐星标AI寒武纪,好内容不错过

用你的在看告诉我~

开源羊毛

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
令人发指!武汉4岁白化病女孩被生父残忍杀害案件曝光,细节流出

令人发指!武汉4岁白化病女孩被生父残忍杀害案件曝光,细节流出

火山詩话
2026-04-11 17:04:18
注意:这8样东西不能用酒精擦,一擦就坏,无法修复

注意:这8样东西不能用酒精擦,一擦就坏,无法修复

室内设计师有料儿
2026-04-12 13:00:36
“桎梏”不要再读 zhì kù,或 zhì gào,丢不起那个人!

“桎梏”不要再读 zhì kù,或 zhì gào,丢不起那个人!

未央看点
2026-04-10 00:09:02
伊朗谈判代表团成员:世界将见证霍尔木兹海峡的新格局

伊朗谈判代表团成员:世界将见证霍尔木兹海峡的新格局

财联社
2026-04-12 18:50:03
北京飞絮的杨柳树能不能都砍了?官方回应:不能一砍了之 而是科学施策

北京飞絮的杨柳树能不能都砍了?官方回应:不能一砍了之 而是科学施策

闪电新闻
2026-04-12 17:25:25
通往佛山莫氏鸡煲店的道路即将完工,预计下周可通行,老莫:我想缩小店面

通往佛山莫氏鸡煲店的道路即将完工,预计下周可通行,老莫:我想缩小店面

极目新闻
2026-04-11 15:20:15
煮米饭别只加清水!酒店不外传秘诀,粒粒蓬松超好吃

煮米饭别只加清水!酒店不外传秘诀,粒粒蓬松超好吃

开心美食白科
2026-04-09 09:43:04
自2月以来奥赖利已打入6球,与哈兰德并列同期队内最多

自2月以来奥赖利已打入6球,与哈兰德并列同期队内最多

懂球帝
2026-04-13 01:05:10
匈牙利总理欧尔班竞选被喊“俄罗斯人回家”!只剩2成胜率

匈牙利总理欧尔班竞选被喊“俄罗斯人回家”!只剩2成胜率

项鹏飞
2026-04-11 22:08:11
伊美第三轮会谈在伊斯兰堡举行

伊美第三轮会谈在伊斯兰堡举行

新华社
2026-04-12 04:15:03
土耳其央行抛售黄金震动全球金融市场

土耳其央行抛售黄金震动全球金融市场

烽火瞭望者
2026-04-12 14:23:25
郑丽文刚回到台湾,民进党就发难,民众党摊牌,侯友宜彻底不装了

郑丽文刚回到台湾,民进党就发难,民众党摊牌,侯友宜彻底不装了

梁猕爱玩车
2026-04-13 00:07:19
湖人3-0爵士胜,八主力缺阵詹姆斯状态佳

湖人3-0爵士胜,八主力缺阵詹姆斯状态佳

余憁搞笑段子
2026-04-13 01:06:44
“赌王”女儿何超蕸去世享年60岁,曾被父亲赞为最能帮忙的女儿,信德集团官网已变黑白;“赌王”17名子女已有3人离世

“赌王”女儿何超蕸去世享年60岁,曾被父亲赞为最能帮忙的女儿,信德集团官网已变黑白;“赌王”17名子女已有3人离世

极目新闻
2026-04-12 16:25:42
浙大名嘴揭开残酷真相:当年恒大倒台,压根不是因为2万亿负债!

浙大名嘴揭开残酷真相:当年恒大倒台,压根不是因为2万亿负债!

阿器谈史
2026-04-02 13:31:44
网传业内人士名单:4位奥运冠军+央视名记在282人群 未辱骂全红婵

网传业内人士名单:4位奥运冠军+央视名记在282人群 未辱骂全红婵

念洲
2026-04-11 22:07:23
亚锦赛首次封王!石宇奇2-0完胜最强黑马,打破国羽8年冠军荒

亚锦赛首次封王!石宇奇2-0完胜最强黑马,打破国羽8年冠军荒

钉钉陌上花开
2026-04-12 18:36:03
回到台湾就被抓?郑丽文和大陆谈完,临走前达成共识,赖清德急了

回到台湾就被抓?郑丽文和大陆谈完,临走前达成共识,赖清德急了

影孖看世界
2026-04-11 23:45:22
投票率创新高,蒂萨党领先,欧尔班或结束16年执政

投票率创新高,蒂萨党领先,欧尔班或结束16年执政

每日奇迹
2026-04-12 21:08:23
特朗普在伊朗战争中犯下的7个致命错误

特朗普在伊朗战争中犯下的7个致命错误

史政先锋
2026-04-12 18:27:18
2026-04-13 01:40:49
AI寒武纪 incentive-icons
AI寒武纪
专注于人工智能,科技领域
1036文章数 396关注度
往期回顾 全部

科技要闻

理想称遭恶意拉踩,东风日产:尊重同行

头条要闻

伊媒:美驱逐舰遭革命卫队锁定 距离被摧毁仅差几分钟

头条要闻

伊媒:美驱逐舰遭革命卫队锁定 距离被摧毁仅差几分钟

体育要闻

创造历史!五大联赛首位女性主教练诞生

娱乐要闻

赌王女儿何超蕸病逝,常年和乳癌斗争

财经要闻

美伊谈判破裂的三大症结

汽车要闻

焕新极氪007/007GT上市 限时19.39万起

态度原创

艺术
健康
数码
家居
公开课

艺术要闻

揭开她笔下女人的神秘面纱,豪放洒脱的魅力令人惊叹!

干细胞抗衰4大误区,90%的人都中招

数码要闻

苹果版套娃 买台Mac Pro回家:打开一看里面还藏着一台Mac Pro

家居要闻

复古风格 自然简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版