网易首页 > 网易号 > 正文 申请入驻

最强开源模型Llama 3.1凌晨发布!推理成本是GPT-4o的一半!小扎:想保竞争优势需靠开源

0
分享至

作者 | 郑松毅

运营编辑 | 李阳

长久的开源与闭源技术路线之争,今天要有个结果了?

今日凌晨,Meta正式发布Llama 3.1系列模型。

硅谷AI见闻从Meta官网获悉,Llama 3.1系列模型共包含8B、70B和405B三个尺寸,最大上下文提升至128K,代码生成、复杂推理能力得到优化。

开源从此不再只是追赶闭源

谁说开源大模型只配陪跑?

据了解,超大杯Llama 3.1 405B被称为全球目前最强大的开源模型,且实力与GPT等主流闭源大模型旗鼓相当。

从某种角度来说,从今天起,或无需再争论开源与闭源的优劣,Llama 3.1用实力证明了技术路线之争并不影响大模型最终性能表现。

可以说,Meta在Llama 3.1模型训练上也是大费苦心,Llama 3.1 405B使用了超过15万亿个token进行训练。

为了使模型训练达到预期效果,Meta更是直接用上了超过16000个H100 GPU对Llama 3.1进行特训,这也是第一次Meta在如此大规模上训练Llama模型。

话不多说,先上一张Meta官方给出的大模型通用基准测试图表,来看看Llama 3.1究竟实力如何。

从基准测试结果来看,超大杯Llama 3.1的大部分表现超过了GPT-4(0125),与第一梯队的最新闭源大模型GPT-4 Omni和Claude 3.5 Sonnet相比不分上下。

具体来看,在MMLU标准中,虽超大杯Llama 3.1得分为88.6,稍低于GPT-4 Omni,但也表明其在多任务知识理解能力方面表现优异。

在NIT/Multi-needle标准中,超大杯Llama 3.1更是取得98.1的高分,表明其在复杂信息处理的能力上也堪称一绝。

在代码生成能力方面(Human Evaluation主要是负责测试代码理解和生成能力),超大杯Llama 3.1与GPT-4 Omni、Claude 3.5 Sonnet相比也稍占上风。

除了超大杯,8B、70B两个尺寸的Llama 3.1模型也上演了“以小博大”的好戏。

从基准测试结果来看,Llama 3.1 8B几乎完胜Gemma 2 9B 1T。而Llama 3.1 70B的表现也是优于Mixtral 8x22B Instruct和GPT 3.5 Turbo。

Meta官方表示,“借助 Llama 3.1,我们评估了超过 150 个涵盖多种语言的基准数据集的性能。这些结果表明 405B 可以与 GPT-4、Claude 2 和 Gemini 等领先的闭源模型竞争。”

“我们还使用 405B 参数模型来提高较小模型的训练后质量,使得研究团队能够每轮创建更高质量的合成数据对模型进行迭代训练。帮助小模型在于参数量相近的模型相比时,同样展现出竞争力。”

小扎发文细谈开源之路

伴随Llama 3.1模型发布,扎克伯格也忍不住发文《Open Source AI is the Path Forward》(开源人工智能是未来发展方向)致辞。

小扎说道,“在高性能计算的早期,主要科技公司都大力投资于开发自己的闭源 Unix 版本。当时很难想象其他任何方法能够开发出如此先进的软件。然而最终,开源 Linux 变得流行起来。最初是因为它允许开发人员随意修改其代码并且更加经济实惠,随着时间的推移,因为它变得更加先进、更加安全,并且拥有比任何闭源 Unix 更多功能的更广泛生态系统的支持。”

“我相信人工智能会以类似的方式发展。如今,有几家科技公司正在开发领先的封闭模型。但开源很快在缩小差距。去年,Llama 2 只能与边缘之后的旧一代模型相提并论。而今年,Llama 3 在一些领域具有竞争力,甚至在某些方面领先于最先进的模型。从明年开始,我们预计未来的 Llama 模型将成为行业中最先进的。但即使在那之前,Llama 已经在开放性、可修改性和成本效益方面处于领先地位。”

谈及开源对于开发者的益处,小扎表示,“我们需要掌控自己的命运,不要被困在封闭的供应商中。相较于闭源,开源软件往往更安全,因为它的开发更加透明。”

“开发者可以在他们自己的基础设施上运行 Llama 3.1 405B 上的推理,成本大约是使用像 GPT-4o 这样的封闭模型的 50%,适用于用户界面和离线推理任务。”

很多人问,Meta会不会担心开源使Llama失去竞争优势,小扎淡定表示,“大模型激烈竞争还会继续,相较于下一代模型,任何模型不会永远保持优势。Llama 要成为行业标准,关键在于一代又一代地保持竞争力、高效性和开放性。”

“Meta 和封闭模型提供商之间的一个关键区别是,出售 AI 模型的访问权限并不是我们的商业模式。通过与 Open Compute Project 共享我们的服务器、网络和数据中心设计,并让供应链标准化我们的设计,我们节省了数十亿美元。我们通过开源领先工具如 PyTorch、React 等受益于生态系统的创新。”

谈及开源对于世界的益处,小扎相信,开源对于积极的人工智能未来是必要的。人工智能拥有比任何其他现代技术更大的潜力,可以提高人类的生产力、创造力和生活质量,加速经济增长,同时在医学和科学研究领域推动进展。开源将确保全球更多人能够分享人工智能的好处和机会,避免权力过度集中在少数公司手中,同时可以更均衡、更安全地在社会各个领域推广这项技术。

“目前存在关于开源 AI 模型安全性的辩论,我认为开源 AI 将比其他选择更安全。我认为各国政府会得出结论,支持开源符合他们的利益,因为这将使世界更加繁荣和安全。开源人工智能代表着世界最好的机会,利用这项技术创造最大的经济机会和安全保障。”

小扎还提到开源对于大模型竞争的意义,“美国的优势在于分散和开放的创新。有人认为我们必须关闭我们的模式,以防止中国获得对它们的访问,但我认为这不会奏效,只会给美国及其盟友带来不利。封闭模型的世界会导致少数几家大公司以及我们的地缘政治对手能够访问领先的模型,而初创公司、大学和小型企业则错失机会。”

“将美国的创新限制在封闭开发中会增加我们根本无法领先的可能性。相反,我认为我们最好的策略是建立一个强大的开放生态系统,并让我们领先的公司与我们的政府和盟友密切合作,确保他们能够最好地利用最新进展,并在长期内取得可持续的先发优势。”小扎说。

“我相信 Llama 3.1 版本将成为行业的一个转折点,大多数开发人员将开始主要使用开源,我期待这种方法从这里开始不断增长。希望您能加入我们,一起努力将人工智能的好处带给世界上的每个人。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
同一套“民生投降论”,为何在乌克兰与伊朗身上轮番上演

同一套“民生投降论”,为何在乌克兰与伊朗身上轮番上演

律法刑道
2026-03-22 10:37:01
“最干净女演员”被富商苦追10年才嫁,如今和女儿被宠如宝

“最干净女演员”被富商苦追10年才嫁,如今和女儿被宠如宝

吃青菜长高
2026-05-26 16:31:47
换了5台车才明白:家用车最没用的,就是车企吹爆的这6个“配置”

换了5台车才明白:家用车最没用的,就是车企吹爆的这6个“配置”

周哥一影视
2026-06-01 13:33:05
“第二个朝鲜”出现了?俄罗斯正在养虎为患,真正慌的是巴基斯坦

“第二个朝鲜”出现了?俄罗斯正在养虎为患,真正慌的是巴基斯坦

健身狂人
2026-06-03 17:37:44
美军证实先空袭后拦截 否认第五舰队总部遇袭

美军证实先空袭后拦截 否认第五舰队总部遇袭

新华社
2026-06-03 08:10:03
小酒窝背LV包过生日!高云翔飞北京跟董璇团聚,爷爷奶奶一脸慈爱

小酒窝背LV包过生日!高云翔飞北京跟董璇团聚,爷爷奶奶一脸慈爱

小彭美识
2026-06-02 23:10:27
航程更远!空客A350-1000ULR成功首飞 最长飞行时长可达22小时

航程更远!空客A350-1000ULR成功首飞 最长飞行时长可达22小时

观潮志科技
2026-06-03 18:55:32
5败1胜!小米汽车,不是鸿蒙智行的对手

5败1胜!小米汽车,不是鸿蒙智行的对手

互联网.乱侃秀
2026-06-02 10:04:29
社交心理学:别人喜欢打压你,并不是看不起你,也不是你努力不够,这所有的一切,都是因为你有着过人之处,又可以被利用的价值

社交心理学:别人喜欢打压你,并不是看不起你,也不是你努力不够,这所有的一切,都是因为你有着过人之处,又可以被利用的价值

心理观察局
2026-06-03 06:13:08
王晓晨俞灏明被曝就医,王晓晨街边抽烟,全程眉头紧锁,神色焦灼

王晓晨俞灏明被曝就医,王晓晨街边抽烟,全程眉头紧锁,神色焦灼

韩小娱
2026-06-02 15:22:29
多次侵入某战区医院数据库,窃取药品数据后对外销售,获利45.8万元!杨某被判3年6个月

多次侵入某战区医院数据库,窃取药品数据后对外销售,获利45.8万元!杨某被判3年6个月

都市快报橙柿互动
2026-06-03 22:25:44
直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

直到伊朗下令轰炸美空军基地,全世界才惊觉:中国有句话说得很对

福建睿平
2026-06-01 13:12:14
巴基斯坦拿霹雳-15E做顺水人情,帮助土耳其研发双脉冲空空导弹?

巴基斯坦拿霹雳-15E做顺水人情,帮助土耳其研发双脉冲空空导弹?

阿龙聊军事
2026-06-03 13:42:05
A股算电协同隐藏龙头,三年不飞三年不叫,高盛、瑞银却重仓?

A股算电协同隐藏龙头,三年不飞三年不叫,高盛、瑞银却重仓?

长风价值掘金
2026-06-03 21:58:54
美股盘前要闻一览:特朗普声称正与伊朗达成协议;Marvell盘前再飙升10%,英特尔有望终结五连跌;欧洲拟减少对美科技巨头依赖

美股盘前要闻一览:特朗普声称正与伊朗达成协议;Marvell盘前再飙升10%,英特尔有望终结五连跌;欧洲拟减少对美科技巨头依赖

财联社
2026-06-03 20:57:09
独家|多地银行正按要求适当加大信贷投放,经营贷等或成提规模方向

独家|多地银行正按要求适当加大信贷投放,经营贷等或成提规模方向

财联社
2026-06-03 17:32:06
西交大学生周凯旋被判死刑,行刑前拒见家属,孤身赴死!

西交大学生周凯旋被判死刑,行刑前拒见家属,孤身赴死!

华人星光
2026-05-23 10:51:12
耿同学遭永久限流后,两大顶尖高校周末深夜官宣,多人集体被免职

耿同学遭永久限流后,两大顶尖高校周末深夜官宣,多人集体被免职

小徐讲八卦
2026-06-01 08:51:26
开源神器TrueNAS接入Home Assistant,我的NAS从存储仓库变身智能控制中枢

开源神器TrueNAS接入Home Assistant,我的NAS从存储仓库变身智能控制中枢

硅屿手记
2026-06-03 01:34:15
重要!湖南省发布2026高考考前提醒!6月9日阅卷,6月25日出成绩

重要!湖南省发布2026高考考前提醒!6月9日阅卷,6月25日出成绩

小e教育
2026-06-03 11:54:03
2026-06-04 05:12:49
搜狐科技 incentive-icons
搜狐科技
搜狐科技官方账号
4863文章数 9193关注度
往期回顾 全部

科技要闻

传DeepSeek融资意向500亿:腾讯投100亿

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

头条要闻

男子不想上班辞职后上武当山当道士 8个月后选择下山

体育要闻

选择中国品牌的库里,和他们的巨大野心

娱乐要闻

官方痛批乱象 刘涛郑恺等艺人遭点名

财经要闻

AI,开始偷懒了?

汽车要闻

专访蒋平:安全不做高低配 长安要让安全技术普惠

态度原创

健康
艺术
亲子
房产
数码

违规干细胞抗衰美容,为何肆无忌惮

艺术要闻

二十年前割麦的场景

亲子要闻

9岁孩童竟患上冠心病!医生说明原因,父母后悔不已……

房产要闻

突发!254亩调规,海口江东的超级学校真的快来了!

数码要闻

高通CEO安蒙:“2026年是智能体之年”,Token成AI新货币

无障碍浏览 进入关怀版