网易首页 > 网易号 > 正文 申请入驻

Meta,重磅发布!

0
分享至

开源大模型元老,发布重磅更新。

北京时间4月6日凌晨,美国科技巨头Meta推出了开源人工智能模型Llama 4。据介绍,该模型目前目前有Scout和Maverick两个版本,是Meta迄今为止最先进的模型,也是同类产品中多模态性最强的模型。

在DeepSeek引发模型开源浪潮以前,Meta一直是开源模型的领先玩家及重要的行业奠基者。在ChatGPT横空出世7个多月后,Meta就率先宣布开源Llama 2,并且可免费商用。这也成为大模型发展的分水岭,是开源模型社区的历史性时刻。Llama第四代模型的发布,不仅是Meta应对DeepSeek等新兴开源势力的一次“回击”,同时也推动了开源模型技术的进一步发展和生态的进一步完善。

大规模、多模态、长文本的Llama 4发布

北京时间4月6日凌晨,Meta发布Llama 4系列首批模型,包括两款高效模型Llama 4 Scout、Llama 4 Maverick。此外,Meta还预览了其迄今最强大最智能的模型——Llama 4 Behemoth,是“新模型中的教师”。

Llama 4模型是Llama系列模型中首批采用混合专家(MoE)架构的模型。这一模型也是DeepSeek系列模型采用的架构,与传统的稠密模型相比,在MoE架构中,单独的token只会激活全部参数中的一小部分,训练和推理的计算效率更高。

首先,Llama 4的第一大特点是参数规模大,最先进的Llama 4 Behemoth总参数高达2万亿(作为对照,DeepSeek-R1总参数规模为6710亿)。

其中,Llama 4 Scout面向文档摘要与大型代码库推理任务,专为高效信息提取与复杂逻辑推理打造,共有16位“专家”、1090亿参数、170亿激活参数量;Llama 4 Maverick则专注于多模态能力,支持视觉和语音输入,具备顶级的多语言支持与编程能力,共有128位“专家”、4000亿参数、170亿激活参数量;Llama 4 Behemoth(预览版)则是Meta未来最强大的AI模型之一,具备令人瞩目的超大规模参数架构,具有2880亿激活参数量,总参数高达2万亿。

其次,Llama 4的另外一大特点是多模态能力突出。作为原生多模态模型,Llama 4采用了早期融合(Early Fusion)技术,可以用海量的无标签文本、图片和视频数据一起来预训练模型,实现文本和视觉token无缝整合到统一的模型框架里。

据Meta介绍,Llama用各种图像和视频帧静止图像训练两个模型,以赋予它们广泛的视觉理解能力,包括时间活动和相关图像。这支持多图像输入与文本提示的无缝交互,用于视觉推理和理解任务。模型在预训练中最多使用48张图像,后训练中测试了最多8张图像,结果良好。

最后,Llama在长文本能力上也取得了突破,具有超大的上下文窗口长度。Llama 4 Scout 模型支持高达1000万token的上下文窗口,刷新了开源模型的纪录,而市场上其他领先模型如GPT-4o也未能达到此规模。超大上下文窗口使Llama 4在处理长文档、复杂对话和多轮推理任务时表现出色。

大模型竞争趋于白热化

作为开源模型社区的“领头羊”和佼佼者,Llama(Large Language Model Meta AI)系列模型由Meta在2022年推出。2023年,为应对ChatGPT等领先闭源模型的挑战,Meta率先宣布开源Llama 2,并且可免费商用。这一开源之举激活了开发者社区的创新潜力,此后基于Llama 2构建的应用项目数量大大增加,覆盖各种领域,形成了一个充满活力的生态系统。

2024年4月,Llama 3正式发布,在技术层面实现了诸多突破,最重要的是不仅在单语言任务上表现卓越,还实现了多模态处理能力,能够同时理解并生成文本、图像、音频等多种类型的数据,从而开启了多模态的新纪元。

虽然Meta是开源模型的重要奠基者,但是开源领域的竞争正变得日益激烈和焦灼,尤其是DeepSeek的崛起,对Meta在开源模型社区的领先地位构成了巨大的冲击。

今年1月末,在DeepSeek刚刚在海外火爆出圈时,就有Meta员工在匿名社区TeamBlind上爆料称,仅用550万美元训练的DeepSeek-V3在基准测试中已经让Llama模型相形见绌,Meta的工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。该爆料帖还说,Meta管理层正面临严峻的财务压力,其生成式AI部门数十位高管,“每个人的年薪都超过了DeepSeek-V3的全部训练费用。如何向公司高层解释这种投入产出比,已成为他们的噩梦”。

除了DeepSeek以外,阿里巴巴通义千问系列开源大模型也屡屡斩获佳绩。4月2日,全球最大的AI开源社区Hugging Face更新了大模型榜单,阿里通义千问近期开源的端到端全模态大模型Qwen2.5-Omni登上总榜榜首。据了解,阿里至今已向全球开源200多款模型,千问衍生模型数量已突破10万,超越美国Llama系列,成为全球最大的开源模型族群。

在Llama 4发布之际,OpenAI首席执行官山姆·奥特曼也对外透露了公司的模型发布计划。他表示,OpenAI可能在几周后发布最新的推理模型o3和最新的基座模型o4-mini,然后在几个月后推出GPT-5。

DeepSeek-R2模型何时发布也备受市场关注。4月4日,DeepSeek与清华大学研究团队联合发布题为《奖励模型的推理时Scaling方法及其在大规模语言模型中的应用》的重磅论文,提出自我原则点评调优(SPCT)与元奖励模型(Meta Reward Model)两项核心技术,为提升大语言模型的推理能力提供了全新方法论。虽然官方并未明确R2的发布时间,但这一成果被视为DeepSeek下一代推理模型R2的重要技术铺垫。

技术的不断突破及各家大模型的密集推出,表明大模型竞争趋于白热化,彼此间你追我赶将是未来一段时间的常态。业内人士分析称,模型能力的持续提升,推动大模型竞争进入推理强化和应用拓展的下半场赛程。个人智能体潜力初步显现,行业应用渐次走深,开源开放日益成为大模型的核心竞争力组成。大算力、多模态、强推理、广开源、准数据、智能体、深应用等,成为大模型发展的重要趋势。

责编:李丹

校对:刘榕枝

版权声明

" Type="normal"@@-->

证券时报各平台所有原创内容,未经书面授权,任何单位及个人不得转载。我社保留追究相关行为主体法律责任的权利。

转载与合作可联系证券时报小助理,微信ID:SecuritiesTimes" Type="normal"@@-->

END

" Type="normal"@@-->

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
何晴头七上演冰火两重天:许何独守空房,前夫与现任却在狂欢。

何晴头七上演冰火两重天:许何独守空房,前夫与现任却在狂欢。

陈意小可爱
2025-12-23 15:13:33
马上评|向好友发不雅照算违法?并非修法新增,别误读

马上评|向好友发不雅照算违法?并非修法新增,别误读

澎湃新闻
2025-12-23 10:50:28
马卡:C罗在红海购入两栋豪华别墅,享受私密宁静的家庭时光

马卡:C罗在红海购入两栋豪华别墅,享受私密宁静的家庭时光

懂球帝
2025-12-23 21:16:16
拒绝成为标本:我的“可爱”不设保质期

拒绝成为标本:我的“可爱”不设保质期

疾跑的小蜗牛
2025-12-23 22:17:02
撕破脸了?53岁宁静毫不掩饰,骂张柏芝的三胎全是“赔钱货”

撕破脸了?53岁宁静毫不掩饰,骂张柏芝的三胎全是“赔钱货”

广西阿妹香香
2025-12-21 14:27:21
一夜之间,中国传来2个爆炸性突破,美国从88%降到9%,中国猛追

一夜之间,中国传来2个爆炸性突破,美国从88%降到9%,中国猛追

法老不说教
2025-11-19 22:46:19
没想到!下赛季中超葡萄牙身价最高外援 不是申花特谢拉跟马纳法

没想到!下赛季中超葡萄牙身价最高外援 不是申花特谢拉跟马纳法

80后体育大蜀黍
2025-12-23 23:27:34
美国参众两院提交支持日本决议案

美国参众两院提交支持日本决议案

辇毂
2025-12-23 22:09:03
刺激夜:62岁穆帅率队1-0,那不勒斯2-0夺冠,萨拉赫率队2-1绝杀

刺激夜:62岁穆帅率队1-0,那不勒斯2-0夺冠,萨拉赫率队2-1绝杀

侧身凌空斩
2025-12-23 06:53:14
血亏终结!米兰终于甩掉史上最差引援,年薪400万欧只换来2粒进球

血亏终结!米兰终于甩掉史上最差引援,年薪400万欧只换来2粒进球

只关于米兰
2025-12-23 08:37:10
狗仔确认鹿晗和关晓彤分手,意外透露女方能喝酒,深夜酒局没醉过

狗仔确认鹿晗和关晓彤分手,意外透露女方能喝酒,深夜酒局没醉过

蕾爸退休日记
2025-12-23 16:27:44
1937年王树声率500人掩护李先念,3个月后剩8人,最后乞讨回延安

1937年王树声率500人掩护李先念,3个月后剩8人,最后乞讨回延安

宅家伍菇凉
2025-12-23 10:00:03
香港再无董建华

香港再无董建华

华人星光
2025-11-25 12:01:27
官方:世界斯诺克巡回赛中国公开赛未来三年落户山西

官方:世界斯诺克巡回赛中国公开赛未来三年落户山西

懂球帝
2025-12-23 20:59:43
马杜罗命战舰护航油轮,错了,最佳选择是找中俄当“镖师”

马杜罗命战舰护航油轮,错了,最佳选择是找中俄当“镖师”

南风不及你温柔
2025-12-24 04:18:09
莎莎这孩子是真的懂事。脚扭伤之后

莎莎这孩子是真的懂事。脚扭伤之后

小光侃娱乐
2025-12-23 15:55:05
新加坡反了!越南也反了!中日关系紧张的时候,一个公然站队日本

新加坡反了!越南也反了!中日关系紧张的时候,一个公然站队日本

南权先生
2025-12-23 16:56:51
湖人队詹姆斯谈自己的历史得分纪录:没有刻意追求的情况下完成的

湖人队詹姆斯谈自己的历史得分纪录:没有刻意追求的情况下完成的

好火子
2025-12-24 03:43:27
影响中国人1500年的千字奇文,作者仅用一晚就完成,至今还在流传

影响中国人1500年的千字奇文,作者仅用一晚就完成,至今还在流传

铭记历史呀
2025-12-24 01:55:21
24岁美女被骗到缅北,经历两个月“双开门”折磨,被救已不成人形

24岁美女被骗到缅北,经历两个月“双开门”折磨,被救已不成人形

阿妹讲故事
2025-03-12 22:39:50
2025-12-24 05:24:49
证券时报 incentive-icons
证券时报
运营主体:深圳证券时报社有限公司
845024文章数 238554关注度
往期回顾 全部

科技要闻

惨烈90分钟!快手惊魂:遭遇最强黑产攻击

头条要闻

与多名女子在泳池大尺度照片披露 克林顿最新回应

头条要闻

与多名女子在泳池大尺度照片披露 克林顿最新回应

体育要闻

杨瀚森连续5场DNP!开拓者遭活塞双杀

娱乐要闻

朱孝天回应阿信感谢,自曝没再收到邀约

财经要闻

祥源系百亿产品爆雷 浙金中心18人被拘

汽车要闻

四款新车集中发布 星途正式走进3.0时代

态度原创

时尚
手机
亲子
家居
军事航空

今年流行“毛衣+外套”,这样穿时髦又好看!

手机要闻

荣耀Win系列:标配超声波指纹+5920Hz高频PWM,或力压竞品!

亲子要闻

严禁引入第三方,管住幼儿园乱收费 | 新京报快评

家居要闻

通透明亮 大气轻奢风

军事要闻

俄乌冲突关键人物在莫斯科被炸死 乌方尚未公开认领

无障碍浏览 进入关怀版