网易首页 > 网易号 > 正文 申请入驻

文心大模型 4.5 系列正式开源,涵盖 10 余款模型

0
分享至

作者 | 褚杏娟

6 月 30 日,百度正式开源文心大模型 4.5 系列模型,涵盖 47B、3B 激活参数的混合专家(MoE)模型,与 0.3B 参数的稠密型模型等 10 款模型,并实现预训练权重和推理代码的完全开源。

目前,文心大模型 4.5 开源系列已可在飞桨星河社区、HuggingFace 等平台下载部署使用,系列权重按照 Apache 2.0 协议开源,同时开源模型 API 服务也可在百度智能云千帆大模型平台使用。值得关注的是,此次文心大模型 4.5 系列开源后,百度实现了框架层与模型层的“双层开源”。


https://huggingface.co/models?other=ERNIE4.5

https://aistudio.baidu.com/modelsoverview

早在今年 2 月,百度就已预告了文心大模型 4.5 系列的推出计划,并明确将于 6 月 30 日起正式开源。

文心大模型 4.5 是百度于 2025 年 3 月 16 日发布的新一代多模态基础大模型,属于百度人工智能核心产品体系的重要升级版本。此次百度一次性推出 10 款文心大模型 4.5 系列开源模型,在独立自研模型数量占比、模型类型数量、参数丰富度、开源宽松度与可靠性等关键维度上,均处于行业领先位置。

据介绍,ERNIE 4.5 型号(尤其是基于 MoE 的 A47B 和 A3B 系列)的先进功能由几项关键技术创新支撑:

  • 多模态异构 MoE 预训练。基于文本与视觉模态进行训练,更精准捕捉多模态信息的细微差异,从而提升文本理解生成、图像理解及跨模态推理等任务性能。为避免模态间学习相互干扰,百度团队设计了异构 MoE 结构,并引入了模态隔离路由机制,采用路由正交损失与多模态 token 均衡损失双重优化。这些架构设计确保两种模态特征均得到高效表征,从而在训练过程中实现相互强化。

  • 可扩展高效的基础设施。百度团队提出了一种新异构混合并行和分层负载均衡策略,以实现 ERNIE 4.5 模型的高效训练。通过采用节点内专家并行、内存优化流水线调度、FP8 混合精度训练和细粒度重计算方法,显著提升预训练吞吐量。在推理方面,提出了多专家并行协作方法和卷积码量化算法,以实现 4-bit/2-bit 无损量化。此外,团队还引入了具有动态角色切换的 PD 分解,以有效利用资源,从而提升 ERNIE 4.5 MoE 模型的推理性能。基于 PaddlePaddle 构建的 ERNIE 4.5 可在各种硬件平台上提供高性能推理。

  • 针对特定模态的后训练。为了满足实际应用的多样化需求,团队针对特定模态对预训练模型的变体进行了微调,并针对通用语言理解和生成进行了优化。VLM 专注于视觉语言理解,并支持思考和非思考模式。每个模型都结合使用了监督微调 (SFT) 、 直接偏好优化 (DPO) 或一种名为统一偏好优化 (UPO) 的改进强化学习方法进行后训练。

此外,文心大模型 4.5 开源系列均使用飞桨深度学习框架进行高效训练、推理和部署。在大语言模型的预训练中,模型 FLOPs 利用率(MFU)达到 47%。实验结果显示,其系列模型在多个文本和多模态基准测试中达到 SOTA 水平,尤其在指令遵循、世界知识记忆、视觉理解和多模态推理任务上效果突出。

百度表示,在文本模型方面,文心大模型 4.5 开源系列基础能力强、事实准确性高、指令遵循能力强、推理和编程能力出色,在多个主流基准评测中超越 DeepSeek-V3、Qwen3 等模型。在多模态模型方面,文心大模型 4.5 开源系列拥有卓越的视觉感知能力,同时精通丰富视觉常识,并实现了思考与非思考统一,在视觉常识、多模态推理、视觉感知等主流的多模态大模型评测中优于闭源的 OpenAI o1。此外,在轻量模型上,文心 4.5-21B-A3B-Base 文本模型效果与同量级的 Qwen3 相当,文心 4.5-VL-28B-A3B 多模态模型也是目前同量级最好的多模态开源模型,甚至与更大参数模型 Qwen2.5-VL-32B 不相上下。

文心 4.5 预训练模型在主流基准测试中表现

文心 4.5-300B-A47B 模型在主流基准测试中表现

文心多模态后训练模型(支持思考、关闭思考)的多个多模态基准测试

会议推荐

首届 AICon 全球人工智能开发与应用大会(深圳站)将于 8 月 22-23 日正式举行!本次大会以 “探索 AI 应用边界” 为主题,聚焦 Agent、多模态、AI 产品设计等热门方向,围绕企业如何通过大模型降低成本、提升经营效率的实际应用案例,邀请来自头部企业、大厂以及明星创业公司的专家,带来一线的大模型实践经验和前沿洞察。一起探索 AI 应用的更多可能,发掘 AI 驱动业务增长的新路径!

今日荐文

你也「在看」吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
喜提30亿越南盾!越南队6战5胜+只输中国队 连续2场染红缔造耻辱

喜提30亿越南盾!越南队6战5胜+只输中国队 连续2场染红缔造耻辱

风过乡
2026-01-24 06:36:06
官媒亲宣,25岁王欣瑜再破天花板,让郑钦文和整个网球界沉默了

官媒亲宣,25岁王欣瑜再破天花板,让郑钦文和整个网球界沉默了

丁丁鲤史纪
2026-01-23 11:24:55
为啥唐氏儿“千人一面”?好像都长得一模一样?是什么原因引起的

为啥唐氏儿“千人一面”?好像都长得一模一样?是什么原因引起的

向航说
2026-01-02 00:20:03
1972年,毛主席当着周总理和乔冠华的面批评章含之:你没有出息

1972年,毛主席当着周总理和乔冠华的面批评章含之:你没有出息

大运河时空
2026-01-24 10:40:02
罗威里斯今日都缺阵!杨瀚森机会又来了:赛前热身三分12连中

罗威里斯今日都缺阵!杨瀚森机会又来了:赛前热身三分12连中

罗说NBA
2026-01-24 09:49:30
昔日联盟铁人废了?刚复出又伤了,能换来杜兰特,现在还不如添头

昔日联盟铁人废了?刚复出又伤了,能换来杜兰特,现在还不如添头

你的篮球频道
2026-01-24 10:52:47
他本是个窝囊皇帝,当了十三年傀儡后,却因为一个女人而雄起了

他本是个窝囊皇帝,当了十三年傀儡后,却因为一个女人而雄起了

鹤羽说个事
2026-01-23 16:19:20
1死4伤!北京一商场附近发生严重事故!

1死4伤!北京一商场附近发生严重事故!

美丽大北京
2026-01-23 17:16:12
两部委定调,2026或继续调整养老金,独生子女父母多涨100元吗?

两部委定调,2026或继续调整养老金,独生子女父母多涨100元吗?

八斗小先生
2026-01-24 10:14:03
2026澳网第七日:王欣瑜冲刺16强,高温影响提前开赛!

2026澳网第七日:王欣瑜冲刺16强,高温影响提前开赛!

全网球APP
2026-01-23 18:53:46
彻底逼疯三巨头!阿尔卡拉斯持续打破纪录!德约完全无力抗衡!

彻底逼疯三巨头!阿尔卡拉斯持续打破纪录!德约完全无力抗衡!

生活新鲜市
2026-01-23 15:19:59
杜兰特生涯三分数超越杰森-特里升历史第11,距第十卡特仅7记

杜兰特生涯三分数超越杰森-特里升历史第11,距第十卡特仅7记

懂球帝
2026-01-24 09:05:05
如果活捉了赖清德,建议不要用注射,还是枪决比较适合他

如果活捉了赖清德,建议不要用注射,还是枪决比较适合他

朝子亥
2026-01-22 17:25:03
曼联重大突破!皇马 1.2 亿巨星已点头,克洛普或主动 “舍弃”

曼联重大突破!皇马 1.2 亿巨星已点头,克洛普或主动 “舍弃”

奶盖熊本熊
2026-01-24 06:29:26
刘少林落选米兰冬奥!归化奥运冠军竹篮打水一场空?

刘少林落选米兰冬奥!归化奥运冠军竹篮打水一场空?

阿晞体育
2026-01-23 18:17:08
华尔街的杀猪术,越来越不体面了

华尔街的杀猪术,越来越不体面了

美第奇效应
2026-01-16 03:20:02
释永信和夫人的同框照,被扒出来了!他的艳福和品味是藏不住的…

释永信和夫人的同框照,被扒出来了!他的艳福和品味是藏不住的…

火山诗话
2025-07-29 06:41:00
美国正式退出世卫组织,仍欠费2.6亿美元,尚未支付2024年和2025年度应缴款项

美国正式退出世卫组织,仍欠费2.6亿美元,尚未支付2024年和2025年度应缴款项

每日经济新闻
2026-01-22 15:11:50
吴京再次失手,新片上映8天票房1200万,投资血本无归

吴京再次失手,新片上映8天票房1200万,投资血本无归

小椰的奶奶
2026-01-24 03:05:47
背刺中国,出卖孟晚舟的真凶被挖出来后,如今遭到了哪些报应

背刺中国,出卖孟晚舟的真凶被挖出来后,如今遭到了哪些报应

起喜电影
2026-01-23 16:20:08
2026-01-24 11:32:49
AI前线 incentive-icons
AI前线
面向AI爱好者、开发者和科学家,提供AI领域技术资讯。
1264文章数 112关注度
往期回顾 全部

科技要闻

特斯拉Cybercrab即将落地 每公里不到1块钱

头条要闻

日本迎来"最匆忙"大选 高市早苗解散众议院原因披露

头条要闻

日本迎来"最匆忙"大选 高市早苗解散众议院原因披露

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

李微漪更新:狼王格林去世,3字泪目

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

售75.58万元,新款大众途锐3.0TSI锐臻版上市

态度原创

亲子
房产
旅游
家居
时尚

亲子要闻

马年必入!4款亲子好物玩出年味与知识,承包孩子寒假快乐

房产要闻

正式官宣!三亚又一所名校要来了!

旅游要闻

漫游乐购趣青浦,快来青浦开启周末冬日游吧!

家居要闻

在家度假 160平南洋混搭宅

不一定能掀桌男主,但一定是个好演员!

无障碍浏览 进入关怀版