网易首页 > 网易号 > 正文 申请入驻

百度大模型又支棱起来了吗?文心一言 5.0 我实测了

0
分享至

免责:

本文纯个人观点,仅测试文本理解、代码生成能力,结果不代表 ERNIE 5.0 完整、真实水平。

省流

  • 1、生成速度很慢

  • 2、网页版居然没有 html 预览功能,这事儿不难啊,Kimi、Qwen 都可以

  • 3、各种拉垮,6 个题目,没有 1 个可以与 Kimi K2 Thinking 掰手腕,只有最后1题完成度高,能勉强与Qwen-3Max对比

  • 4、它对指令的理解很差,但凡与图像生成沾边的都会忽略指令,开始直接 AI 绘图,即便你已经明确告诉它了实现方式也不行。

  • 5、或许我不应该测试它最新这个多模态版 ERNIE 5.0,1022 版本的文心 5.0 号称文本能力更强,我没再测。但是话说回来了,多模态就可以不遵守指令吗?

  • 6、它太喜欢画画了

大家好,我是 Ai 学习的老章

最近一周国产大模型还是很热闹的

阿里更新了 Qwen DeepResearch、微博开源了基于 Qwen2.5-Math-1.5B 微调 VibeThinker 1.5B 大模型

最让我感兴趣的是“支棱起来”的百度 ERNIE 5.0 来了,对标 ChatGPT,原生全模态支持。

官方宣称的模型特色之处:

原生统一多模态建模技术,结合文本、图像、音频和视频进行理解和生成 采用超过 2.4T 的 MoE 架构,每次推理激活不到 3 个,降低计算量同时提升推理效率 在 40 多项基准测试中表现出前沿水平的性能

基准测试对比情况

1、文本处理,各项基准平均值,稳赢 DeepSeek-V3.2-Exp 和 Gemini-2.5-Pro,还有几个基准能打赢 GPT-5


2、视觉理解各种领先,N 多项上 Gemini-2.5-Pro、GPT-5 都手下败将


3、图像生成秒杀 GPT-image 和谷歌的 Nano-Banana、视频生成与 Veo3 旗鼓相当


4、音频理解、STT、语音识别都各种强过 GPT-4o-Audio、Gemini-2.5-Pro


真实水平咋样呢,我就直接单测试其文本处理、代码能力吧

这些题目与之前我测试 K2 Thinking 和 Qwen3-Max 一致,更容易看出模型差距

测试平台为官方网站:https://ernie.baidu.com/

模型选择文心 5.0 Preview


ERNIE 5.0 1022 预览版具有更强的文字能力,ERNIE 5.0 预览版是最新版本 测试 1:总结朱自清《背影》绘制 SVG

字都出格了,跟 Kimi K2 Thinking 没法比,也比不上一样没能正确识别出 4 次背影但绘制 svg 正常的 Qwen3-Max,

Kimi K2 Thinking
Qwen3-Max


测试 2:生成器官分布

怎么就出发了绘图功能呢?


即便告诉它给我 svg 代码,依然失败



测试 3:用 html 创建一个带有旋转星云和动态光照的 3D 粒子星系。

思考过程看,也是用 Three.js 创建 3D 场景、相机和渲染器,但是太太太简陋了

完败与 K2 Thinking 和 Qwen3-Max


没有对比就没有伤害


测试 4:发挥你的最大才能,用你最擅长的工具,生成一组数据后绘制数据大屏,主题自拟。

ERNIE 5.0 不像 K2 和 Qwen,它先用 Python 脚本生成 csv 数据集,但是可视化时,它告诉我要用Power BI实现。。。


K2 Thinking 生成的是"未来智慧城市运营中心"主题的数据大屏,包含动态生成的多维度城市运营数据。一共 285 行代码。前两次均报 bug,第三次成功生成!


对比 Qwen3-Max⬇️,它第一次的代码也报错,第二次成功


测试 5:3D 动画演示月食原理及全过程

不遵指令,后面我追问了,给我 html 代码,依然是绘图



Kimi K2⬇️

测试 6:生成一个动态网页,展现绚丽多彩的烟花盛况,样式要多,颜色要炫

这次遵守指令了,思考过程是用 html+CSS+js 实现,效果如下,除了相比 K2 和 Qwen 功能上少了,完成度还不错,甚至比 Qwen3-Max 还要好点的感觉

K2 Thinking 碾压 Qwen3-Max 的视频

最后再说一句,即便是我切换成 10 月份擅长文本生成的文心 5.0,它的指令遵循也不稳定,它太喜欢画画了,思考过要用 html5 和 webgl 实现后,pia 一下直接 AI 绘画了


最后再推荐一个我正在学习的强化学习课程



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
49岁赵薇广东饭局近照疯传!瘦脱相显凶相,当年小燕子彻底凉透了

49岁赵薇广东饭局近照疯传!瘦脱相显凶相,当年小燕子彻底凉透了

阿纂看事
2025-12-12 09:18:29
蔡磊致渐冻症病友新年公开信:历史已经被改写,将抗争到最后一刻

蔡磊致渐冻症病友新年公开信:历史已经被改写,将抗争到最后一刻

澎湃新闻
2026-01-01 15:36:32
评论:绝路狂奔!赖清德嫡系推动“法理台独”提“引战法案”的三重算计

评论:绝路狂奔!赖清德嫡系推动“法理台独”提“引战法案”的三重算计

海峡导报社
2026-01-05 00:12:30
被年轻人的收纳智慧惊艳了,果然是新脑子好使!难怪家里井井有条

被年轻人的收纳智慧惊艳了,果然是新脑子好使!难怪家里井井有条

美家指南
2026-01-04 14:45:12
希望中国,少一些唱赞歌的弱智,少一些乱撕咬的野狗

希望中国,少一些唱赞歌的弱智,少一些乱撕咬的野狗

柴差说
2025-09-09 13:19:04
早日康复,摩纳哥全队身穿印“加油拓实”的T恤支持南野拓实

早日康复,摩纳哥全队身穿印“加油拓实”的T恤支持南野拓实

懂球帝
2026-01-04 11:42:18
赵薇母女亮相上海,小四月一头黄发被吐槽,赵薇2026年有新动作

赵薇母女亮相上海,小四月一头黄发被吐槽,赵薇2026年有新动作

古希腊掌管月桂的神
2026-01-04 15:40:37
这是同一帧吗?半自动越位显示维尔茨进球不越位引发争议

这是同一帧吗?半自动越位显示维尔茨进球不越位引发争议

懂球帝
2026-01-05 01:14:06
“最快女护士”张水华宣布辞职后,医院回应:已批准其辞职申请

“最快女护士”张水华宣布辞职后,医院回应:已批准其辞职申请

大风新闻
2026-01-04 11:44:14
CBA积分榜最新排名出炉!广厦第1辽宁第9:山西杀回前8?

CBA积分榜最新排名出炉!广厦第1辽宁第9:山西杀回前8?

篮球快餐车
2026-01-05 00:46:20
剪发、玩手机、拒交流!小玥儿这波“无声反抗”,狠狠打谁的脸?

剪发、玩手机、拒交流!小玥儿这波“无声反抗”,狠狠打谁的脸?

阿废冷眼观察所
2025-12-29 03:51:04
淘宝成功,乐福逆袭成球队替补核心,一特质杨瀚森需要多向其学习

淘宝成功,乐福逆袭成球队替补核心,一特质杨瀚森需要多向其学习

拾叁懂球
2026-01-05 01:44:20
陈慧琳素颜现身美国超市,腮帮子鼓起来了,一笑就看出牙不整齐

陈慧琳素颜现身美国超市,腮帮子鼓起来了,一笑就看出牙不整齐

孤酒老巷QA
2026-01-04 19:43:16
法国没有参与火烧圆明园?英国人说出放火真正目的:让中国记住

法国没有参与火烧圆明园?英国人说出放火真正目的:让中国记住

史之铭
2025-12-11 16:37:42
香港回归当晚,查尔斯王子演讲慢了23秒,英方国旗提前10秒下降

香港回归当晚,查尔斯王子演讲慢了23秒,英方国旗提前10秒下降

古书记史
2026-01-03 01:01:38
蒋万安的一张全家福,他有三个儿子,妻子看着就是挺和善的一个人

蒋万安的一张全家福,他有三个儿子,妻子看着就是挺和善的一个人

大江
2025-12-30 14:45:26
梅婷晒视频忘开美颜,脖子黑,皮还松,看脖子像是60岁的人!

梅婷晒视频忘开美颜,脖子黑,皮还松,看脖子像是60岁的人!

韩驰
2026-01-04 16:18:06
在超市制止插队,被黑人当众殴打身亡,妻子目睹全程,结果凶手只判了5年?!

在超市制止插队,被黑人当众殴打身亡,妻子目睹全程,结果凶手只判了5年?!

新欧洲
2025-12-23 20:57:43
女人正不正经一眼便知,不正经的女人,多半都有这6个特征!

女人正不正经一眼便知,不正经的女人,多半都有这6个特征!

风起见你
2026-01-01 07:48:58
浙江男子失业一年,躺平出租房,全靠女友养!女友无奈:长得帅真没用

浙江男子失业一年,躺平出租房,全靠女友养!女友无奈:长得帅真没用

趣笔谈
2025-11-27 10:40:06
2026-01-05 04:44:49
机器学习与Python社区 incentive-icons
机器学习与Python社区
机器学习算法与Python
3240文章数 11081关注度
往期回顾 全部

科技要闻

雷军:骂小米汽车有流量,但别故意抹黑

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

头条要闻

拘押马杜罗的拘留中心"环境令人作呕" 内部画面披露

体育要闻

女子世界第一,9年前在咖啡店洗碗

娱乐要闻

《小城大事》上星央八 热血筑梦正当时

财经要闻

李迅雷:扩内需必须把重心从"投"转向"消"

汽车要闻

最高续航310km 岚图泰山8或将上半年发布

态度原创

房产
旅游
艺术
公开课
军事航空

房产要闻

单盘最高狂卖64亿!海南楼市2025年最全榜单发布!

旅游要闻

一票“畅玩”京津冀

艺术要闻

震撼视觉!西班牙画家安格拉达的油画作品引热议

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美军突袭抓获马杜罗 三个细节值得关注

无障碍浏览 进入关怀版