免责:
本文纯个人观点,仅测试文本理解、代码生成能力,结果不代表 ERNIE 5.0 完整、真实水平。
省流:
1、生成速度很慢
2、网页版居然没有 html 预览功能,这事儿不难啊,Kimi、Qwen 都可以
3、各种拉垮,6 个题目,没有 1 个可以与 Kimi K2 Thinking 掰手腕,只有最后1题完成度高,能勉强与Qwen-3Max对比
4、它对指令的理解很差,但凡与图像生成沾边的都会忽略指令,开始直接 AI 绘图,即便你已经明确告诉它了实现方式也不行。
5、或许我不应该测试它最新这个多模态版 ERNIE 5.0,1022 版本的文心 5.0 号称文本能力更强,我没再测。但是话说回来了,多模态就可以不遵守指令吗?
6、它太喜欢画画了
大家好,我是 Ai 学习的老章
最近一周国产大模型还是很热闹的
阿里更新了 Qwen DeepResearch、微博开源了基于 Qwen2.5-Math-1.5B 微调 VibeThinker 1.5B 大模型
最让我感兴趣的是“支棱起来”的百度 ERNIE 5.0 来了,对标 ChatGPT,原生全模态支持。
官方宣称的模型特色之处:
原生统一多模态建模技术,结合文本、图像、音频和视频进行理解和生成 采用超过 2.4T 的 MoE 架构,每次推理激活不到 3 个,降低计算量同时提升推理效率 在 40 多项基准测试中表现出前沿水平的性能
基准测试对比情况
1、文本处理,各项基准平均值,稳赢 DeepSeek-V3.2-Exp 和 Gemini-2.5-Pro,还有几个基准能打赢 GPT-5
![]()
2、视觉理解各种领先,N 多项上 Gemini-2.5-Pro、GPT-5 都手下败将
![]()
3、图像生成秒杀 GPT-image 和谷歌的 Nano-Banana、视频生成与 Veo3 旗鼓相当
![]()
4、音频理解、STT、语音识别都各种强过 GPT-4o-Audio、Gemini-2.5-Pro
![]()
真实水平咋样呢,我就直接单测试其文本处理、代码能力吧
这些题目与之前我测试 K2 Thinking 和 Qwen3-Max 一致,更容易看出模型差距
测试平台为官方网站:https://ernie.baidu.com/
模型选择文心 5.0 Preview
![]()
ERNIE 5.0 1022 预览版具有更强的文字能力,ERNIE 5.0 预览版是最新版本 测试 1:总结朱自清《背影》绘制 SVG![]()
字都出格了,跟 Kimi K2 Thinking 没法比,也比不上一样没能正确识别出 4 次背影但绘制 svg 正常的 Qwen3-Max,
Kimi K2 Thinking![]()
Qwen3-Max
![]()
测试 2:生成器官分布
怎么就出发了绘图功能呢?
![]()
即便告诉它给我 svg 代码,依然失败
![]()
![]()
测试 3:用 html 创建一个带有旋转星云和动态光照的 3D 粒子星系。
思考过程看,也是用 Three.js 创建 3D 场景、相机和渲染器,但是太太太简陋了
完败与 K2 Thinking 和 Qwen3-Max
![]()
没有对比就没有伤害
![]()
测试 4:发挥你的最大才能,用你最擅长的工具,生成一组数据后绘制数据大屏,主题自拟。
ERNIE 5.0 不像 K2 和 Qwen,它先用 Python 脚本生成 csv 数据集,但是可视化时,它告诉我要用Power BI实现。。。
![]()
K2 Thinking 生成的是"未来智慧城市运营中心"主题的数据大屏,包含动态生成的多维度城市运营数据。一共 285 行代码。前两次均报 bug,第三次成功生成!
![]()
对比 Qwen3-Max⬇️,它第一次的代码也报错,第二次成功
![]()
测试 5:3D 动画演示月食原理及全过程
不遵指令,后面我追问了,给我 html 代码,依然是绘图
![]()
Kimi K2⬇️
测试 6:生成一个动态网页,展现绚丽多彩的烟花盛况,样式要多,颜色要炫
这次遵守指令了,思考过程是用 html+CSS+js 实现,效果如下,除了相比 K2 和 Qwen 功能上少了,完成度还不错,甚至比 Qwen3-Max 还要好点的感觉
K2 Thinking 碾压 Qwen3-Max 的视频
最后再说一句,即便是我切换成 10 月份擅长文本生成的文心 5.0,它的指令遵循也不稳定,它太喜欢画画了,思考过要用 html5 和 webgl 实现后,pia 一下直接 AI 绘画了
![]()
最后再推荐一个我正在学习的强化学习课程
![]()
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.