网易首页 > 网易号 > 正文 申请入驻

百度大模型又支棱起来了吗?文心一言 5.0 我实测了

0
分享至

免责:

本文纯个人观点,仅测试文本理解、代码生成能力,结果不代表 ERNIE 5.0 完整、真实水平。

省流

  • 1、生成速度很慢

  • 2、网页版居然没有 html 预览功能,这事儿不难啊,Kimi、Qwen 都可以

  • 3、各种拉垮,6 个题目,没有 1 个可以与 Kimi K2 Thinking 掰手腕,只有最后1题完成度高,能勉强与Qwen-3Max对比

  • 4、它对指令的理解很差,但凡与图像生成沾边的都会忽略指令,开始直接 AI 绘图,即便你已经明确告诉它了实现方式也不行。

  • 5、或许我不应该测试它最新这个多模态版 ERNIE 5.0,1022 版本的文心 5.0 号称文本能力更强,我没再测。但是话说回来了,多模态就可以不遵守指令吗?

  • 6、它太喜欢画画了

大家好,我是 Ai 学习的老章

最近一周国产大模型还是很热闹的

阿里更新了 Qwen DeepResearch、微博开源了基于 Qwen2.5-Math-1.5B 微调 VibeThinker 1.5B 大模型

最让我感兴趣的是“支棱起来”的百度 ERNIE 5.0 来了,对标 ChatGPT,原生全模态支持。

官方宣称的模型特色之处:

原生统一多模态建模技术,结合文本、图像、音频和视频进行理解和生成 采用超过 2.4T 的 MoE 架构,每次推理激活不到 3 个,降低计算量同时提升推理效率 在 40 多项基准测试中表现出前沿水平的性能

基准测试对比情况

1、文本处理,各项基准平均值,稳赢 DeepSeek-V3.2-Exp 和 Gemini-2.5-Pro,还有几个基准能打赢 GPT-5


2、视觉理解各种领先,N 多项上 Gemini-2.5-Pro、GPT-5 都手下败将


3、图像生成秒杀 GPT-image 和谷歌的 Nano-Banana、视频生成与 Veo3 旗鼓相当


4、音频理解、STT、语音识别都各种强过 GPT-4o-Audio、Gemini-2.5-Pro


真实水平咋样呢,我就直接单测试其文本处理、代码能力吧

这些题目与之前我测试 K2 Thinking 和 Qwen3-Max 一致,更容易看出模型差距

测试平台为官方网站:https://ernie.baidu.com/

模型选择文心 5.0 Preview


ERNIE 5.0 1022 预览版具有更强的文字能力,ERNIE 5.0 预览版是最新版本 测试 1:总结朱自清《背影》绘制 SVG

字都出格了,跟 Kimi K2 Thinking 没法比,也比不上一样没能正确识别出 4 次背影但绘制 svg 正常的 Qwen3-Max,

Kimi K2 Thinking
Qwen3-Max


测试 2:生成器官分布

怎么就出发了绘图功能呢?


即便告诉它给我 svg 代码,依然失败



测试 3:用 html 创建一个带有旋转星云和动态光照的 3D 粒子星系。

思考过程看,也是用 Three.js 创建 3D 场景、相机和渲染器,但是太太太简陋了

完败与 K2 Thinking 和 Qwen3-Max


没有对比就没有伤害


测试 4:发挥你的最大才能,用你最擅长的工具,生成一组数据后绘制数据大屏,主题自拟。

ERNIE 5.0 不像 K2 和 Qwen,它先用 Python 脚本生成 csv 数据集,但是可视化时,它告诉我要用Power BI实现。。。


K2 Thinking 生成的是"未来智慧城市运营中心"主题的数据大屏,包含动态生成的多维度城市运营数据。一共 285 行代码。前两次均报 bug,第三次成功生成!


对比 Qwen3-Max⬇️,它第一次的代码也报错,第二次成功


测试 5:3D 动画演示月食原理及全过程

不遵指令,后面我追问了,给我 html 代码,依然是绘图



Kimi K2⬇️

测试 6:生成一个动态网页,展现绚丽多彩的烟花盛况,样式要多,颜色要炫

这次遵守指令了,思考过程是用 html+CSS+js 实现,效果如下,除了相比 K2 和 Qwen 功能上少了,完成度还不错,甚至比 Qwen3-Max 还要好点的感觉

K2 Thinking 碾压 Qwen3-Max 的视频

最后再说一句,即便是我切换成 10 月份擅长文本生成的文心 5.0,它的指令遵循也不稳定,它太喜欢画画了,思考过要用 html5 和 webgl 实现后,pia 一下直接 AI 绘画了


最后再推荐一个我正在学习的强化学习课程



特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
中国不当冤大头了!中科院停付国际期刊发表费,老外专家也急了

中国不当冤大头了!中科院停付国际期刊发表费,老外专家也急了

青青子衿
2026-02-27 20:32:03
大爆冷!悄悄升至联盟第一!整个NBA看不起你们,你们却要夺冠了

大爆冷!悄悄升至联盟第一!整个NBA看不起你们,你们却要夺冠了

篮球扫地僧
2026-02-27 22:52:50
突发!2026年全国第一巨额抢劫案在江苏发生了,197万,疑犯已捕

突发!2026年全国第一巨额抢劫案在江苏发生了,197万,疑犯已捕

离离言几许
2026-02-26 10:14:26
朝鲜深夜毫无征兆阅兵,金正恩释放开战信号:已做好万全准备迎战

朝鲜深夜毫无征兆阅兵,金正恩释放开战信号:已做好万全准备迎战

小小科普员
2026-02-27 14:07:40
26岁林妙可逛庙会,仍是娃娃脸,本是童星出道,长大后却无戏可拍

26岁林妙可逛庙会,仍是娃娃脸,本是童星出道,长大后却无戏可拍

她时尚丫
2026-02-27 23:06:05
女子回湖北婆家过年,车被妯娌砸稀烂,报警后绝不和解,结局爽了

女子回湖北婆家过年,车被妯娌砸稀烂,报警后绝不和解,结局爽了

离离言几许
2026-02-27 21:13:58
为什么交通部约谈高德?业务全踩红线,五天被约谈三次

为什么交通部约谈高德?业务全踩红线,五天被约谈三次

小蜜情感说
2026-02-27 06:43:29
黎智英案再次开审,美方高层在特朗普访华前,先要求中方放人

黎智英案再次开审,美方高层在特朗普访华前,先要求中方放人

东极妙严
2026-02-27 14:34:31
男子打扫前租客房间发现遗留白色行李箱,打开后吓得手心直冒汗:10捆印着“建行”字样的纸钞,“少说有100万”,民警一查,180度大反转

男子打扫前租客房间发现遗留白色行李箱,打开后吓得手心直冒汗:10捆印着“建行”字样的纸钞,“少说有100万”,民警一查,180度大反转

极目新闻
2026-02-27 08:08:34
津巴布韦这一刀,砍醒了中国锂电的“富贵梦”

津巴布韦这一刀,砍醒了中国锂电的“富贵梦”

小蜜情感说
2026-02-27 17:14:37
人可以狠心到什么程度?看网友讲述,发现我真做不到这般绝

人可以狠心到什么程度?看网友讲述,发现我真做不到这般绝

侃神评故事
2026-02-27 07:40:03
张本智和爆冷出局!弗队长结束八败之交3-2险胜,约战林昀儒

张本智和爆冷出局!弗队长结束八败之交3-2险胜,约战林昀儒

乒谈
2026-02-27 20:21:22
历史性大联合!匈牙利反对党集体退选,欧尔班16年统治迎来倒计时

历史性大联合!匈牙利反对党集体退选,欧尔班16年统治迎来倒计时

老马拉车莫少装
2026-02-27 23:58:33
21岁男子想花200和女骑手发生关系,被警察找上门后:我给你跪下

21岁男子想花200和女骑手发生关系,被警察找上门后:我给你跪下

社会酱
2026-02-27 17:37:31
美军集结“灭国”力量,伊朗最后关头低头,全世界紧盯特朗普

美军集结“灭国”力量,伊朗最后关头低头,全世界紧盯特朗普

策略述
2026-02-27 19:11:15
巴拿马强吞中国18亿资产,竟是自掘坟墓,这下后悔也来不及!

巴拿马强吞中国18亿资产,竟是自掘坟墓,这下后悔也来不及!

梁讯
2026-02-27 20:39:31
大瓜!黄晓明小22岁新欢曝光,照片流出,网友:这眼光,挺专一的

大瓜!黄晓明小22岁新欢曝光,照片流出,网友:这眼光,挺专一的

乌娱子酱
2026-02-27 10:40:54
3000万打工人逃离北上广,却不知道县城已被161个家族瓜分

3000万打工人逃离北上广,却不知道县城已被161个家族瓜分

流苏晚晴
2026-02-27 18:06:43
央八新剧仅播五晚,就被观众要求下架?理由:胡编乱造、假的离谱

央八新剧仅播五晚,就被观众要求下架?理由:胡编乱造、假的离谱

TVB的四小花
2026-02-27 20:50:22
表姑向我借了85000,17年没还,我去银行注销旧卡时,柜员看了眼卡说:女士,最后一笔转账留言您要看吗?

表姑向我借了85000,17年没还,我去银行注销旧卡时,柜员看了眼卡说:女士,最后一笔转账留言您要看吗?

黎兜兜
2026-02-27 21:20:19
2026-02-28 07:19:00
Ai学习的老章 incentive-icons
Ai学习的老章
Ai学习的老章
3248文章数 11088关注度
往期回顾 全部

科技要闻

狂揽1100亿美元!OpenAI再创融资神话

头条要闻

特朗普警告伊朗:“有时候不得不打”

头条要闻

特朗普警告伊朗:“有时候不得不打”

体育要闻

一场必须要赢的比赛,男篮何止击败了裁判

娱乐要闻

郭晶晶霍启刚现身香港艺术节尽显恩爱

财经要闻

沈明高提共富建议 百姓持科技股国家兜底

汽车要闻

岚图泰山黑武士版3月上市 搭载华为四激光智驾方案

态度原创

家居
时尚
手机
数码
公开课

家居要闻

素色肌理 品意式格调

舒淇最爱穿的裙子搭配,真的很适合春天!

手机要闻

澎湃OS 3 Beta新版本,涵盖5款机型,堆叠排布+超级小爱全落地

数码要闻

Omdia:时隔5年,小米去年再度回归可穿戴设备出货榜首

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版