网易首页 > 网易号 > 正文 申请入驻

拳打DeepSeek R1,比肩GPT-5,百度文心X1.1真有这么强?

0
分享至

昨天,在WAVE SUMMIT 2025大会上,百度发布了文心大模型X1.1深度思考模型,开放网页端使用和百度智能云千帆大模型平台调用。

继文心大模型4.5系列模型开源之后,百度再次发布闭源模型X1.1。看来百度文心大模型走的是部分开源,部分闭源的路线。

据百度描述,X1.1不仅超越了DeepSeek R1-0528,还与GPT-5和Gemini 2.5 Pro效果持平。看起来很厉害的样子,我们决定在网页上试一试。

五大工具和意外发现

打开网页版的文心X1.1,因为百度官方新闻稿里没有看到模型用法的具体介绍,不如先问问文心X1.1有哪些工具。

根据回答,X1.1有5个工具可用:1.联网搜索web_search;2.图像生成image_gen;3.图像理解image_chat;4.代码解释器code_interpreter;5.文件检索file_retrieval。至顶AI实验室会挨个测试一遍。

意外的是,在它的思考过程中,竟然有一句“要避免提到竞品”。追问下,它仅在思考中显示了竞品包括Openai o1和DeepSeek R1,思考后的回答中还真没有提到具体的竞品名称。

两次回答都像是戴上了测谎仪,嘴过关了,但被思考过程给出卖了。

五大工具测试

通过上一步对话了解了X1.1的工具,接下来就是实测环节了,看看它的智能体工具调用能力如何。

联网搜索web_search

问到X1.1模型不知道的知识的时候,它会调用web_search工具联网搜索,然后回答。比如我这里问了一个DeepSeek V3.1的发布时间。

图像生成image_gen

因为本人比较喜欢仙侠剧,所以让它画一幅仙侠的图。

发送任务前,我想象会看到一张类似仙剑奇侠传3飞蓬将军在云层上御剑飞行或者景天和雪见坐在门前台阶上看大雪纷飞。因为提示词比较简略,粗糙一点可以理解,但发挥空间比较大。

X1.1调用了image_gen工具,它的构思是“水墨风格的山水背景,远处有云雾缭绕的山峰,近处有古松和仙鹤,画面中有一位身着飘逸长袍的仙人,手持长剑,站在悬崖边,整体画面充满仙侠意境,采用中国传统水墨画技法,笔触流畅,墨色浓淡相宜”。相当于帮我扩展了一下提示词。

结果,我得到下面这张图,更像是李白准备吟诗一首,诗仙算仙侠吗?

图像理解image_chat

说到作诗那就干脆让它再根据这张图作诗一首,来个看图写诗。模型在思考过程中调用了image_chat工具。

模型观察还是比较仔细的,云雾、山峰、松树、飞鸟、文人这些意向都写进诗里了,对仗也比较工整。

代码解释器code_interpreter

用一个代码任务来测试一下X1.1的代码能力。任务要求是通过纯前端编程语言模拟超音速飞机突破音障过程的动画。

这个过程没有直接触发代码解释器工具。

X1.1生成的动画中,在空白的蓝天白云中,先是一股粒子从左边喷出,随后一个类似火箭的物体缓缓向右移动进入画面,不久出现一个莫名的圆圈(可能是在模拟音障),最终火箭停留在画面正中间。

GPT-5生成的动画,左下角标明了当前速度值,右上角标明突破音障的状态(从接近音障到已突破音障),速度值、状态、画面实现了同步更新。缺点是飞机看着没那么像飞机。

从前端编程的直观结果看,X1.1和GPT-5的差距还是肉眼可见的。

文档检索file_retrieval

百度网盘用户可能会喜欢的一点是,网页版的X1.1与百度网盘联动起来了。用户可以把自己网盘里的文件传给X1.1,对文档的内容进行提问,省去了中间文件下载再上传的麻烦。

我把网盘里的一份PDF格式的报告交给X1.1解读,还是像模像样的。

至顶AI实验室洞见

作为一个深度思考的智能体模型,X1.1工具调用的准确性尚可。不过工具数量只有5个,而且都是自己的工具。面对复杂的外部工具,比如在MCP和其他智能体中,X1.1是否还能准确调用工具,尚需考证。

工具使用效果上看,联网搜索表现中规中矩,图片生成能力过关,图片理解能力还不错。在给出的任务上,代码能力就算不上最顶尖的了。

从智能体能力来看,X1.1比DeepSeek R1-0528强可能还真不是吹牛,这方面可以和kimi、qwen、claude进一步PK一下。目前DeepSeek R1模型的智能体能力确实急需提升,因此DeepSeek在8月21日发布了DeepSeek V3.1着重了提升智能体能力,为下一代R系列模型做准备。

至于X1.1与GPT-5和Gemini 2.5 Pro效果相当的说法,就见仁见智了。将文心大模型和百度网盘连接,利用好自己的生态优势,这一点还是值得肯定的。

我们很高兴看到国产模型的能力不断提升,相信未来百度文心大模型还会给大家带来更多惊喜。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
赖清德向大陆喊话,林佳龙返台:机场大言不惭!解放军打独大动作

赖清德向大陆喊话,林佳龙返台:机场大言不惭!解放军打独大动作

共工之锚
2026-04-28 15:40:37
陈伟霆曝妻子何穗生产过程不太顺利:女人真的很不容易!此前何穗产后因子宫淤血又做手术,90天便复工

陈伟霆曝妻子何穗生产过程不太顺利:女人真的很不容易!此前何穗产后因子宫淤血又做手术,90天便复工

现代快报
2026-04-30 08:45:37
情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

情侣在瑞士雪山顶“撒欢”,就这么被全世界直播了···

新欧洲
2026-04-21 19:37:05
上港与铜梁龙的比赛!裁判是否漏吹海港两个点球,足协已给出答案

上港与铜梁龙的比赛!裁判是否漏吹海港两个点球,足协已给出答案

张丽说足球
2026-04-30 09:04:37
绕开马六甲!王毅前脚刚走,泰国火速拍板,砸1万亿为中国开新路

绕开马六甲!王毅前脚刚走,泰国火速拍板,砸1万亿为中国开新路

神秘的未知领域
2026-04-29 17:26:15
菲律宾战队选手致歉 做眯眯眼动作涉嫌种族歧视

菲律宾战队选手致歉 做眯眯眼动作涉嫌种族歧视

3DM游戏
2026-04-28 07:03:04
目无法纪,贪婪无度!任上落马的原正部级蓝天立被公诉,三天三“虎”被处理

目无法纪,贪婪无度!任上落马的原正部级蓝天立被公诉,三天三“虎”被处理

上观新闻
2026-04-29 12:31:05
千年难遇的美人,太漂亮了,没有一点毛病,太完美了

千年难遇的美人,太漂亮了,没有一点毛病,太完美了

情感大头说说
2026-04-24 12:46:24
离婚后想找一个比前夫条件更好的为啥那么难 网友们是一片嘲笑声

离婚后想找一个比前夫条件更好的为啥那么难 网友们是一片嘲笑声

侃神评故事
2026-04-21 07:20:03
商业航天概念龙头三年亏损49亿,此前股价两个月暴涨近4倍

商业航天概念龙头三年亏损49亿,此前股价两个月暴涨近4倍

每日经济新闻
2026-04-29 22:07:43
绝了!霍福德娶环球小姐冠军!生6个孩子!网友:这才是人生赢家

绝了!霍福德娶环球小姐冠军!生6个孩子!网友:这才是人生赢家

罗氏八卦
2026-04-29 18:10:03
30轮积79分,利雅得胜利再拿8分即可夺得沙特联冠军

30轮积79分,利雅得胜利再拿8分即可夺得沙特联冠军

懂球帝
2026-04-30 04:23:42
亨德利:如果赵心童没有拿到4次世锦赛冠军 我会很意外的

亨德利:如果赵心童没有拿到4次世锦赛冠军 我会很意外的

罗克
2026-04-30 08:44:22
震惊!惠州32岁独女网征上门女婿,一句“入赘我家享荣华”引热议

震惊!惠州32岁独女网征上门女婿,一句“入赘我家享荣华”引热议

火山詩话
2026-04-27 11:46:05
广东4名骑手因遵守交规获价值9999元纯金金牌,6人获800元头盔

广东4名骑手因遵守交规获价值9999元纯金金牌,6人获800元头盔

新浪财经
2026-04-29 22:27:17
本以为是临时救火教练,谁知带拜仁横扫欧洲,封神欧冠历史

本以为是临时救火教练,谁知带拜仁横扫欧洲,封神欧冠历史

勇士军武闲谈
2026-04-30 07:31:29
体制内硬刚领导会是什么下场?网友"铁头娃"式回答,大彻大悟

体制内硬刚领导会是什么下场?网友"铁头娃"式回答,大彻大悟

夜深爱杂谈
2026-04-24 07:32:39
为什么女人偷情初次同房很容易,后面会越来越难呢?

为什么女人偷情初次同房很容易,后面会越来越难呢?

思絮
2026-04-30 08:46:13
中国"绝不谈判"!光刻机封锁,全球谁急?一台光刻机能有多贵?

中国"绝不谈判"!光刻机封锁,全球谁急?一台光刻机能有多贵?

潮鹿逐梦
2026-04-28 14:47:26
任彬再凭《蜜语纪》出圈,不仅演技获好评,角色也十分圈粉,真帅

任彬再凭《蜜语纪》出圈,不仅演技获好评,角色也十分圈粉,真帅

李虰手工制作
2026-04-30 07:46:54
2026-04-30 09:43:00
至顶AI实验室 incentive-icons
至顶AI实验室
一个专注于探索生成式AI前沿技术及其应用的实验室。
3467文章数 171关注度
往期回顾 全部

科技要闻

四巨头财报齐发:AI已经不只是风口

头条要闻

牛弹琴:特朗普自以为找到妙计对伊放话 伊朗估计气懵了

头条要闻

牛弹琴:特朗普自以为找到妙计对伊放话 伊朗估计气懵了

体育要闻

一场九球狂欢,各路神仙批量下凡

娱乐要闻

马頔一句话,孙杨妈妈怒骂节目组2小时

财经要闻

一场20年级别的供应危机,在眼前了!

汽车要闻

技术天花板再摸高 全能型的奕境X9首秀

态度原创

家居
亲子
游戏
本地
公开课

家居要闻

寂然无界 简洁风格

亲子要闻

春季感冒发烧的孩子特别多,家长困扰

业内人士谈《马拉松》惨淡:可惜索尼没砸大钱宣传!

本地新闻

用青花瓷的方式,打开西溪湿地

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版