网易首页 > 网易号 > 正文 申请入驻

百度最强深度思考模型来了!性能追平GPT-5

0
分享至


智东西
作者 王涵
编辑 漠影

智东西9月9日报道,今天上午,在百度Wave Summit深度学习开发者大会上,百度正式发布深度思考模型文心大模型X1.1、大模型开发框架飞桨框架V3.2、智能代码助手文心快码3.5S以及一系列开发组件更新。

相比于深度思考模型文心X1,文心大模型X1.1的事实性能力提升34.8%,指令遵循能力提升12.5%,智能体能力提升9.6%,在多项基准测试中超越DeepSeek-R1-0528


目前,用户可以在文心一言官网、文小言APP使用文心大模型X1.1。文心大模型X1.1已正式上线百度智能云千帆平台,对企业客户及开发者全面开放使用。

一、超越DeepSeek,对标GPT-5!百度文心大模型X1.1多项基准测试获SOTA

会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布了文心大模型X1.1深度思考模型。

据王海峰分享,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,相比文心X1,文心大模型X1.1的事实性提升34.8%,指令遵循能力提升12.5%,智能体能力提升9.6%

在权威基准评测中,文心大模型X1.1在多个任务上超越DeepSeek-R1-0528,取得第一名的成绩。同时,与国际顶尖模型GPT-5和Gemini 2.5 Pro相比,效果基本持平。


文心大模型X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。

在客服场景,文心大模型X1.1可以识别用户客诉的情绪和需求,通过思考和调用后台多个工具,自动完成客诉处理的服务流程。

基于文心大模型X1.1的基础,百度开发剧本驱动多模协同的数字人技术,可以通过大语言模型生成剧本,驱动语音语调和数字人的形象,最终形成完善的数字人。


百度集团副总裁、深度学习技术应用及国家工程研究中心副主任吴甜透露,今年6月15日,在百度电商平台,罗永浩数字人直播的GMV已经超过其本人直播的GMV表现。

数字人主播的问答转化率问答接待率都可以超越真人,其超长待机能力在70分钟以上的场直播中优势明显。


二、飞桨文心生态开发者超2千万,百度内部45%新代码由AI生成

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化。

大会现场,百度发布了飞桨核心框架3.2版本,该版本在大模型训练、硬件适配和生态支持上全面升级。


百度飞桨同步升级了大模型开发套件ERNIEKit高效部署套件FastDeploy,还发布了AI科学套件,包括智能流体力学开发套件和智能材料科学开发套件,以及大规模计算图数据集GraphNet

据最新数据披露,飞桨文心生态开发者达到2333万位,服务企业达到76万家


AI编程方面,百度还发布了文心快码3.5S,新版本的代码生成准确率提升26%,其中复杂场景提升38%。可以驾驭更复杂的任务。

据悉,目前,百度中有45%的新增代码是AI生成的,文心快码已累计服务超过1000万位开发者上千家企业。

结语:飞桨文心联合优化,降低开发与技术落地门槛

飞桨与文心的深度联合优化,持续推动着文心大模型能力的拓展与效率的提高。文心快码3.5S的发布进一步降低了AI编程的门槛,为开发者与企业带来了高效且强大的工具。

在产业落地层面,无论是数字人直播还是文心快码的落地,这些实践为AI与实体经济融合提供了具体参考路径,在电商、编程开发等领域对行业智能化转型产生了实际影响。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
千里大堤溃于蚁穴,银行信用,溃于呼伦贝尔?

千里大堤溃于蚁穴,银行信用,溃于呼伦贝尔?

细雨中的呼喊
2026-01-31 15:43:54
便利背后暗藏风险 手机“贴一贴”可能无形中危害国家安全

便利背后暗藏风险 手机“贴一贴”可能无形中危害国家安全

大象新闻
2026-02-02 06:57:23
徐畅江,升副部

徐畅江,升副部

新京报政事儿
2026-02-02 09:00:23
订单暴增!年夜饭私厨上门服务火了,价格涨到三倍仍供不应求

订单暴增!年夜饭私厨上门服务火了,价格涨到三倍仍供不应求

上观新闻
2026-02-02 06:49:12
两被击毙港人去乌做雇佣兵原因曝光,接受军事训练以在香港使用

两被击毙港人去乌做雇佣兵原因曝光,接受军事训练以在香港使用

侠客栈
2026-02-01 13:50:37
江苏南通一吊车起吊树木时,突然向前翻倒,车身直接被翻成直角!当地回应:事故未造成人员伤亡

江苏南通一吊车起吊树木时,突然向前翻倒,车身直接被翻成直角!当地回应:事故未造成人员伤亡

台州交通广播
2026-02-01 20:06:15
59年陈毅回老家,得知表弟被关押,陈拍案而起大怒:你们真是可笑

59年陈毅回老家,得知表弟被关押,陈拍案而起大怒:你们真是可笑

海佑讲史
2026-01-30 16:30:09
以2.5吨白银建造的湖南“永兴银楼”被拍卖,其中1.75吨纯银折算1204.7万元,每克仅6.88元“白菜价”,委托方回应

以2.5吨白银建造的湖南“永兴银楼”被拍卖,其中1.75吨纯银折算1204.7万元,每克仅6.88元“白菜价”,委托方回应

极目新闻
2026-02-01 16:43:12
邻居投诉我家太吵,我无奈卖掉架子鼓,半月后邻居崩溃:你卖谁了

邻居投诉我家太吵,我无奈卖掉架子鼓,半月后邻居崩溃:你卖谁了

船长与船1
2026-02-01 08:45:05
台湾GDP靓眼   跃居亚洲第三

台湾GDP靓眼 跃居亚洲第三

跟着老李看世界
2026-02-01 11:44:55
万科亏损1314亿

万科亏损1314亿

地产微资讯
2026-01-31 13:05:20
现货白银日内跌幅扩大至10%,报76.89美元/盎司

现货白银日内跌幅扩大至10%,报76.89美元/盎司

每日经济新闻
2026-02-02 07:26:07
美智库:俄军伤亡竟然大幅下降!北约终于发现:为何打不赢俄罗斯

美智库:俄军伤亡竟然大幅下降!北约终于发现:为何打不赢俄罗斯

混沌录
2026-01-31 16:29:05
豪门悲喜夜:皇马100分钟绝杀2-1 曼联94分钟破门3-2 热刺2-2曼城

豪门悲喜夜:皇马100分钟绝杀2-1 曼联94分钟破门3-2 热刺2-2曼城

狍子歪解体坛
2026-02-02 02:36:41
内存涨到怀疑人生:512GB DDR5逼近100000元!价签贴了一层又一层

内存涨到怀疑人生:512GB DDR5逼近100000元!价签贴了一层又一层

快科技
2026-02-01 20:57:39
1688平台售卖“德国双筒望远镜”宣称可望38.4万千米 到手成地摊玩具

1688平台售卖“德国双筒望远镜”宣称可望38.4万千米 到手成地摊玩具

信网
2026-02-01 15:01:30
现场画面:柬埔寨对一电诈园区展开最大规模行动,抓捕2044人;缅甸出动空军运输机押729人回国

现场画面:柬埔寨对一电诈园区展开最大规模行动,抓捕2044人;缅甸出动空军运输机押729人回国

扬子晚报
2026-02-01 15:59:57
2月1日俄乌:马斯克终于出手了

2月1日俄乌:马斯克终于出手了

山河路口
2026-02-01 18:23:05
吃相越来越难看,都开始硬抢了!

吃相越来越难看,都开始硬抢了!

胖胖说他不胖
2026-02-01 10:00:18
8年来,两任英国首相访华,为何都关注京东?

8年来,两任英国首相访华,为何都关注京东?

正解局
2026-01-31 22:32:13
2026-02-02 09:48:49
智东西 incentive-icons
智东西
聚焦智能变革,服务产业升级。
11161文章数 116947关注度
往期回顾 全部

科技要闻

10亿元宝红包突袭 复刻微信支付还是微视?

头条要闻

牛弹琴:欧洲终于开骂了 特朗普可能会气到咆哮

头条要闻

牛弹琴:欧洲终于开骂了 特朗普可能会气到咆哮

体育要闻

德约大度祝贺阿卡 幽默互动逗笑纳达尔

娱乐要闻

春晚第三次联排阵容曝光:全是实力派

财经要闻

国六货车被迫"换头" 每次收费超200元

汽车要闻

岚图汽车1月交付10515辆 同比增长31%

态度原创

教育
健康
艺术
手机
亲子

教育要闻

现在看易中天大师的金句,感觉买德云社的门票太亏了(三)

耳石症分类型,症状大不同

艺术要闻

上海“高技派”地标:华润中心竣工,LV总部入驻!

手机要闻

天玑8300+6.95英寸LCD屏!TLCD手机众筹失败:已退款

亲子要闻

2-5岁孩子如何在家做早教?用好这些小道具,孩子进步超快!

无障碍浏览 进入关怀版