网易首页 > 网易号 > 正文 申请入驻

国内首个!文心X1 Turbo获信通院“4+级”最高评级

0
分享至

5月20日,百度AI Day活动在北京举办,百度集团副总裁吴甜、中国信息通信研究院人工智能研究所平台与工程化部主任曹峰及文心一言用户代表陈君航现场分享了文心大模型最新技术、全球大模型发展及大模型能力测评、文心一言使用体验等。活动现场,中国信通院发布大模型推理能力评估结果。结果显示,百度文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。文心X1 Turbo逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。

文心大模型新版本技术详解

活动现场,吴甜对文心大模型最新版本的技术创新进行了系统性的讲解。她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

百度集团副总裁吴甜

文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。

后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,让大模型拥有了自我迭代的“最强大脑”,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

在训练阶段,通过融合偏好学习的强化学习技术,实现多元统一奖励机制,提升了对结果质量判别的准确率。通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。此外,通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升,模型输出结果思路清晰、逻辑严密,表达自然。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

数据方面,打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

此外,吴甜也指出,大模型的能力进一步拓展、效率进一步提升之后,可以探索更前瞻、更有想象力的创新应用。

以数字人为例,超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等,需要综合运用多模态AI技术。百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播,直播转化率达31%,降低80%直播开播成本。在代码场景上,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。百度每天新增的代码中,文心快码生成的代码占比已超过40%。截至目前,文心快码向全社会开放,累计服务760万开发者。

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化,包括框架模型的联合优化,也包括框架算力的联合优化。通过训练和推理的技术创新,文心4.5 Turbo训练吞吐达到文心4.5的5.4倍,推理吞吐达到8倍。公开数据显示,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。基于飞桨深度学习平台和文心大模型,百度在上海、广州、南京、武汉、厦门、宁波、南昌、无锡等多地落地产业赋能中心、数据生态中心和教育创新中心,以科技+人才+创新的模式打造区域人工智能公共技术服务平台,汇聚行业高价值数据集、培养新型复合型人才、赋能本地AI产品研发,构建围绕人工智能核心能力的“政产学研用”协同发展机制,加快区域产业智能化升级。

国内首个!文心X1 Turbo获信通院“4+级”最高评级

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰从全球大模型发展、从测评看大模型能力演进以及文心大模型推理能力评测解读等行业视角在现场进行了趋势解读。他指出,2024年人工智能能力持续进化,在多任务语言理解、竞赛级数学、博士级科学问题等之前具有挑战性的基准测试中超越了人类的表现。

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰为百度颁发大模型推理能力评估证书

现场,曹峰公布了信通院大模型推理能力评估结果。百度文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。

他进一步表示,评估结果表明,文心X1 Turbo擅长结构化的逻辑思考,并具备平衡模型能力与效率的优化技术,其有效的数据机制保障了模型的可信及可用程度,其推理服务能广泛支持各类应用。文心X1 Turbo强化推理泛化能力,拓宽工具链应用生态,加强安全机制建设,构筑可信应用保障壁垒。

16岁高中生:打开文心一言,就像打开新华字典一样

活动现场,一位16岁高中学生陈君航分享了他使用文心一言的经历。他从2023年开始接触文心一言,自那以后,文心一言几乎陪伴了他整个中考备考过程。

君航回忆,初次接触文心一言时,他正为语文作文的修改发愁,于是就把作文和老师点评发给文心一言,让它逐句分析给出修改建议。他坦言,“我打开文心一言,就像打开新华字典一样频繁。在它的陪伴下,我的写作能力得到很大提升。”

君航表示,文心一言不仅帮他量身定制过阶段性的学习规划,还能解析搜题软件无法解析的原创题目。“在学习方面,文心一言就像我 24 小时在线的全能老师。”

陈君航现场分享与文心一言的故事

这位高一学生不仅自己爱用文心一言,还把他带给了母亲、同学、老师们。也让大家对AI有了新的认知。

“我从小学时就开始对编程产生兴趣,但家人一直认为学编程只够作为一项兴趣爱好,反对我投入过多的时间在编程研究上。因此,到了晚上规定的时间,爸妈都会准时关闭电脑,要求我去学习或者休息。”

但后来发生的事,让君航妈妈对他在编程上花时间的态度发生了转变。君航的妈妈是一位小学老师,平时在繁重的教学任务中,还要抽时间做很多案头工作。“我经常看到她一边批卷子一边熬夜写点评,五十几份,一句句手打。”所以君航想:“我能不能做点什么?”于是他开始尝试用文心一言,为妈妈设计了一个“智能文案生成器”,原本三天的工作仅需几小时就可以完成。这让君航的妈妈对编程有了新的认知,也激发了她自己对大模型的使用兴趣。

当大模型学会像人类一样感知世界,像人类一样思考和行动并自我进化,技术进步便真正转化为普惠的社会红利。正如陈君航同学所说:“技术真正的魅力不是惊艳谁,而是真正解决一个又一个真实的问题”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
寿宁抬棺事件通报为何引起争议?又凸显了什么?| 何兰生

寿宁抬棺事件通报为何引起争议?又凸显了什么?| 何兰生

农见度
2026-06-22 10:04:37
主持人施可莹去世,年仅29岁

主持人施可莹去世,年仅29岁

上观新闻
2026-06-22 17:46:21
泽连斯基:没有乌克兰,谁也保护不了波兰

泽连斯基:没有乌克兰,谁也保护不了波兰

参考消息
2026-06-22 13:47:49
所有人都预判日本经济衰退,可没人想到,崩这么快、垮得这么彻底

所有人都预判日本经济衰退,可没人想到,崩这么快、垮得这么彻底

临云史策
2026-06-22 14:08:55
几乎全是假货!利润高达2400%,为何消费者还前赴后继争相购买?

几乎全是假货!利润高达2400%,为何消费者还前赴后继争相购买?

离离言几许
2026-06-22 15:58:48
东南亚人口拐卖最新套路:20万一个人,落地就被卖进园区!

东南亚人口拐卖最新套路:20万一个人,落地就被卖进园区!

命运自认幽默
2026-06-22 01:28:36
深蓝新材料创始股东朱建琴去世,享年57岁

深蓝新材料创始股东朱建琴去世,享年57岁

界面新闻
2026-06-22 15:06:34
日方逮捕一与电诈集团有关男子,外交部:望周边国家与中方一道加大执法合作力度

日方逮捕一与电诈集团有关男子,外交部:望周边国家与中方一道加大执法合作力度

澎湃新闻
2026-06-22 15:32:26
雷军回应小女孩吐槽冲上热搜:他的解释,让全网观众匪夷所思!

雷军回应小女孩吐槽冲上热搜:他的解释,让全网观众匪夷所思!

李晚书
2026-06-22 10:46:30
中国援建人士:不惊讶佛得角逼平西班牙;他们出线我们也开心

中国援建人士:不惊讶佛得角逼平西班牙;他们出线我们也开心

懂球帝
2026-06-22 13:46:24
独家——美日台三方首次同步开展涉台海方向上的大规模军事演习

独家——美日台三方首次同步开展涉台海方向上的大规模军事演习

东海观澜
2026-06-22 10:58:20
凌晨1点CCTV现场直播!梅西冲击5大纪录,阿根廷赢球将提前出线

凌晨1点CCTV现场直播!梅西冲击5大纪录,阿根廷赢球将提前出线

全景体育V
2026-06-22 12:23:20
澳大利亚主帅震惊:“中国队竟然有这么好的大前锋”

澳大利亚主帅震惊:“中国队竟然有这么好的大前锋”

许穩很机智
2026-06-22 15:09:11
葡萄牙队孔塞桑:我们没义务给C罗喂球,会把球传给位置最好的队友,他和任何球员一样,都是来帮助球队的

葡萄牙队孔塞桑:我们没义务给C罗喂球,会把球传给位置最好的队友,他和任何球员一样,都是来帮助球队的

极目新闻
2026-06-22 11:29:35
姆巴佩:世界杯射手王?应该问梅西,我一直知道他会继续进球

姆巴佩:世界杯射手王?应该问梅西,我一直知道他会继续进球

懂球帝
2026-06-22 05:34:11
北京男篮新任主教练出炉:李楠接替许利民 此前两年担任顾问

北京男篮新任主教练出炉:李楠接替许利民 此前两年担任顾问

醉卧浮生
2026-06-22 14:55:05
"毒纸尿裤"调查记者发布公开信:我只为那些体内检出甲酰胺的孩子!

"毒纸尿裤"调查记者发布公开信:我只为那些体内检出甲酰胺的孩子!

记录者王文志
2026-06-22 13:41:49
纸尿裤全面失控!举报人再拿重磅铁证,真相恐不只是婴儿生殖受损

纸尿裤全面失控!举报人再拿重磅铁证,真相恐不只是婴儿生殖受损

冰语历史
2026-06-21 11:09:21
女子称宠物犬寄存海底捞办公室后死亡:员工承诺开空调却关了!门店回应→

女子称宠物犬寄存海底捞办公室后死亡:员工承诺开空调却关了!门店回应→

极目新闻
2026-06-22 08:36:39
江苏连云港通报:废品收购站经营者已被采取刑事拘留强制措施

江苏连云港通报:废品收购站经营者已被采取刑事拘留强制措施

观察者网
2026-06-22 10:47:09
2026-06-22 18:48:49
牛刀财经 incentive-icons
牛刀财经
刀刀解剖新商业真相和本质
1566文章数 1531关注度
往期回顾 全部

科技要闻

智谱盘中狂飙超40%,市值破万亿港元

头条要闻

37万的新车送店贴膜3小时被店员撞损直贬7万 多方回应

头条要闻

37万的新车送店贴膜3小时被店员撞损直贬7万 多方回应

体育要闻

法国球星祝中国队下届世界杯取得好成绩

娱乐要闻

陪睡陪玩是皮毛,向佐揭内娱暗规则

财经要闻

多部门核查"婴幼儿纸尿裤甲酰胺问题"

汽车要闻

华为智驾ADS限时优惠月底结束 7月1日前下订立省3000元

态度原创

本地
健康
手机
艺术
亲子

本地新闻

龙腾资江 韵动邵阳

粽子还没吃完?专家教你“清库存”

手机要闻

消息称某厂小屏性能机评估骁龙8 Elite Gen6,预计为一加16T

艺术要闻

看看米芾临的《十七帖》,得王羲之笔法精髓者,不是智永赵孟頫,而是他!

亲子要闻

宝宝防蚊 这份清单请收好

无障碍浏览 进入关怀版