网易首页 > 网易号 > 正文 申请入驻

国内首个!文心X1 Turbo获信通院“4+级”最高评级

0
分享至

5月20日,百度AI Day活动在北京举办,百度集团副总裁吴甜、中国信息通信研究院人工智能研究所平台与工程化部主任曹峰及文心一言用户代表陈君航现场分享了文心大模型最新技术、全球大模型发展及大模型能力测评、文心一言使用体验等。活动现场,中国信通院发布大模型推理能力评估结果。结果显示,百度文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。文心X1 Turbo逻辑推理、代码推理、推理效果优化等技术能力及工具支持度、安全可靠度等应用能力均获得满分。

文心大模型新版本技术详解

活动现场,吴甜对文心大模型最新版本的技术创新进行了系统性的讲解。她介绍,文心大模型4.5是多模态基础大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链,问答、创作、逻辑推理、工具调用和多模态能力进一步增强。

百度集团副总裁吴甜

文心4.5和4.5 Turbo实现了文本、图像和视频的混合训练。针对不同模态数据在结构、规模、知识密度上的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升跨模态学习效率和多模态融合效果,学习效率提高近2倍,多模态理解效果提升超过30%。

后训练方面,百度研制了自反馈增强的技术框架,基于大模型自身的生成和评估反馈能力,实现了“训练-生成-反馈-增强”的模型迭代闭环,让大模型拥有了自我迭代的“最强大脑”,不仅解决了大模型对齐过程中,数据生产难度大、成本高、速度慢等问题,而且显著降低了模型幻觉,模型理解和处理复杂任务的能力大幅提升。

在训练阶段,通过融合偏好学习的强化学习技术,实现多元统一奖励机制,提升了对结果质量判别的准确率。通过离线偏好学习和在线强化学习统一优化,进一步提升了数据利用效率和训练稳定性,并增强了模型对高质量结果的感知。此外,通过偏好信号与奖励信号的融合运用,模型的理解、生成、逻辑和记忆等能力全面提升。

深度思考方面,突破了仅基于思维链优化的范式,在思考路径中结合工具调用,构建了融合思考和行动的复合思维链,模型解决问题能力得到显著提升,模型输出结果思路清晰、逻辑严密,表达自然。同时,结合多元统一的奖励机制,实现了思考和行动链的端到端优化,大幅提升了跨领域的问题解决能力。

数据方面,打造了“数据挖掘与合成 - 数据分析与评估 - 模型能力反馈”的数据建设闭环,为模型训练源源不断地生产知识密度高、类型多样、领域覆盖广的大规模数据。同时,数据建设流程具备良好的可扩展性,能够轻松迁移到全新的数据类型,实现快速、高效的数据生产。

此外,吴甜也指出,大模型的能力进一步拓展、效率进一步提升之后,可以探索更前瞻、更有想象力的创新应用。

以数字人为例,超拟真数字人需要具备出色的表现力、吸引人的内容、数字人与场景、物品的互动等,需要综合运用多模态AI技术。百度研制了“剧本”驱动多模协同的超拟真数字人技术,实现了语言、声音、形象的协调一致。目前这套技术已经支持超过10万数字人主播,直播转化率达31%,降低80%直播开播成本。在代码场景上,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。百度每天新增的代码中,文心快码生成的代码占比已超过40%。截至目前,文心快码向全社会开放,累计服务760万开发者。

文心大模型的能力拓展和效率提升,得益于飞桨文心的联合优化,包括框架模型的联合优化,也包括框架算力的联合优化。通过训练和推理的技术创新,文心4.5 Turbo训练吞吐达到文心4.5的5.4倍,推理吞吐达到8倍。公开数据显示,飞桨文心开发者数量已超过2185万,服务超过67万家企业,创建的模型达到110万。基于飞桨深度学习平台和文心大模型,百度在上海、广州、南京、武汉、厦门、宁波、南昌、无锡等多地落地产业赋能中心、数据生态中心和教育创新中心,以科技+人才+创新的模式打造区域人工智能公共技术服务平台,汇聚行业高价值数据集、培养新型复合型人才、赋能本地AI产品研发,构建围绕人工智能核心能力的“政产学研用”协同发展机制,加快区域产业智能化升级。

国内首个!文心X1 Turbo获信通院“4+级”最高评级

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰从全球大模型发展、从测评看大模型能力演进以及文心大模型推理能力评测解读等行业视角在现场进行了趋势解读。他指出,2024年人工智能能力持续进化,在多任务语言理解、竞赛级数学、博士级科学问题等之前具有挑战性的基准测试中超越了人类的表现。

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰为百度颁发大模型推理能力评估证书

现场,曹峰公布了信通院大模型推理能力评估结果。百度文心X1 Turbo在24项能力评估中,16项达5分、7项达4分、1项达3分,综合评级获当前最高级“4+级”,成为国内首款通过该测评的大模型。

他进一步表示,评估结果表明,文心X1 Turbo擅长结构化的逻辑思考,并具备平衡模型能力与效率的优化技术,其有效的数据机制保障了模型的可信及可用程度,其推理服务能广泛支持各类应用。文心X1 Turbo强化推理泛化能力,拓宽工具链应用生态,加强安全机制建设,构筑可信应用保障壁垒。

16岁高中生:打开文心一言,就像打开新华字典一样

活动现场,一位16岁高中学生陈君航分享了他使用文心一言的经历。他从2023年开始接触文心一言,自那以后,文心一言几乎陪伴了他整个中考备考过程。

君航回忆,初次接触文心一言时,他正为语文作文的修改发愁,于是就把作文和老师点评发给文心一言,让它逐句分析给出修改建议。他坦言,“我打开文心一言,就像打开新华字典一样频繁。在它的陪伴下,我的写作能力得到很大提升。”

君航表示,文心一言不仅帮他量身定制过阶段性的学习规划,还能解析搜题软件无法解析的原创题目。“在学习方面,文心一言就像我 24 小时在线的全能老师。”

陈君航现场分享与文心一言的故事

这位高一学生不仅自己爱用文心一言,还把他带给了母亲、同学、老师们。也让大家对AI有了新的认知。

“我从小学时就开始对编程产生兴趣,但家人一直认为学编程只够作为一项兴趣爱好,反对我投入过多的时间在编程研究上。因此,到了晚上规定的时间,爸妈都会准时关闭电脑,要求我去学习或者休息。”

但后来发生的事,让君航妈妈对他在编程上花时间的态度发生了转变。君航的妈妈是一位小学老师,平时在繁重的教学任务中,还要抽时间做很多案头工作。“我经常看到她一边批卷子一边熬夜写点评,五十几份,一句句手打。”所以君航想:“我能不能做点什么?”于是他开始尝试用文心一言,为妈妈设计了一个“智能文案生成器”,原本三天的工作仅需几小时就可以完成。这让君航的妈妈对编程有了新的认知,也激发了她自己对大模型的使用兴趣。

当大模型学会像人类一样感知世界,像人类一样思考和行动并自我进化,技术进步便真正转化为普惠的社会红利。正如陈君航同学所说:“技术真正的魅力不是惊艳谁,而是真正解决一个又一个真实的问题”。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
钱学森的儿子钱永刚,初中数学考30分,高中没念完就辍学,钱学森却摆摆手“没事!谁料,后来钱永刚却考上了国防科大!

钱学森的儿子钱永刚,初中数学考30分,高中没念完就辍学,钱学森却摆摆手“没事!谁料,后来钱永刚却考上了国防科大!

背包旅行
2026-06-30 15:11:04
宏远速递!朱芳雨开抢布朗,土豪球队问价杜润旺,萨姆纳恢复训练

宏远速递!朱芳雨开抢布朗,土豪球队问价杜润旺,萨姆纳恢复训练

多特体育说
2026-06-30 23:06:17
惊讶!广西一护士因与银行男子开房!涉嫌非法性交易被医院开除

惊讶!广西一护士因与银行男子开房!涉嫌非法性交易被医院开除

娱乐洞察点点
2026-07-01 01:26:49
事态升级!曝韩红退出公益,道歉难平众怒,原来留几手早有预判

事态升级!曝韩红退出公益,道歉难平众怒,原来留几手早有预判

陈意小可爱
2026-07-01 01:52:22
媒体人:老詹和湖人分手 无论老詹or湖人球迷都很开心 这场面难得

媒体人:老詹和湖人分手 无论老詹or湖人球迷都很开心 这场面难得

云隐南山
2026-07-01 01:11:02
韩红基金会年入7.6亿,87%靠小额捐款,5毛1块,高管年薪62万

韩红基金会年入7.6亿,87%靠小额捐款,5毛1块,高管年薪62万

小小河
2026-06-28 17:23:37
世界杯淘汰赛预测:法国3-1瑞典,挪威2-1科特迪瓦,墨西哥1-1

世界杯淘汰赛预测:法国3-1瑞典,挪威2-1科特迪瓦,墨西哥1-1

慢歌轻步谣
2026-06-30 12:45:55
“奶茶袋子装大疆!”初三女孩收礼变脸被骂,面相学果然权威!

“奶茶袋子装大疆!”初三女孩收礼变脸被骂,面相学果然权威!

林林先生
2026-06-30 09:20:03
齐达内谈摩洛哥:他们能闯进世界杯决赛,更看好非洲球队创造历史

齐达内谈摩洛哥:他们能闯进世界杯决赛,更看好非洲球队创造历史

体育闲话说
2026-07-01 06:03:50
苹果折叠屏iPhone Ultra黑色机模首次亮相:阔比例、内屏挖孔

苹果折叠屏iPhone Ultra黑色机模首次亮相:阔比例、内屏挖孔

中国能源网
2026-06-30 11:08:17
安徽一女子在酒吧被陌生男子投放“伟哥”,警方不予立案,双方签署调解协议后男方赔偿1.3万元,女子回应:已撤销协议,正在走法律程序

安徽一女子在酒吧被陌生男子投放“伟哥”,警方不予立案,双方签署调解协议后男方赔偿1.3万元,女子回应:已撤销协议,正在走法律程序

大风新闻
2026-06-29 22:09:46
随着哈兰德制胜+挪威2-1,第2组世界杯八分之一决赛对阵正式敲定

随着哈兰德制胜+挪威2-1,第2组世界杯八分之一决赛对阵正式敲定

侧身凌空斩
2026-07-01 03:11:13
“感觉已经闻到臭味了!”YSL新款男士水晶鞋遭吐槽,网友:脚臭可视化了

“感觉已经闻到臭味了!”YSL新款男士水晶鞋遭吐槽,网友:脚臭可视化了

大象新闻
2026-06-30 21:02:21
整容失败不可怕,一股姨味才尴尬!52岁苏有朋给所有男星提了个醒

整容失败不可怕,一股姨味才尴尬!52岁苏有朋给所有男星提了个醒

史行途
2026-06-27 15:14:20
深夜,688256提示:股价可能存在下跌风险

深夜,688256提示:股价可能存在下跌风险

中国基金报
2026-07-01 02:17:16
王菲又把便宜货穿出了高攀不起的样子!西安古城路人狂拍也不刻意

王菲又把便宜货穿出了高攀不起的样子!西安古城路人狂拍也不刻意

老吴教育课堂
2026-06-30 13:06:48
为什么说闲鱼是中国最大的黑市?网友:我直接给跪了!

为什么说闲鱼是中国最大的黑市?网友:我直接给跪了!

另子维爱读史
2026-06-02 10:51:07
广东省教育厅官方更正!广东2026高考招生目录12校调整,变动清单

广东省教育厅官方更正!广东2026高考招生目录12校调整,变动清单

手工制作阿爱
2026-06-30 19:50:32
两性关系:不管你信不信,女性过了45岁后,基本都有这7个现状

两性关系:不管你信不信,女性过了45岁后,基本都有这7个现状

荔子言
2026-06-11 13:28:05
降维打击到底有多恐怖 看网友讲述 原来换个招数可以这样玩学到了

降维打击到底有多恐怖 看网友讲述 原来换个招数可以这样玩学到了

侃神评故事
2026-06-30 18:15:03
2026-07-01 06:44:49
陆新之谈商业 incentive-icons
陆新之谈商业
改变认知,逆袭改运。
891文章数 11721关注度
往期回顾 全部

科技要闻

iPhone18 Pro遭泄密!印度代工商惹祸

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

头条要闻

坎贝尔承认:中国是最成功渡过难关的国家

体育要闻

德国足球,脸都不要了

娱乐要闻

黄晓明沦陷!羡慕周杰伦能降住昆凌

财经要闻

万亿“寒王”,历史时刻

汽车要闻

奇瑞风云A9探店 五个理由一定来看看

态度原创

本地
时尚
数码
亲子
公开课

本地新闻

贵州小城的新目标:举办“村超”世界杯!

Meiinpsn的穿衣风格,清新又叛逆

数码要闻

曝微软停产Surface Go与Surface Laptop Go,无后续机型研发计划

亲子要闻

闺蜜用10块钱,让儿子看清概率陷阱,比唠叨他一百遍更管用

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版