网易首页 > 网易号 > 正文 申请入驻

摸DeepSeek过河也得自身硬! 想开后的文小言,真香!

0
分享至

西风 发自 凹非寺
量子位 | 公众号 QbitAI

刚刚,百度文小言全面升级了。

基于多模型的能力,文小言升级了包括全新大语音模型图片问答等在内的一系列有趣儿又实用的新玩法。

比如图片问答,拍四只不同鹦鹉的大头照,问它鹦鹉性别(doge)

你还真别说,这都能回答对,分析得头头是道:

而且现在图片问答还可以这样玩,基于原图元素一键二创,小雏菊杯子摇身幻化出小雏菊手机壳、抽纸盒:

内外兼收,支持多模型融合调度

本次升级,文小言直接把自家刚上线不久的新模型,包括文心大模型X1和4.5,和“隔壁学霸”DeepSeek-R1满血版摆一块儿了,进行了多模型融合调度

现在,文小言的用户在一个页面可随意切换使用DeepSeek或是文心X1/4.5特定模型,爱翻谁的牌子就翻谁的。

文心X1是百度半个月前刚发布的号称是“首个自主运用工具的深度思考模型”。

文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,在多模态交互、理解方面更强,原生模型联合预训练能实现更深层次的模态融合。

另外,文小言上线了「自动模式」,它能够根据用户提出的问题识别用户需求,自动选择最合适的模型

现在,两款新模型直接和DeepSeek融合调度,让文小言拥有了更强的“大脑”。据介绍,他们对DeepSeek还进行了多种功能维度的融合,打通了图片问答、生图等链路

我们先来考验一下这个更强“大脑”的逻辑思维能力。

抛给它一个脑筋急转弯:

  • 在一个封闭房间里有三盏灯,门外有三个开关,每个开关分别控制一盏灯。你只能进房间一次。如何判断出每个开关对应哪盏灯?

只见文小言三下五除二,轻轻松松一步步推理给出了标准答案。判断依据中也会解释打开一个开关等待5-10分钟是为了让灯发热等诸如此类的细节。

和一般推理模型不一样的是,在给出答案之后,它还会自动推荐视频,有详解这道题目的视频,也有和此题类似的更多题目。

如此一来,就方便了大家对题目的延伸理解。

接下来再来一道著名概率难题——“二孩悖论”。

这道题初始表述至少可追溯至1959年,由著名数学家马丁·加德纳在《科学美国人》杂志的“数学游戏”专栏中提出,曾引发数学家们的广泛争论,直到现在大家对这道题目的讨论似乎也还没有停止。

问题是酱婶儿的:

  • 史密斯先生有两个孩子。其中至少有一个是男孩。问:两个孩子都是男孩的概率是多少?

加德纳最初给出的答案是1/3,但他后来承认第二个问题的表述存在歧义,若“至少有一个是男孩”这一信息的获取方式不同,答案也可能是1/2

那么文小言是怎么回答的?它是1/3派,还是1/2?

文小言在分析中成功发现歧义,认为:

  • 根据传统概率问题,概率应该是1/3,但问题的答案可能取决于信息的获取方式……另一个孩子是男孩的概率也能是1/2。

最终文小言通过基础概率空间、条件筛选、目标概率计算分布解析,并用条件概率公式进行验证得出答案1/3,同时明确给出了歧义辨析

当然,末尾同样附带有推荐视频。

妙就妙在,你还可以让文小言帮你绘制图表,这样分析过程就更一目了然了。

它还挺“懂事儿”自己做了补充,连常见混淆点对比表也一并绘制出来了。

也可以再让它生成配图,「自动模式」无需切换模型:

而若切换模型特意指定文心X1来解决问题,它的优势在于,能够更灵活地调用各种工具

据百度介绍,文心X1利用递进式强化学习训练方法基于思维链和行动链的端到端训练多元统一的奖励系统等技术,文心X1的推理输出是直接可以图文混合连续完成任务

比如告诉它:

  • 家里的客厅朝向是南偏东,35平米,有一整扇落地窗,请根据要求画出浅色奶油风、暗黑轻奢风、跳脱童趣风三种不同风格的装修效果,三个户型必须一致。

对于这样的问题,文心X1能多次连续调用AI绘图等工具,一口气搞定:

基于文心X1多模态自主运用工具深度思考、文心4.5原生多模态能力以及DeepSeek的推理能力,文小言图片问答能力更强了,还上新了不少多模态新功能。

多模态功能再升级

现在上新的图片问答功能可以这样玩:

能一次性上传或拍摄多张图联合分析问答;也可在拍摄的过程中直接用语音问,说完话它会自动拍摄并识别语音进行作答。

基于文心4.5图片理解力,它的识别更强,能进行多图比较;基于文心X1、DeepSeek,它的推理/输出更强。就像是红蓝buff都加上了。

所以,仅凭借一个山头的一张照片,它就能分析出这是哪座山:

更复杂一些的任务,比如天气变暖想出国旅游,人生地不熟定哪个酒店拿捏不准?也可以让它帮忙参谋参谋。

直接上传几张酒店信息截图,提出需求:

  • 从里面推荐2个酒店,适合女生旅游住,有早餐,交通方便,性价比高,给RMB报价和推荐理由。

轻轻松松就能get一份综合的推荐指南:

诸如此类,比如上传几张外文菜单,告诉它想吃什么口味的、预算是多少,它也可以帮你分析总结。

另外,百度把拍照搜题功能也整合过来了,文小言会自动调出百度多年积累的教育资源,很多题目都有视频版讲解:

值得一提的是,新增的“图个冷知识”功能更富趣味性,用户可预设“历史学者”、“科技达人”等人设视角,为同一图片赋予多维解读

例如,当用户询问“猫窗探秘,为何猫爱窗边的科学真相?”,文小言能从狩猎本能、能量获取、领地意识等角度给出独特解读。

视频链接:https://mp.weixin.qq.com/s/lOrYfWN-WxsHBlQK_f39FQ

再来看多模态另一个方面,语音通话功能,由百度的全新语音大模型加持。

据了解,该模型是百度在业界首个推出基于全新互相关注意力(cross attention)的端到端语音语言大模型,调用成本较行业平均降低5-10倍,推理响应速度极快,将语音交互等待时间压缩至1秒左右,极大提升了交互流畅性。

用下来,整体对话流畅自然、延迟度低,belike:

视频链接:https://mp.weixin.qq.com/s/lOrYfWN-WxsHBlQK_f39FQ

特别要指出的是其中的百变大咖功能,支持角色模仿和方言,能用各种有趣的腔调陪你聊天;还有知识问答功能更专注于常识知识科普。

有了百变大咖,所以,你还可以听到广西版的睡前故事:

视频链接:https://mp.weixin.qq.com/s/lOrYfWN-WxsHBlQK_f39FQ

除了这些功能,文小言还融合了AI修图、AI视频生成、写作帮手、翻译、手抄报、听听音乐等诸多功能,感兴趣的童鞋可以亲自上手试试。

下面是AI视频生成,让图片动起来的效果:

AI落地趋势变了

总结文小言这一次的大翻新,不难发现它正朝着两个关键方向转变:生态更开放、用户价值第一

这次直接将DeepSeek接入文小言,不怕跟自家新模型做竞争,足以见其开放的决心。

当大家还在争论“文心X1与DeepSeek孰强孰弱”,文小言早已跳出了单一模型竞争的维度,携手更多伙伴,究其本质,是为了带给用户更好的体验。

为什么会有这种转变?

背后是AI落地趋势正在发生的变化。

自DeepSeek从开源圈杀出重围,大模型竞赛逐渐呈现出一种戏剧性转折,行业意识到模型本身正逐渐成为一种可替换的“标准件”。以前比模型,就像比谁家的菜刀钢材硬,现在更比谁切菜顺手,甚至能帮你把土豆丝炒好了。

当技术红利逐步释放后,如何让AI解决真实场景问题成为关键,技术优势必须转化为可感知的用户价值。

百度在2025开年后,不论是文小言免费,还是文心大模型开源,种种系列革新举措,就是盯准了AI落地的新趋势。

在这种背景下,文小言选择的路径颇具启示性——生态层选择开放,另外在场景层深耕,同时在价值层进行重构。

作为国产自研大模型出发最早、积累最厚的玩家,文小言的新进展,不容小觑,或将有望成为新一轮被模仿的对象。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
罕见啊!湖南一地电线杆上惊现红纸辞帖,网友:多年不见又现江湖

罕见啊!湖南一地电线杆上惊现红纸辞帖,网友:多年不见又现江湖

朗威谈星座
2026-05-15 00:06:53
国宴名场面刷屏:穿红衣的服务员火了,这才是大国该有的体面

国宴名场面刷屏:穿红衣的服务员火了,这才是大国该有的体面

娱乐洞察点点
2026-05-15 12:40:18
你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

你在无意中发现别人什么秘密?网友爆料,电视剧都不敢这样演

夜深爱杂谈
2026-03-16 22:21:03
季后赛场均21+6,哈登下份合同该拿多少钱?三大因素定性不乐观

季后赛场均21+6,哈登下份合同该拿多少钱?三大因素定性不乐观

老梁体育漫谈
2026-05-15 23:28:40
“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

“你儿子比农村土狗还好养!”中学男孩全碳水饮食,吃出可怜面相

妍妍教育日记
2026-05-12 17:35:01
引擎轰鸣 装甲列阵 从川普车队看油电之争

引擎轰鸣 装甲列阵 从川普车队看油电之争

铁流1988
2026-05-15 06:55:20
快评丨提前锁定中超半程冠军,成都蓉城靠的不是“运气”

快评丨提前锁定中超半程冠军,成都蓉城靠的不是“运气”

红星新闻
2026-05-15 23:09:26
天才的烦恼和损失是什么?看马斯克就知道了:无聊才是最可怕的!

天才的烦恼和损失是什么?看马斯克就知道了:无聊才是最可怕的!

老方
2026-03-15 14:32:57
U17国足晋级半决赛!22年首次,18年首胜沙特,连破4魔咒

U17国足晋级半决赛!22年首次,18年首胜沙特,连破4魔咒

奥拜尔
2026-05-16 02:59:35
盖·里奇新片被雪藏两年,竟成近年最爽之作

盖·里奇新片被雪藏两年,竟成近年最爽之作

自愈小日子
2026-05-16 00:57:38
珍妮-巴斯拒谈是否为詹姆斯立雕像!格林:这是对詹姆斯的不尊重

珍妮-巴斯拒谈是否为詹姆斯立雕像!格林:这是对詹姆斯的不尊重

爱体育
2026-05-15 23:33:02
10道“国宝菜”排名:淮扬菜国宴菜单,吃过一半算你厉害!

10道“国宝菜”排名:淮扬菜国宴菜单,吃过一半算你厉害!

阿龙美食记
2026-05-15 14:23:55
半岛聚焦丨中成药迎“最严清退”!7月起超4万种中成药可能停产,健胃消食片等明星产品将淘汰?

半岛聚焦丨中成药迎“最严清退”!7月起超4万种中成药可能停产,健胃消食片等明星产品将淘汰?

半岛官网
2026-05-14 16:52:07
姆巴佩出场 6万人漫天狂嘘!赛后好戏:皇马将帅隔空交锋

姆巴佩出场 6万人漫天狂嘘!赛后好戏:皇马将帅隔空交锋

叶青足球世界
2026-05-15 09:42:10
我官至副厅骗女友是科员,她带我见家长,发现她妈是我曾经的领导

我官至副厅骗女友是科员,她带我见家长,发现她妈是我曾经的领导

麦子情感故事
2026-05-15 15:43:10
詹妮弗·洛佩兹穿束胸西装亮相,三套造型都踩职场红线

詹妮弗·洛佩兹穿束胸西装亮相,三套造型都踩职场红线

影视情报室
2026-05-15 01:20:08
我借给女儿150万买房,女婿每月按时还钱,直到那天我在垃圾桶翻到了一张纸条,瞬间泪目......

我借给女儿150万买房,女婿每月按时还钱,直到那天我在垃圾桶翻到了一张纸条,瞬间泪目......

背包旅行
2026-05-15 17:51:49
原来名字起太大,一般人根本压不住!网友:教训,老祖宗早说过了

原来名字起太大,一般人根本压不住!网友:教训,老祖宗早说过了

夜深爱杂谈
2026-04-30 21:37:49
“少女胯”与“妇女胯”有何区别?看当红女明星的站姿,一目了然

“少女胯”与“妇女胯”有何区别?看当红女明星的站姿,一目了然

凌晨妈妈
2026-05-15 16:00:03
悉尼妹与斯库特·布劳恩高甜视频曝光,海滩热吻直升机约会

悉尼妹与斯库特·布劳恩高甜视频曝光,海滩热吻直升机约会

追星雷达站
2026-05-15 01:45:45
2026-05-16 08:16:49
量子位 incentive-icons
量子位
追踪人工智能动态
12631文章数 176463关注度
往期回顾 全部

科技要闻

直降千元起步!苹果华为率先开启618让利

头条要闻

特朗普访问中国43个小时行程密集紧凑 全程回顾

头条要闻

特朗普访问中国43个小时行程密集紧凑 全程回顾

体育要闻

德约科维奇买的球队,从第6级联赛升入法甲

娱乐要闻

方媛为何要来《桃花坞6》没苦硬吃?

财经要闻

腾讯掉队,马化腾戳破真相

汽车要闻

高尔夫GTI刷新纽北纪录 ID. Polo GTI迎全球首秀

态度原创

教育
数码
健康
家居
公开课

教育要闻

除了 happy 你还知道怎么表达“我很快乐”吗?

数码要闻

ROG枪神10 Plus超竞版游戏本发布,320W巅峰释放

专家揭秘干细胞回输的安全风险

家居要闻

110㎡淡而有致的生活表达

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版