网易首页 > 网易号 > 正文 申请入驻

摸DeepSeek过河也得自身硬! 想开后的文小言,真香!

0
分享至

西风 发自 凹非寺
量子位 | 公众号 QbitAI

刚刚,百度文小言全面升级了。

基于多模型的能力,文小言升级了包括全新大语音模型图片问答等在内的一系列有趣儿又实用的新玩法。

比如图片问答,拍四只不同鹦鹉的大头照,问它鹦鹉性别(doge)

你还真别说,这都能回答对,分析得头头是道:

而且现在图片问答还可以这样玩,基于原图元素一键二创,小雏菊杯子摇身幻化出小雏菊手机壳、抽纸盒:

内外兼收,支持多模型融合调度

本次升级,文小言直接把自家刚上线不久的新模型,包括文心大模型X1和4.5,和“隔壁学霸”DeepSeek-R1满血版摆一块儿了,进行了多模型融合调度

现在,文小言的用户在一个页面可随意切换使用DeepSeek或是文心X1/4.5特定模型,爱翻谁的牌子就翻谁的。

文心X1是百度半个月前刚发布的号称是“首个自主运用工具的深度思考模型”。

文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,在多模态交互、理解方面更强,原生模型联合预训练能实现更深层次的模态融合。

另外,文小言上线了「自动模式」,它能够根据用户提出的问题识别用户需求,自动选择最合适的模型

现在,两款新模型直接和DeepSeek融合调度,让文小言拥有了更强的“大脑”。据介绍,他们对DeepSeek还进行了多种功能维度的融合,打通了图片问答、生图等链路

我们先来考验一下这个更强“大脑”的逻辑思维能力。

抛给它一个脑筋急转弯:

  • 在一个封闭房间里有三盏灯,门外有三个开关,每个开关分别控制一盏灯。你只能进房间一次。如何判断出每个开关对应哪盏灯?

只见文小言三下五除二,轻轻松松一步步推理给出了标准答案。判断依据中也会解释打开一个开关等待5-10分钟是为了让灯发热等诸如此类的细节。

和一般推理模型不一样的是,在给出答案之后,它还会自动推荐视频,有详解这道题目的视频,也有和此题类似的更多题目。

如此一来,就方便了大家对题目的延伸理解。

接下来再来一道著名概率难题——“二孩悖论”。

这道题初始表述至少可追溯至1959年,由著名数学家马丁·加德纳在《科学美国人》杂志的“数学游戏”专栏中提出,曾引发数学家们的广泛争论,直到现在大家对这道题目的讨论似乎也还没有停止。

问题是酱婶儿的:

  • 史密斯先生有两个孩子。其中至少有一个是男孩。问:两个孩子都是男孩的概率是多少?

加德纳最初给出的答案是1/3,但他后来承认第二个问题的表述存在歧义,若“至少有一个是男孩”这一信息的获取方式不同,答案也可能是1/2

那么文小言是怎么回答的?它是1/3派,还是1/2?

文小言在分析中成功发现歧义,认为:

  • 根据传统概率问题,概率应该是1/3,但问题的答案可能取决于信息的获取方式……另一个孩子是男孩的概率也能是1/2。

最终文小言通过基础概率空间、条件筛选、目标概率计算分布解析,并用条件概率公式进行验证得出答案1/3,同时明确给出了歧义辨析

当然,末尾同样附带有推荐视频。

妙就妙在,你还可以让文小言帮你绘制图表,这样分析过程就更一目了然了。

它还挺“懂事儿”自己做了补充,连常见混淆点对比表也一并绘制出来了。

也可以再让它生成配图,「自动模式」无需切换模型:

而若切换模型特意指定文心X1来解决问题,它的优势在于,能够更灵活地调用各种工具

据百度介绍,文心X1利用递进式强化学习训练方法基于思维链和行动链的端到端训练多元统一的奖励系统等技术,文心X1的推理输出是直接可以图文混合连续完成任务

比如告诉它:

  • 家里的客厅朝向是南偏东,35平米,有一整扇落地窗,请根据要求画出浅色奶油风、暗黑轻奢风、跳脱童趣风三种不同风格的装修效果,三个户型必须一致。

对于这样的问题,文心X1能多次连续调用AI绘图等工具,一口气搞定:

基于文心X1多模态自主运用工具深度思考、文心4.5原生多模态能力以及DeepSeek的推理能力,文小言图片问答能力更强了,还上新了不少多模态新功能。

多模态功能再升级

现在上新的图片问答功能可以这样玩:

能一次性上传或拍摄多张图联合分析问答;也可在拍摄的过程中直接用语音问,说完话它会自动拍摄并识别语音进行作答。

基于文心4.5图片理解力,它的识别更强,能进行多图比较;基于文心X1、DeepSeek,它的推理/输出更强。就像是红蓝buff都加上了。

所以,仅凭借一个山头的一张照片,它就能分析出这是哪座山:

更复杂一些的任务,比如天气变暖想出国旅游,人生地不熟定哪个酒店拿捏不准?也可以让它帮忙参谋参谋。

直接上传几张酒店信息截图,提出需求:

  • 从里面推荐2个酒店,适合女生旅游住,有早餐,交通方便,性价比高,给RMB报价和推荐理由。

轻轻松松就能get一份综合的推荐指南:

诸如此类,比如上传几张外文菜单,告诉它想吃什么口味的、预算是多少,它也可以帮你分析总结。

另外,百度把拍照搜题功能也整合过来了,文小言会自动调出百度多年积累的教育资源,很多题目都有视频版讲解:

值得一提的是,新增的“图个冷知识”功能更富趣味性,用户可预设“历史学者”、“科技达人”等人设视角,为同一图片赋予多维解读

例如,当用户询问“猫窗探秘,为何猫爱窗边的科学真相?”,文小言能从狩猎本能、能量获取、领地意识等角度给出独特解读。

视频链接:https://mp.weixin.qq.com/s/lOrYfWN-WxsHBlQK_f39FQ

再来看多模态另一个方面,语音通话功能,由百度的全新语音大模型加持。

据了解,该模型是百度在业界首个推出基于全新互相关注意力(cross attention)的端到端语音语言大模型,调用成本较行业平均降低5-10倍,推理响应速度极快,将语音交互等待时间压缩至1秒左右,极大提升了交互流畅性。

用下来,整体对话流畅自然、延迟度低,belike:

视频链接:https://mp.weixin.qq.com/s/lOrYfWN-WxsHBlQK_f39FQ

特别要指出的是其中的百变大咖功能,支持角色模仿和方言,能用各种有趣的腔调陪你聊天;还有知识问答功能更专注于常识知识科普。

有了百变大咖,所以,你还可以听到广西版的睡前故事:

视频链接:https://mp.weixin.qq.com/s/lOrYfWN-WxsHBlQK_f39FQ

除了这些功能,文小言还融合了AI修图、AI视频生成、写作帮手、翻译、手抄报、听听音乐等诸多功能,感兴趣的童鞋可以亲自上手试试。

下面是AI视频生成,让图片动起来的效果:

AI落地趋势变了

总结文小言这一次的大翻新,不难发现它正朝着两个关键方向转变:生态更开放、用户价值第一

这次直接将DeepSeek接入文小言,不怕跟自家新模型做竞争,足以见其开放的决心。

当大家还在争论“文心X1与DeepSeek孰强孰弱”,文小言早已跳出了单一模型竞争的维度,携手更多伙伴,究其本质,是为了带给用户更好的体验。

为什么会有这种转变?

背后是AI落地趋势正在发生的变化。

自DeepSeek从开源圈杀出重围,大模型竞赛逐渐呈现出一种戏剧性转折,行业意识到模型本身正逐渐成为一种可替换的“标准件”。以前比模型,就像比谁家的菜刀钢材硬,现在更比谁切菜顺手,甚至能帮你把土豆丝炒好了。

当技术红利逐步释放后,如何让AI解决真实场景问题成为关键,技术优势必须转化为可感知的用户价值。

百度在2025开年后,不论是文小言免费,还是文心大模型开源,种种系列革新举措,就是盯准了AI落地的新趋势。

在这种背景下,文小言选择的路径颇具启示性——生态层选择开放,另外在场景层深耕,同时在价值层进行重构。

作为国产自研大模型出发最早、积累最厚的玩家,文小言的新进展,不容小觑,或将有望成为新一轮被模仿的对象。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2-1!辽宁铁人“绝处逢生”,绝杀青岛海牛,1大耻辱纪录遭终结

2-1!辽宁铁人“绝处逢生”,绝杀青岛海牛,1大耻辱纪录遭终结

汪星人哟
2026-05-20 21:00:55
王楚然抹胸花苞裙,美出新高度!

王楚然抹胸花苞裙,美出新高度!

芳华青年
2026-05-20 20:58:54
央视直播乒乓时间表:5月20日CCTV5转播国乒!莎头出战大满贯混双

央视直播乒乓时间表:5月20日CCTV5转播国乒!莎头出战大满贯混双

观史搜寻着
2026-05-20 11:30:58
西红柿被点名!医生发现:吃得越多,高血压患者寿命越短?真的吗

西红柿被点名!医生发现:吃得越多,高血压患者寿命越短?真的吗

老马健康讲坛
2026-05-19 13:38:15
A股:周三晚间传来3个特大级消息!A股或迎来更大级别反弹行情?

A股:周三晚间传来3个特大级消息!A股或迎来更大级别反弹行情?

趋势清风侠
2026-05-20 17:13:40
用户通过豆包预订饭店座位,到店后被告知“你找豆包预约那你找豆包啊”,豆包客服回应:无法帮用户预订或者购买商品

用户通过豆包预订饭店座位,到店后被告知“你找豆包预约那你找豆包啊”,豆包客服回应:无法帮用户预订或者购买商品

浙江之声
2026-05-20 08:24:54
今晚,有大事件!牵动市场后续走向

今晚,有大事件!牵动市场后续走向

钱眼
2026-05-20 20:50:28
中国闹出个乌龙,沙漠种麦本为保粮仓,谁料金黄麦浪竟成治沙神器

中国闹出个乌龙,沙漠种麦本为保粮仓,谁料金黄麦浪竟成治沙神器

三农雷哥
2026-05-20 17:38:31
普京果然说到做到,四次归还领土,最后一次归还面积最大

普京果然说到做到,四次归还领土,最后一次归还面积最大

秋枫凋零
2026-05-18 12:19:52
张雪机车车队聚餐照片流出!一个个笑容满面,瓦嫂嘴角根本压不住

张雪机车车队聚餐照片流出!一个个笑容满面,瓦嫂嘴角根本压不住

火山詩话
2026-05-19 19:22:02
太扎心!72岁王健林被逼到崩溃,6000亿负债,连利息都快付不起了

太扎心!72岁王健林被逼到崩溃,6000亿负债,连利息都快付不起了

蜉蝣说
2026-04-30 11:59:18
当百余款车都用同一套“灵魂”,是救命稻草还是“技术殖民”?

当百余款车都用同一套“灵魂”,是救命稻草还是“技术殖民”?

青橙汽车
2026-05-19 13:58:13
去母留子?这一次,何九华“自爆黑料”,将王鸥的体面撕了个稀碎

去母留子?这一次,何九华“自爆黑料”,将王鸥的体面撕了个稀碎

星娱叨叨社
2026-05-19 15:38:54
存储芯片史上最罕见的逆袭!

存储芯片史上最罕见的逆袭!

君临财富
2026-05-20 17:11:28
人人喊打的信用卡APP,终于要没了?

人人喊打的信用卡APP,终于要没了?

差评XPIN
2026-05-20 00:07:31
海淀妈妈曾自曝尴尬现状:“我,海归高管、花千万买学区房,却养出个「学渣」儿子”,如今现状反转了……

海淀妈妈曾自曝尴尬现状:“我,海归高管、花千万买学区房,却养出个「学渣」儿子”,如今现状反转了……

阅读第一
2026-05-20 08:36:21
有点皮,勒沃库森官方发布趣图把角球阿森纳改成恭喜阿森纳

有点皮,勒沃库森官方发布趣图把角球阿森纳改成恭喜阿森纳

懂球帝
2026-05-20 07:39:00
宁愿在国外种地,也不愿意回国,培养出92个世界冠军的李永波图啥

宁愿在国外种地,也不愿意回国,培养出92个世界冠军的李永波图啥

阅微札记
2026-02-22 19:15:15
“见过最廉价的兜底”,一份趁热吃的山姆烤鸡,让家长被全网群嘲

“见过最廉价的兜底”,一份趁热吃的山姆烤鸡,让家长被全网群嘲

妍妍教育日记
2026-05-20 16:49:27
22年终圆梦!阿森纳狂欢后,今夏哪些球员可能加盟帮助枪手卫冕?

22年终圆梦!阿森纳狂欢后,今夏哪些球员可能加盟帮助枪手卫冕?

仰卧撑FTUer
2026-05-20 18:22:37
2026-05-20 21:48:50
量子位 incentive-icons
量子位
追踪人工智能动态
12662文章数 176467关注度
往期回顾 全部

科技要闻

一文看懂谷歌I/O2026:谷歌打响智能体大战

头条要闻

货车司机刚运出34吨面粉就遇大雨淋湿大半 面粉厂免赔

头条要闻

货车司机刚运出34吨面粉就遇大雨淋湿大半 面粉厂免赔

体育要闻

不再美丽的阿森纳,终于成为英超冠军

娱乐要闻

王菲“没事儿”,成年人学不来的松弛

财经要闻

白酒榜|汾酒营收净利双增 口子窖"造富"

汽车要闻

28项升级 新红旗HQ9上市 33.88万元起

态度原创

教育
时尚
手机
房产
旅游

教育要闻

我国被严重低估的3所大学,500多分就能上,毕业就业能完爆985!

“血糖焦虑”的年轻女性,为什么越努力越疲惫?

手机要闻

首发天玑9500最强版本!iQOO 15T发布:3299元起

房产要闻

别被中介带了节奏,你的房子可能比你想的值钱

旅游要闻

向世界推介重庆!重庆文旅魅力“圈粉”友城

无障碍浏览 进入关怀版