![]()
作者 | Kino 卷毛
编辑 | 张洁
阿里的秘密项目终于公开了——备受瞩目的阿里AI助手千问,全新上线,11月14日起开启公测。
![]()
这次千问用上了阿里目前最强的闭源大模型Qwen,官方称回答更聪明,支持全体裁写作,相机识别也更出色,而且支持以图搜图,再加上和阿里旗下应用的打通联动,这套组合拳打出来,显然是要将千问APP打造成一个深入阿里全生态的超级AI入口。
AI新榜第一时间进行了实测,我们将千问APP和DeepSeek对比PK,测评维度主要包括基础的模型对话、写作能力,以及视觉识别、实时翻译的多模态能力。
省流结论如下:
1. 千问APP对中文语义的理解力拉满,而且展现出了极强的网感,能轻松get中文语境下的潜台词和网络文化;智商情商同时在线;文笔也令人惊喜。
2. 千问拍照识别能力升级,相比只能识别文字的DeepSeek,千问的应用场景更多,“万物皆可准确识别”真不是吹的,而且有独家绝活“以图搜图”,可以检索出高清图片、相似图片,找到原图出处,甚至可以跳转购买同款商品。
3. 千问的翻译功能很实用还是免费的,支持119种语言,开会、追剧、看直播都能实时记录,录音笔白买了。
4. 千问APP功能丰富全面,适合普通用户日常作为AI助手使用,以及部分专业领域的AI生产力工具。
5. 国产大模型对标ChatGPT的口号常有,但很多产品都是在单项能力上发力,这次千问给我们最大的惊喜是它能力的均衡性。值得注意的是,阿里的Qwen开源模型系列在Hugging Face等全球权威的开源榜单上长期霸榜。当一个团队在开源竞技中证明了技术实力,再聚焦产品打磨用户体验,这或许才是其跻身全球顶尖AI行列的真正底气。
![]()
实测千问APP:“双商”在线,文笔出众
作为一个通用AI助手,语义理解、逻辑推理、写作等能力是用户日常体验的核心,这决定了它在处理日常问答、逻辑分析和内容创作时是否足够可靠。
于是我们从这几个核心维度出发,设计了一系列问题,一起来看看千问APP的表现如何。
语义理解能力
这个故事笑点在哪里:晚上和男友散步,他突然悠悠地说:感觉现在四季都变慢了。我一惊,想他一工科男居然能说出这么有诗意的话。过了一会他又说:是该换个5G了。
![]()
千问不仅一下子就识别出了其中“四季”和“4G”的谐音梗,还进一步分析了笑点的潜台词,而DeepSeek只答出了表面的反差,而没有get到最核心的谐音梗。
![]()
DeepSeek
对复杂概念的类比推理能力
请像给5岁的小孩子讲故事一样,解释什么是“量子纠缠”。
![]()
千问的解释通俗易懂,用魔法手套的比喻生动地传达了“纠缠”态的“超距”和“瞬时”关联,非常贴切。而且,千问在讲完故事后,还会举一反三,向用户提问,延展对话,并主动推荐了相关视频,便于辅助理解。
请向一个非金融背景的外行人解释什么是“杜邦分析法”。并说明如果一家公司的ROE很高,但净利率很低,这通常意味着什么风险?
![]()
![]()
千问敏锐捕捉到了“外行人”这一背景信息,用通俗易懂的语言和生活化的例子解释了“杜邦分析法”,对风险的分析也很专业和全面,最后还推荐了知乎上的相关问答辅助理解。
学术研究与写作能力
我想研究“背景音乐的节奏快慢对大学生记忆英语单词效率的影响”。请帮我设计一个严谨的心理学实验流程,包括自变量、因变量、控制变量。
![]()
先抛开我虚构的这个研究课题有没有价值,千问设计的实验流程反正是把我唬住了,从实验目的、实验类型、实验变量到实验流程、预期结果、实验局限和改进方向…… 结构清晰、逻辑严谨,可操作性很强。
逻辑性和创造力
请写一篇关于“人工智能觉醒”的短篇小说,但是结局必须是一个关于“麻辣烫”的笑话。
![]()
给AI觉醒这一严肃宏大的科幻叙事,嫁接一个极端无厘头的结尾,这就比较考验模型的逻辑自洽和想象力了。可以看到,前半部分千问构建了一个经典的AI觉醒场景,氛围感拉满,完全是科幻小说的笔触。在铺垫了足够的紧张感后,成功地用一个麻辣烫笑话收尾,逻辑十分自洽,一点都不割裂,结尾让人捧腹。
对网络文化的理解和风格解构能力
模仿废话文学的精髓,围绕“未来AI大模型会如何发展”写一段废话回答。
![]()
![]()
看得出来,千问是会“上网冲浪”的。在我没有给它任何参考的情况下,它准确理解了“废话文学”这个抽象的文化概念,然后带着一种老艺术家的从容,交了一份堪称“废话文学”教科书式的回答。
“AI大模型的应用范围,取决于它被应用的范围,而被应用的范围,又取决于有没有人用。有没有人用,则取决于人们是否觉得它有用,而是否有用,又需要用了才知道。”
真是“听君一席话,如听一席话”。
特定体裁写作能力
请模仿鲁迅的笔调,写一段关于“周一早上不想上班”的短文,要体现出那种苍凉和犀利。
![]()
这文笔……堪称AI界“鲁迅”,它不是在拼凑经典意象,而是真的在创作。“同事们各自坐在其中,面色木然,眼神空洞”、“这周一,何尝不是一场无声的刑?”寥寥几笔,就把鲁迅的文风给复刻出来了。
请为一款隐形眼镜写一段小红书风格的种草文案(不要出现真实的品牌)。
![]()
小红书种草文案也不在话下,不仅用词非常有网感和契合小红书的社区氛围,而且全方位植入了隐形眼镜的核心卖点,再加上具体的个人使用体验,真实感极强。
数学能力
![]()
![]()
这道题考察的是模型对多步骤推理和题意陷阱的拆解能力。这道题的坑在于:它要求模型先进行8次不同进制的转换(把97转为2至9进制),然后再把这些转换结果当成十进制数相加,最后再对97求余,这是一个非常容易出错的多步骤任务。但千问的表现很稳健,仅思考了20秒就给出了正确答案。
情商和语境分析
女朋友问我:“如果你现在女友不是我,遇到我你会出轨吗?”我该怎么回?
![]()
![]()
这是一道情侣间典型的“送命题”,千问的回答可以说是滴水不漏,十分真诚和高情商。
![]()
万物皆可识别,实时录音翻译
一个好用的AI助手,除了会聊天写作还远远不够,对于图像、音视频等多模态内容能否准确理解才是关键。
我们先来看看视觉识别方面的PK。
1.拍个照问问AI“这是什么”
我们分别选择了三张广告牌上的风景图、路边的二次元痛车和夕阳下的小花,测试AI的基础识别能力,能否准确识别出图中的核心内容。
![]()
![]()
![]()
千问准确识别出第一张图是德国Sylvenstein湖上的桥梁,没想到靠的是“以图搜图”,找到了相似图,这是其他AI没有的功能。
![]()
第二张动漫《NANA》的痛车,千问也能搜索到相关介绍,回答正确。识别花卉植物这种常规任务更是轻轻松松,游刃有余。
![]()
![]()
而DeepSeek只能识别图中的文字,但对不带文字的风景、物品、植物等照片就束手无策了。
![]()
说到以图搜图,正好有个非常适合的使用场景——找剧名。比如这张台词截图,说出了打工人的心声,好想知道出自哪部剧。
![]()
千问通过以图搜图快速找到了电视剧出处,还有原场景的高清大图和相似图。
![]()
而DeepSeek只能通过文字搜索,上传文件后也无法开启联网搜索,回答错误。
![]()
还有一个AI常用功能“识图翻译”,我们特意选了一张密密麻麻写满了日文的商品包装,结果千问和DeepSeek都一眼看出这是日本品牌的鼻贴,准确翻译了使用方法。
![]()
令人意外的是,千问更进一步,打通了阿里旗下的电商平台,在回答末尾添加了商品链接,可以一键跳转到淘宝、1688、闲鱼等购买同款商品。
![]()
2.拍个照问问AI“为什么”
我们加大难度,下面来测试AI的逻辑推理能力,看它能否理解图像背后的故事、情感或意图。
先来看看当下流行的企鹅表情包,“苏轼人设”拼图,这没点文化还真看不懂吧。
![]()
千问对每一个表情包都进行了详细解读,分析了相关人物和事件的出处,不仅解释了表情包的含义,而且排版清晰,很容易理解。
![]()
DeepSeek能读懂部分梗的出处含义,但可能是识别排版有误,会把表情包里的配字误解成苏轼的名句。
![]()
我们继续上强度,别说图片了,直接把一段1分钟的房屋展示视频发给千问,问问它这个房子能租吗,为什么最近会降价呢。
千问根据视频快速分析了房屋的优缺点,列出了几点要注意的细节,比如阳台的健身器材占地方、浴室玻璃门有划痕,还贴心提醒了降价的其他原因,可能和噪音有关。
![]()
3.实时录音翻译
除了图像和视频识别,我们最后再来试试音频。千问官方表示支持119种语言翻译,要知道一般录音笔也就支持十几种语言。
看到这种不带字幕的美剧,我们可以打开千问的实时记录功能,边听边翻译,之后也可以回听记录,方便练习英语。
![]()

为了测评小语种,我们搬出了世界上最难学的语言之一,阿拉伯语,打开千问的同声传译功能,没想到真能将演讲实时翻译成中文,还会自动分段显示。
![]()
![]()
以上就是我们对千问APP的全部实测,欢迎和我们分享你的使用经验。
「AI新榜交流群」进群方式:添加微信“banggebangmei”并备注姓名+职业/公司+进群,欢迎玩家们来群里交流,一起探索见证AI的进化。
欢迎分享、点赞、推荐
一起研究AI
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.