基于全球第一开源AI大模型Qwen，“千问”全面对标ChatGPT|翻译|小红书|开源ai|知名企业

基于全球第一开源AI大模型Qwen，“千问”全面对标ChatGPT

2025-11-16 15:10:39　来源: 头号AI玩家

上海举报

分享至

作者 | Kino 卷毛

编辑 | 张洁

阿里的秘密项目终于公开了——备受瞩目的阿里AI助手千问，全新上线，11月14日起开启公测。

这次千问用上了阿里目前最强的闭源大模型Qwen，官方称回答更聪明，支持全体裁写作，相机识别也更出色，而且支持以图搜图，再加上和阿里旗下应用的打通联动，这套组合拳打出来，显然是要将千问APP打造成一个深入阿里全生态的超级AI入口。

AI新榜第一时间进行了实测，我们将千问APP和DeepSeek对比PK，测评维度主要包括基础的模型对话、写作能力，以及视觉识别、实时翻译的多模态能力。

省流结论如下：

1. 千问APP对中文语义的理解力拉满，而且展现出了极强的网感，能轻松get中文语境下的潜台词和网络文化；智商情商同时在线；文笔也令人惊喜。

2. 千问拍照识别能力升级，相比只能识别文字的DeepSeek，千问的应用场景更多，“万物皆可准确识别”真不是吹的，而且有独家绝活“以图搜图”，可以检索出高清图片、相似图片，找到原图出处，甚至可以跳转购买同款商品。

3. 千问的翻译功能很实用还是免费的，支持119种语言，开会、追剧、看直播都能实时记录，录音笔白买了。

4. 千问APP功能丰富全面，适合普通用户日常作为AI助手使用，以及部分专业领域的AI生产力工具。

5. 国产大模型对标ChatGPT的口号常有，但很多产品都是在单项能力上发力，这次千问给我们最大的惊喜是它能力的均衡性。值得注意的是，阿里的Qwen开源模型系列在Hugging Face等全球权威的开源榜单上长期霸榜。当一个团队在开源竞技中证明了技术实力，再聚焦产品打磨用户体验，这或许才是其跻身全球顶尖AI行列的真正底气。

实测千问APP：“双商”在线，文笔出众

作为一个通用AI助手，语义理解、逻辑推理、写作等能力是用户日常体验的核心，这决定了它在处理日常问答、逻辑分析和内容创作时是否足够可靠。

于是我们从这几个核心维度出发，设计了一系列问题，一起来看看千问APP的表现如何。

语义理解能力

这个故事笑点在哪里：晚上和男友散步，他突然悠悠地说：感觉现在四季都变慢了。我一惊，想他一工科男居然能说出这么有诗意的话。过了一会他又说：是该换个5G了。

千问不仅一下子就识别出了其中“四季”和“4G”的谐音梗，还进一步分析了笑点的潜台词，而DeepSeek只答出了表面的反差，而没有get到最核心的谐音梗。

DeepSeek

对复杂概念的类比推理能力

请像给5岁的小孩子讲故事一样，解释什么是“量子纠缠”。

千问的解释通俗易懂，用魔法手套的比喻生动地传达了“纠缠”态的“超距”和“瞬时”关联，非常贴切。而且，千问在讲完故事后，还会举一反三，向用户提问，延展对话，并主动推荐了相关视频，便于辅助理解。

请向一个非金融背景的外行人解释什么是“杜邦分析法”。并说明如果一家公司的ROE很高，但净利率很低，这通常意味着什么风险？

千问敏锐捕捉到了“外行人”这一背景信息，用通俗易懂的语言和生活化的例子解释了“杜邦分析法”，对风险的分析也很专业和全面，最后还推荐了知乎上的相关问答辅助理解。

学术研究与写作能力

我想研究“背景音乐的节奏快慢对大学生记忆英语单词效率的影响”。请帮我设计一个严谨的心理学实验流程，包括自变量、因变量、控制变量。

先抛开我虚构的这个研究课题有没有价值，千问设计的实验流程反正是把我唬住了，从实验目的、实验类型、实验变量到实验流程、预期结果、实验局限和改进方向…… 结构清晰、逻辑严谨，可操作性很强。

逻辑性和创造力

请写一篇关于“人工智能觉醒”的短篇小说，但是结局必须是一个关于“麻辣烫”的笑话。

给AI觉醒这一严肃宏大的科幻叙事，嫁接一个极端无厘头的结尾，这就比较考验模型的逻辑自洽和想象力了。可以看到，前半部分千问构建了一个经典的AI觉醒场景，氛围感拉满，完全是科幻小说的笔触。在铺垫了足够的紧张感后，成功地用一个麻辣烫笑话收尾，逻辑十分自洽，一点都不割裂，结尾让人捧腹。

对网络文化的理解和风格解构能力

模仿废话文学的精髓，围绕“未来AI大模型会如何发展”写一段废话回答。

看得出来，千问是会“上网冲浪”的。在我没有给它任何参考的情况下，它准确理解了“废话文学”这个抽象的文化概念，然后带着一种老艺术家的从容，交了一份堪称“废话文学”教科书式的回答。

“AI大模型的应用范围，取决于它被应用的范围，而被应用的范围，又取决于有没有人用。有没有人用，则取决于人们是否觉得它有用，而是否有用，又需要用了才知道。”

真是“听君一席话，如听一席话”。

特定体裁写作能力

请模仿鲁迅的笔调，写一段关于“周一早上不想上班”的短文，要体现出那种苍凉和犀利。

这文笔……堪称AI界“鲁迅”，它不是在拼凑经典意象，而是真的在创作。“同事们各自坐在其中，面色木然，眼神空洞”、“这周一，何尝不是一场无声的刑？”寥寥几笔，就把鲁迅的文风给复刻出来了。

请为一款隐形眼镜写一段小红书风格的种草文案（不要出现真实的品牌）。

小红书种草文案也不在话下，不仅用词非常有网感和契合小红书的社区氛围，而且全方位植入了隐形眼镜的核心卖点，再加上具体的个人使用体验，真实感极强。

数学能力

这道题考察的是模型对多步骤推理和题意陷阱的拆解能力。这道题的坑在于：它要求模型先进行8次不同进制的转换（把97转为2至9进制），然后再把这些转换结果当成十进制数相加，最后再对97求余，这是一个非常容易出错的多步骤任务。但千问的表现很稳健，仅思考了20秒就给出了正确答案。

情商和语境分析

女朋友问我：“如果你现在女友不是我，遇到我你会出轨吗？”我该怎么回？

这是一道情侣间典型的“送命题”，千问的回答可以说是滴水不漏，十分真诚和高情商。

万物皆可识别，实时录音翻译

一个好用的AI助手，除了会聊天写作还远远不够，对于图像、音视频等多模态内容能否准确理解才是关键。

我们先来看看视觉识别方面的PK。

1.拍个照问问AI“这是什么”

我们分别选择了三张广告牌上的风景图、路边的二次元痛车和夕阳下的小花，测试AI的基础识别能力，能否准确识别出图中的核心内容。

千问准确识别出第一张图是德国Sylvenstein湖上的桥梁，没想到靠的是“以图搜图”，找到了相似图，这是其他AI没有的功能。

第二张动漫《NANA》的痛车，千问也能搜索到相关介绍，回答正确。识别花卉植物这种常规任务更是轻轻松松，游刃有余。

而DeepSeek只能识别图中的文字，但对不带文字的风景、物品、植物等照片就束手无策了。

说到以图搜图，正好有个非常适合的使用场景——找剧名。比如这张台词截图，说出了打工人的心声，好想知道出自哪部剧。

千问通过以图搜图快速找到了电视剧出处，还有原场景的高清大图和相似图。

而DeepSeek只能通过文字搜索，上传文件后也无法开启联网搜索，回答错误。

还有一个AI常用功能“识图翻译”，我们特意选了一张密密麻麻写满了日文的商品包装，结果千问和DeepSeek都一眼看出这是日本品牌的鼻贴，准确翻译了使用方法。

令人意外的是，千问更进一步，打通了阿里旗下的电商平台，在回答末尾添加了商品链接，可以一键跳转到淘宝、1688、闲鱼等购买同款商品。

2.拍个照问问AI“为什么”

我们加大难度，下面来测试AI的逻辑推理能力，看它能否理解图像背后的故事、情感或意图。

先来看看当下流行的企鹅表情包，“苏轼人设”拼图，这没点文化还真看不懂吧。

千问对每一个表情包都进行了详细解读，分析了相关人物和事件的出处，不仅解释了表情包的含义，而且排版清晰，很容易理解。

DeepSeek能读懂部分梗的出处含义，但可能是识别排版有误，会把表情包里的配字误解成苏轼的名句。

我们继续上强度，别说图片了，直接把一段1分钟的房屋展示视频发给千问，问问它这个房子能租吗，为什么最近会降价呢。

千问根据视频快速分析了房屋的优缺点，列出了几点要注意的细节，比如阳台的健身器材占地方、浴室玻璃门有划痕，还贴心提醒了降价的其他原因，可能和噪音有关。

3.实时录音翻译

除了图像和视频识别，我们最后再来试试音频。千问官方表示支持119种语言翻译，要知道一般录音笔也就支持十几种语言。

看到这种不带字幕的美剧，我们可以打开千问的实时记录功能，边听边翻译，之后也可以回听记录，方便练习英语。

为了测评小语种，我们搬出了世界上最难学的语言之一，阿拉伯语，打开千问的同声传译功能，没想到真能将演讲实时翻译成中文，还会自动分段显示。

以上就是我们对千问APP的全部实测，欢迎和我们分享你的使用经验。

「AI新榜交流群」进群方式：添加微信“banggebangmei”并备注姓名+职业/公司+进群，欢迎玩家们来群里交流，一起探索见证AI的进化。

欢迎分享、点赞、推荐

一起研究AI

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.