网易首页 > 网易号 > 正文 申请入驻

比Qwen3-Max更Max?夸克抢先用上最新闭源模型

0
分享至

机器之心报道

编辑:杨文

最强搜索「牵手」最强模型,能碰撞出什么火花?

Qwen 最新闭源模型,让夸克先用上了。

10 月 23 日,一向不爱出风头的夸克上线了对话助手,可以让用户在一个 App 内即可完成信息查找、问题解答与任务处理,实现了 AI 搜索与对话的深度融合。



其中一大亮点就是,该对话助手采用了 Qwen 最新闭源模型。至于是哪个型号、性能有多强,夸克卖了个关子,只透露比 Qwen3-Max 更进一步,在业界有绝对领先性。

要知道,此前在云栖大会上惊艳亮相的 Qwen3-Max,一经发布就凭借超越 GPT-5 和 Claude Opus 4 的优异表现,跻身全球大模型前三甲。因此,我们有理由相信,夸克对话助手所采用的这款 Qwen 闭源模型,其性能将达到一个全新的高度。



得益于 Qwen 最新闭源模型的强推理、长文本理解能力,夸克对话助手能够快速、精准回答用户的提问,在处理复杂问题和多轮对话时表现更出色。

再加上夸克在搜索和工具领域的多年积累,以及自建的专业知识库,让该助手能够通过多链路实时检索,提供高质量、可溯源的信息,显著提高了回答的准确性和可信度,真正做到了「既聪明又可靠」。

目前,夸克对话助手已经全面上线,所有人只需下载最新夸克 APP 即可免费体验。

接下来,我们就来个深度评测,看看它在实际场景中的表现如何。

一手体验

先来看看它的王牌功能「AI 搜索」

平时我「召唤」夸克最多的场景就是找网盘资源,现在有了夸克对话助手,找资源更是省时省力。比如我们让它找英语专八真题的夸克网盘资源,它立马就贴出资源合集链接,点一下即可保存至夸克网盘。



这两天 AI 圈闹得最沸沸扬扬的大事,非 Meta AI 裁员莫属,汪滔大手一挥干掉了 600 个岗位,其中 FAIR、AI 产品以及基础设施团队成了妥妥的裁员重灾区。

我们索性就让夸克对话助手扒下这事的来龙去脉。输入提示词,点开「深度搜索」,夸克对话助手搜索了 197 篇资料,并从中筛选出符合要求的 38 个参考信源,包括网易、搜狐、新浪新闻等,机器之心也赫然在列。



它的回答虽然言简意赅,但基本涵盖了关键的新闻事实,且条分缕析逻辑清楚,从裁员范围、原因、补偿到同期重大动作,再到行业影响,它给扒了个底朝天。



再来测测它的理解能力

今年 6 月,莫言在广东惠州面对百年客家围屋碧滟楼有感而发,写下「从南阳到南洋根深叶茂」十字上联,并发出「向天下文友敬求下联」之邀。最近,该征集活动获奖名单揭晓,一 00 后女生凭「自井壁及井毕角亢星张」下联夺得一等奖。有网友称:没点传统文化知识还理解不了这个下联。

我们让夸克对话助手来解读下这副对联妙在哪。它抽丝剥茧分析得头头是道,不仅能理解上联中地理与历史的双线叙事,还能识别出下联中涉及的天文知识及典故,并由此延伸出这副对联所蕴含的天人合一的宇宙观。



至于写作能力,我们直接上传了一张图片,让它拿出所有本事,为此景写一首古诗。在这个过程中,夸克对话助手不仅要识别图像内容,还要从视觉信息中提炼出与之匹配的情感和意象,通过古诗的形式进行表达,而古诗又对文化和语言知识有着极高的要求,比如音韵和谐、对仗工整等。



我们还让它模仿「Sir 电影」公众号风格,为英剧《流人》第一季写一篇剧评。

夸克写的这篇剧评还是蛮符合「Sir 电影」的一贯风格,使用幽默解构与结构化叙事介绍了《流人》第一季故事情节,对于人物性格的捕捉和场景的描述尤为细致生动。可以这么说,再稍微润色下,加上几张剧照或者动图完全可以进行发布。



逻辑推理能力也是测评必不可少的。我们采用拍照搜题的形式,上传了一道图像推理题,夸克先是观察图形规律,继而进行分析、推理,最终选出了正确答案,整个过程既快又准。



此外,夸克还自建了医疗、教育、法律、财经等多个垂直知识库,通过结构化、标准化的专业数据训练,大幅增强了模型在专业领域的推理与专业理解能力。

比如我们拍一张老师作业批改记录的表格,输入提示词:提取一下表格。不到 10 秒,夸克对话助手就完成扫描、生成表格等一系列操作,即使是手写字体,它也能准确无误地识别,极大地提高了办公效率。



或者使用「打电话」功能,咨询一些医疗知识,比如腰疼怎么办?它能提供比较专业的回答并给出靠谱的解决方案。

总体来说,夸克这次算是最强模型和最强搜索的「双剑合璧」,与其他对话助手相比,夸克的回答更加严谨、有逻辑,内容风格也更接近于 ChatGPT。

技术解读

如今,市面上 AI 助手类产品层出不穷,虽然都宣称拥有智能对话、信息搜索等功能,但从本质上来说,AI 助手的核心竞争力仍然取决于其背后所依托的模型技术。不同的模型驱动了这些产品的智能化水平,而模型的先进性则直接决定了 AI 助手的实用性和用户体验。

作为新一代 AI 助手的代表,夸克对话助手背后的 Qwen 最新闭源模型无疑让它在众多竞争者中脱颖而出。尽管该款闭源模型仍保持神秘,但可以肯定的是,这款模型在多个维度上都展现出惊人的能力,并在全球都有绝对的领先性

因为还没有这款最新闭源模型的更多信息,我们就以 Qwen3-Max 为例做参考。Qwen3-Max 模型预训练数据量达 36T tokens,总参数超过万亿,不仅在数学推理、复杂指令理解、长文本处理和多语言能力方面表现优异,还在编程和 Agent 工具调用等领域有着卓越的表现。

具体来说,在大模型用 Coding 解决真实世界问题的 SWE-Bench Verified 测试中,Qwen3-Max-Instruct 版本斩获 69.6 分,位列全球第一梯队;在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,Instruct 版本更是实现了突破性表现,以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。不仅如此,Qwen3-Max-Thinking-Heavy 曾在 AIME25 和 HMMT 这两个数学评测榜单中拿下双满分,这可是国产大模型首次,直接证明了夸克 AI 助手领先的逻辑推理能力,让夸克能够在信息检索和任务处理过程中,快速且精准地理解用户意图,提供高质量的解答。



夸克对话助手的另一大优势则在于其技术架构上的创新。

众所周知,大模型有个最大的毛病,就是喜欢一本正经地胡说八道。为了提升答案的准确性和可信度,夸克采用了「模型 + 系统」的双轮驱动策略。基于阿里 Qwen 最新闭源模型,夸克自研了由实时信息检索、信源追溯和交叉验证组成的可信系统,以确保生成内容的来源可追溯、信息可验证,且支持用户进一步追问。

夸克算法团队与通义实验室还成立了专项联合研发小组,聚焦于「搜索推理」和「可信生成」两大核心领域,深度定制了一款更擅长搜索与信息甄别的专属模型,从根本上提升了生成内容的专业性与可靠性。

此外,夸克还自建了包括医疗、教育、法律、财经等在内的多个垂直领域的专业知识库,以此提升在特定领域的应用表现。这些知识库经过结构化、标准化处理,为夸克提供了丰富的行业知识,让它能够在健康咨询、学习辅导、法律解读、财经分析等核心场景中,能够提供更精准、更专业的解答。

结语

一直以来,阿里都秉持着「模型即应用」的战略。这个战略的核心,就是让 AI 从藏在幕后的技术工具,真正走到台前,成为用户可以直接感知、随时交互的应用本身。

夸克对话助手,正是这一战略的最佳注脚。它不是单纯在搜索引擎里加个对话框,而是用大模型重新定义了信息获取的方式,让搜索、问答、任务处理在同一个对话界面里无缝流转。用户不必在多个 App 之间反复切换,也无需纠结「这个问题该搜索还是该问 AI」,所有需求都在一次次对话中解决。

而这才是 AI 应用该有的样子。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
浙江一菜场3条鲫鱼卖450元!有人抢着要,只因是难得一见的“芝麻鲫”

浙江一菜场3条鲫鱼卖450元!有人抢着要,只因是难得一见的“芝麻鲫”

瓜哥的动物日记
2026-03-03 10:23:04
鲁比奥认错,希望中国解除反制!事到如今,他想陪特朗普一起访华

鲁比奥认错,希望中国解除反制!事到如今,他想陪特朗普一起访华

朝子亥
2026-03-03 12:40:03
史诗级封杀!2000万网红“听风的蚕”彻底凉了

史诗级封杀!2000万网红“听风的蚕”彻底凉了

互联网品牌官
2026-02-12 01:17:23
实际票房“0蛋”,背却号称“百亿票房先生”,真求求这6位别吹了

实际票房“0蛋”,背却号称“百亿票房先生”,真求求这6位别吹了

动物奇奇怪怪
2026-03-02 10:01:21
美国打仗最怕什么?张召忠:一旦发生这2种情况,美军必然战败

美国打仗最怕什么?张召忠:一旦发生这2种情况,美军必然战败

闻识
2026-03-02 07:35:39
卖国求荣!为讨美国欢心,不惜将总统送进大牢,如今结局大快人心

卖国求荣!为讨美国欢心,不惜将总统送进大牢,如今结局大快人心

顾史
2026-01-22 20:28:11
美国上将问:怎么做才能击败中国?马斯克的回答,令全场一片寂静

美国上将问:怎么做才能击败中国?马斯克的回答,令全场一片寂静

阿校谈史
2026-01-19 00:04:19
1岁娃心脏有个大洞,英国医生说没救了!结果网友众筹150万,硬给救活了!

1岁娃心脏有个大洞,英国医生说没救了!结果网友众筹150万,硬给救活了!

英国那些事儿
2026-02-27 23:25:51
官方:CCTV5将转播中国女足亚洲杯首战vs孟加拉国女足

官方:CCTV5将转播中国女足亚洲杯首战vs孟加拉国女足

懂球帝
2026-03-02 14:43:31
欧美“四巨头”设下死局,招招夺命!中国一雪前耻,甩出四张王炸!

欧美“四巨头”设下死局,招招夺命!中国一雪前耻,甩出四张王炸!

毛豆论道
2026-02-23 19:06:45
无人机母舰被美军击沉,伊朗海军损失惨重,影响远程作战装备投送

无人机母舰被美军击沉,伊朗海军损失惨重,影响远程作战装备投送

国平视野
2026-03-03 13:08:04
伊朗狂轰美国驻巴林空军基地,20架无人机+3枚导弹精准命中

伊朗狂轰美国驻巴林空军基地,20架无人机+3枚导弹精准命中

军武咖
2026-03-03 12:53:51
难怪俄军进攻磨磨蹭蹭,和乌军交手4年,坦克装甲车损失3万多?

难怪俄军进攻磨磨蹭蹭,和乌军交手4年,坦克装甲车损失3万多?

阿讯说天下
2026-03-03 12:41:51
韩国股市暴跌触发熔断

韩国股市暴跌触发熔断

第一财经资讯
2026-03-03 11:41:57
又有两国参战中东!战局变成了3打2,沙特背刺,把中国也骗了?

又有两国参战中东!战局变成了3打2,沙特背刺,把中国也骗了?

起喜电影
2026-03-03 11:41:04
伊朗导弹炸翻比亚迪,史上最硬核广告诞生了!

伊朗导弹炸翻比亚迪,史上最硬核广告诞生了!

互联网品牌官
2026-03-03 12:16:54
“冬萍一笑,生死难料”后续:前夫已重启人生,那燕冬萍呢?

“冬萍一笑,生死难料”后续:前夫已重启人生,那燕冬萍呢?

大鱼简科
2026-02-10 16:54:05
北大才子杨舒春,不顾父母跪求拒进外交部,痴迷种地,后来怎样了

北大才子杨舒春,不顾父母跪求拒进外交部,痴迷种地,后来怎样了

珺瑶婉史
2025-12-25 19:45:03
一天报销115辆坦克!塔利班举白旗求饶,巴铁:多亏了中国制造!

一天报销115辆坦克!塔利班举白旗求饶,巴铁:多亏了中国制造!

来科点谱
2026-03-02 10:58:53
和平已无望?马斯克预言大战时间,美政府已签字:提到台湾省8次

和平已无望?马斯克预言大战时间,美政府已签字:提到台湾省8次

兴史兴谈
2026-01-07 06:19:46
2026-03-03 13:43:00
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12397文章数 142576关注度
往期回顾 全部

科技要闻

手机AI在MWC上卷出了新高度

头条要闻

伊朗称摧毁美空军基地大楼:20架无人机和3枚导弹命中

头条要闻

伊朗称摧毁美空军基地大楼:20架无人机和3枚导弹命中

体育要闻

35轮后积分-7,他们遭遇史上最早的降级

娱乐要闻

谢娜霸气护夫:喊话薛之谦给张杰道歉

财经要闻

霍尔木兹海峡近乎停摆 布油直逼80美元

汽车要闻

长安汽车2月销量151922辆 环比逆势增长12.8%

态度原创

艺术
家居
亲子
手机
军事航空

艺术要闻

Nihad Aghazada:当代阿塞拜疆画家

家居要闻

万物互联 享科技福祉

亲子要闻

自闭症儿童空间方位分不清?别急!这样教so easy

手机要闻

荣耀Magic 9系列大屏产品或测试2亿像素主摄!

军事要闻

美国中央司令部透露对伊朗动武全部武器装备清单

无障碍浏览 进入关怀版