网易首页 > 网易号 > 正文 申请入驻

比Qwen3-Max更Max?夸克抢先用上最新闭源模型

0
分享至

机器之心报道

编辑:杨文

最强搜索「牵手」最强模型,能碰撞出什么火花?

Qwen 最新闭源模型,让夸克先用上了。

10 月 23 日,一向不爱出风头的夸克上线了对话助手,可以让用户在一个 App 内即可完成信息查找、问题解答与任务处理,实现了 AI 搜索与对话的深度融合。



其中一大亮点就是,该对话助手采用了 Qwen 最新闭源模型。至于是哪个型号、性能有多强,夸克卖了个关子,只透露比 Qwen3-Max 更进一步,在业界有绝对领先性。

要知道,此前在云栖大会上惊艳亮相的 Qwen3-Max,一经发布就凭借超越 GPT-5 和 Claude Opus 4 的优异表现,跻身全球大模型前三甲。因此,我们有理由相信,夸克对话助手所采用的这款 Qwen 闭源模型,其性能将达到一个全新的高度。



得益于 Qwen 最新闭源模型的强推理、长文本理解能力,夸克对话助手能够快速、精准回答用户的提问,在处理复杂问题和多轮对话时表现更出色。

再加上夸克在搜索和工具领域的多年积累,以及自建的专业知识库,让该助手能够通过多链路实时检索,提供高质量、可溯源的信息,显著提高了回答的准确性和可信度,真正做到了「既聪明又可靠」。

目前,夸克对话助手已经全面上线,所有人只需下载最新夸克 APP 即可免费体验。

接下来,我们就来个深度评测,看看它在实际场景中的表现如何。

一手体验

先来看看它的王牌功能「AI 搜索」

平时我「召唤」夸克最多的场景就是找网盘资源,现在有了夸克对话助手,找资源更是省时省力。比如我们让它找英语专八真题的夸克网盘资源,它立马就贴出资源合集链接,点一下即可保存至夸克网盘。



这两天 AI 圈闹得最沸沸扬扬的大事,非 Meta AI 裁员莫属,汪滔大手一挥干掉了 600 个岗位,其中 FAIR、AI 产品以及基础设施团队成了妥妥的裁员重灾区。

我们索性就让夸克对话助手扒下这事的来龙去脉。输入提示词,点开「深度搜索」,夸克对话助手搜索了 197 篇资料,并从中筛选出符合要求的 38 个参考信源,包括网易、搜狐、新浪新闻等,机器之心也赫然在列。



它的回答虽然言简意赅,但基本涵盖了关键的新闻事实,且条分缕析逻辑清楚,从裁员范围、原因、补偿到同期重大动作,再到行业影响,它给扒了个底朝天。



再来测测它的理解能力

今年 6 月,莫言在广东惠州面对百年客家围屋碧滟楼有感而发,写下「从南阳到南洋根深叶茂」十字上联,并发出「向天下文友敬求下联」之邀。最近,该征集活动获奖名单揭晓,一 00 后女生凭「自井壁及井毕角亢星张」下联夺得一等奖。有网友称:没点传统文化知识还理解不了这个下联。

我们让夸克对话助手来解读下这副对联妙在哪。它抽丝剥茧分析得头头是道,不仅能理解上联中地理与历史的双线叙事,还能识别出下联中涉及的天文知识及典故,并由此延伸出这副对联所蕴含的天人合一的宇宙观。



至于写作能力,我们直接上传了一张图片,让它拿出所有本事,为此景写一首古诗。在这个过程中,夸克对话助手不仅要识别图像内容,还要从视觉信息中提炼出与之匹配的情感和意象,通过古诗的形式进行表达,而古诗又对文化和语言知识有着极高的要求,比如音韵和谐、对仗工整等。



我们还让它模仿「Sir 电影」公众号风格,为英剧《流人》第一季写一篇剧评。

夸克写的这篇剧评还是蛮符合「Sir 电影」的一贯风格,使用幽默解构与结构化叙事介绍了《流人》第一季故事情节,对于人物性格的捕捉和场景的描述尤为细致生动。可以这么说,再稍微润色下,加上几张剧照或者动图完全可以进行发布。



逻辑推理能力也是测评必不可少的。我们采用拍照搜题的形式,上传了一道图像推理题,夸克先是观察图形规律,继而进行分析、推理,最终选出了正确答案,整个过程既快又准。



此外,夸克还自建了医疗、教育、法律、财经等多个垂直知识库,通过结构化、标准化的专业数据训练,大幅增强了模型在专业领域的推理与专业理解能力。

比如我们拍一张老师作业批改记录的表格,输入提示词:提取一下表格。不到 10 秒,夸克对话助手就完成扫描、生成表格等一系列操作,即使是手写字体,它也能准确无误地识别,极大地提高了办公效率。



或者使用「打电话」功能,咨询一些医疗知识,比如腰疼怎么办?它能提供比较专业的回答并给出靠谱的解决方案。

总体来说,夸克这次算是最强模型和最强搜索的「双剑合璧」,与其他对话助手相比,夸克的回答更加严谨、有逻辑,内容风格也更接近于 ChatGPT。

技术解读

如今,市面上 AI 助手类产品层出不穷,虽然都宣称拥有智能对话、信息搜索等功能,但从本质上来说,AI 助手的核心竞争力仍然取决于其背后所依托的模型技术。不同的模型驱动了这些产品的智能化水平,而模型的先进性则直接决定了 AI 助手的实用性和用户体验。

作为新一代 AI 助手的代表,夸克对话助手背后的 Qwen 最新闭源模型无疑让它在众多竞争者中脱颖而出。尽管该款闭源模型仍保持神秘,但可以肯定的是,这款模型在多个维度上都展现出惊人的能力,并在全球都有绝对的领先性

因为还没有这款最新闭源模型的更多信息,我们就以 Qwen3-Max 为例做参考。Qwen3-Max 模型预训练数据量达 36T tokens,总参数超过万亿,不仅在数学推理、复杂指令理解、长文本处理和多语言能力方面表现优异,还在编程和 Agent 工具调用等领域有着卓越的表现。

具体来说,在大模型用 Coding 解决真实世界问题的 SWE-Bench Verified 测试中,Qwen3-Max-Instruct 版本斩获 69.6 分,位列全球第一梯队;在评估智能体工具调用能力的严苛基准 Tau2-Bench 上,Instruct 版本更是实现了突破性表现,以 74.8 分超越 Claude Opus 4 与 DeepSeek-V3.1。不仅如此,Qwen3-Max-Thinking-Heavy 曾在 AIME25 和 HMMT 这两个数学评测榜单中拿下双满分,这可是国产大模型首次,直接证明了夸克 AI 助手领先的逻辑推理能力,让夸克能够在信息检索和任务处理过程中,快速且精准地理解用户意图,提供高质量的解答。



夸克对话助手的另一大优势则在于其技术架构上的创新。

众所周知,大模型有个最大的毛病,就是喜欢一本正经地胡说八道。为了提升答案的准确性和可信度,夸克采用了「模型 + 系统」的双轮驱动策略。基于阿里 Qwen 最新闭源模型,夸克自研了由实时信息检索、信源追溯和交叉验证组成的可信系统,以确保生成内容的来源可追溯、信息可验证,且支持用户进一步追问。

夸克算法团队与通义实验室还成立了专项联合研发小组,聚焦于「搜索推理」和「可信生成」两大核心领域,深度定制了一款更擅长搜索与信息甄别的专属模型,从根本上提升了生成内容的专业性与可靠性。

此外,夸克还自建了包括医疗、教育、法律、财经等在内的多个垂直领域的专业知识库,以此提升在特定领域的应用表现。这些知识库经过结构化、标准化处理,为夸克提供了丰富的行业知识,让它能够在健康咨询、学习辅导、法律解读、财经分析等核心场景中,能够提供更精准、更专业的解答。

结语

一直以来,阿里都秉持着「模型即应用」的战略。这个战略的核心,就是让 AI 从藏在幕后的技术工具,真正走到台前,成为用户可以直接感知、随时交互的应用本身。

夸克对话助手,正是这一战略的最佳注脚。它不是单纯在搜索引擎里加个对话框,而是用大模型重新定义了信息获取的方式,让搜索、问答、任务处理在同一个对话界面里无缝流转。用户不必在多个 App 之间反复切换,也无需纠结「这个问题该搜索还是该问 AI」,所有需求都在一次次对话中解决。

而这才是 AI 应用该有的样子。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
恕我直言,幸亏梅西离开巴萨了,要不然亚马尔非得给梅西上一课!

恕我直言,幸亏梅西离开巴萨了,要不然亚马尔非得给梅西上一课!

田先生篮球
2025-10-27 18:20:45
陈芋汐失利!中国跳水新星遭冷遇!全红婵与陈芋汐命运何去何从

陈芋汐失利!中国跳水新星遭冷遇!全红婵与陈芋汐命运何去何从

小毅说事
2025-08-07 20:32:59
“死对头”终于倒了!特朗普高兴坏了,“矛头”对准下一个目标

“死对头”终于倒了!特朗普高兴坏了,“矛头”对准下一个目标

花花娱界
2025-11-02 17:55:34
新疆维吾尔自治区党委常委会召开会议 坚决拥护党中央对金之镇涉嫌严重违纪违法进行纪律审查和监察调查的决定

新疆维吾尔自治区党委常委会召开会议 坚决拥护党中央对金之镇涉嫌严重违纪违法进行纪律审查和监察调查的决定

环球网资讯
2025-11-02 13:34:52
这才是瓦格纳兵变失败的原因?普京早留了一手,俄军最大赢家浮现

这才是瓦格纳兵变失败的原因?普京早留了一手,俄军最大赢家浮现

青途历史
2025-10-16 20:09:37
总统府被包围!乌克兰人终于醒悟了:最大敌人并不是俄罗斯?

总统府被包围!乌克兰人终于醒悟了:最大敌人并不是俄罗斯?

花花娱界
2025-11-02 17:45:52
中国航母震撼全球!第五艘开始实现真正超越,美国优势不再?

中国航母震撼全球!第五艘开始实现真正超越,美国优势不再?

科学知识点秀
2025-10-23 08:00:03
据说12月1日起,中国正式升级对荷兰的稀土出口管控…

据说12月1日起,中国正式升级对荷兰的稀土出口管控…

福建平子
2025-11-02 16:53:33
16年八达岭野生动物园私自下车,被老虎撕咬的赵菁,后来咋样了?

16年八达岭野生动物园私自下车,被老虎撕咬的赵菁,后来咋样了?

青途历史
2025-10-06 17:01:45
黄仁勋在韩国的两天,都留给了一家炸鸡店

黄仁勋在韩国的两天,都留给了一家炸鸡店

小鬼头体育
2025-11-01 12:16:23
海牛1-0,赢球不可怕,可怕的是李霄鹏赛后一席话,尽显高情商

海牛1-0,赢球不可怕,可怕的是李霄鹏赛后一席话,尽显高情商

范櫳舍长
2025-11-02 20:20:16
64岁费翔英国被偶遇!戴着墨镜特时髦,颠覆了对中年男人的印象

64岁费翔英国被偶遇!戴着墨镜特时髦,颠覆了对中年男人的印象

娱圈小愚
2025-10-29 09:59:20
2-0 神锋头槌破门 连续6场零封 13.1亿豪门9连胜强势领跑一骑绝尘

2-0 神锋头槌破门 连续6场零封 13.1亿豪门9连胜强势领跑一骑绝尘

狍子歪解体坛
2025-11-02 01:02:12
酒红色长袖配黑色瑜伽裤,显瘦显高级还炸街,日常出街美到犯规

酒红色长袖配黑色瑜伽裤,显瘦显高级还炸街,日常出街美到犯规

小乔古装汉服
2025-11-01 22:12:23
马卡:维尼修斯抢走姆巴佩点球又造丑陋一幕,阿隆索本应干预

马卡:维尼修斯抢走姆巴佩点球又造丑陋一幕,阿隆索本应干预

雷速体育
2025-11-02 11:45:16
彻底傻眼了,不仅广西,全国都束手无策!

彻底傻眼了,不仅广西,全国都束手无策!

另子维爱读史
2025-10-19 11:44:19
又4个大瓜!王晶爆料舒淇、大导演暴雷、向太谈统一,风波不断

又4个大瓜!王晶爆料舒淇、大导演暴雷、向太谈统一,风波不断

温读史
2025-11-01 19:22:17
场均3分4助,效率联盟垫底!哈登和快船要失算,你确实该退役了

场均3分4助,效率联盟垫底!哈登和快船要失算,你确实该退役了

老梁体育漫谈
2025-11-03 00:50:02
意甲神剧情:乌龙球绝杀,第93分钟破门,国米缔造奇迹

意甲神剧情:乌龙球绝杀,第93分钟破门,国米缔造奇迹

足球狗说
2025-11-02 21:32:15
上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

上海专家发现:吃甜食的老人,健康指数是吃蔬菜的人的8倍不止?

霹雳炮
2025-10-17 21:31:29
2025-11-03 02:48:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
11617文章数 142497关注度
往期回顾 全部

科技要闻

10月零跑突破7万辆,小鹏、蔚来超4万辆

头条要闻

马来西亚首富之子买上海大平层 449平米1.17亿元

头条要闻

马来西亚首富之子买上海大平层 449平米1.17亿元

体育要闻

这个日本人,凭啥值3.25亿美元?

娱乐要闻

陈道明被王家卫说他是阴阳同体的极品

财经要闻

段永平捐了1500万元茅台股票!本人回应

汽车要闻

神龙汽车推出“发动机终身质保”政策

态度原创

旅游
数码
手机
艺术
军事航空

旅游要闻

这道金黄的绝美秋景里藏着古韵京华

数码要闻

麒麟9030处理器突然曝光:1+4+4六核狂飙,可惜工艺不详!

手机要闻

华为Mate80风扇版确认:五款机型同台竞技,18号见!

艺术要闻

陈丹青 无论画风与文风,都具有一种优雅而朴素,睿智而率真的气质

军事要闻

俄在日本海演习击沉假想敌潜艇

无障碍浏览 进入关怀版