网易首页 > 网易号 > 正文 申请入驻

实测新版通义 APP:更好用的个人 AI 助理,需要什么?

0
分享至

革新 AI 终端的操作体验,不止靠模型能力。

作者|张勇毅
编辑|郑玄

正式并入阿里 AI To C 业务之后,通义有了新的动作。

最近,通义 App 全新升级——整合了上周刚刚开源的 QwQ-32B,并上线了人格化的智能体作为主产品要交互对象。

与 AI 大模型不同,「智能体」所强调的除了模型本身能力之外,多了目标导向的需求,通过感知环境、自主决策与执行动作,从而在真实环境中完成操作。

这次更新,可以说是通义 App 上线以来最重要的一次产品迭代。一方面,上周开源的 QwQ-32B,因为以更低的参数量实现了媲美 R1 的推理和通用能力,而被全球 AI 行业关注;另一方面,由于 Monica 团队推出的 Manus 一夜爆火,智能体也是近期行业关注的焦点,人们期待看到更多可以影响真实世界的 AI 应用诞生。

而过去两年,通义千问一直凭借着模型能力本身,通过 AI 模型生成视频等方式,多次在全球社交媒体上「出圈」,因此也有很多人期待通义 APP 的这次更新,能真正做到整合阿里在模型领域的竞争优势,在面向 C 端用户的 App 应用场景中打造爆款。

当然,路遥知马力,通义 App 这次能否在用户体验上带来惊喜,还是要试试才知道。

01

实测效果

如其名,QwQ-32B 是一款拥有 320 亿参数的大模型,但阿里通过基础模型 + 大规模强化学习的方式,在前代模型的基础上实现性能提升。

在此前开源版本的基准测试中就已经能看出,其数学推理、编程能力以及通用能力,已经可与具备 6710 亿参数的 DeepSeek-R1 媲美。

在保持强劲性能的同时,千问 QwQ-32B 还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。

本次更新之后,通义 App 首页就能看到千问 QwQ-32B 的应用,同时提供了多个能够体现深度思考能力的问题供用户体验

整合深度思考能力的通义 App,在面对如「若 A=5,B=3*A,C=B+2,求 C 的值」这样的数学逻辑问题,亦或是「分析《哪吒 2》三个关键角色的 MBTI 这样根据互联网内容」「把橙汁加进牛奶里」这样结合知识库的解答问题。

在实际的问题测试中,深度思考让通义 App 成功通过了数学题这样的基准测试理解,同时也展示出了针对现实物理现象的推导能力,同时相比于同期其他模型的回答,通义 App 更强调对结果的复核以及谨慎列出其他可能的特征。

比如在处理另一个容易误导 AI 的经典问题「为什么爸妈结婚没有叫我参加婚礼?」时,通义 App 成功识别到其中的逻辑漏洞,但仍然从「时间因素」以及「婚礼习俗」等角度,谨慎地为这个明显看起来很「抽象」的问题,绞尽脑汁地帮你从各种角度,想出了更多可能性。

不过上面也提到,QwQ-32B 模型本身的强大,并不是构成「超级智能体」的全部要素。随着大模型应用在端侧设备上的整合越来越深入,「不同任务不同模型」的这个逻辑概念也被越来越多人所熟知。

首先从模型能力上来说,通义 App 这个超级智能体是一个复合模型,比如问答、聊天等等调用的都是阿里不同的模型能力,例如代码、翻译、逻辑推理这些就是调用的通义千问的旗舰模型 Qwen2.5-MAX。

除了模型能力本身,本次通义 App 更新的另一个重点,则是聚焦在了 App 本身:这在近两年 AI 应用能力军备竞赛如火如荼的情况下,是一个很罕见的情况,但因此也更加值得关注。

新版通义 App 将主页设计分为了三部分,左滑右滑对应着不同的功能。首页左滑是历史记录,包括聊过的智能体、对话记录等,便于高效管理与资产沉淀。右滑则进入通义丰富的智能体生态,覆盖学习、工作、娱乐等多元场景。类似拍照讲题、思维导图这样新增的功能,在首页的输入栏上方就能找到。

在首页,通义 App 还增加了一个可爱的「邻家女孩」,作为此前以科研、代码能力专长的通义千问大模型产品中,从未出现过的 AI 陪伴形象,用户可以通过与她的对话,直接使用到 QwQ-32B 的全部能力。

除了新形象之外,在右滑之后进入到的界面中,你能找到各种对应具体应用场景的模型能力,例如「健康顾问」「AI 扩图」这样的重要但小到不会有人专为其开发 App 的场景。都被通义 App 整合到了这个「工具箱」中。用户还可以在这里根据自己的具体使用需求,创建属于自己的智能体:例如让模型模仿某个剧中的角色,或是利用模型能力,创建各种娱乐游戏。

除此之外,通义 App 就没有其他的主要交互方式了,所有内容被浓缩在这三大页面中,让已经习惯当代各种应用层层嵌套操作逻辑的我,甚至一时间都没有适应这种突如其来的简洁。

按照官方开发人员的介绍,未来通义 App 还会继续在 App 中塞入更多 AI 能力,但不会跳出这「三大页面」的框架。未来,通义 App 还能实现根据用户的问题,自动识别到应该调用哪个具体的智能体。

这个变化,有体验新版通义 App 后的网友感慨说,通义 App 让「最强 AI 飞入寻常百姓家」。

02

行业意义

在软件领域,「杀手级应用」(Killer App)是一个已经颇有年头的名词。按照通义 App 的说法,「杀手级应用」的定义是「一种具有颠覆性吸引力或功能」的 App。

按照这个定义,实际上 ChatGPT 之后,AI ToC 应用生态直到目前,都还没有产生真正的「杀手级应用」。

这一现象与 2025 年 AI Agent 的爆火背道而驰,AI Agent「代替你做一切」概念的出现,其实反而倒逼着大模型应用在体验上要做到「更好用」:不仅能聊,还要在类似帮用户规划行程、查找资料等相关场景中,体现出「超级入口」应有的智能。

「AI 即 APP」最大的挑战在于用户习惯的改变——毕竟,不是每个人都愿意为一个个 AI 单独下载一个又一个的 APP,甚至更习惯在已有的 APP 里顺手调用 AI。

对于通义 App 团队来讲,他们或许是让用户感受到「这个超级智能体啥都会干」;不仅能问能聊能写作,能生图能拍图能翻译这些基础需求,还能在此基础上,做到更多基于用户个人需求专属定制的智能化。

03

总结

「智能体」这一概念,从诞生一开始,就以追求目标导向为设计指标。

对于通义 App 来讲,无论是更强悍的基座模型,还是「可爱的邻家女孩」,都是在这个目标导向下所作出的努力,为了让 AI App 变得更智能,真正成为一个满足用户预期的超级入口。

一个让用户足够方便的 AI App,并不只是一个简单的提效工具,更将会成为我们的「数字世界代理人」。

随着模型能力的逐步提升,个人 AI 助理这个概念能做到的事,也在逐渐变得更多。

或许,随着 AI Agent 进化到极致,我们甚至将不再需要一个可以用于触控的 UI:无论是 AI 应用早期出现的 Rabbit R1,还是近期爆火的 Manus AI,这些 AI Agent 产品,实际上都是通向这个目标的不同阶段。通义 App 实际上也是在这个方向上,向着成为一个更好用的产品,又迈进了坚实的一步。

*头图来源:通义 APP

本文为极客公园原创文章,转载请联系极客君微信 geekparkGO

极客一问

你如何看待新版通义 APP

Sanctuary AI 新型触控感测器技术,机器人看不见也能拾起物体。

点赞关注极客公园视频号

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
洗米华大女儿硕士毕业,一家人拍毕业照,洗米嫂戴钻戒出镜

洗米华大女儿硕士毕业,一家人拍毕业照,洗米嫂戴钻戒出镜

素素娱乐
2026-01-23 11:07:53
强阵冲首冠!U23国足VS日本首发:向余望连场先发,拜合拉木替补

强阵冲首冠!U23国足VS日本首发:向余望连场先发,拜合拉木替补

我爱英超
2026-01-24 21:37:03
白宫发布特朗普与企鹅走向格陵兰岛AI图片!丹麦国防部称“北极耐力”军演将持续到2026年底

白宫发布特朗普与企鹅走向格陵兰岛AI图片!丹麦国防部称“北极耐力”军演将持续到2026年底

每日经济新闻
2026-01-24 13:18:06
童锦程不配合,孩子还没办出生证明,女方自曝美照后,舆论反转了

童锦程不配合,孩子还没办出生证明,女方自曝美照后,舆论反转了

非常先生看娱乐
2026-01-23 17:54:48
特朗普通告全球,不许减持美国国债;中方还剩6830亿,游戏已结束

特朗普通告全球,不许减持美国国债;中方还剩6830亿,游戏已结束

影孖看世界
2026-01-23 23:49:11
U23国足获得亚洲杯亚军,知名解说员黄健翔:球迷应该记住这支球队,别用胜负绑架他们的成长

U23国足获得亚洲杯亚军,知名解说员黄健翔:球迷应该记住这支球队,别用胜负绑架他们的成长

极目新闻
2026-01-25 01:26:36
《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

《人民日报》:70%的病跟情绪有关!很多人被亲人给慢性折磨死的

诗词中国
2026-01-23 18:47:36
善恶终有报!靠星光大道成名的“盲人”杨光,终要为自己荒唐买单

善恶终有报!靠星光大道成名的“盲人”杨光,终要为自己荒唐买单

小熊侃史
2026-01-23 11:01:14
“和平委员会”最终成员名单出来了,4国突然变卦反悔!

“和平委员会”最终成员名单出来了,4国突然变卦反悔!

爱吃醋的猫咪
2026-01-23 20:25:06
冯小刚养女徐朵晒家中日常,别墅宽敞却朴素,夫妻俩宠溺藏不住

冯小刚养女徐朵晒家中日常,别墅宽敞却朴素,夫妻俩宠溺藏不住

骄阳之夏明
2026-01-24 19:37:45
20岁浙江独生女泰国留学25天遭撕票!凶手是3名同胞,男友是主谋

20岁浙江独生女泰国留学25天遭撕票!凶手是3名同胞,男友是主谋

一盅情怀
2026-01-24 17:01:22
看不上?日本人毫不关心决赛:保持一副玩的态度 网站无相关报道

看不上?日本人毫不关心决赛:保持一副玩的态度 网站无相关报道

风过乡
2026-01-24 10:06:49
离开皇马是对的!9次过人帮助球队致胜,想去世界杯的他机会来了

离开皇马是对的!9次过人帮助球队致胜,想去世界杯的他机会来了

里芃芃体育
2026-01-24 03:00:03
后悔吗?被老头“白嫖”10年,还倒贴上亿,59岁不婚不育的李若彤

后悔吗?被老头“白嫖”10年,还倒贴上亿,59岁不婚不育的李若彤

TVB的四小花
2026-01-25 01:26:04
外媒:丹麦将因格陵兰问题向中国寻求歼-20!

外媒:丹麦将因格陵兰问题向中国寻求歼-20!

达文西看世界
2026-01-24 20:53:57
中国芯片英雄,被美国囚禁9年后终于回家!他反手把苹果告上法庭

中国芯片英雄,被美国囚禁9年后终于回家!他反手把苹果告上法庭

胖哥不胡说
2026-01-24 18:45:24
U23国足噩梦开局!6战首次丢球,李昊无能为力,彭啸太郁闷

U23国足噩梦开局!6战首次丢球,李昊无能为力,彭啸太郁闷

奥拜尔
2026-01-24 23:17:06
王钰栋失误致丢球!记者感慨:最好的球员之一,把球停出了几米远

王钰栋失误致丢球!记者感慨:最好的球员之一,把球停出了几米远

林子说事
2026-01-24 23:54:01
被雪豹咬伤女子已从急诊转至其他科室,目击者称“当事人没有去摸豹子”,专家:雪豹当时或在“应激”状态

被雪豹咬伤女子已从急诊转至其他科室,目击者称“当事人没有去摸豹子”,专家:雪豹当时或在“应激”状态

大风新闻
2026-01-24 20:38:09
中国移动:重磅合并重组启动!

中国移动:重磅合并重组启动!

环球通信
2026-01-24 11:48:01
2026-01-25 02:03:00
极客公园
极客公园
让最棒的创新成为头条
11739文章数 78749关注度
往期回顾 全部

科技要闻

黄仁勋现身上海菜市场

头条要闻

张又侠、刘振立被查 解放军报发布社论

头条要闻

张又侠、刘振立被查 解放军报发布社论

体育要闻

当家球星打替补,他们在故意摆烂?

娱乐要闻

回归还是顶流 凤凰传奇将现身马年春晚

财经要闻

“百年老字号”张小泉遭60亿债务压顶

汽车要闻

有增程和纯电版可选 日产NX8或于3-4月间上市

态度原创

数码
家居
时尚
游戏
艺术

数码要闻

UnifyDrive UC250/450 Pro家庭存储NAS发布,配置与价格曝光

家居要闻

在家度假 160平南洋混搭宅

冬天最佳“显瘦”公式:上短+下长

梦幻西游珍宝阁拿下新出第一化生神衣,毅力帝300万帮贡求超越?

艺术要闻

634米!世界第一高塔:东京晴空塔建设纪实

无障碍浏览 进入关怀版