网易首页 > 网易号 > 正文 申请入驻

实测腾讯Marvis,我们距离成为“钢铁侠”还有多远?

0
分享至


参考图片来自腾讯产品Marvis

©有界UnKnown原创

作者丨钱江

编辑|山茶

最近,腾讯又推出了一款新的AI产品——Marvis,并在行业里引起大范围的讨论。

Marvis,听这个名字,就知道这是在致敬Jarvis——这个人是钢铁侠的亲密助理,也是人工智能领域最经典的荧幕形象。

对钢铁侠或者漫威有过了解的朋友肯定都知道,Jarvis是一个多么强大的AI助理。

它会在钢铁侠实验着火的时候主动拿来灭火器灭火(日常应变);能够在钢铁侠仅仅给出一个指引的情况下,自动测算出用虫洞穿越时间的方法(科研能力),以及在钢铁侠遇到危险、性命垂危的时候,主动帮钢铁侠拨通爱人的电话(情感陪伴)......

它是一个真正的全能助理,从生活到工作;它也真正理解并懂得主人的需求,并在适当的时候主动帮助主人做出选择。

可以说,没有人会在了解Jarvis之后,不想拥有一个Jarvis;因此这个形象也成为人工智能助理最完美的预设。

所以,腾讯给自己的AI产品取这么一个名字,其想法其实已经昭然若揭——想要打造类似Jarvis一样,全能的、真正如人类助理一样角色的AI产品。

这个想法肯定是好的,但,腾讯这个目标能实现吗?或者说,腾讯实现这个目标的第一步,走稳了吗?


Marvis,刻意经营的“活人”形象

为了了解实际情况,我们全程体验了Marvis这款产品。

可能是为了让Marvis与Jarvis更接近,反正从进入Marvis的产品页面,到真正将其安装到电脑上,这个过程中的每一步,都有腾讯刻意营造的,一种扑面而来的“活人感”。

首先是Marvis的形象,一匹带着红围脖的年、腾讯马化腾,以及现在无数打工人都自称“牛马”,这种设定一开始就在想拉近与用户的距离。

其次,在Marvis初始界面,Marvis一边给自己补充Token,一边办理“入职手续”。

这个画面也很“腾讯”。因为现实中,腾讯员工完成入职时,也会进入一套名为“红围脖”的服务平台。所谓“戴上红围脖,成为鹅厂人”,到了Marvis这里,也有了类似的入职仪式。


但Marvis的“活人感”不只来自这匹小马,还来自它为Agent搭出的整套办公室。

在这个虚拟办公区里,“老板”Marvis坐在前排,后面是五个组员:App Agent、File Agent、Computer Agent、Browser Agent和Search Agent。

它们各自负责不同任务,但呈现出来的不是功能模块,而是一群正在上班的“同事”,它们有人去茶水间吃零食,有人去健身房活动,有人能在厕所里蹲着刷手机、自由抽纸。

偶尔,它们还能互相窜工位,看“同事”打王者荣耀,顺便交流几句,整个办公室明亮、整洁,员工穿得整齐体面,像是一个真正的企业环境。


从外部的视角来看,这像是产品经理将腾讯的企业文化和办公日常搬到了线上,Marvis这匹小马,就像是一位真正的腾讯员工一样。

但我们和腾讯的朋友讨论,他们却说,这显然不是真正的腾讯,因为真正的打工人没有这么松弛。

他们开玩笑地讲,这或许是腾讯老板眼中的腾讯,也或许,是一些腾讯打工人心中理想的腾讯。

但玩笑归玩笑,无论产品宣传的氛围多么有“活人感”,Agent产品最终还是要回到一个最朴素的问题:它到底能不能把活儿干好。


给Marvis做个上岗测试

那么,Marvis的实际能力如何呢?

在正式使用之前,我们看了许多宣传,基于其系统级AI助手的定位,我们对Marvis的能力有着很高的预期。

因此我们的第一个任务是:让其调用电脑端已经存储好的图片,然后用PS完成公众号文章封面的制作。

我们设定了一个提示词:

帮我打开已提供的 PSD 文件,将其中的底图图层替换为我提供的新图片,保持原 PSD 的画布尺寸、图层结构、文字、特效与排版不变。替换后,检查图片位置、比例与裁切是否正确,避免变形或错位。最后导出高质量 JPG 文件,并保存到电脑【下载】文件夹。

我们期待的结果是这样的,这是我们日常使用的封面:


而Marvis实际给到的结果是这样的:


按理来说,作为系统级的AI助理,Marvis应该用Computer Agent直接打开PSD文件,用我给它的图片替换掉原来的图片,并重新导出一个图片。

但在实际执行过程中,Marvis选择的却是File Agent,并且运行了很久。

为此,我还特意和Marvis确认了一下,但它坚持应该使用File Agent,而实际输出的结果,却始终不尽如人意。


如果说PSD测试考验的是本地软件调用能力,那么接下来的测试,就看它能不能在网页环境里完成一组连续操作。

我尝试要求搜索并打开SpaceX的招股书,重点提炼其股权结构、收入结构、核心业务占比,以及近年营收、利润和主要增长业务。

Marvis派出了Browser Agent联网搜索,交付了一份表格,列出每一项,但仔细看,出现了一个很离谱的错误,本地表格中的关键数据都被抹去了一个“开头”:


比如Space X在2025年的全年营收是187亿美金,而Excel表格写成“87亿”美金。

Marvis算是基本完成了任务,但是交付的结果却存在重大问题…

但在这个过程中,我其实也在反思,是不是我提出的要求本身就超出了这个产品的能力?

所以在后续的测试中,我不再从“我想让它做什么”的角度出发,而是从“它能做什么”的角度出发。

从Marvis给出的引导功能来看,它默认强调的操作系统级能力,主要集中在三个方向。

第一类是电脑设置和系统检查,比如检查电池健康状况、查看电脑中App的状态、提醒哪些软件可能需要更新。


第二类是本地文档和图库的归类处理。比如,它可以尝试识别电脑里的文件类型,把资料按照用途重新整理。但这部分体验里也会出现一些“谜之操作”,例如把一些大摩的研究报告归类成“简历”。


第三类是定时处理一些标准化任务。比如,设置每天17:00自动查看GitHub当日热门项目,或者订阅《哈哈哈哈哈6》的更新提醒。这类任务本质上更像“提醒 + 固定流程”,路径清楚、动作明确,比较适合交给Agent执行。

那么,在这个范畴内,Marvis的完成度如何?

先试试系统设定好的【记不住Mac快捷键】任务,点击后,数秒钟就完成了任务,并生成了速查图片:


系统设定好的任务欠缺挑战性,那么,在这个范畴内新建的任务呢?

我让Marvis帮我检查电脑上已安装的办公类 App,找出哪些还没有更新到最新版本,并试着让它帮我完成一部分App更新。

我给出提示词:

请检查我电脑上已安装的办公类 App,找出哪些还没有更新到最新版本。重点包括 Office、WPS、飞书、钉钉、企业微信、腾讯会议、Zoom、Notion、Obsidian、Adobe Acrobat、OneDrive、Google Drive、Dropbox 等办公、协作、文档和效率类软件。请只检查版本,不要自动更新、卸载或修改设置。最后用表格列出 App 名称、当前版本、最新版本、是否需要更新、检查渠道和备注;无法确认的请标注“待人工确认”。

很快,Marvis给出了一份诊断报告:


它提示了我6月12日之前需要更新ChatGPT,于是我要求Marvis帮我下载,但结果不如人意,Marvis几乎没有任何浏览器的调用权。

在多番尝试失败后,给了我一份手动下载建议:


从这几个任务来看,Marvis的能力需要分两个维度来看:

一方面是在系统设定的固定任务中,Marvis的完成度较高;但另一方面,一旦任务进入开放环境,它的表现就差强人意。

也可以理解为,Marvis和市场上的龙虾产品本质差不多,需要结合一些skill或workflow封装流程,来完成任务。

从我们的结果来看,Marvis给我们带来的问题是,一开始的宣传拔高了我们的预期,而实际能力又无法兑现宣传的结果,因此让我们在测试的过程中有了一个明显的心理落差。

但除此之外,即便抛开这种心理落差,Marvis能够给用户提供的价值其实也十分基础,甚至有些鸡肋:

比如文档检索、资料整理,现在市面上有非常多的资料管理和检索工具,效率和结果都要比Marvis好很多;再比如任务拆解和内容生成就更不用提了,都不需要拿国际上的其他产品做对比,仅仅是腾讯自家的Workbuddy,其完成度就要比Marvis高很多。

Marvis和市场上同类龙虾产品的不同之处,更多在于它把这项能力单独拎出来,包装成了一个更明确的产品卖点,但实际体验还没有证明它比别人干得更好。

所以,体验到这里,我其实有个疑问,腾讯起这么一个高调,但给出这样一个产品,Marvis的意义又是什么呢?


Marvis,产品化的OpenClaw?

从宣传口径上,Marvis是操作系统层级AI助手,这意味着它可以根据指令,直接操作用户的电脑,帮助用户完成一些工作。

怎么样,这个形容是不是听起来很耳熟?没错,之前风靡全网的OpenClaw(龙虾)也是这么宣传的。

事实上,从产品层面目标的角度来讲,Marvis和龙虾是一致的,所以他们的很多能力/功能也非常相似,比如都可以直接操作用户电脑,都可以直接帮助用户完成一些工作等等。

它们的差异点在于,OpenClaw是一种框架,它把更多的选择权和控制权都交给了用户,比如需要用户自己部署Gateway,连接各种聊天通道,再配置模型、工具、插件和权限。

而Marvis则更像是一个完全产品化的龙虾,真正的开箱即用。

比如,Marvis弱化了模型的概念。

界面里看不到模型选项,用户也不用在GPT、Claude、通义千问、MiniMax之间来回切换。它更像是默认替你选好了底座,大概率是腾讯自家的混元大模型。相比之下,很多龙虾产品会把模型选择放在前台,甚至把“支持多少模型”本身当成卖点。


比如,Marvis做了一个skill合集社区,但和龙虾产品一板一眼的skill列表式呈现不同,Marvis界面就像小红书笔记一样。标题要足够抓人,封面要足够夸张,每个skill都被包装成一个看起来很有用、很适合收藏的“经验帖”。

每个skill下方还会标注来源,看上去像是一个允许用户上传、分享skill的UGC社区。但目前在Marvis里,并没有看到上传skill的入口。所以这些skill更可能还处在官方筛选或定向邀请阶段,也就是说,它看起来像社区,但暂时还不是一个真正开放的社区。


总的来说,使用Marvis,用户不需要知道什么是Agent、Gateway、Plugin、API Key,只要像微信一样下载,安装,然后就可以给Marvis下达指令,比如:根据电脑中的论文资料,帮我拟定一个开题报告。

所以,Marvis目前最核心的价值,或许是先把“AI模拟真人操作电脑系统”这个概念做成了一个可体验的产品。

它让用户看到了一种方向:未来的AI助手不只是在聊天框里回答问题,而是可以进入电脑、理解资料、执行任务。但就当前体验来说,它更像是把这个方向先占住了,而真正的能力突破,还没有完全发生。


Marvis为什么没变成“Jarvis”?

最后,我们来反思一下Marvis的体验过程。

说实话,上手之前,Marvis “操作系统级”的宣传确实抬高了我们的预期。

在还没使用之前,我和朋友讨论时都觉得,这才是Agent产品真正应该做的方向,把OpenClaw没有做好的工作做好,封装成产品,降低用户使用门槛,让AI不只是聊天、调用工具或执行封装流程,而是能真正进入电脑环境,替人打开软件、处理文件、操作网页,像真人一样连续完成任务。

也正因为如此,我们期待的不是又一个AI助手,而是它能在“模拟人类操作电脑”这件事上,比市场上现有产品更进一步。

但实际体验下来,期待越高,落差也越明显。

当然,这不只是Marvis的问题。它遇到的难点,也是整个Agent市场正在攻克的方向:如何让AI不只是会回答、会调用工具,而是真的能在真实操作环境里把活儿干好。

第一个难点,是应用权限。

Marvis能当电脑的“二房东”,前提是用户把本地权限交给了它,所以它可以管理本地文件、检查系统状态、整理桌面资料。

但今天很多资料并不在本地,而是在微信、印象笔记、飞书、腾讯文档、网盘和邮箱里。真正有用的Agent,应该能进入这些日常应用,把分散的信息找出来、读进去、再整理出来。

现实是,微信不在Marvis的权限列表里。


印象笔记也不在可操作范围内。


但有意思的是,Marvis有一种契而不舍的“牛马精神”,它虽然没有权限接入App,但它给了我一个“小相机”,让我把相关页面拍给它看,再继续识别和处理。


这很像两点之间本来直线最短,但中间每个路口都有人收费,于是只能不断绕路。最后事情也许能做成,但效率和体验都打了折扣。

Agent要真正好用,本质上要把用户常用应用都做成tools接进去。但问题是,接口掌握在各个平台手里。微信未必开放,印象笔记未必开放,淘宝、支付宝更不可能轻易开放。各大平台更愿意自己做生态,而不是把入口交出去。

第二个难点,是技术本身。

Agent在电脑里操作,和人形机器人进家庭干家务很像:标准化环境里能做,泛化环境里就会遇到无数卡点。

电脑界面本身不是结构化数据。人看屏幕时,天然知道哪里是按钮、哪里是输入框、哪个弹窗必须处理、哪个文件像论文;但AI看到的首先只是截图。它必须先把截图理解成可操作的界面结构,再判断下一步点哪里、输什么、打开哪个文件。

所以,单次点击成功不难,难的是连续几十步都不出错。搜索文件、筛选日期、判断主题、复制资料、阅读内容、生成文档、保存到桌面,任何一步出错,后面都会累积偏差。

Marvis提出了一个很美好的未来:AI进入电脑,成为用户和操作系统之间的新中介。但要真正变成电脑里的“Jarvis”,还要跨过应用权限、生态接口和长任务稳定性这几道坎。


结语

AI时代,腾讯一直被寄予更高的期待。

马化腾在2023年5月的股东大会上称:“对于工业革命级的机遇来讲,早一个月还是晚一个月把电灯泡拿出来,在长的时间跨度上来看,是不那么重要的。”

到了2026年5月的股东大会,马化腾再次回应外界关于腾讯AI“落后”的说法:“原来一年前我们以为上了船,后来发现那个船漏水了,现在感觉站上去了,还坐不下去,还是希望船速能快一点。”

他同时提到:“公司曾盲目跟风涉足非优势领域,跟风布局各类热门赛道,最终大多以失利告终。面对本轮人工智能发展浪潮,我们时刻保持理性清醒,坚决规避过往发展误区。”

从这几次发言来看,腾讯对AI的态度一直以“稳”为主:不急着抢第一时间的声量,而是希望AI成为业务的“增倍器”,结合具体场景解决问题。

但进入2026年,腾讯在AI C端上的动作明显变得频繁:2月春节期间,“元宝”上线AI社交;3月推出“龙虾阵”,微信开放ClawBot接口;4月上线AI影游产品探梦DreamNow;5月上线Marvis。

所以,面对AI,腾讯并不是不焦虑。它只是把焦虑包装得更克制。

这种焦虑并不难理解。现实情况是,整个AI行业都在面对同一个问题:产品越来越多,入口越来越多,但真正能够改变用户习惯的杀手级应用,还没有完全出现。就像Marvis产品经理直言,“坦白说,我们当下真没有杀手锏”。

这句话也解释了Marvis的位置。它并不是腾讯已经找到答案之后推出的产品,而更像是在答案尚未清晰之前,先把一个可能的方向推到用户面前:让AI从聊天框里走出来,进入电脑,接管文件、应用和任务。

* 文中配图来源于网络

欢迎添加微信:cyxx-z

加入「有界UnKnown」科技交流群


特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
菲律宾专家:如果中国真咄咄逼人,为什么我们能在仁爱礁待24年!

菲律宾专家:如果中国真咄咄逼人,为什么我们能在仁爱礁待24年!

田园小归
2026-06-01 09:29:48
谷爱凌把米兰冬奥会全部奖金796万自己4万,一共800万全部捐出去

谷爱凌把米兰冬奥会全部奖金796万自己4万,一共800万全部捐出去

离离言几许
2026-03-09 22:43:32
今年秋季登场 全新三菱帕杰罗预告图发布

今年秋季登场 全新三菱帕杰罗预告图发布

车质网
2026-06-01 09:18:08
人间恶魔!32岁男子伪装成15岁,骗11岁女孩开房!施暴致其染性病

人间恶魔!32岁男子伪装成15岁,骗11岁女孩开房!施暴致其染性病

川渝视觉
2026-05-30 22:40:22
“你的教资不想要了?”男老师抱着学生拍视频,网友都看不下去了

“你的教资不想要了?”男老师抱着学生拍视频,网友都看不下去了

妍妍教育日记
2026-05-31 09:25:07
新华社下场,耿同学又抛出4条大鱼!

新华社下场,耿同学又抛出4条大鱼!

仕道
2026-05-30 09:52:28
杨鸣再爆金句!33分屠杀 广厦充足季后赛经验 却一文不值?

杨鸣再爆金句!33分屠杀 广厦充足季后赛经验 却一文不值?

你看球呢
2026-06-01 10:36:49
日韩股市续创新高 韩国综合指数涨近1.5%

日韩股市续创新高 韩国综合指数涨近1.5%

每日经济新闻
2026-06-01 08:25:12
人口告别世界第一?催生“二孩”无效后,国家终于向住房出手了!

人口告别世界第一?催生“二孩”无效后,国家终于向住房出手了!

混沌录
2026-05-30 23:41:14
震撼!超150万人参加阿森纳夺冠游行 赖斯高歌:定位球又来了哈哈

震撼!超150万人参加阿森纳夺冠游行 赖斯高歌:定位球又来了哈哈

风过乡
2026-06-01 06:07:36
《主角》还没收官就停播?疑似有3个原因,都在说明它是一个好剧

《主角》还没收官就停播?疑似有3个原因,都在说明它是一个好剧

可乐谈情感
2026-06-01 06:21:07
虎父无犬子!曼联名宿19岁爱子压哨入选世界杯名单

虎父无犬子!曼联名宿19岁爱子压哨入选世界杯名单

仰卧撑FTUer
2026-05-31 18:57:03
人类灭绝已成定局?科学家算出人类灭绝日期,我们还能幸存多久?

人类灭绝已成定局?科学家算出人类灭绝日期,我们还能幸存多久?

蜉蝣说
2026-05-28 19:49:46
理想高管:目前没见到过任何一台SUV 滤震舒适性超过全新L9 Ultra

理想高管:目前没见到过任何一台SUV 滤震舒适性超过全新L9 Ultra

快科技
2026-05-31 13:58:07
医生:只要低密度脂蛋白没这个数,高血脂并发症风险就不用太焦虑

医生:只要低密度脂蛋白没这个数,高血脂并发症风险就不用太焦虑

健康科普365
2026-05-31 13:05:09
又美又能打:2-0,世界第8完胜泰希曼,安德列娃昂首挺进法网女单8强

又美又能打:2-0,世界第8完胜泰希曼,安德列娃昂首挺进法网女单8强

凌空倒钩
2026-06-01 01:01:47
美国选手跑出9秒89打破白人男子百米世界纪录

美国选手跑出9秒89打破白人男子百米世界纪录

林子说事
2026-05-31 12:37:41
1-0爆冷!天津津门虎掀翻中超第3名,于根伟把4队拖入保级军团

1-0爆冷!天津津门虎掀翻中超第3名,于根伟把4队拖入保级军团

何老师呀
2026-05-31 21:04:48
对越反击战走出的五位传奇上将

对越反击战走出的五位传奇上将

祁州校尉
2026-05-31 13:00:17
1949年,渡江战役若晚20天开战,中国可能被推入分裂深渊

1949年,渡江战役若晚20天开战,中国可能被推入分裂深渊

鹤羽说个事
2026-05-29 22:59:33
2026-06-01 11:31:00
有界UnKnown incentive-icons
有界UnKnown
记录时代发展,讲好产业故事。
110文章数 33关注度
往期回顾 全部

科技要闻

关停三年后,天涯社区今起开放访问

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

头条要闻

牛弹琴:巴黎又乱了火光冲天 马克龙都看得目瞪口呆

体育要闻

哭过之后,文班亚马想给波波维奇打电话

娱乐要闻

张凌赫活动商场玻璃被挤爆5人受伤

财经要闻

网红驱蚊产品,标注化妆品竟含农药成分

汽车要闻

卖车卖到手软 MG4 5月销量突破15000台

态度原创

教育
时尚
数码
手机
公开课

教育要闻

定了!2026山东高考模拟志愿填报安排发布!

女人不管多大年纪,夏天都要准备一条白色阔腿裤,百搭又清爽

数码要闻

基普乔格代言:华为WatchGT Runner 2赛道传奇款开售,2588元

手机要闻

古尔曼重申苹果iOS 27聚焦于小修小补,明年iOS 28将更有看点

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版