![]()
作者|懒人
编辑|张洁
第一次打开Marvis的时候,我先盯着它的界面看了半天。
不是有多爱研究UI,主要是它太像我在上班了。
6个Agent坐在一间办公室里,有人坐在电脑前认真干活,有人在“带薪拉屎”,还安排了健身房和咖啡角。这不就是“牛马”的日常吗?
![]()
我当时心里只有一个想法:
好家伙,AI都有工位了。
这可能也是Marvis最容易被记住的地方。什么“操作系统级AI助手”、“多Agent协作”,听起来都很大。真正戳中打工人的,反而是它把Agent画成了一群电子牛马。
Marvis是腾讯应用宝团队在5月20日正式开放下载的,定位是一个“操作系统级AI助手”。里面预置了6个Agent,Marvis负责统筹任务,Computer Agent负责操作电脑,File Agent负责处理文件,Browser Agent负责浏览器任务,App Agent负责应用,Search Agent负责网页搜索。
刚上线,迅速引起了关注。因为它有一个其他Agent不具备的大招——总结微信群聊。
不是那种选中很多条聊天记录转发给它,它来总结。你直接对Marvis说,“帮我总结‘群聊名称’最近的消息”,它就可以自动读取并总结给你。
![]()
截图来自公众号“AI产品分析”
对于加了很多群、没时间爬楼但又不想错过消息的牛马来说,这功能简直是救星。
当然,想必腾讯推出Marvis也不是为了让它总结一下群聊这么简单。这里提到“大招”,是因为AI总结群聊这个需求呼声一直很高,但市面上几乎没有Agent能真正做到。
尤其是这个功能发生在微信。微信作为国民级应用,一举一动都备受关注。AI会与微信生态内的原子化组件碰撞产生什么样的化学反应,也是很多从业者关心的话题。
此前5月13日,腾讯曾官宣打通元宝和微信,让元宝可以一键总结微信群聊,但实际操作上,用户仍然需要先进入群聊,勾选要总结的消息,再整体转发给元宝。
所以,如果Marvis能在这个基础上更进一步,让用户只需要直接说“帮我总结某个群最近的消息”,它就能自动完成读取和整理,这确实会让人期待。
只不过,这个能力很快不可体验。“AI新榜”测评时发现,Marvis已经无法实现读取微信群聊消息的功能了。
![]()
那么,抛开这个能力,Marvis的6个电子牛马还能帮我干哪些活呢?考虑到Marvis毕竟立志于成为一个更全面的助手,我还是进行了更进一步的测评。
我测的第二个任务,是一个很日常的问题:电脑摸起来好热啊,怎么办?
如果问普通AI,它大概率会给你一套排查建议:打开活动监视器,看看CPU占用,检查后台进程,清理散热口,必要时重启。
Marvis的处理方式不一样。
它会先查看系统状态、能耗情况和内存占用,分析可能导致发热的原因,然后再拍了拍Computer Agent,让它去完成优化。
![]()
这个case不复杂,但很直观体现了Marvis在操作本地电脑上的能力。
聊天AI更像“告诉你怎么做”的顾问;Marvis则是接进电脑本身,读到系统状态、文件、网页和应用,再把这些东西串成一个任务。这意味着,电脑发热、系统设置、文件管理等本地场景里,它确实比纯聊天AI更接近“能干活”。
其实微信群总结失败之后,我本来对Marvis处理微信相关的任务没抱太高期待。
不过测试下来发现,聊天记录这种数据不好碰,但Marvis还能做一些其他事。
比如,微信公众号的文章整理。
我给它发了一篇公众号的文章链接,让它帮我把文中的案例和提示词整理成一个表格。
![]()
很多AI产品没法正常解析微信链接,但Marvis的结果还不错。它打开链接,并准确理解文章内容,提取了案例概览、操作步骤、关键提示词和注意事项。
![]()
这个场景还挺实用。很多干货文章看完,当下觉得“学到了”,过几天就忘了。现在用Marvis顺手把里面的案例、方法、提示词拆出来,变成之后能参考的素材。
不仅如此,Marvis还能实现微信公众号的排版。
我不是让它调一篇稿子的格式,而是让它做一个本地排版工具:左边放纯文字,右边按照指定格式生成排版结果,并支持直接复制到公众号编辑框里。
![]()
这个需求很典型。对内容团队来说,公众号排版不难但非常繁琐。标题、正文、缩进、段距、图片位置,每一项都有固定要求,每天重复做。
Marvis没有一次成功。第一版工具在预览里看起来是对的,但粘贴到公众号后台后,格式丢了;后来继续加带图粘贴、调图片位置,又遇到复制后空行丢失的问题。
大概四五轮对话之后,最终,Marvis给出了一个能在本地端口打开的排版工具。把纯文字放进去,右侧会生成符合要求的排版结果,复制到微信公众号编辑框后,样式和空行都能保留下来。
![]()
当我告诉它我想把这个工具分享给同事,Marvis继续生成了HTML文件,并补了一份README,说明工具怎么使用。
![]()
这一套流程跑下来,我最大的感受是,Marvis未必一次就给出最终答案,但在目标明确、问题可以被拆开的任务里,它能持续迭代,没有出现“修好这个、弄坏那个”的明显失控。
在信息整理上,Marvis也能跑通更完整的链路。
我让它搜索过去一周AI融资新闻,把超过1亿人民币的轮次整理成表格,并保存到桌面文件ai-funding.md里。
这个任务看起来只是“搜资料+做表格”,但实际拆开看,里面包含联网搜索、时间范围判断、金额筛选、结构化整理和本地文件写入几个步骤。
Marvis最后确实完成了文件写入,但不算很完美。
![]()
第一版结果里,它混入了一些不在“过去一周”范围内的融资新闻。也就是说,它能把搜索、筛选、整理、写文件这条流程跑完,但在时间范围这种硬条件上,并没有逐条核对。
这类问题在AI信息整理里很常见。模型会优先抓取相关性强、信息完整的内容,但“相关”不等于“符合条件”。尤其是融资、榜单、财报、公司动态这类内容,时间、金额、来源都属于硬信息,不能只看AI整理得漂不漂亮。
我们还测了自动化任务。
比如,让Marvis每天早上9点搜索AI行业的新品发布、公司动态和行业新闻,把链接、摘要标题和简介整理好,再通过飞书推送。
值得注意的是,我在派发这个任务时,并没有指令清晰地说帮我做什么。我只是把日常的工作文字像流水账一样发给它,Marvis根据这些信息提炼出固定任务,并设置成自动执行。
![]()
这个能力有一定想象空间。它不只是执行一句明确指令,而是能从一段相对自然的描述里,识别出哪些事情需要周期性完成,再转成自动任务。
但它的限制也很现实,自动任务依赖本地客户端运行。
如果电脑关机、休眠,或者Marvis客户端退出,任务就无法继续执行。对话过程中如果中途关闭客户端,正在执行的任务也会被终止。
这意味着,Marvis更像一个住在本地电脑里的执行助手,而不是一个永远在线的云端秘书。它适合处理那些本来就发生在电脑上的任务,比如整理文件、操作网页、调用应用;但如果用户期待的是到点自动运行、稳定推送、不受设备状态影响的后台服务,目前还不能完全交给它。
除了系统操作和自动任务,Marvis也做了自己的技能广场,汇聚了Clawhub、Claude、GitHub等多个来源的Skill。
我也从库里挑选了一些Skill安装,来看下整体的使用难度和好用程度。
![]()
比如,排名最高的frontend-design Skill,点击该Skill,在弹出的页面点击“添加”,就可以去对话框里使用这个Skill了。整个安装过程很快速,而且简单。
![]()
我们让Marvis做一个AI工具发现页面。
安装之前,Marvis也能生成页面,但整体更接近一个基础模板。安装之后,同样的任务,结果更完整。页面增加了快捷键、分类数量、深色/浅色模式切换、鼠标悬停效果等细节,整体的字体、色彩、间距和交互也更接近一个正式产品页面。
![]()
安装前vs安装后
不过Marvis更有意思的一点是,它没有把Skill广场做成一个纯工具列表,加入了类似内容社区的推荐形态。可以从具体场景出发,看别人如何使用Skill。
![]()
从这几轮任务来看,Marvis最值得讨论的地方,不是某个单点功能有多惊艳,而是它确实把AI从聊天框往真实电脑环境里推了一步。
它能读取系统状态,能调用不同Agent处理文件、网页和应用,也能把重复任务设置成自动执行。相比只给建议的聊天机器人,Marvis更像把AI接到了电脑里,让它真的去看、去干活。
但这并不意味着它已经可以被完全托管。它会受限于软件生态、本地环境和任务复杂度,也会在事实判断上出错。
不过,它的能力也还在扩展。比如手机远程连接电脑,目前只有安卓端可以用,iOS还尚未上线。按照目前公开介绍和用户反馈,它可以让用户在手机端查看并接管电脑任务,比如人在外面临时找文件、查看电脑端任务进度,甚至远程操作锁屏后的电脑。
![]()
这个场景也值得继续观察。因为那时候Marvis的价值可能就不只是“电脑里的AI助手”,而更像一个能随时接管你电脑的随身入口。
回到最开始的问题:这群Agent,真的能当电子牛马吗?
答案可能没那么绝对。
Marvis不是万能牛马,还不能完全放养。但它确实开始有点像打工人的第二双手了。
欢迎分享、点赞、推荐
一起研究AI
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.