网易首页 > 网易号 > 正文 申请入驻

马维斯(Marvis)实测:当AI真正"住进"你的电脑,靠谱吗?

0
分享至



最近这两天,微信朋友圈被一个名叫「马维斯」(Marvis)的AI助手刷屏了。

这是腾讯应用宝团队推出的新产品,官方给它的定位很激进——「操作系统层级」的AI助手。什么意思?它不再满足于像ChatGPT、Claude那样只在浏览器里陪你聊天,而是直接扎根在你的Windows系统里,拥有调用本地文件、修改系统设置、启动应用程序、甚至跨屏操作手机App的权限。

官方宣传稿的标题很直白:「装上就有6个AI牛马帮你干活」



作为一个每天被选题、写稿包围的媒体人,我对这种"全能型数字助理"毫无抵抗力,正好借机梳理下工作流。于是我下载,开始了这场48小时的真实测试,看看Marvis能不能成为我的真实生产力。

以下所有体验,均为纯个人真实操作记录。

当"明确要求"遇上"执行偏差"

做自媒体,选题是核心,而选题的前提是信息收集。

所以,和平时使用其他AI模型一样,我先让Marvis帮我搭建一个"AIHOT"的资讯追踪任务,准备从热点中找找创作灵感。

任务创建很顺畅,Marvis很快通知我已生成文件。但当我满怀期待地打开输出文档时,映入眼帘的却是满屏乱码

说实话,这是我用过这么多大模型和AI工具以来,第一次遇到输出文件乱码的情况。我随即在对话框里指出问题,Marvis的响应倒是很快——它立刻"意识到"了问题所在,并告诉我:任务说明里已经明确要求了UTF-8编码,乱码通常是因为写入文件时编码未显式指定导致的。



但这里有个值得细究的细节:写入指令里明明是明确要求了UTF-8的,执行环节却"漏"掉了这一步。

这让我想到一个更深层的问题:当AI助手拥有直接操作系统文件的权限时,"理解指令"和"严格执行指令"之间,其实还隔着一道执行的鸿沟。Marvis能听懂你要什么,但在调用底层系统API写入文件时,那个"编码参数"的传递出现了断层。好在指出后它迅速修正,任务恢复正常。

系统级AI的第一次考验,不是"能不能做",而是"能不能稳定、不出错地做"。

第一印象并不美好,但好在自己勘误能力还算ok 。

AI的"时间感知"竟然会翻车?

写完一段稿子,我想让Marvis帮我定个闹钟,劳逸结合提醒我一会起来活动活动。没想到,这个最简单的指令,却上演了一出"四幕剧"。

第一幕:时间幻觉(9:40 → 设10:00闹钟)

当时时间是9:40,我让Marvis设一个10点的闹钟。结果它"自圆其说"地告诉我:10点已经过了,于是给我创建了明天10点的闹钟。



我当场震惊。9:40到10:00明明还有20分钟,Marvis是怎么判断"时间已过"的?这个bug暴露了一个问题:AI对"当前系统时间"的感知,在某些场景下会出现逻辑漂移。

仔细思考下这个逻辑漂移问题,有可能是agent调用了错误的工具导致抓取错误,也有可能是模型返回的具体时间有问题,短期看还好,如果长期使用,稳定性一定是生产力中的关键要点,基础信息的判断,Marvis确实还有待加强。

第二幕:正常发挥(10:30闹钟)

不死心,我重新测试,设了一个10:30的闹钟。这次没有任何停顿,任务立刻创建成功。

第三幕:保守策略(8:00闹钟)

我故意选了一个已经过去的时间(8:00)。这次它没有再犯"时间幻觉"的错误,而是切换到了另一种交互模式:弹出手动确认窗口,要求我在系统层面亲自确认



这种"拿不准就交给人"的策略,虽然慢了一步,但起码不犯错,好评。

第四幕:进化自查(10:08闹钟)

第四次,我设了一个10:08的闹钟。这一次,Marvis的表现完全不同了——它开始自查:先核对当前时间,再确认目标时间是否合理,最后才执行创建。



这之后我又反复测试了几次,均没有再出现问题,任务创建变得及时且便捷。

这四次闹钟测试,几乎浓缩了AI产品迭代的典型路径,从幻觉犯错,到保守兜底,再到自查修正。Marvis的学习和纠错速度,比我想象中快。

图片生成与识别,仍是短板

稿件准备得差不多了,需要配图。我尝试用Marvis生成图片,结果质量确实有点拉胯,画面模糊、风格不统一。

随后我又测试了它的"找图"能力,特别是人物识别。我让它找某位公众人物的照片,讲道理,这是属于自家生态的强势领域,我对他是有期待的。但结果基本对不上号。

更尴尬的是,我反过来拿着它找到的图片问"这是谁",它也只能给出泛泛的描述,无法准确说出人名



后来研究了才发现:Marvis目前没有人脸生物识别比对的权限和能力。这不是技术做不到,而是涉及隐私合规的边界问题——一个能自由操作你电脑的AI,如果再拥有精准的人脸识别能力,安全争议会指数级上升。所以还好,业内共有的问题不是问题。

不过“小马”还是给了我一个小惊喜,就是他的“本地知识库”。在选图的时候我发现,他会把我本地的图片和文档纳入一个整体的库里,形成一个全局图库。要知道,媒体人的桌面,一般都是这样的。



图片仅供参考,实际更乱

对于文档类的内容还好,但是图片类的信息真的是存进电脑几乎就再也找不到了。而这个本地知识库就可以支持我用模糊语意去寻找固定内容了,给我提效不少。

在图片生成和人物识别这两个维度上,Marvis目前还不能替代专业工具。它的优势不在"创作视觉内容",而在"帮你调用和管理视觉内容"

批量操作才是"系统级AI"的真正主场

文章写完后,进入最枯燥的环节:多平台同步。我手里有一个Excel表格,里面存着微信公众号、知乎、头条号、微博等所有平台的发布链接。

以前这个流程是这样的:找到表格→ 打开 → 逐个复制链接 → 粘贴到浏览器 → 登录 → 发布。全程手动,至少折腾十几分钟。

这次我让Marvis直接读取桌面上的表格文件,打开里面所有网址。我原本以为会卡顿,甚至做好等三五分钟的心理准备。结果不到一分钟,我眼看着它依次完成:读取桌面文件→ 解析表格 → 启动浏览器 → 逐个打开平台网址。浏览器里的标签页瞬间拉满,效率提升肉眼可见。

后面我还让它整理了电脑里散落的旧稿件,统一梳理命名规则。这些"体力活"它都完成得干净利落。

创作间隙,我随手让它"打开网易云,放首歌",它也能秒响应。甚至最后,我让它扫描了一遍电脑里可卸载的App和陈年图片。它不仅分析得很快,对卸载建议还说得头头是道;那些藏在磁盘深处、我自己都忘了的老照片,也被它翻出来整整齐齐理了一遍。

看着老照片,听着“网抑云”,独属于我的时刻,降临了。反正今天的活儿,Marvis也帮我干了不少,那么就进入今日Emo时刻吧。



Marvis的真正价值,在于把"重复性、流程化、跨应用"的脏活累活自动化。它不是替代你的大脑,而是替代你的手指。

为什么它总在"确认"?

在整个测试过程中,我注意到Marvis有一个非常鲜明的交互特征:频繁确认

删除文件前确认、修改设置前确认、执行可能影响系统的操作前确认……几乎每一步涉及"写操作"的环节,它都会停下来问你:"确定要这样做吗?"

这让我想到之前的一篇稿子:Gemini 3.5删了两万八千行代码后,给自己写了封表扬信。两件事放在一起看,反差极大。

Marvis的"过度确认",究竟是AI没有完全释放其便捷性?还是开发者刻意把最终决定权牢牢握在用户手中,划定一条"不越界"的安全线

我的看法是:在系统级权限面前,"保守"比"激进"更负责任。一个能删你文件、改你设置、操作你应用的AI,如果太"果断",风险是不可逆的。Marvis的多次确认,本质上是一种权限敬畏——它知道自己的能力边界,也知道你的数据边界。

当然,这也带来一个体验上的trade-off:有时候你会觉得"有点啰嗦"。如何在"安全"和"流畅"之间找到更好的平衡点,是Marvis下一步需要优化的方向。

它还不是"终极形态",但方向对了

48小时体验下来,我的总体感受是:

Marvis目前更像一个"高级实习生",它不能替你思考选题、不能帮你写出爆款标题、不能生成惊艳的配图,但它能帮你把"找资料、整文件、开网页、定提醒、清内存"这些琐事扛起来。

它的优势非常明确:系统级整合能力、跨应用调度能力、本地文件操作能力。这些恰恰是传统云端AI助手做不到的。

它的短板也很清晰:时间感知偶发幻觉、图片生成与识别能力弱、高频确认影响操作流畅度。

最后必须诚实地说:我个人使用的时间还太短,很多功能(比如手机App跨屏操作、复杂工作流编排)完全没有深入测试。以上体验,仅限于一个自媒体人日常工作中真实接触到的场景。

如果你也厌倦了在十几个应用之间来回切换、被琐碎操作吃掉大量时间,Marvis值得一试。它未必能让你立刻拥有"6个AI牛马",但至少,第一个愿意帮你干脏活累活的"数字助理",已经坐在你的电脑里了。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
1954年,犹太人卖给我们原子弹浓缩铀,周恩来当即下令:查明真伪

1954年,犹太人卖给我们原子弹浓缩铀,周恩来当即下令:查明真伪

历史龙元阁
2026-05-29 10:55:12
《真人快打2》女星自曝为角色拼命:毫无武术基础,开拍前疯狂特训

《真人快打2》女星自曝为角色拼命:毫无武术基础,开拍前疯狂特训

赴一场山海啊
2026-05-30 01:20:38
南阳多名老人莫名背上百万贷款,专挑文盲贫困户下手

南阳多名老人莫名背上百万贷款,专挑文盲贫困户下手

天空空啊
2026-05-29 16:21:31
光纤光缆,最核心7家企业梳理

光纤光缆,最核心7家企业梳理

风风顺
2026-05-31 03:35:03
“客厅5不放,放了快拿走”!不是胡说,都是过来人的经验教训

“客厅5不放,放了快拿走”!不是胡说,都是过来人的经验教训

家居设计师苏哥
2026-05-25 14:30:37
穆里尼奥封神第一签!900 万挖新克罗斯,全皇马反对他偏要硬来

穆里尼奥封神第一签!900 万挖新克罗斯,全皇马反对他偏要硬来

澜归序
2026-05-30 06:40:36
带着屏幕去流浪:宏碁把显示器塞进口袋,甚至挂在了孩子身上

带着屏幕去流浪:宏碁把显示器塞进口袋,甚至挂在了孩子身上

半勺甜心事
2026-05-30 00:28:58
1986年,戴安娜穿高跟鞋坐查尔斯车头,查尔斯一脸嫌弃的让她起来

1986年,戴安娜穿高跟鞋坐查尔斯车头,查尔斯一脸嫌弃的让她起来

笑傲春秋
2026-05-29 17:05:03
彩电“龙虎斗”血洗一线市场

彩电“龙虎斗”血洗一线市场

家电圈
2026-05-29 20:30:19
我楼上住着一个女邻居,33岁长得挺漂亮,她老公却留她一个人守家

我楼上住着一个女邻居,33岁长得挺漂亮,她老公却留她一个人守家

千秋文化
2026-03-13 21:00:35
他率六千人投靠八路军,成为纵队司令;建国后为何只是副县级?

他率六千人投靠八路军,成为纵队司令;建国后为何只是副县级?

顾秋韵
2026-05-31 00:24:57
北京多家野人先生门店上线全新蛋糕冰淇淋,网友:被价格吓晕!有门店已断货…

北京多家野人先生门店上线全新蛋糕冰淇淋,网友:被价格吓晕!有门店已断货…

北京商报
2026-05-28 14:51:19
张家港保税区多人被查,管委会原主任胡剑鹏因保外就医又被收监

张家港保税区多人被查,管委会原主任胡剑鹏因保外就医又被收监

江南江南
2026-05-30 14:11:52
大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

大S年轻时房间曝光,太过诡异引人不适,难怪有人曾说活不过50岁

草莓解说体育
2026-05-11 20:49:33
穿情侣装现身谢霆锋演唱会!王菲素颜坐提词器旁,两人已复合12年

穿情侣装现身谢霆锋演唱会!王菲素颜坐提词器旁,两人已复合12年

手工制作阿歼
2026-05-31 01:06:10
2026款保时捷911 GT3 Touring手动挡版本亮相

2026款保时捷911 GT3 Touring手动挡版本亮相

体坛观察猿
2026-05-30 01:58:56
蜂蜜被点名!医生提醒:糖尿病患者常喝蜂蜜水很快迎来4个改变!

蜂蜜被点名!医生提醒:糖尿病患者常喝蜂蜜水很快迎来4个改变!

芹姐说生活
2026-05-20 23:42:03
利物浦高层:认为换帅比换球员更容易

利物浦高层:认为换帅比换球员更容易

懂球帝
2026-05-30 20:51:25
网友们这几天都在吃著名毛巾集团洁丽雅的瓜,讽刺其家族“丑闻”

网友们这几天都在吃著名毛巾集团洁丽雅的瓜,讽刺其家族“丑闻”

网络易不易
2026-05-17 12:29:12
皇马重磅:即将完成首签,身价8000万中场,40场20球,仅需900万

皇马重磅:即将完成首签,身价8000万中场,40场20球,仅需900万

郝小小看体育
2026-05-30 17:13:13
2026-05-31 04:20:49
AI唱反调 incentive-icons
AI唱反调
在这里,听见不一样的 AI 声音。
10文章数 0关注度
往期回顾 全部

科技要闻

车圈大佬发声:价格战远去,但竞争仍残酷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

头条要闻

两名9岁女孩被困电梯近2小时 求救几十次物业无动于衷

体育要闻

岁月不饶人!39岁德约鏖战近5小时拼到呕吐

娱乐要闻

张碧晨《歌手》 “活人微死” 自嘲

财经要闻

双汇管不住一头猪

汽车要闻

900V+3.2秒破百 领克10+&领克10上市16.99万元起

态度原创

房产
健康
数码
公开课
军事航空

房产要闻

红动五月!全国抢入核心资产,广州盯紧凯旋新世界!

尝试干细胞疗法如何避免踩坑?

数码要闻

华擎RX 9070 XT太极十周年版曝光:黑白金配色首次亮相

公开课

李玫瑾:为什么性格比能力更重要?

军事要闻

美防长参加"香会" 就美中关系最新表态

无障碍浏览 进入关怀版