网易首页 > 网易号 > 正文 申请入驻

Manus吹散了人与Agent之间的迷雾|直播测试8小时,Manus实测感想

0
分享至

想了想,应该有不少读者想看我对 Manus 的评价,还是不偷懒,分享直播实测 8 小时的真实感受。

先给总体评价(也非常希望你们能看看最后的小结):

整体感受下来,Manus 工程、产品化做的都很棒,易上手、价值感知明确。

所以文章开头必须给 Manus 团队点赞,同时做到“想到”、“做出来”、“做到让人愿意好好用用的程度”,这真的很不容易。

  • 本文不聊太深入的技术原理,就想给用过 or 没用过的读者,通俗易懂地讲讲Manus 在做什么,能做什么,还缺点什么。

先讲下 Manus 是个啥

  • 当前的 Manus ≈AI 操纵着一个没有图形界面的 Linux 虚拟机 & 浏览器,感知电脑环境,执行各类操作。
    • 所以它能跑各种 linux 下的指令、库、程序( cd、ls 指令、python……),也能访问各种网页、获取一些 API 接口的数据
    • 但因为没有图形界面,所以没法运行图形程序。比如我让它跑《宝可梦》,在运行时就终止了
    • 访问网页时,阻挠人类使用的各种要素,一样会打扰到 Manus。比如:强制要求登录、余额不足的充值弹窗
    • Manus 没有网页账号,也没有钱。所以为了方便用户通过键鼠介入,Manus 提供了用户可视的命令行视窗、浏览器、vscode两种选项,方便查看运行指令、接管网页和修改文件。这也反向说明了 Manus 现在的活动边界。
    • 至于 Manus AI 能够很顺畅地和网页交互、读数据、点元素、打游戏,甚至还能从无图形界面随时切换到用户可接管的图形界面。这可能就是 Peak、Red 他们的传统艺能了,一个浏览器大佬,一个浏览器插件大佬,做浏览器相关工程化开发是手掐把拿的。
  • 对了,你还是可以给 Manus 上传文件,想必未来也能对接私有 API,有想象空间

Okay,再回过来讲它的运作逻辑

  • Manus 的主要智力担当是 Claude AI 和某个特训过的推理模型。它面临一个人类指令时,会对指令按“根据人类指令,拆分完成任务所需的子步骤”的思路,生成 todolist 文档,拆解任务,降低实现难度
  • 基于这个 todolist,每完成一个子任务就打个 ✅,为 AI 指明多步骤任务中每一步的执行要求(因为当前 AI 的上下文记忆长度有限,也需要做备忘录)
  • 再针对 list 中的每个 todo,按需调用相关工具( linux 命令、python、浏览器等),一一推进子步骤进行,评估完成质量。这些步骤可以是安装软件环境、创建文档、浏览网页、编写程序&网页等
  • 多个子步骤的生成结果,嵌套利用起来,它就可以做出原始指令的产出物。比如:网页搜索、网页阅读总结而成的调研数据文档 + 网页样式 + …… = 生成了 xx 市场调研分析报告网页
  • 当然,Manus 不局限于做网页,做报告;还能玩 html 的 2048 游戏、写游戏攻略心得、帮我安装宝可梦游戏、安装 NDS 模拟器、代替我登录可灵 AI 输入 prompt 做 AIGC 视频。>>> 此处需要发挥想象力
  • 所以它确实是个通用 Agent

那我试了什么 Case?

Manus 团队自己说过:“他们也不知道这个产品的能力边界在哪”。我也十分好奇这个问题,于是设计了 6 个最想测的任务。

按照顺序,是以下这些(➡️ 可以通过链接查看详细回放):

  1. 创作世界首支 AI 自主创作的自我介绍的视频:https://manus.im/share/EWwJDzTWrW8MjqThadvTT9?replay=1
  2. 帮我草拟邮件,找到 Manus 官方邮箱,完成 Manus 邀请码的申请:https://manus.im/share/Fk6f4LCKvuM0lQ62EJf6SZ?replay=1
  3. 自主玩 2048 网页游戏,并给自己解说,写游戏心得:https://manus.im/share/5XJGL0FQP1nuWchxtqsV8R?replay=1
  4. 安装《宝可梦:黑》,并尝试捕获第一只宝可梦:https://manus.im/share/pCPVNmrejPknbTy5GBuzAy?replay=1
  5. 自行进入可灵 AI ,创作一条由 AI 操作生成的 AI 视频:https://manus.im/share/Q08zzgKnAPIog5QxqMqHoA?replay=1
  6. 让 Manus 自行调查自己所处的环境,输出 Manus 自己的技术架构:https://manus.im/share/Gez1G14tfRexf50GMZyckD?replay=1

Case 效果怎么样?
  1. 它真的创作视频了,用 opencv 一帧帧画的,但有点丑,也不能自己配上音。但毕竟做出视频了(也有其他朋友有测出配上 BGM 的)
  2. 能帮我草拟邮件,但是还不支持使用邮件服务代发邮件,可能官方有限制
  3. 真的玩起来了,超出预期!最高分 192 分,比起人类是差很多(理论上存在 10w 分以上的可能),每一步也很慢,但终究是模拟键鼠输入玩起来了。看来 Manus 能玩一切非即时性游戏。由于单个 case 的上下文长度现在有限制,我正在向官方申请解除限制,看看无限制情况下,Manus 到底能玩到多少分
  4. 这个 case 很神奇,我也没看懂它到底做到了什么程度,希望大家都来尝试分析一下:
    1. 它自己调研了运行游戏的要求,安装了模拟器与其依赖
    2. 但游戏镜像资源确实不好找,网盘下载也需要登录人类账号、下载网盘客户端。所以我给它开小灶,直接把包传给它了。
    3. 然后自行安装的很顺利。要知道模拟器配置啥的其实真的没那么方便。这意味着,以后用不着我们远程费劲教长辈如何用软件,Agent 将是我们每个人最好的伙伴
    4. 在运行游戏时,Manus 的沙箱不支持图形服务,于是我适度“鼓励”了一下,它竟然开始尝试自行改进无头环境下的虚拟显示替代方案。

  1. 看起来它似乎通过主动改造自己的环境,找到了让本不能运行的游戏运行的方案?说实话,这里我已经有点看不懂它做到什么程度了,到底是真做了,还是一场幻觉?
  2. 自主设计了整个 AI 视频的脚本、文生图提示词。 我接管登录了可灵 AI,也能成功调整管理台参数尝试生成。但是因为账号没钱,弹出了收费弹窗,不想充值就无法继续了。
  3. 大部分都被产品工程限制了,但最终输出了一些在官方网站上查不到的方案设计内容,且经官方证实,确实大部分正确。Manus 真的能对环境进行感知,反思环境对它的影响,简直是 AI Agent 版本的《楚门的世界》。

所以我对 Manus 的评价是什么?

你可以把它当做一个非常肯干活的实习生?

但你最好自己试试再下判断。因为每个人在不同的任务场景,预期都不一样。

实际上有好多我不熟悉的任务中,它做的比我快多了,也好多了。

  • 前面提过,它是用 LLM 大模型拆解原始任务为多个子任务,再针对一个个子任务,逐步生成行动步骤/内容/方案……
    • 所以,它的每个子任务能力,就是当下 LLM 的智力水平——缺乏实战经验的、缺点灵性(长期的自我改进与成长空间)、但能 24 小时极高吞吐量、极速干活的在校大学实习生
    • 拼起来的最终产物的水平,也基本在这样的实习生水平(具体看作为 Agent 内核的 AI 水平,和它可接触的数据质量)
    • PS:直播里,我也请了一个专业的金融分析师朋友,让他点评官网公布的特斯拉股票分析 case 中的分析报告的水平。得到的评价是:“花里胡哨的仪表板我们是不看的。实际分析得到的报告水平大概是在读大一实习生的水平,在实战中不可用。可能给到私有数仓 API 和我们实战在用的分析报告模板与要求,能给出更有实际价值的成果。”
    • 不过还是再次建议,这部分主观因素过于强烈,建议务必公测后亲自体验!!!
  • 不是说 Manus 不行,解决不了难题。而是意味着这类产品的能力表现会与底模 AI 息息相关,共同进步( “套壳”产品反而能拥有无限成长空间 )
  • 而且官方说,每个 case 的 token 花费基本在 2 美金,随着模型发展,这个价格还会无限下探。这也比人类实习生的成本低太多了,未来的组织架构必然会与现在有巨大的差别。

但 Manus 有些问题,或者说这个阶段的 AI Agent 都会有的问题
  • 在人机协作过程中,人和 AI 反复拉扯修改任务过程中的中间产物,是非常不好的体验。一旦不能一梭流梭出好结果,容易陷入无限的反复提示修改的困境
  • 就和让实习生工作一样:如果实习生做不好事情,就容易反反复复改,而且基本很难靠他自己的“瞎猜”改好。你必须更加耐心地给予更多的背景信息、子步骤思路指导、增加有信息量的反馈
  • 由于 Manus 毕竟不是我们的随身助理,且尚不支持跨任务项目的对话记忆、账号登录态、文件互通,以及文字语言是对现实信息的有损压缩,所以它很难掌握你想让它做的事情的完整背景信息,很多东西需要你老老实实地交代清楚,没法读心,也没法读你因为它没干好事情而紧张起来的空气
  • 当下的 Manus 确实在一些能明确定义过程/低交付预期的任务中,大幅度帮你节省力气。但在更多场景里,可能还因为数据质量、背景信息有限、无法持续成长等原因,没法承担更多期待。

所以我也在问自己一个问题:现阶段的 manus,我能找到长期用它的主力场景吗?

我现在暂时没想出答案,我直觉是我自己的问题,我们都应该再多试试,思考自己与 AI 的最佳人机协作模式。

Manus 的发布,让更多人重新看清了未来

虽然很多人说 Manus 用的这些技术并无壁垒,甚至有些部分都是半年前被验证的项目。

但这不阻碍 Manus 是目前唯一一个把 AI、工程化、产品化结合的如此棒的产品。

一个产品,同时做到“想到”、“做出来”、“做到让人愿意好好用用的程度”,这真的很不容易。

它打通了几乎全部的链路,以极低的体验成本(国内可用、免费试用,有邀请码限制,但正在每天数千人的速度逐步放开),让人类能够一站式地托管完成复杂的任务。

未来胜出的可能并不是拥有最强技术的公司,而是那些真正理解了AI与人类如何共进化、并能建立持续、稳定的协作机制的公司。(出自:https://yage.ai/manus.html)

在 Manus 眼见为实的体感刺激下,广大从业者、一般用户,都进一步开始思考:我们的产品在 AI 时代,到底应该是什么样的?未来的人机协作是怎么样的?人应该与 AI 如何协作共处?

总结

行文至此,作为行业首个爆火的通用 Agent(且尚在 alpha 内测阶段),Manus 与其团队已经承担了极大的关注度与舆论压力。

在思考本文标题的时候,我其实犹豫了很久,要不要拔高到如此程度。

虽然没有任何利益关系,最终还是选择了你们现在看到的版本。

因为他们值得:

——Manus 以极高的产品完成度,再次把隔在人和 agent 的未来的迷雾吹散了一些,透出了更多光亮。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
张尧学院士称号被撤销

张尧学院士称号被撤销

新京报
2026-05-25 22:13:36
太阳报:阿森纳球员在夜总会时遇到热刺球员,随后一起狂欢

太阳报:阿森纳球员在夜总会时遇到热刺球员,随后一起狂欢

懂球帝
2026-05-26 00:52:08
安妮·海瑟薇自曝左眼有10年基本看不见:我的左眼已经算是盲人

安妮·海瑟薇自曝左眼有10年基本看不见:我的左眼已经算是盲人

韩小娱
2026-05-25 20:26:53
职业生涯法网首胜!吴易昺三盘横扫过关,下轮将战10号种子

职业生涯法网首胜!吴易昺三盘横扫过关,下轮将战10号种子

全景体育V
2026-05-26 05:16:53
开始离谱了!燕郊板块房价从4万变6千,业主集体断供

开始离谱了!燕郊板块房价从4万变6千,业主集体断供

专业聊房君
2026-05-25 07:28:59
首个“台独”政党宣示考虑成为中华人民共和国一部分,提了个条件

首个“台独”政党宣示考虑成为中华人民共和国一部分,提了个条件

深挖全球热点
2026-05-25 03:37:35
广东省批复:深圳街道可直接对乱摆卖、占道经营实施行政处罚

广东省批复:深圳街道可直接对乱摆卖、占道经营实施行政处罚

南方都市报
2026-05-25 23:28:45
他没秃,但变强了,一个44岁日本大叔的三年“一拳超人”实修录

他没秃,但变强了,一个44岁日本大叔的三年“一拳超人”实修录

国创漫话
2026-05-24 14:24:45
航天员黎家盈年收入多少?回来后享受什么待遇?

航天员黎家盈年收入多少?回来后享受什么待遇?

墨印斋
2026-05-26 09:56:09
国际油价大跌逾6%

国际油价大跌逾6%

证券时报
2026-05-26 07:44:04
尼克斯时隔27年重返总决赛,对NBA联盟的收视来说,是一针强心剂

尼克斯时隔27年重返总决赛,对NBA联盟的收视来说,是一针强心剂

夜白侃球
2026-05-26 10:45:16
盒马又翻车?!粉木耳「擦边」包装被骂上热搜,这设计真离谱

盒马又翻车?!粉木耳「擦边」包装被骂上热搜,这设计真离谱

雷科技
2026-05-25 18:35:36
潘玮柏自爆:最近我没去面摊,因为我得了面瘫

潘玮柏自爆:最近我没去面摊,因为我得了面瘫

现代快报
2026-05-26 09:28:17
塞尔维亚爆发大规模抗议!议长否认俄罗斯为“兄弟国家”

塞尔维亚爆发大规模抗议!议长否认俄罗斯为“兄弟国家”

项鹏飞
2026-05-25 19:58:08
4年2.8亿!这是掘金给约基奇的全部,他将成NBA历史收入最高球员

4年2.8亿!这是掘金给约基奇的全部,他将成NBA历史收入最高球员

奕辰说球
2026-05-25 11:40:48
美军称在霍尔木兹海峡击沉两艘伊朗布雷船

美军称在霍尔木兹海峡击沉两艘伊朗布雷船

新京报
2026-05-26 09:51:05
抗战中,八路军给上千只青蛙喂上花椒,使用青蛙战术拔掉鬼子据点

抗战中,八路军给上千只青蛙喂上花椒,使用青蛙战术拔掉鬼子据点

云霄纪史观
2026-05-25 16:13:28
看了耿同学的打假 我去查了自然期刊的撤稿数 各国对比

看了耿同学的打假 我去查了自然期刊的撤稿数 各国对比

慕容律师
2026-05-25 11:56:06
韦国清之子公开澄清:网传韦国清阻碍粟裕平反,与事实不符

韦国清之子公开澄清:网传韦国清阻碍粟裕平反,与事实不符

人生录
2026-05-25 19:02:18
中国“捡钱”时代或将来临:如果手中只有10万,试试死啃这两条线

中国“捡钱”时代或将来临:如果手中只有10万,试试死啃这两条线

美食格物
2026-05-13 14:03:12
2026-05-26 11:44:49
一泽Eze
一泽Eze
AI 产品,提示工程师 ? 探索AI应用边界,寻找人与AI共处的答案
52文章数 3关注度
往期回顾 全部

科技要闻

今年秋季,麒麟芯片将首次落地"逻辑折叠"

头条要闻

牛弹琴:"两个铁杆"来北京 一个当场落泪一个带来喜讯

头条要闻

牛弹琴:"两个铁杆"来北京 一个当场落泪一个带来喜讯

体育要闻

上赛季差点降入英甲,下赛季要踢英超了

娱乐要闻

景甜被曝停工失联 富商索要2亿和解费

财经要闻

中国铝行业爆单 下一个“煤炭”大周期?

汽车要闻

启境GT7定档5月29日预售 提供三电机版本

态度原创

房产
本地
亲子
健康
公开课

房产要闻

工抵房骗局!134套房款入私账!海南这个盘,坑惨买房人!

本地新闻

用云锦的方式,打开江苏南京

亲子要闻

感官敏感期这样做启蒙,激活五感促进大脑发育

几百块一瓶的外泌体精华,涂脸上是“智商税”吗?

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版