![]()
哈喽,大家好,小圆今天要和大家拆解的,是近期AI圈因Meta收购而再度爆红的Manus团队分享,打造AI智能体通用动作引擎。Manus研究员Ivan Leo的这次分享,不仅揭秘了智能体开发的核心逻辑,更让我们看到了AI从聊天工具走向实干助手的清晰路径。
在当下的工作场景中,很多人其实都在充当人肉复制粘贴的角色,在十几个浏览器标签页、各类软件和表格间来回奔波,做着毫无创造性的数据搬运工作,即便有AI聊天机器人帮忙检索信息,也没能从根本上解决问题,我们和AI的关系始终停留在对话层面,而非真正的协作。
![]()
![]()
这一概念的出现,标志着AI不再满足于单纯提供答案,而是朝着执行任务、自动化工作流、延展人类能力的方向迈进,这不仅是技术层面的升级,更是人机交互逻辑的根本转变,聊天界面不再是AI的全部,它更像是一个指令入口,最终目标是成为所有数字化工具的“通用遥控器”。
![]()
这背后的改变极具颠覆性:过去开发软件是“人指挥代码”,现在变成人指挥AI,AI指挥代码,开发门槛从会写代码直接降低到会说人话,这种转变让技术不再是少数人的专利,普通人也能通过自然语言创造属于自己的工具。
![]()
如果说通用动作引擎是Manus的大脑,那浏览器操作员就是它连接数字世界的双手,在小圆看来,这一功能的核心价值在于打破了不同软件、不同平台间的信息孤岛,让AI能像真人一样操作我们的数字工具。
![]()
最贴近生活的例子就是Ivan Leo分享的场景:在纽约AWS会场倒时差想喝美式咖啡,告诉Manus后,它不会只甩给一串咖啡店链接,而是直接在用户的浏览器里打开地图,自动搜索并筛选附近的咖啡店。
AI使用的是用户自己的浏览器,带着用户的登录状态、Cookie和历史记录,这意味着它能操作那些需要登录才能访问的网站,实用性大大提升,另一个案例更能体现其高效性:Ivan喜欢打匹克球,但新加坡政府提供的场地很难预定。
![]()
于是他让Manus写了个Python脚本,同时启动6个浏览器自动化工具实例监控网站,一旦有空位就自动预定,这说明AI不再只是云端的虚拟程序,而是能深度介入本地设备操作的实干者。
![]()
![]()
Manus API通过异步任务与Webhook实现了跨服务集成。用户提交复杂任务后,会得到一个任务ID,之后不用等待,AI在后台完成工作后会主动通过Webhook通知用户,这说明Manus从设计之初就瞄准了耗时较长的复杂任务,与聊天机器人的即时问答逻辑完全不同。
![]()
这种“意图输入-结果输出”的闭环模式,正在重构我们的工作方式,也让我们看到了通用动作引擎的核心竞争力,不是某个单一功能的领先,而是对复杂工作流的整体优化,了解了这些具体能力后,我们再来聊聊这份分享带给行业的深层思考。
![]()
AI在记忆能力、权限管理、任务优先级判断等方面还有很多需要完善的地方,AI智能体技术远未到成熟阶段,但不可否认的是,方向已经十分清晰:AI不再满足于做知识渊博的“聊天伙伴”,而是渴望获得“双手”去触碰数字世界的每一个角落。
Manus团队打造的通用动作引擎,不仅为行业提供了技术参考,更让我们看到了AI赋能产业、解放人类创造力的巨大潜力,随着技术的不断迭代,相信未来会有更多类似的智能体出现,让我们从重复繁琐的劳动中解放出来,专注于更具创造性的工作。
![]()
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.