机器之心编辑部
最近,复旦大学肖仰华教授的朋友圈引起了热议,其在研发测试的 AI 智能体通过自主学习学会了操作微信,在朋友圈发消息并与其好友在评论区自主互动。面对自然的互动,不少好友甚至开始要求 “证明你真的是肖老师,而不是他的 AI”。
![]()
这种 “分不清真人与 AI” 的错觉,源于 A3 实验室(Advantage AI Agent 实验室,由深圳夸夸菁领科技有限公司与复旦大学知识工场实验室联合成立的科研团队)研发的新型智能体:GenericAgent。
它不再是安装繁复、上限受限、难以迁移的传统智能体,而是下一代自组织、自学习、自进化的通用智能体,是一个拥有 “生命感”,能够在用户使用调教下快速学习与成长的数字生命。本系统自 2026 年 1 月 11 日已经开源(https://github.com/lsdefine/pc-agent-loop)。
01 自学习、自进化:AGI 的可能形态
达到 AGI 水平的智能体不应只能在预设好的脚本与工作流下执行,而是能在环境的碰撞与探索中不断学习生长,理解并交互各种复杂环境(比如社交平台),学习解决问题的有效策略,并能形成经验沉淀,进而演变成为解决问题的专家能手,演变成为善解人意的贴心助手。这种自进化特性体现在三个维度:
自组织记忆:拒绝信息的简单平铺。它拥有记忆分层组织、持续精炼功能,有效提升记忆检索效率和交互稳定性,甚至能在 “过夜” 时自主整理杂乱的记忆,确保长期运行效率。(插图:记忆的组织架构)
![]()
自适应学习: 具备极强的环境适应性,在交互过程中会自己记住合理的步骤、策略,只会越来越 “聪明”。
![]()
一回生,两回熟
自主成长进步: 遇到新问题时,它会通过 “Fork” 模式尝试直接复制自己,选取多样策略,用更好的策略更新自己。在闲置时间,“探索模式” 可以自己培养未知能力,持续拓展已有能力边界。
智能体自主行为分布报告,它甚至在自主行动阶段自己在网上冲浪
实现这种 “自进化” 的背后,仅仅依赖于三个简单原则:极简架构、极强执行、极致迁移。
02 极简架构:用极致工程架构实现便捷落地
极简特点体现在:“极简架构、极低开销、极简部署” 这三个角度。
极简架构: 代码仅 3000 多行(核心模块仅数百行),实现了传统架构 50 多万行代码才能具备的能力,任何开发者都能轻易读懂。
> 代码量即上下文优势:全代码 ≈ 8000 tokens,占 200K 上下文的 4%。这意味着 LLM 每轮对话都能全量理解自身源码,自己就是最好的文档、社区和工程化工具。传统项目的文档 / 社区 / 测试套件是大代码库的 "生存必需品",不是优势。
极低开销:团队的核心理念是 “信息密度越大,效果越好” 。
通过记忆的分层索引和按需加载(用哪层读哪层),大幅压缩 System Prompt,极大地节省了 Token 开销。
全部特殊 prompt + 记忆核心 加起来没别人一个 AGENTS.md 大
绝不重复传输,一半的代码逻辑都在确保 “ context 中不放任何垃圾信息”,比如重复的技能定义。
极简部署:从此告别智能体还要付费指导安装的窘境,有网就能装!只要有 Python+Requests 环境就能运行,真正实现了 “只要有电的地方就能进化”。
03 极强执行能力:八爪鱼般的触达与使用工具的能力
如果说自进化是 GenericAgent 的灵魂,那么 “八爪鱼” 式的工具控制力就是它强壮的触角,以保证其出色的任务完成能力。它不仅能使用工具,更能像八爪鱼一样深入系统中的每个工具,打破组合泛化的天花板。更能像八爪鱼的身体一般具有韧劲,适应不同复杂环境的交互,即便迷宫一般的软件系统也能习得其交互策略。
原子工具撬动数字世界: 团队拒绝给模型提供过于臃肿的选项,仅通过 code_run(执行任意代码)、file_read/write(文件操作)、web_scan/execute_js(浏览器控制)等 9 个原子工具,便能操控整个数字世界( PC 与网络世界)。
现场 “制造” 工具: 当现有工具不足以解决问题时,GenericAgent 会开启探索模式:现场安装 Python 包、现场编写脚本、现场验证方案。
![]()
现场搓工具
降维打击的浏览器策略: 不同于传统方案需开启全新的、未登录的浏览器实例,它通过 JS 插件直接接管你正在使用的浏览器。
优势: 无需重新登录 OA 或企业微信,它能直接在你的账号权限下内容查找、表格填写、附件上传、资源下载等繁琐流程,实现真正的 “人机接力”。
![]()
接管你的浏览器
04 极致的迁移:你的智能体,随你走
GenericAgent 的设计初衷就是打破软硬件的藩篱,让智能不再被禁锢在某一个特定的 “黑盒” 里。
基座模型的上游: 它不挑底座模型。无论是 Claude、Gemini 还是 Kimi ,在 GenericAgent 的架构加持下,底座的能力依赖都可以被缩小,确保输出质量稳定可靠。
![]()
切换基础模型毫无压力
极致低廉的硬件门槛: 只要有电、有网、有 Python 环境,只要任意一台普通 PC 与手机,它就能跑起来。无论你在 Windows、Mac 还是 Android 手机上,都能拥有同样的进化体验。
![]()
可以用手机操控
agent 用手机点奶茶
![]()
也可以操控手机
极致技能复用: 智能体在某台机器上习得的复杂技能可以被提炼成记忆并直接移植。这意味着一个人的调教成果,可以让千万人直接享用,极大地降低了全社会的智能成本。
![]()
新的模型(kimi),新的 Agent,从未做过发送消息的任务,注入 wechat_send_sop 后迅速掌握在微信中发消息的技能
GenericAgent 只是一个开始。想看它在你的手机上 “偷偷” 点外卖或整理记忆吗?
(注:本文案所有动图均由智能体自主生成)
[关注 A3 实验室,共同见证自进化智能的诞生]
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.