GitLab Transcend 大会将于6月10日在伦敦线上直播,次日为亚太和美洲地区提供重播。活动将展示Duo Agent平台的实机演示、同行分享的代理式AI用例,以及由高级开发者倡导者Colleen Lake主持的现场版《开发者秀》。
本次技术内容聚焦AI智能体的内部结构。一个AI智能体可以被理解为一个简单的While循环:它使用大语言模型选择动作,执行该动作,评估结果,然后重复这一过程直到任务完成。
![]()
核心组件分为五个部分。第一是大脑,即大语言模型本身。它读取当前状况、进行推理、决定下一步行动。从聊天机器人到智能体的关键转变在于:模型不再只是生成文本,而是做出选择。
第二是规划。复杂任务需要多步骤拆解,智能体采用的方法包括思维链(逐步思考)、思维树(尝试多个选项并选择最优)以及反思(从错误中学习并重试)。规划将模糊目标转化为清晰动作。
第三是工具。没有工具的大语言模型如同罐中的大脑。工具是模型可调用的功能,包括网络搜索、代码执行、API接口、文件操作或浏览器控制(通常使用MCP标准)。模型请求工具,系统执行,结果返回。
第四是记忆。没有记忆的话,每次交互都从零开始。短期记忆即上下文窗口,长期记忆存储在向量数据库、文件和知识库中。当窗口填满时,智能体会总结旧对话并携带摘要继续。
第五是循环。上述四部分在循环中协同工作:智能体查看当前状态,决定行动,使用工具,观察结果,然后重复,直到给出最终答案。
此外,护栏虽非严格意义上的解剖结构,但至关重要。沙箱隔离、人工审核、令牌限制、输出验证和范围限制,可防止自主性演变为代价高昂的混乱。赋予的自主性越高,这些机制越关键。
技术架构层面,本周内容还涉及API设计范式的对比:REST、GraphQL与gRPC。REST以URL代表资源,使用标准HTTP动词操作,简单通用但获取关联数据常需多次请求;GraphQL允许客户端精确指定所需字段,单次请求获取嵌套数据,灵活但缓存更复杂;gRPC基于HTTP/2和Protocol Buffers,二进制传输、支持流式通信,性能优异但浏览器支持有限。
Git版本控制的操作差异同样值得关注:git fetch仅下载远程变更不合并,git pull等于fetch加merge,git pull --rebase则将本地提交变基到远程分支之上,保持线性历史。
回到智能体设计:当你构建一个智能体时,这五个组件中哪一个需要投入最多精力才能做好?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.