谷歌新发布的一份名为《 Agent 》的白皮书设想了未来人工智能将在商业领域扮演更积极、更独立的角色。这份长达 42 页的文件于 9 月悄然发布,目前已在 X.com(原 Twitter)和 LinkedIn 上引起关注。
它引入了 AI Agent 的概念——一种旨在通过推理、规划和采取行动实现特定目标来超越当今人工智能模型的软件系统。与仅基于预先存在的训练数据生成响应的传统人工智能系统不同, AI Agent 可以与外部系统交互,自行做出决策并完成复杂任务。
白皮书解释道:“ Agent 是自主的,可以独立于人类干预而行动。” 他们将 Agent 描述为结合推理、逻辑和实时数据访问的系统。这些 Agent 背后的想法是雄心勃勃的:它们可以帮助企业自动执行任务、解决问题并做出曾经完全由人类处理的决策。
这篇论文的作者Julia Wiesinger、Patrick Marlow和Vladimir Vuskovic详细分析了 AI Agent 的工作原理以及它们需要什么才能发挥作用。但更广泛的影响也同样重要。 AI Agent 不仅仅是现有技术的升级;它们代表着组织运营、竞争和创新方式的转变。采用这些系统的企业可以看到效率和生产力的显著提高,而那些犹豫不决的企业可能会发现自己很难跟上。
以下是谷歌白皮书中最重要的五个见解,以及它们对商业人工智能未来的意义。
1.AI Agent不仅仅是更智能的模型
谷歌认为, AI Agent 与传统语言模型有着根本区别。虽然GPT-4o或谷歌的Gemini等模型擅长生成单轮响应,但它们的能力仅限于从训练数据中学到的知识。相比之下, AI Agent 旨在与外部系统交互、从实时数据中学习并执行多步骤任务。
论文指出:“传统模型中的知识仅限于训练数据中可用的内容。 Agent 通过工具与外部系统的连接来扩展这些知识。”
这种差异不仅仅是理论上的。想象一下一个负责推荐旅行行程的传统语言模型。它可能根据常识提出建议,但缺乏预订航班、查看酒店空房或根据用户反馈调整建议的能力。然而, AI Agent 可以做所有这些事情,将实时信息与自主决策相结合。
这种转变将 Agent 定位为能够处理复杂工作流程的新型数字工作者。对于企业而言,这可能意味着以前需要多个人工角色才能完成的任务将实现自动化。通过整合推理和执行, Agent 可能成为从物流到客户服务等各个行业不可或缺的一部分。
2. 认知架构为他们的决策提供动力
AI Agent 的核心功能是其认知架构,谷歌将其描述为推理、规划和决策的框架。这种架构称为编排层,允许 Agent 循环处理信息,并整合新数据以改进其行动和决策。
谷歌将这个过程比作厨师在忙碌的厨房里准备一顿饭。厨师收集食材,考虑顾客的喜好,并根据反馈或食材供应情况根据需要调整菜谱。同样, AI Agent 收集数据,推理下一步行动,并调整其行动以实现特定目标。
编排层依靠先进的推理技术来指导决策。推理和行动 (ReAct)、思维链 (CoT)和思维树 (ToT)等框架提供了分解复杂任务的结构化方法。例如,ReAct 使 Agent 能够实时结合推理和行动,而 ToT 则允许它同时探索多种可能的解决方案。
这些技术使 Agent 能够做出不仅被动而且主动的决策。根据该论文,这使它们具有高度的适应性,能够以传统模型无法做到的方式管理不确定性和复杂性。对于企业而言,这意味着 Agent 可以承担诸如解决供应链问题或分析财务数据等任务,并且具有一定的自主性,从而减少了对持续人工监督的需求。
3. 工具将智能体的范围拓展到训练数据之外
传统的人工智能模型通常被描述为“静态知识库”,仅限于它们所接受的训练。另一方面, AI Agent 可以访问实时信息并通过工具与外部系统交互。这种能力使它们在实际应用中具有实用性。
论文解释道:“工具弥补了 Agent 内部能力与外部世界之间的差距。”这些工具包括 API、扩展和数据存储,允许 Agent 获取信息、执行操作并检索随时间演变的知识。
例如,负责规划商务旅行的 Agent 可以使用 API 扩展来查看航班时刻表,使用数据存储来检索旅行政策,使用地图工具来查找附近的酒店。这种与外部系统动态交互的能力将 Agent 从静态响应者转变为业务流程的积极参与者。
谷歌还强调了这些工具的灵活性。例如,功能允许开发人员将某些任务转移到客户端系统,让企业更好地控制 Agent 如何访问敏感数据或执行特定操作。这种灵活性对于金融和医疗保健等行业来说至关重要,因为合规性和安全性至关重要。
4.检索增强生成使Agent更加智能
AI Agent 设计中最有前景的进步之一是检索增强生成(RAG) 的集成。当 Agent 的训练数据不足时,该技术允许 Agent 查询外部数据源(例如矢量数据库或结构化文档)。
该论文解释道:“数据存储通过提供对更动态和最新信息的访问来解决(静态模型的)局限性”,并描述了 Agent 如何实时检索相关数据以根据事实信息做出反应。
基于 RAG 的 Agent 在信息快速变化的领域尤其有价值。例如,在金融领域, Agent 可以在提出投资建议之前获取实时市场数据。在医疗保健领域,它可以检索最新研究以提供诊断建议。
这种方法还解决了人工智能的一个长期问题:幻觉,即产生不正确或虚假的信息。通过将响应建立在现实世界的数据上, Agent 可以提高准确性和可靠性,使其更适合高风险应用。
5. Google 提供加速代Agent部署的工具
白皮书不仅包含丰富的技术细节,还为希望实施 AI Agent 的企业提供了实用指导。谷歌重点介绍了两个关键平台:用于 Agent 开发的开源框架LangChain和用于大规模部署 Agent 的托管平台 Vertex AI 。
LangChain 允许开发人员将推理步骤和工具调用链接在一起,从而简化了构建 Agent 的过程。同时,Vertex AI 提供测试、调试和性能评估等功能,使部署生产级 Agent 变得更加容易。
论文指出:“Vertex AI 允许开发人员专注于构建和完善他们的 Agent ,而基础设施、部署和维护的复杂性则由平台本身管理。”
这些工具可以降低那些想要尝试 AI Agent 但缺乏广泛技术专业知识的企业的准入门槛。然而,它们也引发了人们对广泛采用 Agent 的长期后果的质疑。随着这些系统变得更加强大,企业将需要考虑如何在效率提升与潜在风险之间取得平衡,例如过度依赖自动化或对决策透明度的道德担忧。
这一切意味着什么
谷歌的AI Agent 白皮书详细而雄心勃勃地描绘了 AI 的发展方向。对于企业来说,信息很明确:AI Agent 不仅仅是一个理论概念,它们还是一种可以重塑企业运营方式的实用工具。
然而,这种转变不会一蹴而就。部署 AI Agent 需要仔细规划、实验,并愿意重新思考传统的工作流程。正如论文所指出的,“由于支撑其架构的基础模型具有生成性,因此没有两个 Agent 是完全相同的。”
目前, AI Agent 既是机遇也是挑战。投资理解和实施这项技术的企业将获得巨大优势。那些等待的企业可能会发现自己在一个智能、自主系统日益占据主导地位的世界里只能苦苦追赶。
免责声明:
本文所发布的内容和图片旨在传播行业信息,版权归原作者所有,非商业用途。如有侵权,请与我们联系。所有信息仅供参考和分享,不构成任何投资建议。加密货币市场具有高度风险,投资者应基于自身判断和谨慎评估做出决策。投资有风险,入市需谨慎。
关注我们,一起探索AWM!
2024-12-18
领域,智能体能发挥出什么作用?
2024-12-15
2024-12-14
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.