![]()
谷歌正秘密为其企业级产品Gemini Enterprise开发一项新功能:一个多智能体(multi-agent)系统,它能够扮演联席科学家或研究员的角色,帮助用户提炼想法,实现研究自动化
具体来说,该系统的工作流程是:接收一个主题和一套评估标准,生成大量想法,然后启动一个智能体团队,以锦标赛(tournament-style)的形式对这些想法进行评估
值得注意的是,该系统能够让Gemini就单个问题持续运行约40分钟,这对于一个面向用户的产品而言,是一次非常长的连续运行
在运行结束后,用户会收到一份根据所选标准从优到劣排序的想法列表,一次运行可产出约100个想法
![]()
对于每个想法,用户会得到概述、详细描述、评审摘要、完整评审报告以及专门的锦标赛表现报告。这份锦标赛表现报告会作为一项独立输出,可供单独浏览。所有生成的想法都是可选的,方便用户专注于特定选项并进行更深入的探索
![]()
两款核心智能体:“想法生成”与“联席科学家”
在目前的预览版中,谷歌准备了三款预置智能体,其中两款建立在这一多智能体锦标赛系统之上
![]()
一款名为“想法生成”(Idea Generation)。用户提供一个主题,该智能体便会启动多智能体工作流,通过锦标赛式评估来生成与该主题相关的想法并进行排序
另一款名为“联席科学家”(Co-scientist),更侧重于科学家和研究人员。它允许用户指定一个研究课题,提供额外数据,然后由一个智能体团队通过相同的锦标赛机制来生成和评估想法,但更聚焦于研究和科学用例
L3级AI的体现:强大的算力投入
这一设置最引人注目的方面之一,是其背后巨大的算力投入。
让智能体就单个任务工作约40分钟,与典型的智能体工具相比,算力消耗相当大。在整个运行期间,系统会持续对问题进行迭代
![]()
与现有的智能体实现相比,这似乎是一个重要的进步。即使是像ChatGPT中那些能够使用浏览器模式的高级智能体,通常也受到有限的上下文窗口和时间预算的限制。相比之下,谷歌的这种方法被设计成一个面向用户的产品,直接向企业客户开放了非常高的算力
![]()
这也与“L3级AI”的理念相符,即智能体能够持续较长时间处理一个问题。在这种背景下,单任务运行40分钟是一个有力的例证
目前,所有这些功能都出现在开发中的Gemini Enterprise内部,尚未对普通用户开放
不止于原始建议,输出结构化研究方向
在实践中,其主要输出是一套经过提炼的想法
但这些不仅仅是原始建议,而是结构化的研究方向。考虑到输入的数据和原始问题,这些方向可能带来极具价值的洞见。这体现了谷歌正致力于为组织、企业和研究团队提供极其强大的智能体
![]()
当该功能最终发布时,可能会是一次重大飞跃,特别是如果这些智能体最终由尚未发布的Gemini 3 Pro驱动。目前,Gemini 3 Pro尚未在Gemini Enterprise中可用,因此尚不清楚驱动这些实验性智能体的具体模型。
此外,该系统还有一个工作流程细节:当用户提交提示时,系统会首先展示一份计划中的评估和想法维度的摘要。用户在审查并批准该摘要后,才能启动实际任务,以确保在投入大量算力之前,初始提示被正确理解
另一项新功能:与文档对话
除了多智能体锦标赛流程外,还有另一款名为“与文档对话”的智能体,它拥有一个独立的UI
该智能体允许用户上传最大30MB的PDF文件,并与这些文档进行明确的对话。其目标是让模型能够分析和整合多达30MB的PDF内容到上下文,以便用户从现有文档中提取更有意义的信息。
该功能同样是Gemini Enterprise的一部分,尚未发布,且目前在生产环境中无法使用。
在Gemini Enterprise正在开发的多项功能中,多智能体锦标赛工作流和专注于文档的智能体最为突出。
特别是基于锦标赛的多智能体设置,看起来是一个突破性的产品方向,其他LLM提供商尚未真正提供达到这种水平的服务。多智能体锦标赛在面向用户的工具中仍然很少见
一旦这些智能体更加成熟,看到它们正式的评估和基准测试将非常有价值。仅从描述来看,“联席科学家”智能体对于那些积极探索新科学方向的大型组织和研究团队来说,已经像一个非常有吸引力的工具。
目前尚不清楚这些智能体将于何时发布,也不确定是否会向企业客户之外的用户提供,但这绝对是值得关注的动向
参考:
https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.