网易首页 > 网易号 > 正文 申请入驻

亚马逊开源感知智能体工具:标注与验证功能正式发布

0
分享至


今天,亚马逊 AGI 实验室宣布开源发布感知智能体工具套件的首批两项基础组件:标注(Annotation)与验证(Verification)。标注功能允许用户直接指出工作流中需要改动的内容,无需再通过文字描述变更需求;验证功能则让智能体能够对照预期目标自主检查其输出结果。两者共同构成了全新的多模态交互模式,旨在提升人机协作效率。

感知智能体的能力边界

感知智能体是一种能够像人类一样查看并解读屏幕、网页等视觉界面的 AI 智能体。它不仅能读取代码或解析文本,还能以足够高的精度感知视觉输出,从而据此采取有效行动。例如,感知智能体可以识别某个按钮偏离中心两个像素、边框圆角与设计规范不符,或者由于某次状态切换静默失败,导致第三次点击时导航流程中断等问题。

感知能力固然重要,但让智能体能够基于所感知的内容采取行动、并支持用户实时反馈的交互模式,才是真正的关键所在。标注与验证这两项基础组件,正是为了将感知能力转化为更高效的人机协作体验而设计的。

标注:让反馈像指点一样自然

当用户与智能体共享同一屏幕视图时,理应能够像与人类同事协作一样,直接指出、圈画并描述所看到的内容,而非依赖打一段话来解释问题所在。

标注组件引入了一种自然的交互方式,以提升输出准确性。在网站或网页上,用户点击某个元素,工具即可自动获取该元素的文档对象模型(DOM)选择器、边界框及计算样式;在文档、图表等视觉界面上,用户可以直接手绘标记:圈出表示"关注这里",划叉表示"删除此处",箭头表示"移动到这里"。用户得以精准传达自己所看到的内容。

使用方式:用户可通过浏览器扩展程序或直接调用 Nova Act Annotator 技能进行标注。在浏览页面时打开扩展程序,选择模式(绘图、元素或点选),对需要修改的内容进行标记。标注结果将保存为结构化产物,作为智能体的输入,智能体可据此精准执行后续操作。

协作设计:标注功能并不局限于用户与智能体之间的一对一循环。任何人都可以参与标注——设计师可以圈出布局问题,质量工程师可以记录异常流程,并将这份结构化反馈发送给后续迭代的执行方,无论是智能体还是团队中的其他开发者。反馈本身即成为上下文,无需再将意见转化为可能丢失细节的文字消息或工单。

Nova Act Annotator(技能 + Chrome 扩展)今日正式开源。

验证:让生成与校验形成闭环

长期以来,生成与验证被视为两个独立环节:先构建软件,再进行测试。这种分离在构建成本高昂、周期漫长的时代自有其合理性。

然而,借助大语言模型,生成过程如今几乎可以瞬间完成。但验证环节——确认输出结果是否真正符合预期——依然全靠人工,耗时且低效。这正是"氛围编程"(Vibe Coding)的悖论所在:60 秒内生成一个完整应用,接下来却要花三个小时验证它是否真的能正常运行。

共享感知能力打破了这一壁垒。当人类与智能体能够观察同一视觉输出并各自推理其内容时,生成与验证就可以形成一个持续循环,无需反复的人工中间干预。智能体可以像人工审查者一样看到自己构建的成果,感知按钮错位或移动端布局错乱等问题。

工作原理:智能体在代码生成完成后调用 Nova Act Visual Verifier 技能,该技能启动渲染后的应用程序并自动执行验证流程。首先运行确定性检查,直接从 DOM 中读取计算后的 CSS 样式,无需 AI 介入即可即时捕获视觉偏差;随后执行行为检查,智能体以人类测试者的方式端到端地走完用户操作流程,捕捉功能性回归问题。

生成与验证相结合的方式,帮助亚马逊团队在内部构建了精度更高的 Web 应用。事实上,标注扩展程序本身及团队的内部工具,也均是借助这套工具构建完成的。

Nova Act Visual Verifier 技能今日正式开源。

开放共建,持续演进

标注与验证是亚马逊 AGI 实验室团队在实践中验证有效的两项基础组件。团队选择以开放方式构建感知智能体工具套件,正是因为这类交互模式会随着更多人的使用、压力测试和二次开发而不断完善。

欢迎立即体验,并告知还缺少哪些功能。接下来该优先构建哪些基础组件,团队希望与社区共同探讨决定。

Q&A

Q1:感知智能体的标注功能具体是怎么用的?

A:用户可通过 Nova Act Annotator 的浏览器扩展程序或直接调用对应技能来使用标注功能。在浏览网页时打开扩展,选择绘图、元素或点选模式,对需要修改的地方进行标记。在网页上点击元素,工具会自动捕获其 DOM 选择器、边界框和计算样式;在文档或图表等视觉界面上,则可以手绘圈注、划叉或箭头,直观传达修改意图。标注结果保存为结构化产物,智能体可据此精准执行操作,无需再用文字反复描述。

Q2:Nova Act Visual Verifier 是如何自动验证应用输出的?

A:智能体在生成代码后调用 Nova Act Visual Verifier 技能,该技能会启动渲染后的应用并自动运行两类检查:首先是确定性检查,直接读取 DOM 中的 CSS 计算样式,无需 AI 参与即可即时发现视觉偏差;然后是行为检查,智能体模拟真实用户操作,端到端走完完整的用户流程,捕捉功能性回归问题。两类检查组合使用,使生成与验证形成连续闭环,大幅减少人工干预。

Q3:感知智能体工具套件的标注功能支持多人协作吗?

A:支持。标注功能并不限于用户与智能体之间的一对一交互,而是面向团队协作设计的。设计师可以圈出布局问题,质量工程师可以标记异常操作流程,生成的结构化标注文件可以直接发送给智能体或其他开发人员。这样一来,反馈本身就携带了完整上下文,不再需要将问题转化为文字消息或工单,从而避免信息在传递过程中丢失。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
苹果史上最低价的 iPhone 上架,仅需二千多!

苹果史上最低价的 iPhone 上架,仅需二千多!

XCiOS俱乐部
2026-07-01 19:07:33
比经济拮据更沉重的是中国60后开始退场后,正在逼近那些隐性压力

比经济拮据更沉重的是中国60后开始退场后,正在逼近那些隐性压力

王二哥老搞笑
2026-07-01 06:20:07
氟化工大利好!外资最新重仓3家低价氟化工,最高5元,最低3元

氟化工大利好!外资最新重仓3家低价氟化工,最高5元,最低3元

长风价值掘金
2026-07-01 15:50:24
詹姆斯宣布征战第24季,非湖人,下一站在哪?

詹姆斯宣布征战第24季,非湖人,下一站在哪?

体坛观察猿
2026-07-02 01:31:34
大连市被严重低估的 3 家社区医院,名医坐镇,当地人超认可!

大连市被严重低估的 3 家社区医院,名医坐镇,当地人超认可!

荷兰豆爱健康
2026-07-01 16:32:10
7月1日起,电价调整!

7月1日起,电价调整!

新浪财经
2026-07-01 18:53:08
状态封神!夺冠大势已定?仅四支劲旅可拦法国世界杯登顶之路!

状态封神!夺冠大势已定?仅四支劲旅可拦法国世界杯登顶之路!

田先生篮球
2026-07-01 09:21:37
是好是坏,李嘉诚突然杀回楼市!手持400亿现金,这次他要抄底了

是好是坏,李嘉诚突然杀回楼市!手持400亿现金,这次他要抄底了

西楼知趣杂谈
2026-07-01 10:25:18
“嫂子亲自下场营业” 哈兰德女友社媒上感谢中国球迷,曾分享美食发布穿旗袍照片,被网友称接地气

“嫂子亲自下场营业” 哈兰德女友社媒上感谢中国球迷,曾分享美食发布穿旗袍照片,被网友称接地气

红星新闻
2026-07-01 15:56:30
她是首位被枪决的女明星,曾红遍全国,临刑前大喊:这不公平!

她是首位被枪决的女明星,曾红遍全国,临刑前大喊:这不公平!

人生录
2026-07-01 17:04:10
落叶归根?曝女篮顶级中锋回归加盟劲旅,补齐短板,全力冲总冠军

落叶归根?曝女篮顶级中锋回归加盟劲旅,补齐短板,全力冲总冠军

萌兰聊个球
2026-07-01 20:30:10
前童星戴维·蔡斯死因确认:艾滋病夺命,仅35岁

前童星戴维·蔡斯死因确认:艾滋病夺命,仅35岁

浅遇时光
2026-07-01 01:17:18
外国女孩模仿哈兰德爆火全网 网友直呼还原度拉满

外国女孩模仿哈兰德爆火全网 网友直呼还原度拉满

快科技
2026-07-01 16:30:15
一个网红吐槽俄罗斯经济,竟引爆创纪录的60%悲观情绪

一个网红吐槽俄罗斯经济,竟引爆创纪录的60%悲观情绪

我是一个养虾人
2026-07-01 01:31:02
曼联冤大头! 8500 万嫌贵放走世界级天才,转头要砸 1 亿备选

曼联冤大头! 8500 万嫌贵放走世界级天才,转头要砸 1 亿备选

澜归序
2026-07-02 01:41:26
世界杯巨大争议!凯恩被扑到无点,图赫尔暴怒,名宿:大错特错

世界杯巨大争议!凯恩被扑到无点,图赫尔暴怒,名宿:大错特错

奥拜尔
2026-07-02 00:53:39
温网女单乱了:随着克雷吉茨科娃2-1逆转,2大世界前十名将已出局

温网女单乱了:随着克雷吉茨科娃2-1逆转,2大世界前十名将已出局

侧身凌空斩
2026-07-02 02:32:20
俄罗斯GDP,1993年是中国的97%,2009年是中国的23.5%,2025年呢

俄罗斯GDP,1993年是中国的97%,2009年是中国的23.5%,2025年呢

混沌录
2026-06-24 22:25:07
贝里瓦尔:几个月前人们甚至觉得我们进不了世界杯,这次征途已够本

贝里瓦尔:几个月前人们甚至觉得我们进不了世界杯,这次征途已够本

懂球帝
2026-07-02 00:37:22
全程面色阴沉!郑丽文罕见表态,一句话道尽台湾无奈现状!

全程面色阴沉!郑丽文罕见表态,一句话道尽台湾无奈现状!

故事终将光明磊落
2026-07-01 18:35:13
2026-07-02 03:19:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19781文章数 49712关注度
往期回顾 全部

科技要闻

Claude Code被曝“植入木马”识别中国用户

头条要闻

凯恩梅开二度 英格兰2-1逆转民主刚果将战墨西哥

头条要闻

凯恩梅开二度 英格兰2-1逆转民主刚果将战墨西哥

体育要闻

卖球衣救子的门将,把德国扑出了世界杯

娱乐要闻

77岁牛群公证裸捐全部财产,清贫独居坚持月捐

财经要闻

新氧贷款:宣传年化15%,实际顶格24%

汽车要闻

同比暴涨188.4% 方程豹6月热销35607台

态度原创

数码
游戏
艺术
手机
公开课

数码要闻

华硕a豆高速固态U盘上架:280-959元

索尼停产PS实体版!外媒怒赞任天堂:钥匙卡是对的

艺术要闻

西安美术学院,2026届油画系硕士研究生毕业作品选(二)

手机要闻

TCL华星宣布独供REDMI K90至尊版屏幕:165Hz高刷 40+款游戏原生适配

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版