网易首页 > 网易号 > 正文 申请入驻

AI读网页,这次真不一样了,谷歌Gemini解锁「详解网页」新技能

0
分享至

机器之心报道

机器之心编辑部

谷歌回归搜索老本行,这一次,它要让 AI 能像人一样「看见」网页。

这是谷歌前不久在 Gemini API 全面上线的URL Context功能(5 月 28 日已在Google AI Studio 中推出),它使 Gemini 模型能够访问并处理来自 URL 的内容,包括网页、PDF 和图像。



Google 产品负责人 Logan Kilpatrick 表示这是他最喜欢的 Gemini API 工具,并推荐大家把这个工具设置为默认开启的「无脑选项」。



那么灵魂一问:这和我平时把链接扔给 AI 对话框里有什么本质区别?感觉我一直在这么做。

区别在于处理深度和工作方式。你平时扔链接,AI 通常会通过一个通用的浏览工具或搜索引擎插件来「看」这个网页,AI 很可能只读取了网页的摘要或部分文本。

而 URL Context 则完全不同。它是一个专为开发者设计的编程接口(API),当开发者在他的程序里调用这个功能时,他是明确地指令 Gemini「把这个 URL 里的全部内容(上限高达 34MB)作为你回答下一个问题的唯一、权威的上下文」,Gemini 会进行深度、完整的文档解析,理解整个文档的结构、内容和数据。

以下是它的能力清单:

  • 深度解析 PDF:能深刻理解 PDF 中的表格、文本结构甚至脚注。
  • 多模态理解:能处理 PNG、JPEG 等图片,并理解其中的图表和图示。
  • 支持多种网页文件:HTML、JSON、CSV 等常见格式均不在话下。

官方 API 文档提供详细的配置教程,除此之外,还可以在 Google AI Studio 直接体验。



Towards Data Science上的一篇文章详细介绍了 URL Context Grounding,作者 Thomas Reid 犀利地将 URL Context Grounding 评价为「RAG的又一颗棺材钉」。



  • 文章地址:
  • https://towardsdatascience.com/googles-url-context-grounding-another-nail-in-rags-coffin/

RAG 是过去几年中用于提升大语言模型回答准确性、时效性和可靠性的主流技术。由于大模型的知识截止于其训练数据,RAG 通过一个外部知识库来为其提供最新的、特定性的信息。

传统的 RAG 流程相对复杂,通常包括以下步骤:

  • 提取内容:从数据源(如网站、文档)中抓取文本。
  • 分块:将长文本切分成更小、更易于处理的片段。
  • 矢量化:使用嵌入模型(Embedding Model)将文本块转换为数字向量,捕捉其语义信息。
  • 存储:将这些向量存储在专门的向量数据库中。
  • 检索:当用户提问时,系统首先在向量数据库中搜索与问题最相关的文本块。
  • 增强与生成:将检索到的相关文本块作为上下文信息,与原始问题一同输入给大语言模型,从而生成更准确、更具针对性的回答。



RAG 架构。图源:Mindful Matrix

Thomas Reid 指出,使用 URL Context Grounding「无需提取 URL 文本和内容、分块、矢量化、存储等」。对于处理公开网络内容这个非常普遍的场景,它提供了一个极其简单的替代方案。

开发者不再需要花费大量时间和精力去搭建和维护一个由多个组件(数据提取、向量数据库等)组成的复杂管道,只需几行代码就能实现更精准的效果。

在 Thomas Reid 提供的示例中,Gemini 仅凭一个指向特斯拉 50 页财报 PDF 的 URL,就准确无误地提取出了位于第 4 页表格中的「总资产」和「总负债」数据,这是仅靠摘要绝无可能完成的任务。



自特斯拉 SEC 10-Q 申报文件第 4 页内容。

以下是我们在 Google AI Studio 中的测试结果。



作者接着测试了 URL Context 挑选其他信息的能力。在 PDF 的末尾,有一封写给即将离开公司的员工的信,概述了他们的遣散条款。



信中提到的退出日期用星号(***)标记,屏蔽退出日期的原因在脚注中给出。

URL Context 准确识别出了脚注中的内容。

  • 根据所提供的文件,员工离职协议中的离职日期被标记为「***」,原因在于某些公司视为隐私或机密的特定非关键信息,已在公开文件中被有意略去。

  • 该文件包含一条对此做法的澄清说明:「本文档中某些已识别的信息已被略去,因为这些信息并非关键信息,且属于公司视为隐私或机密的信息类型,并已用「***」标记以示省略之处。



根据官网介绍,URL Context 采用一个两步检索流程,以平衡速度、成本和对最新数据的访问。

当用户提供一个 URL 时,该工具首先尝试从内部索引缓存中获取内容,以提高速度和成本效益。如果 URL 不在缓存中(比如一个刚刚发布的页面),它会进行实时抓取。

那它的能力边界在哪里呢?官方介绍中也有明确说明。

  • 无法翻越「付费墙」:需要登录或付费才能访问的内容,它无能为力。
  • 专用工具优先:YouTube 视频、Google Docs等有专门 API 处理的内容,它不会涉足。
  • 有明确的容量限制:单次请求最多处理20 个 URL,且单个 URL 内容上限为34MB。

价格方面,它的计费方式非常直观:按处理的内容 Token 数量计费。你提供的 URL 内容越多,被转换成输入 Token 的数量就越多,成本也相应增加。这可能会间接引导开发者进行更高效的应用设计,即精确地提供所需的信息源,而非宽泛地投喂大量不相关的 URL,从而优化成本。

不过话说回来,URL Context Grounding 的出现并非宣告 RAG 的终结,而是对其应用场景的重新划分。对于处理企业内网的海量私有文档、需要复杂检索逻辑和极致安全性的场景,构建一套自主可控的 RAG 系统依然是不可或缺的。

URL Context 揭示了一个行业趋势:基础模型正在将越来越多的「外部能力」内置化。过去需要由应用层开发者承担的复杂数据处理工作,正在被逐步吸收到底层模型的服务中。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
暴跌60%,引来全国牙科关店潮,暴利的牙科生意真的走到了尽头?

暴跌60%,引来全国牙科关店潮,暴利的牙科生意真的走到了尽头?

小熊侃史
2026-01-17 07:50:11
曝特朗普曾强迫13-14岁未成年为其“咬”,爱泼斯坦文件揭事发35年前

曝特朗普曾强迫13-14岁未成年为其“咬”,爱泼斯坦文件揭事发35年前

不掉线电波
2026-01-31 21:31:42
安徽美女道士胡千慧被捕:精通“胡媚术”,九名男徒弟揭露其罪行

安徽美女道士胡千慧被捕:精通“胡媚术”,九名男徒弟揭露其罪行

小熊侃史
2026-01-15 07:05:08
水贝黄金交易平台“云点当”兑付异常,公告称受行业恐慌影响,遭遇三波严重挤兑

水贝黄金交易平台“云点当”兑付异常,公告称受行业恐慌影响,遭遇三波严重挤兑

红星资本局
2026-02-02 19:09:04
太讽刺了!大S一周年祭日,数位明星各有千秋,汪小菲的态度难评

太讽刺了!大S一周年祭日,数位明星各有千秋,汪小菲的态度难评

史行途
2026-02-02 18:22:52
雄鹿为留住字母疯了!让29岁全明星签300万合同,鹈鹕或成大赢家

雄鹿为留住字母疯了!让29岁全明星签300万合同,鹈鹕或成大赢家

你的篮球频道
2026-02-02 15:01:00
春晚阵容曝光!十年来最强的演出阵容,网友:今年春晚总算能看了

春晚阵容曝光!十年来最强的演出阵容,网友:今年春晚总算能看了

阿纂看事
2026-02-02 09:55:11
山东小伙娶只有8岁智商的新娘,笑的合不拢嘴,网友:赚大了!

山东小伙娶只有8岁智商的新娘,笑的合不拢嘴,网友:赚大了!

观察鉴娱
2026-02-01 15:02:49
窦靖童:我妈钱多到用不完,但穷苦潦倒的爸爸,成了我如今的心病

窦靖童:我妈钱多到用不完,但穷苦潦倒的爸爸,成了我如今的心病

璀璨幻行者
2026-01-20 04:29:30
美国记者与周恩来握手后,故意用手帕反复擦手挑衅,周总理见状拿出手帕轻扫手掌后丢弃,用这一招轻松化解了尴尬并予以有力回击

美国记者与周恩来握手后,故意用手帕反复擦手挑衅,周总理见状拿出手帕轻扫手掌后丢弃,用这一招轻松化解了尴尬并予以有力回击

史海孤雁
2025-12-27 20:50:23
斯基拉:阿森纳为托纳利提供高新长约,合同至2031年

斯基拉:阿森纳为托纳利提供高新长约,合同至2031年

懂球帝
2026-02-02 18:00:08
中国人的恐怖“期待”,西方怎么也想不明白,老外都吓傻了!

中国人的恐怖“期待”,西方怎么也想不明白,老外都吓傻了!

毛豆论道
2026-02-01 17:43:14
中信证券:2026年黄金有望涨至6000美元/盎司,银价涨至120美元/盎司

中信证券:2026年黄金有望涨至6000美元/盎司,银价涨至120美元/盎司

北京商报
2026-02-02 11:53:56
贾家被抄家的真实原因,就是贾元春省亲,可惜他们没懂皇帝的用意

贾家被抄家的真实原因,就是贾元春省亲,可惜他们没懂皇帝的用意

铭记历史呀
2026-01-26 19:39:13
马年春晚主持天团大洗牌!老面孔调岗新面孔挑梁,这变动太有看头

马年春晚主持天团大洗牌!老面孔调岗新面孔挑梁,这变动太有看头

复转这些年
2026-01-30 23:38:18
央企设计大院也崩掉了!

央企设计大院也崩掉了!

黯泉
2026-02-01 22:38:13
钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

钱再多有什么用?52岁刘强东上千亿身家,儿子却是他一生的遗憾

墨印斋
2026-01-31 16:37:48
221名女囚流放澳洲,下船时很多怀孕,这批女囚孕育出了一个国家

221名女囚流放澳洲,下船时很多怀孕,这批女囚孕育出了一个国家

千秋文化
2026-01-30 21:45:45
患者感觉近视手术后“做了像没做”,医院解释“半飞秒手术”机器能量衰减,已报不良事件

患者感觉近视手术后“做了像没做”,医院解释“半飞秒手术”机器能量衰减,已报不良事件

大风新闻
2026-01-29 23:39:04
S家又开始了!全家上阵使出三连招,就为榨干大S一周年忌日热度

S家又开始了!全家上阵使出三连招,就为榨干大S一周年忌日热度

萌神木木
2026-02-01 17:01:19
2026-02-02 21:36:49
机器之心Pro incentive-icons
机器之心Pro
专业的人工智能媒体
12238文章数 142562关注度
往期回顾 全部

科技要闻

阿里筑墙,腾讯寄生,字节偷家

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

头条要闻

捧红王菲、那英的袁惟仁走了 曾被陶晶莹公开调侃

体育要闻

澳网男单决赛,属于阿尔卡拉斯的加冕仪式

娱乐要闻

57岁音乐人袁惟仁去世,家属发文悼念

财经要闻

金银暴跌 全球股市遭遇“黑色星期一”

汽车要闻

雷克萨斯LC500将于今年底停产 "最美雷克萨斯"谢幕

态度原创

亲子
家居
数码
旅游
艺术

亲子要闻

萌娃和爸爸抢妈妈,逻辑太强了,让爸爸无奈苦笑

家居要闻

现代几何彩拼 智焕童梦居

数码要闻

马年含金量最高的耳机!华为联名周大福 FreeClip 2黄金耳饰细节公布

旅游要闻

雪域同心·青春融情——记台青冬令营新疆之旅

艺术要闻

马斯克花5万买的折叠屋,是预制住宅的未来吗?

无障碍浏览 进入关怀版