网易首页 > 网易号 > 正文 申请入驻

力压群雄:谷歌Gemini 2.5 Pro成首款完全理解PDF布局的 AI 模型

0
分享至

IT之家 4 月 22 日消息,最新报告指出,谷歌旗下的 Gemini 2.5 Pro 模型能准确解析 PDF 文档的视觉结构,实现精准的视觉引用功能,成为首款能完全理解 PDF 布局的 AI 模型。

IT之家注:谷歌于 3 月 25 日向付费用户和开发者发布 Gemini 2.5 Pro 实验模型,仅隔 4 天时间,谷歌便通过免费 Web 应用向全球用户开放。

Gemini 2.5 Pro 不仅能提取 PDF 文档中的文本内容,还能理解其视觉布局,包括图表、表格和整体排版。

谷歌在开发者文档中表示,该模型具备“原生视觉”(Native Vision)能力,支持处理最多 3000 个 PDF 文件(每个文件上限为 1000 页或 50MB),同时拥有 100 万 token 的超大上下文窗口,未来计划扩展至 200 万 token。

AI 初创公司 Matrisk 的联合创始人 Sergey Filimonov 特别赞扬了 Gemini 2.5 Pro 在 PDF 视觉引用上的表现。

Filimonov 指出,传统的文本分割方法会切断用户与原文的视觉联系,导致无法直观验证信息的来源。甚至在 ChatGPT 中,点击引用也只能下载 PDF,迫使用户自行判断模型是否“幻觉”,这严重损害了用户信任。

过去,引用文档内容往往只能高亮大段无关文本,精准度极低。Gemini 2.5 彻底改变这一现状,它不仅能将提取的文本片段映射回原始 PDF 的确切位置,还能以前所未有的精度锁定特定句子、表格单元甚至图像。

这种技术突破为用户提供了直观的视觉反馈,例如在询问房屋费率变化时,系统能直接高亮文档中相关数据(如 15.4% 的费率变化),并标注来源依据。

这种清晰度和交互性是现有工具无法企及的。Gemini 2.5 不仅优化了现有流程,更开启了全新的文档交互模式。

相比之下,Gemini 2.5 以 0.804 的 IoU(交并比)精度大幅领先其他模型,如 OpenAI 的 GPT-4o(0.223)和 Claude 3.7 Sonnet(0.210),展现出惊人的空间理解能力。

提供商模型IOU简评Gemini2.5 Pro0.804非常优秀Gemini2.5 Flash0.614有时表现不错Gemini2.0 Flash0.395
OpenAIgpt-4o0.223
OpenAIgpt-4.10.268
OpenAIgpt-4.1-mini0.253
Claude3.7 Sonnet0.210

Gemini 2.5 的潜力远不止于文本定位。它还能从 PDF 中提取结构化数据,同时明确标注每个数据的来源位置,解决下游决策中因数据来源不明而产生的信任障碍。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
这一次,再多的名和利,也拯救不了副军级职位的阎维文

这一次,再多的名和利,也拯救不了副军级职位的阎维文

阿芒娱乐说
2026-01-02 11:41:22
跨年夜,乌军大规模袭击“俄控区”庆祝新年的平民,引发大火,致27死31伤!当地曾被誉为“乌克兰粮仓”,此前公投加入俄罗斯

跨年夜,乌军大规模袭击“俄控区”庆祝新年的平民,引发大火,致27死31伤!当地曾被誉为“乌克兰粮仓”,此前公投加入俄罗斯

每日经济新闻
2026-01-02 19:44:04
海警突发激烈对峙!为拦截美军火船入台,解放军做好随时开火准备

海警突发激烈对峙!为拦截美军火船入台,解放军做好随时开火准备

荐史
2025-12-30 22:12:12
朝鲜战争中,美军原本已接近击败中国,却碰上了中国决死的师长

朝鲜战争中,美军原本已接近击败中国,却碰上了中国决死的师长

兴趣知识
2025-12-18 01:04:23
为了拿奖,面相都变了?

为了拿奖,面相都变了?

橘子娱乐
2026-01-02 20:57:00
冠军联赛:惊现147,连爆大冷世界第14两胜两负,中国00后1胜2负

冠军联赛:惊现147,连爆大冷世界第14两胜两负,中国00后1胜2负

求球不落谛
2026-01-03 04:30:31
梁靖崑:最低调富二代!骑电动车带两儿子,甘心被明星老婆拿捏

梁靖崑:最低调富二代!骑电动车带两儿子,甘心被明星老婆拿捏

篮球看比赛
2026-01-02 11:12:31
“他们逼我说台湾是中国的,不然就不救我!”一石激起千层浪

“他们逼我说台湾是中国的,不然就不救我!”一石激起千层浪

壹知眠羊
2025-08-10 07:29:29
董卿现状:独自照顾儿子和父母,丈夫曾失联,与婆婆有隔阂

董卿现状:独自照顾儿子和父母,丈夫曾失联,与婆婆有隔阂

细品名人
2025-11-28 07:24:47
上将许世友之子许援朝如今身在何方?他官至少将,身着一身军装,尽显英姿飒爽之态

上将许世友之子许援朝如今身在何方?他官至少将,身着一身军装,尽显英姿飒爽之态

老杉说历史
2025-12-25 21:12:10
一心想骑在人民头上作威作福?“全职考公”这种歪风应当遏制

一心想骑在人民头上作威作福?“全职考公”这种歪风应当遏制

北欧模式
2026-01-01 21:32:49
中国动“真格”了!中方霸气警告:90天内不给358亿赔偿金

中国动“真格”了!中方霸气警告:90天内不给358亿赔偿金

趣生活
2025-12-31 20:59:47
住酒店你遇到过哪些炸裂事?网友:房间不隔音相当于现场直播

住酒店你遇到过哪些炸裂事?网友:房间不隔音相当于现场直播

带你感受人间冷暖
2025-12-20 00:10:07
轰11+10+6帽!徐昕关键隔扣刘传兴割喉庆祝 博主:打出大魔王风采

轰11+10+6帽!徐昕关键隔扣刘传兴割喉庆祝 博主:打出大魔王风采

颜小白的篮球梦
2026-01-02 21:57:43
7票通过,美利坚合众国将被毁?特朗普发文怒吼,表决结果已确定

7票通过,美利坚合众国将被毁?特朗普发文怒吼,表决结果已确定

花花娱界
2026-01-02 14:22:16
拿5166万老四都不稳?乔治重返SF仍无起色 近五战命中率36%辣眼

拿5166万老四都不稳?乔治重返SF仍无起色 近五战命中率36%辣眼

颜小白的篮球梦
2026-01-02 20:20:34
解放军刚鸣金收兵,俄罗斯就抄中国作业,在日本家门口连打2个月

解放军刚鸣金收兵,俄罗斯就抄中国作业,在日本家门口连打2个月

南宫一二
2026-01-02 18:08:59
49岁赵薇广东饭局近照疯传!瘦脱相显凶相,当年小燕子彻底凉透了

49岁赵薇广东饭局近照疯传!瘦脱相显凶相,当年小燕子彻底凉透了

阿纂看事
2025-12-12 09:18:29
震惊!网传深圳一小公司5个月没发工资,老板拉群教员工套钱救急

震惊!网传深圳一小公司5个月没发工资,老板拉群教员工套钱救急

火山詩话
2026-01-01 20:52:25
孟晓苏语出惊人!小产权房征房产税,合法后价值将倍增

孟晓苏语出惊人!小产权房征房产税,合法后价值将倍增

简约装修设计美图
2026-01-03 09:30:03
2026-01-03 10:16:49
IT之家
IT之家
爱科技,爱这里 - 前沿科技人气平台
322624文章数 606859关注度
往期回顾 全部

科技要闻

比亚迪销冠!特斯拉2025年交付量跌逾8%

头条要闻

牛弹琴:伊朗面临40年来最严峻挑战 不是一个好兆头

头条要闻

牛弹琴:伊朗面临40年来最严峻挑战 不是一个好兆头

体育要闻

快船似乎又行了

娱乐要闻

田亮一家新年全家福!森碟变清纯少女

财经要闻

人工智能四问:投资泡沫出现了吗?

汽车要闻

方程豹全年销量超23.4万辆 同比暴增316.1%

态度原创

本地
家居
教育
游戏
公开课

本地新闻

即将过去的2025年,对重庆的影响竟然如此深远

家居要闻

无形有行 自然与灵感诗意

教育要闻

二次函数 定直线问题第2讲,一个视频学会!

《穿越火线》QBZ95的口碑为什么那么好?毕竟都很少见到人用了

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版