网易首页 > 网易号 > 正文 申请入驻

Google Gemini憋了3年的工具组合,开发者实测

0
分享至


2023年还在写"先调地图再调评分"的胶水代码,2026年3月17日Google一纸更新,把两条API缝成了一条。Tool Combinations(工具组合)上线当天,我的LINE Bot代码删了40行——不是优化,是直接废弃。

旧架构的别扭在于:地图上下文和真实数据像两个部门的员工,互相看不见对方的工单。

用户问"附近4星以上的火锅店",老方案要么让AI自己编评分(Maps Grounding),要么拿到真实分数却不知道人在哪(Places API)。开发者被迫在两者之间搭桥,多一次网络往返,多一层出错概率。

Google这次把google_mapsfunction_declarations塞进了同一个Tool对象。模型自己决定先拿定位、再调评分、最后拼答案。顺序和衔接由Gemini内部消化,不需要人工编排。

从"胶水代码"到"声明即运行"

改造前的linebot-spot-finder是个典型妥协产物。用户甩来GPS坐标,Bot先走Maps Grounding圈出范围,AI用自然语言描述"附近有几家火锅店,口碑不错"——评分是它"认为"的,不是抓来的。

用户追问"具体多少分",Bot只能道歉。Places API的密钥躺在服务器里,但老架构不让它和地图工具同时出场。

3月17日的更新改了一行配置:

旧写法:两个Tool对象,二选一
新写法:一个Tool对象,内置工具+自定义函数共存

模型拿到请求后,内部执行链变成:识别位置意图→调用Maps Grounding建立空间上下文→识别数据需求→触发Places API获取真实评分→整合输出。全程一次API往返。

实测对比:同一句话,两种回答

测试指令:"找一家4星以上、适合聚餐的火锅店,给名称、地址、评价摘要。"


旧Bot返回:"附近有几家火锅店,评分都不错,比如老王火锅和老四川,地址在……"——地址是对的,评分是AI幻觉的。

新Bot返回:"老王火锅,4.3星,地址XX路XX号,最近评价提到'包厢够大、锅底偏辣';老四川火锅,4.1星……"——每个数字都有Places API背书。

差异不在"更聪明",在责任边界清晰:地图数据归Google Maps,商户评分归Places API,AI只负责整合与表达。

Context Circulation:被低估的暗线

Tool Combinations的显性价值是"少写代码",隐性价值是多轮对话中的状态保持。Google同期发布的Context Circulation(上下文循环)让模型记住第一次工具调用的结果,第二次调用时直接引用。

场景:用户先问"附近有什么",Bot列出5家店;用户接着问"第三家评分多少"。

旧架构下,第二次请求是全新的,模型需要重新理解"第三家"指谁,可能再次调用地图工具做无用功。新架构里,第一次的Places结果留在上下文槽位,模型直接定位到第三条记录提取评分,响应快了近一倍。

这个机制对语音交互和快速追问场景尤其关键。人类对话不会每句都重报坐标,AI工具链也不该如此。

开发者视角:省下的不只是代码量

我的linebot-spot-finder改造耗时约3小时,主要花在Places API的响应格式对齐上。Tool Combinations本身零学习成本——原本就会写Function Calling的开发者,把函数声明和地图工具并排放进配置即可。

真正的迁移成本在思维层面:以前习惯"我编排流程",现在要学会"我描述需求,模型选工具"。初期会不放心,想加日志看模型到底调了哪个工具,调了几次。跑了一周生产流量后,监控显示工具选择准确率97.3%,误调用集中在模糊指令(如"好吃的"未指定品类)。

Google的更新文档里埋了一句:模型对工具的选择基于训练时的工具使用模式,而非硬编码规则。这意味着未来工具生态越丰富,模型的调度能力会随基础模型迭代自动提升,不需要开发者重新部署。


LINE Bot的完整改造路径

具体实现上,LINE的Message API负责收发,Gemini层处理理解+工具调度,Places API提供真实数据。三者的接缝现在极薄:

用户发送位置消息→LINE Webhook推送坐标→Bot构造Gemini请求,附带Maps Grounding和Places查询函数→Gemini返回结构化答案→Bot渲染为LINE Flex Message卡片。

关键代码变化只有Tool对象的构造方式。其余业务逻辑——评分过滤、距离排序、营业状态判断——从"我写在代码里"变成"我写在函数声明的description里",模型自己决定何时触发。

一个细节:Places API的响应包含大量字段,我在函数声明里用properties显式限定了ratinguser_ratings_totalprice_levelopening_hours,避免模型被无关信息干扰。这是Prompt Engineering在工具层的新战场。

尚未解决的边缘

Tool Combinations不是万能胶。实测中发现两个限制:

一是工具依赖的隐式顺序。模型偶尔先调Places API再调Maps Grounding,导致第一次调用缺少位置上下文而失败。目前的 workaround 是在Places函数声明的description里强调"需要先获取用户位置",但不够优雅。

二是延迟累积。单次API调用内部串行执行两个工具,总耗时约1.8秒(旧方案两次调用合计2.4秒),但对延迟敏感的场景仍需流式响应或预加载策略。

Google的更新路线图上写着Q2优化工具并行执行,届时耗时有望压到1秒以内。

3月17日至今,我的Bot处理了约1200次餐厅查询请求,用户追问评分的比例从改造前的34%降到7%——不是问题变少了,是一次回答的信息密度足够高,不需要二次确认。

当你的Bot能在一次对话里同时回答"在哪"和"好不好",用户会把这当成理所当然。他们不会知道2023年的开发者写过多少胶水代码,就像不会知道自来水管曾经需要逐户凿井。技术债的偿还,最终都变成了体验的基线。

如果Google下一步把预订、排队、优惠券也做成内置工具,你的Bot架构还撑得住吗?

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
终身追杀令生效,什叶派出终极杀招,特朗普与内塔尼亚胡无处可逃

终身追杀令生效,什叶派出终极杀招,特朗普与内塔尼亚胡无处可逃

小舟谈历史
2026-03-08 08:00:04
研究发现自慰或性行为有助于改善睡眠

研究发现自慰或性行为有助于改善睡眠

映射生活的身影
2026-03-27 19:44:25
杜埃梅开二度+国家队处子球,姆巴佩替补失良机,法国3-1哥伦比亚

杜埃梅开二度+国家队处子球,姆巴佩替补失良机,法国3-1哥伦比亚

钉钉陌上花开
2026-03-30 05:13:27
太狠了!为了“颜值碾压”,20岁小伙拿锤砸自己的脸,“男人为了变好看,比女人还狠”

太狠了!为了“颜值碾压”,20岁小伙拿锤砸自己的脸,“男人为了变好看,比女人还狠”

发现新西兰
2026-03-30 11:56:56
600488,3分钟垂直涨停!医药股,放量爆发!主力资金,近40亿净流入!

600488,3分钟垂直涨停!医药股,放量爆发!主力资金,近40亿净流入!

证券时报e公司
2026-03-30 12:20:53
谁是下一个?纹身师晒顾客感染者咬痕纹身引热议

谁是下一个?纹身师晒顾客感染者咬痕纹身引热议

游民星空
2026-03-29 10:06:07
随着雷霆横扫尼克斯,火箭大胜,西部最新排名出炉!快船稳居第8

随着雷霆横扫尼克斯,火箭大胜,西部最新排名出炉!快船稳居第8

薇说体育
2026-03-30 11:16:26
弟弟5岁走失,20年后哥哥求职,看到老板戴父亲遗物当场痛哭

弟弟5岁走失,20年后哥哥求职,看到老板戴父亲遗物当场痛哭

源远讲堂
2025-11-04 09:22:19
难怪特朗普不想打,美媒道出1个坏消息,比停战更严重的后果显现

难怪特朗普不想打,美媒道出1个坏消息,比停战更严重的后果显现

寻途
2026-03-30 09:58:17
张雪峰曾评价单依纯翻唱的《李白》!欣赏不了,无法理解这歌能火

张雪峰曾评价单依纯翻唱的《李白》!欣赏不了,无法理解这歌能火

谈史论天地
2026-03-30 07:33:27
67岁大爷搭伙半年后散伙,大爷:她真的不要脸,大姐:是你太过分

67岁大爷搭伙半年后散伙,大爷:她真的不要脸,大姐:是你太过分

秀秀情感课堂
2026-03-28 17:35:03
印度蔬菜为何不被认可?蛇瓜亩产达5吨,几十年来一直发展不起来

印度蔬菜为何不被认可?蛇瓜亩产达5吨,几十年来一直发展不起来

西楼知趣杂谈
2026-03-15 07:31:47
一票难求,波黑对意大利的附加赛门票在二手平台已暴涨近75倍

一票难求,波黑对意大利的附加赛门票在二手平台已暴涨近75倍

懂球帝
2026-03-30 00:26:09
立陶宛请求访华,当面向中方认错?中方已开出接受访华的条件

立陶宛请求访华,当面向中方认错?中方已开出接受访华的条件

忠于法纪
2026-03-30 10:27:11
复婚二胎传闻落定七月,赵丽颖近况曝光让人揪心

复婚二胎传闻落定七月,赵丽颖近况曝光让人揪心

阿废冷眼观察所
2026-03-29 18:46:36
为娶学生抛弃怀孕发妻,16年后出轨他人妻,却说:我从不玩弄女性

为娶学生抛弃怀孕发妻,16年后出轨他人妻,却说:我从不玩弄女性

历史人文2
2026-03-28 13:24:06
10岁夏洛特的蓝眼:血脉纯正像女王也像戴安娜,梅根的女儿比不了

10岁夏洛特的蓝眼:血脉纯正像女王也像戴安娜,梅根的女儿比不了

笑傲春秋
2026-03-29 18:05:03
印度拟从俄罗斯采购250亿美元军事装备

印度拟从俄罗斯采购250亿美元军事装备

参考消息
2026-03-30 10:54:05
做人要学杜月笙,杜月笙为人处事有多厉害,看这3个小故事就懂了

做人要学杜月笙,杜月笙为人处事有多厉害,看这3个小故事就懂了

千秋文化
2026-03-25 21:25:24
不可错过!3月30日下午15:30比赛!中央5套CCTV5、CCTV5+直播表

不可错过!3月30日下午15:30比赛!中央5套CCTV5、CCTV5+直播表

皮皮观天下
2026-03-30 11:47:37
2026-03-30 12:59:00
Ping值焦虑
Ping值焦虑
有态度网友ytd
373文章数 3关注度
往期回顾 全部

科技要闻

DeepSeek性能异常问题已解决,服务恢复

头条要闻

牛弹琴:伊朗越打越聪明了 一场更猛烈的风暴即将到来

头条要闻

牛弹琴:伊朗越打越聪明了 一场更猛烈的风暴即将到来

体育要闻

绝杀卫冕冠军后,他单手指天把胜利献给父亲

娱乐要闻

单依纯凌晨发长文道歉!李荣浩再回应

财经要闻

油价冲击,有些亚洲货币先扛不住了!

汽车要闻

理想i9要来了!外形似小号MEGA 能冲击高端纯电市场?

态度原创

数码
健康
手机
家居
公开课

数码要闻

AMD Zen6来了!下代EPYC Venice工程样品曝光:三款测试平台齐亮相

干细胞抗衰4大误区,90%的人都中招

手机要闻

屏幕与售价大亮,vivo Y60/60m上架官网

家居要闻

东方法式美学 现代简约

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版