前几天,去 Gemini 玩的时候发现谷歌的 Gem 功能,也就是类似 GPT 的 GPTs 功能更新了。
原来这个东西的能力非常之差,基本就是保存一段提示词然后给提示词起个名字的水平。
但是前几天发现他更新了,现在可以直接帮你生成带有界面的网页应用,支持任何图片或者文档的输入,也可以创建网页输出结果,而且可以调用所有的谷歌模型,功能相当强大。
![]()
比如我这里就用他创建了一个屏幕使用时间分析工具,上传你的屏幕使用时间他就会帮你创建一个网页展示和分析你的屏幕使用时间状况。
具体包含一个非常漂亮的可视化海报,还有文本分析以及一个基于你屏幕使用时间建议的音频博客。
![]()
仔细探索了一下发现这个就是将前几天谷歌发布的类似 N8N 的 Agent 构建工具 Opal 内置到了 Gemini 里面,而且更加易用了,今天大概教一下大家这个如何玩以及 Opal 的进阶操作。
首先是入口我们进到 Gemini 里面之后,在侧边栏这里找到“探索Gem”这个选项进去就行。
![]()
进去之后你就看到除了之前的 Gem 界面和设置之外,上面出现了一个全新 Gem 的实验。
点击这个“New Gem”就可以进入到新的 Gem 的创建界面。
![]()
进入到创建页面之后很简单的一个输入框,你直接告诉他想要做什么就可以了。
比如我这里让他基于我上传的我力量训练的表格分析我的训练数据给出对应的报告和建议。
![]()
回车之后他就会开始帮你构建 Gem 应用了,右侧会有进度一般很快就能搞定,你就可以在右侧测试刚刚生成的 Gem 了。
![]()
这里我要求的是上传 CSV 文件,但是可以看到新的 Gem 支持的格式非常丰富,包括我们常见文件、youtube视频、甚至还可以录制网页操作视频和涂鸦。
![]()
我上传了自己的训练数据上去测试,可以看到结果相当的详细,上面是数据看板,中间是各种表格,最下方是对我的训练建议。
![]()
但这里全是英文,我们还是需要修改一下,这里简单的修改直接在左侧说提示词就可以,比如我这里让他将报告结果改为中文,他就开始工作了。
![]()
可以看到这这次的分析结果就全部变成中文了,而且分析的数据相当详细。
上面是整体的训练分析,中间是各个部位的数据,接下来是进步的和退步的训练,最后是个性化数据分析和建议。
![]()
当然你肯定这时候对于结果是有些不满意的,比如网页没有图片全是字,而且没有数据可视化看起来非常难以理解等等,你觉得左边通过提示词进行修改太烦了。
这时候我们就可以点击右上角那个“Open Advanced Editor”去到真正的 Opal 界面进行编辑。
![]()
好了,进来之后这个界面看起来是不是很熟悉了,他把用到哪些模型处理数据、生成数据以及输入、输出的卡片都给你展示出来了。
![]()
我们讲一下这个界面,主要大概是这四个部分组成:
黄色:这里是添加卡片的区域,如果你想要增加工作流中的模型或者输入项的话可以点击对应的卡片名称。
红色:这里是预览界面,如果你没有点击任何卡片这里就是完整的应用预览,如果点击卡片就是卡片预览。
紫色:这里你依然可以用提示词对你的应用进行修改,中间的卡片也会同步改变。
绿色:这里是主要的编辑和调整区域,代表着每个数据或者模型处理步骤的卡片,可以进行链接。
我这里一般懒得调整卡片设置和链接卡片,涉及到模态更改和卡片更改的就会直接在输入框输入让他自己帮我修改工作流。
但是如果是涉及到具体效果的提示词调整或者模型调整就得点击卡片在右侧进行精细化调整了。
比如这里我就选择了生成建议这个卡片,之后红色区域就变成了卡片具体以的设置。
![]()
上面你可以选择使用什么模型,这里的模型相当详细,基本可以满足你的任何信息处理和素材生成要求。
比如文本、音频、视频、表格、图片的输入处理我们就可以用比较便宜的 Gemini 2.5 Flash 或者直接用顶级的 Gemini 3 Pro 来完成。
图像输出的话有只支持文生图的 Imagen 4 模型,还有支持改图生图的 Nano Banana Pro 和 Nano Banana 模型。
视频生成有 Veo 视频模型,文本转语音有 AudioLM 模型,跟离谱的是还有音乐生成模型 Lyria 2。
如果你提示词跟他说修改他给你把模型选错了的话,你就可以在这里改回来。
![]()
然后在下方可以调整具体的提示词,很多时候模型自己写的提示词还是有些问题的,你这里可以自己写,也可以点右侧的魔法棒图标直接跟他说怎么改,这里只会对这里的提示词生效,不用担心影响其他地方。
![]()
来看个例子,我前面展示的根据屏幕使用时间生成可视化海报和网页的案例里面,由于图片提示词复杂,他一直写不好,我就直接在图片生成卡片里面将提示词改成我原版的图片提示词了,然后效果就对了。
![]()
上面力量分析的卡片比较少,我们直接来看我的屏幕使用时间分析应用的卡片链接。
可以看到左侧黄色卡片代表输入,这里就是用户上传的屏幕使用时间截图。
中间部分主要是三个部分素材的生成、屏幕使用时间的文本分析、可视化海报的图片生成以及口播稿的生成和将口播稿用 AudioLM 生成博客音频。
最右侧的绿色卡片负责将这三部分素材生成一个网页展示和播放。
![]()
好了具体的创建到这里就差不多了,最后当然是我们的分享功能了。
你可以点击右上角的 “Share App” 按钮获取到应用的分享链接,获得链接的用户直接谷歌登录就能用,会根据用户的 Gemini 会员等级扣除他们的模型额度。
![]()
好了今天的 Gemini Gem 和 Opal 教程就到这里结束了。
你可以自己去创建一个玩玩,也可以来玩玩我自己的这个屏幕使用时间分析工具,点击右上角 Remix 可以直接对我这个应用进行修改和编辑:opal.google/?flow=drive:/1P8cjpYRdou_4DyuBfJU78nrIafcpmdmI&shared&mode=app
谷歌最近在 Gemini 里面的产品整合真的可怕,直接将 AI 实验室的一堆孵化的产品都整合进来了,NoteBookLM 项目好像也可以直接添加到聊天的上下文里面,只需要将 Gemini 的傻逼交互细节修复一下真就无敌了,不封号、额度高、模型强,我要是 Sam 真慌死了。
如果觉得我的内容对你有帮助的话,可以帮我点个赞或者,也可以转发给需要的朋友们,感谢。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.