从昨晚到早上大家应该看了很多 Gemini 3 的相关信息了,藏师傅这里就不废话了。
简单说一下它有多强,从测试基准来看直接在几乎所有基准上都达到了 SOTA,同时相当一部分大幅领先第二名,当然除了 SWE-Bench 这个。
用来验证 AI 是否脱离了“概率模仿”并开始产生“真正思考”的测试集 ARC-AGI v2 的得分上,甚至超过了现在最强模型的两倍以上,看看 Gemini 3 孤零零在的位置。
从昨晚发布开始我就用 Gemini 3 做了相当多的测试。
同时测试内容依旧秉承藏师傅一贯的观点,除了测试能力以外也尽可能都是对大家有用的。
我也会开放这些提示词,由于谷歌一贯的财大气粗,所以你几乎在 AI Studio 和谷歌新发布的 AI IDE Antigravity上可以免费用 Gemini 3,只有你自己的看法才是最客观的,建议多试试。
Gemini 刚发布的时候我最关注的还是多模态的理解能力,毕竟这个一直是谷歌的看家本事,先拿了两个视频试了一下。
第一个是 AI 艺术家 852話 做的 AI MV 视频,里面有相当多的快闪效果,分镜变化也很频繁,非常适合用来分析模型对于视频细节的分析能力。
提示词是:帮我详细分析这个视频的每个分镜内容,确保我可以让设计师复刻它
可以看到他几乎按每秒钟说了每个动画效果表现的细节和画面主体内容,前面加上了总的风格描述,最后加上了如果要用 AE 做的话用哪些插件才行,非常细了。
接下来刚好要发谷歌新发布的 AI IDE 的介绍,索性直接把他们的宣传视频扔给了 Gemini 3,让他帮我总结。
整体非常有条理,产品的核心定位、宣传主题以及产品的详细功能都分析到了,我直接就发了,结果数据还行。
提示词为:帮我详细总结视频内容,介绍这个产品。
然后就来到了我们的重头戏,编码能力上,现在 AI Studio 里面的 Build 模式是真的顶,居然生成的网页也可以直接调用谷歌所有 AI 能力。
于是就想能不能让他帮我直接实现一个设计 Agent 产品,可以帮我思考设计方案,完善之后自己写提示词作图。
提示词:帮我实现一个功能完整的视频和图片Agent 平台,支持自主完成图像编辑和设计任务
没想到真的可以,支持对话,他详细询问你的需求,然后帮你用 Nano 生成设计图,真的一句话一次就搞定了,我甚至没说什么是设计 Agent 以及应该如何实现这些能力。
这个 Logo 设计图和基于 Logo 设计的月饼包装袋都是它帮忙设计的,以前哪敢想啊,朋友们,需求和实现方案都不管,一句话需求,说句不好听的,实习生肯定搞不定。
然后我们来试一下 Gemini 3 的设计稿还原能力。
我找了一张自己收藏夹里相对复杂的设计图,里面细节挺多的,让他完美还原这个设计稿,图片可以用占位图。
没想到直出效果这么好,尤其是头部这部分的排版细节,比如字号、字体颜色以及行间距等。
而且右边那本书他找不到图片,直接自己用代码写了一本,还补全了设计稿中不存在的的内容。
昨天有朋友说,这个细节还是有问题,我还开玩笑说,没 AI 的时候一些大厂程序员拿着 figma 设计稿第一版能做到这个水平,我就已经烧高香了。
然后我就想,图片 Agent 做了,那要不整一个视频 Agent?
但是 AI Studio 里面没有内置 Veo 3.1 视频模型,于是我就到 Youware 用 Gemini 3 试了一下,也是简单说了一下。
提示词:帮我做一个设计 Agent 网页工具,它可以帮我自动地迭代和优化,并且生成设计图和设计视频,调用所有相关的设计 AI API。
第一次他生成的视频只有一个分镜,于是又让他加了多个分镜编排的能力,让他调用 LLM 生成提示词和剧本。
然后搞定了,真离谱啊,选择故事模式后他会自己生成剧本以及每个分镜的提示词然后调用 Veo 生成多段视频。
然后我才反应过来,我这不是做了一个 Krea 那种 AI 聚合应用吗,基本功能都有了,于是直接把 Krea 的界面截图扔给他,连界面也复刻了,哈哈。
早上起来刷到一个,那种宣传产品功能的用 AE 做的快闪动画,然后就想这里面都是前端界面的元素吗,能不能让 Gemini 3 用代码给我整一个。
整理了一下提示词之后,他还真的整了一个出来,现在会以之前非常流行的滚动叙事网页的形式表现,如果你想做自己的产品网站的话可以参考这个提示词,还是很吸睛的。
Gemini 3 滚动叙事网页生成提示词:
请你扮演一位擅长创意交互的前端开发专家。我要做一个类似 Apple 产品页风格的“Scrollytelling(滚动叙事)”网页 Demo。
技术栈要求:
使用 HTML、CSS 和 GSAP (GreenSock) 配合 ScrollTrigger 插件。
交互逻辑:
页面高度要设置得很长(如 5000px),建立一个全屏固定的视口(Pinned Container)。用户的滚动动作不移动页面,而是作为进度条(Scrub: 1)直接控制整个动画的时间轴播放。
视觉与动画流程(请按顺序实现以下 Timeline):
开场: 屏幕中心只有简洁的文字 Slogan,随着滚动,文字放大并渐隐消失。
UI 演示: 随后,模拟“手机通知弹窗”和“邮件列表卡片”从不同方向平滑飞入屏幕中心。
堆叠特效: 继续滚动,这些分散的卡片要通过 3D 变换,自动吸附堆叠在一起(Stacking Effect)。
高潮: 出现一个“Unsubscribe All”的按钮,当滚动经过它时,堆叠的所有卡片瞬间向四周炸开/飞走(Explosion Effect)。
结尾: 露出最后的 Logo。
风格要求:
极简主义、圆角卡片设计、阴影柔和、动画曲线要非常有弹性(Elastic/Spring)。请直接给我可运行的完整代码文件
从三秒开始的动画真的很顶,这个3D 卡片的旋转悬浮然后再排列整齐的动画非常的流畅而且丰富。
而且美学表现也很强,标题的渐变色、描边以及后面卡片的细节,你真的可以用这套逻辑让 Gemini 帮你用前端写一个宣传视频出来,这是一个很大的机会,可以填补目前的 AI 视频模型做不了的部分。
上面的离谱吗?还有更离谱的,早上看见朋友向阳乔木想用 Gemini 生成短剧点子,于是优化了一下,看看能不能让 Gemini 3 直接生成互动式游戏。
没想到在 AI Studio 里面简单调整了两次就搞定了,Gemini 3 会根据你提供的文本生成互动式游戏,很像 GalaGame 常见的形式。
区别就是里面所有的素材都是随着剧情的推进实时生成的,包括:对话文案、语音对话、人物头像、画面背景以及章节信息。
上面这是个很好的机会,人人只要有好剧本会打字就可以做互动内容和互动游戏,再搭配苹果前几天给类似小程序这种产品松绑和降低分成,里面可能酝酿着一个新的顶级内容消费平台的机会。
你用下面这个提示词在 AI Studio 里面的 Build 模式可以直接生成类似游戏,记得在第四步把文案放进去,老板以后靠这个提示词发财了,可千万记得点我。
Gemini 3 互动漫剧生成提示词:
Act as a World-Class Frontend Engineer and UI/UX Designer.
Create a "High-Fidelity Interactive Visual Novel" web application using React (es6 modules), Tailwind CSS, and the Google Gemini API (@google/genai).
1. Design Philosophy & UI Style (Crucial)
The UI must strictly follow a "Japanese Commercial Galgame (Visual Novel)" aesthetic.
- Vibe: Dark Fantasy, Cyberpunk, Polish, High-End.
- Art Style for AI Generation: Enforce "Japanese Celluloid Anime Style (赛洛鲁/平涂)" for all generated images.
- Dialogue Box: NOT a simple rectangle. It must feature:
- A "Glassmorphism" background (dark, blurred).
- Decorative Tech/Fantasy borders (double lines, glowing neon accents in Cyan/Gold).
- A dedicated, stylized "Nameplate" attached to the top-left of the box.
- A large, rectangular Character Avatar (3:4 ratio) on the left side with a decorative frame.
- Typography: Clean, readable serif or sans-serif with typing writer effects.
- Animations: Smooth fade-ins for backgrounds/characters, shake effects for intense scenes, flash effects for combat.
- 1.Story Engine: Iterate through a predefined script (I will provide the story content below).
- 2.AI Image Generation (Gemini Nano/Flash):
- Backgrounds: Automatically generate scene backgrounds based on the current plot location using gemini-2.5-flash-image.
- Character Tachie (Portraits): Automatically generate character standees. Apply a "Card" style frame (rounded corners, inner shadow, border) so they look like polished assets, not raw photos.
- Prompt Engineering: Automatically append "Japanese Celluloid Anime Style, masterpiece, flat color" to all image prompts to ensure consistency.
- 3.Text-to-Speech (TTS): Use the Web Speech API to read dialogue. Assign different pitch/rate to different characters (e.g., Deep/Slow for the Monster, Normal for the Protagonist).
- 4.Gemini Insight: A button to analyze the current scene's sentiment and lore using gemini-2.5-flash.
- Use a constant file to store the Story Script.
- Define Characters with properties: id, name, visualDescription (for AI generation), voicePitch, voiceRate.
- Define Backgrounds with properties: type, visualDescription.
Please parse the following novel content into the structured script.
[在此处粘贴你的小说正文内容]
5. Technical Requirements
- Use process.env.API_KEY for Gemini.
- Handle async image generation gracefully (show a "Generating..." loader in the UI).
- Single file structure preferred or standard modular structure (App, components, services).
- Ensure the layout is responsive but optimized for Landscape viewing.
Generate the complete code now.
最后是一个很好玩的案例,可以同时表现 Gemini 3 的多模态能力以及代码能力,它可以直接从一张图片帮你生成 3D 的体素图像动画,还原度很高。
提示词:I have provided an image. Code a beautiful voxel art scene inspired by this image. Write threejs code as a single-page
刚好刷到一个很好看的赛博风格圣诞树图片就扔个 Gemini 3 了。
没想到它这么懂,带缩放动画的星星、闪光特效和旋转的点状发光丝带,给整个动画增加了非常多的表现力。顺便用这玩意提前祝大家圣诞快乐了。
好了这期内容就这样了,希望这些玩法和测试能给你带来一些启发。
DeepMind 的人说今晚还有大的,不知道是不是昨天试的 Nano Banana Pro 模型,谷歌怕不是要熬死我们这帮人。
如果你觉得这些内容对你有帮助的话,可以帮我点个赞或者,也可以转发✈️给你需要的朋友们,我们评论区见。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.