网易首页 > 网易号 > 正文 申请入驻

还在用 Gemini 3 写 ppt?太土了,来看看最酷炫手势互动(附提示词)

0
分享至

Gemini 3 发布之后这些日子里,我逐渐感到疑惑:为什么总让 AI 写网站写 PPT,Gemini 都发到第三代了,不能干点更有意思的事吗?

要那种科幻感强的、效果酷炫的、难度系数高的,但小白也能做的。比如这种:


或者这种:


Gemini:手势交互?没问题,包的。

在开始之前,先准备好 Gemini 3,这里是一点点的注意事项

目前有三种方式开启玩耍:Gemini 客户端 Canvas 模式、Google AI studio-Playground 和 Google AI studio-Build。

其中,最不推荐的是客户端,亲测无法有效拉起摄像头,并且,下面都是手势互动项目,举着手机,手自然也是没法做操控的。


后两者中,Build 是直接形成一个 app,你可以分享给其它朋友,缺点是 tokens 有限。而 Playground 会生成一套代码,需要下载到本地再打开,一旦换个电脑就可能运行不了,但优点是几乎没有 tokens 限制,每天一百万,量大管饱。


考虑到交互项目比较消耗 tokens,所以 Playground 更为合适,个别小项目用 Build 也可以,这就看个人情况而定。

Jarvis

Jarvis HUD 面板是在推上超过二十万次浏览的热门爆款,手势操控仪表球,就像钢铁侠操控 Jarvis 那样,酷毙了。


参考 prompt 如下:

create a webapp using vanilla js, html, css, modern threejs, mediapipe. it should be a sci-fi tony stark / iron man / jarvis experience focused on simulating an AR heads up display experience. full screen webcam input shown. add a heads up display that tracks the user's head (offset to the right), with live updating metrics. a minimal 3D world globe should be shown on the left center of the screen, that should be able to be rotated / sized by the user hand gestures

在 Build 模式下,亲测完全可以实现一次成型,Gemini 会自动安排任务、编写代码,调用不同的接口,进度条显示完成后,点击 Preview 就能直接打开——记得放行摄像头权限。


Gemini 3 自己就把效果设计安排得明明白白:左手是放大缩小,右边是转动,双手进入摄像头范围后会显示触控点——这些都是 prompt 里没有的,都是它自己的「想」出来的。搭配大屏幕或者投影,真的很有 Jarvis 既视感。

左边的地球建模和右边的面板的内容都是可以改变的,最初 Gemini 3 让右边的面板显示人体体温(显然是凭空编的),后来被我改成了「实时显示左侧地球模型的直径」。反正 vibe coding 一下,想怎么改怎么改。

雨滴控制

Jarvis 都有了,惊天魔盗团不也得安排上。


看电影时只有特效,但现在,有 Gemini 3 了。参考 prompt 如下:

用 HTML+JS+ML 模型做个网页应用,通过摄像头检测手势,实现用手势来控制雨滴动画的暂停、静止和升格效果。动画效果保持在雨滴垂直方向,风格参考电影《惊天魔盗团》

这个 prompt 的第一轮表述完全是按照我看电影之后的想法写的,每个细节都可以通过 vibe coding 再调节。根据第一轮 prompt,Gemini 会加入它自己的设计,比如这具体的手势就是它想出来的。


虽然是用 AI 做的,但是在识别手势动作时非常灵敏,包括不同手势之间的切换都能够快速响应。

3D 粒子

控制雨滴曾经是非常复杂的特效技术,就在《惊天魔盗团 2》上映之后,有一个饮料公司做了一支广告,通过控制雨滴,实现静态的粒子效果。


那么参考「控雨术」,Gemini 完全可以实现上面这种结合实拍和速度控制才能出现的效果,最接近的就是 3D 粒子。所以我又做了一个 3D 粒子效果的交互案例。


非常酷炫!prompt 参考如下:

用 Three.js 创建一个实时交互的 3D 粒子系统。通过摄像头检测双手张合控制粒子群的缩放与扩散,提供 UI 面板可选择爱心/花朵/土星/佛像/烟花等模型,支持颜色选择器调整粒子颜色,粒子需实时响应手势变化。界面简洁现代,包含全屏控制按钮

一次成型,最后出来的交互非常丝滑,尤其是对于手势的识别很准确又灵敏。

【小技巧】 涉及到颜色、布局、UI 设计等等细节,如果每次都用 vibe coding 的方式来调节,表述起来会很麻烦。并且每一次 vibe code 都存在抽卡的情况,所以有一个非常实用的技巧是:加上自定义模块,尤其是颜色、大小等,这样可以完全自主搭配自己喜欢的配色方案。



技能五子棋

由雨滴想到粒子,由粒子想到移动,由移动想到——五子棋!我终于可以做技能五子棋了!!

仔细想想,五子棋不也是一个手势控制、飞来飞去的交互方式吗!飞沙走石移动棋子,力拔山兮移动棋盘,全都安排上!


Prompt 参考如下:

做一个手势互动小游戏「技能五子棋」:主页面为五子棋棋盘,默认已经摆放好棋子。当用户做出「单手甩手」的动作时,棋子会跟随甩动的方向飞出棋盘。当用户做出「双手甩动」的动作时,棋盘会跟随甩动方向飞动

Gemini 自己完成了物理逻辑和手势之间的衔接,我的 prompt 只需要描述效果,而具体的速度向量计算、检测阈值,都不用我管。

它甚至还重新命名了「技能」:万象天引。


这叫飞沙走石啊 Gemini 老师!

节奏音乐游戏

综合上面的几个尝试,Gemini 的毋庸置疑,而且回想一下这些技能树:手势识别、色彩变化,这些组合起来,不就是小游戏吗?

于是我尝试了更复杂一点的项目:节奏游戏。

音游玩过很多了,但是零经验小白真要做一个游戏、怎么给 Gemini 形容我想达到的效果,还真是花了一点脑筋 ,后来第一版 prompt 如下:

做一个用手势操控的音乐游戏,主界面为四条音轨,用户上传音乐文件后,四条音轨上按节拍出现光点,用户需要用手势准确拍击出现的光点,背景为复古合成波(Synthwave)风格,背景、音轨和光点的颜色可以自定义调节

这基本上是我能想到的雏形,根据第一版 prompt,Gemini 选择了 Pygame 作为游戏引擎,继续使用 MediaPipe 做手势追踪,并且加入了 Librosa 用来分析音乐。


选择复古合成波风格是因为它有明确的视觉标志——Gemini 也识别出来了——落日、霓虹渐变色、网格和驶向地平线的道路,非常适合节奏音游。

果然做游戏比前面的一些小交互复杂多了……先是只能识别一只手,得调整;然后是无法上传音乐,得调整;到了第三版才稍稍有点样子


但是在体验过中我发现一个比较 bug 的地方:判定线的位置离屏幕边缘太近了,而摄像头的识别范围是有限的,我的手稍微放低一点就无法被识别。

一开始我尝试的方法是,把判定线移动到屏幕居中位置,保证我的手始终能在摄像头捕捉范围内。


但是又出来一个问题:光点出口和判定线之间的距离过短,留给我的反应时间也很短,更别提点击动作还有一点点点的延迟,整个可玩性大大下降。可是放太低就还是会出现手掉出识别范围的情况。

一时之间我还真想不到这个矛盾该怎么办,于是,我直接去问了 Gemini 能怎么解决。


它直接指出了这个问题的症结所在,并且提出了「视觉欺骗」的方式来优化体验,并且加了一个自定义滑块来调节偏移,这样一来无论手在什么位置,都可以通过调节滑块来对齐判定线。

天才。

后来我还指出,感觉光点的出现跟节奏不太一致,为了解决这个问题,Gemini 又加了一个滑块用来调节延迟。虽然我仍然认为它并没有很好地分析节奏型,但是这个滑块的设计还是很有效,尤其是解决了戴着蓝牙耳机导致的延迟。


【一些小技巧】 本质上,只要有 prompt 就有抽卡的情况存在,但抽卡未必就不好。当碰到非常硬伤的 bug,比如始终无法调用摄像头、无法上传文件等等,vibe coding 时反复修改也没效果,不如就直接「新建项目」。核心功能反映在代码上,彼此之间有所牵连,重新跑一遍,让 AI 整体性地补足,远比一点点 vibe coding 要更有效率。当然,能看懂代码就会更有效率,可以针对性地解决。 只不过,对于完全的零码选手来说,还不如直接重新抽卡。


在 AI 之前,做手势交互的应用,得先学点儿 Touch Designer,最好还懂点儿部署。这些都得一点点翻教程,反复研究,在这个过程中搞不好就被劝退了。

有了 AI 之后有多简单,自然不用多说。更关键的是,手势交互原本的门槛远比生图、做 PPT 要更复杂,却又能让小白零码选手快速领略到做应用的乐趣。

唯一留下的,是对审美的挑战。在这些案例里能看到,Gemini 有点审美,但不多,设计、配色等等都是差强人意。代码的「硬」技能它可以掌握,留给我们的,就是对于审美的挑战。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
百万粉丝博主发4条微博被控损害华为商誉,二审定罪免罚

百万粉丝博主发4条微博被控损害华为商誉,二审定罪免罚

澎湃新闻
2026-01-07 20:08:28
河北农村怎么才能不挨冻?大V:在河北农村盖着16斤棉被,鼻子被冻伤

河北农村怎么才能不挨冻?大V:在河北农村盖着16斤棉被,鼻子被冻伤

六子吃凉粉
2026-01-08 08:39:04
交易框架敲定!特雷杨指定下家!将加盟NBA顶级烂队

交易框架敲定!特雷杨指定下家!将加盟NBA顶级烂队

篮球教学论坛
2026-01-08 10:35:38
坐稳东部第一!活塞双核缺席大胜公牛 斯图尔特31分生涯新高

坐稳东部第一!活塞双核缺席大胜公牛 斯图尔特31分生涯新高

醉卧浮生
2026-01-08 10:17:03
太子集团创始人陈志,被遣送回中国,接受有关部门调查

太子集团创始人陈志,被遣送回中国,接受有关部门调查

新京报政事儿
2026-01-07 20:35:03
黎明前的惊雷:一个时代的落幕与中东秩序的重塑

黎明前的惊雷:一个时代的落幕与中东秩序的重塑

高博新视野
2026-01-05 18:13:59
争议!CBA官方解说员公然搞地域歧视:听到两岸猿声 处罚结果来了

争议!CBA官方解说员公然搞地域歧视:听到两岸猿声 处罚结果来了

念洲
2026-01-08 07:24:21
雷霆天要塌了?详解高开低走4大原因:失去罚球优势+三分投射不稳

雷霆天要塌了?详解高开低走4大原因:失去罚球优势+三分投射不稳

罗说NBA
2026-01-07 21:00:38
费尔明传射,拉菲尼亚独造3球!巴萨造5-0惨案,坐等马竞死磕皇马

费尔明传射,拉菲尼亚独造3球!巴萨造5-0惨案,坐等马竞死磕皇马

我的护球最独特
2026-01-08 04:50:30
闫学晶的事越闹越大,辽宁卫视估计要慌了

闫学晶的事越闹越大,辽宁卫视估计要慌了

麦杰逊
2026-01-07 20:16:03
特斯拉突然大降价

特斯拉突然大降价

新行情
2026-01-07 14:29:08
柬政府确认陈志6日已被遣返回中国,柬国王颁布王令撤销其柬埔寨国籍

柬政府确认陈志6日已被遣返回中国,柬国王颁布王令撤销其柬埔寨国籍

红星新闻
2026-01-07 23:38:19
陈志遣返!全球“杀猪盘”教父落网

陈志遣返!全球“杀猪盘”教父落网

不正确
2026-01-08 00:18:24
中方反制后,日本萌生大胆想法,西方媒体发出提醒,别忘了16年前

中方反制后,日本萌生大胆想法,西方媒体发出提醒,别忘了16年前

博览历史
2026-01-07 17:10:36
女大学生餐馆讹钱后续:正脸曝光很漂亮 家人轮番找店主 目的曝光

女大学生餐馆讹钱后续:正脸曝光很漂亮 家人轮番找店主 目的曝光

鋭娱之乐
2026-01-08 08:34:40
穆雷22+8+17生涯新高掘金终结绿军4连胜 沃特森30分布朗33分

穆雷22+8+17生涯新高掘金终结绿军4连胜 沃特森30分布朗33分

醉卧浮生
2026-01-08 10:32:22
河南三兄弟连续11年给家乡老人发放救助金,村支书:每人每月发300元到1000元,累计发了600多万元,有老人已经领了七八万元

河南三兄弟连续11年给家乡老人发放救助金,村支书:每人每月发300元到1000元,累计发了600多万元,有老人已经领了七八万元

极目新闻
2026-01-07 21:22:09
马杜罗家族500亿美元遭冻结,为何标榜中立的瑞士被多次“打脸”

马杜罗家族500亿美元遭冻结,为何标榜中立的瑞士被多次“打脸”

微评社
2026-01-08 01:07:07
全网玩梗“酸黄瓜”,资本紧急切割,狂妄的闫学晶,终于付出代价

全网玩梗“酸黄瓜”,资本紧急切割,狂妄的闫学晶,终于付出代价

李健政观察
2026-01-07 11:49:17
留洋夺冠两天后,樊振东德国俱乐部续约条件曝光,德甲给足了体面

留洋夺冠两天后,樊振东德国俱乐部续约条件曝光,德甲给足了体面

削桐作琴
2026-01-07 16:11:10
2026-01-08 10:55:00
爱范儿 incentive-icons
爱范儿
消费科技第一媒体
38279文章数 2600553关注度
往期回顾 全部

科技要闻

雷军:现在听到营销这两个字都有点恶心

头条要闻

博主发4条微博被控损害华为商誉 二审定罪免罚

头条要闻

博主发4条微博被控损害华为商誉 二审定罪免罚

体育要闻

卖水果、搬砖的小伙,与哈兰德争英超金靴

娱乐要闻

《马背摇篮》首播,革命的乐观主义故事

财经要闻

农大教授科普:无需过度担忧蔬菜农残

汽车要闻

不谈颠覆与奇迹,智驾企业还能聊点什么?

态度原创

本地
教育
数码
家居
公开课

本地新闻

“闽东利剑·惠民安商”高效执行专项行动

教育要闻

电气专业为什么非要去国家电网

数码要闻

AMD计划2026Q2推出桌面版锐龙AI 400处理器,PRO款也存在

家居要闻

理性主义 冷调自由居所

公开课

李玫瑾:为什么性格比能力更重要?

无障碍浏览 进入关怀版