八年前,我们还在讨论Chromebook能不能替代Windows笔记本。现在谷歌直接换了个玩法——不是让AI跑在系统里,而是让AI成为系统本身。
Magic Pointer就是这个思路的具象化。它把光标变成Gemini的触发器:指向屏幕任意元素,晃一下,AI就进入待命状态。不需要快捷键,不需要打字,语音指令直接跟上。
![]()
谷歌目前开放了两个实验场景。第一个测试让我看到了可能性:指向伦敦眼的图片问"这是哪",再追问附近餐厅,Gemini在几秒内完成识别和推荐。全程只用鼠标和说话。
但第三次任务暴露了边界。当我试图用光标在两个地标图片之间划动、询问路线时,系统完全崩溃——它没能理解"从这里到那里"的指向逻辑,也没有调用地图生成导航。
第二个实验更贴近日常:用多张服装图片合成穿搭效果。这次流程跑通了,但延迟明显,且对复杂叠穿的理解有限。
谷歌的野心不止于识别。官方演示里,选中演唱会海报能直接生成带完整信息的日历事件——这意味着AI需要理解"为什么这个信息对你重要",而不仅是"这是什么"。
现阶段的问题很实在:学习曲线陡峭,失败率不低,且对连续对话的上下文保持能力存疑。但它确实提供了一种新的人机交互原型——让AI接管鼠标控制权,用户只负责发号施令。
秋季Googlebook上市前,这套系统还有打磨窗口。真正的问题是:当AI深度嵌入操作系统,我们准备好放弃"文件-应用-窗口"的三十年来惯了吗?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.