上周,一批美国用户打开Gemini应用时,发现同一个提示词出来的图完全不同。有人收到自己和家人的黏土动画合影,有人只拿到一张通用全家福——区别只在于,前者几年前就点了"同意同步相册"。
这是谷歌Personal Intelligence(个人智能)和Nano Banana 2(纳米香蕉2代,谷歌图像生成模型)联手的第一个大型实验场。核心玩法一句话:让AI记住你是谁,而不是每次从零开始教。
![]()
从"写小作文"到"直接喊一嗓子"
以前的图像生成像面试。想要一张"我和家人周末露营"的图?你得描述人数、年龄、穿搭、帐篷颜色、狗是什么品种。现在谷歌想把这个流程压缩成一个词:我。
Personal Intelligence会扫你过去的Gemini对话,提取"你关心什么"的轮廓。Nano Banana 2则负责把这些抽象偏好变成具体画面。两者接在一起,系统能自动补全你懒得说的细节。
更激进的一步是Google Photos接入。如果你手动授权过,Gemini会直接调用相册里带标签的人脸和宠物照片。提示词"我和家人做最喜欢的活动",系统能认出你老婆是短发、儿子戴眼镜、家里养的是柯基——然后生成一张对得上号的黏土风格合影。
谷歌特意放了两张对比图:同一个提示词,有相册权限的账户生成的是定制化场景,没有的则是随机家庭模板。差距肉眼可见。
但"自动"不等于"猜对"
谷歌在公告里埋了一句免责声明:"Gemini不一定第一次就选到你想要的那张照片或细节。"
这意味着什么?系统确实调用了你的数据,但选择逻辑是个黑箱。它可能选中你三年前 Halloween 的丑照,而非上周的生日聚会。用户唯一能做的,是点"来源"按钮查看它到底用了哪张图,然后重试。
这种"半自动"状态很微妙。比完全手动省事,比完全可控焦虑。对技术从业者来说,这其实是RAG(检索增强生成,一种让AI调用外部数据的技术)在消费级产品的典型落地形态:承诺个性化,但把最终判断权留在用户手里——至少名义上。
隐私的边界画在哪
关于数据安全,谷歌的表述很精细:"Gemini应用不会直接用你的私人Google Photos库训练模型。"
注意主语是"Gemini应用"。训练数据来自"Gemini中的特定提示词和模型响应",而非原始照片。你的脸不会被喂进基础模型变成通用知识,但你的提问方式和AI的反馈会被记录优化。
这是一个合规层面的精巧设计。欧盟AI法案、美国各州隐私法对"生物识别数据用于训练"的门槛极高,而"提示词优化"属于灰色地带。谷歌选择站在线内,但线本身正在移动。
目前该功能仅向Google AI Plus/Pro/Ultra订阅者开放,美国优先,Chrome版和其他地区"很快"跟进。免费用户暂时只能看着。
一张图看懂:Personal Intelligence的工作流
原文提供的核心架构可以拆解为三层漏斗:
第一层是记忆层。Personal Intelligence从两个渠道收数据:历史Gemini对话(文本偏好)和Google Photos(视觉标签)。前者是"你喜欢科幻风格",后者是"你长这样、你家人长那样"。
第二层是融合层。Nano Banana 2接收用户提示词时,会自动查询这两份档案,把抽象指令("我和家人")锚定到具体实体(相册里标记过的五张脸)。
第三层是生成层。模型输出图像后,系统保留溯源链路——用户可随时查看"这次用了哪张照片参考"。这不是可解释AI的完整方案,但至少提供了事后审计的可能。
整个流程的关键设计在于"可选深度"。你可以只开对话记忆,不开相册;可以开相册但不给Gemini权限;也可以全开。每一层都是用户主动勾选,而非默认采集。这种"渐进式授权"是谷歌在监管压力下的标准策略,代价是功能体验的大幅分化。
为什么这值得科技从业者关注
这不是又一个图像生成滤镜。它的真正实验场是"身份连续性"——AI能否跨会话、跨模态地维持对"你"的认知。
目前的聊天机器人基本是金鱼记忆。每次新开窗口,你得重新介绍自己。Personal Intelligence试图打破这个循环,把AI变成有长期记忆的助手。图像生成只是最先落地的场景,因为视觉个性化的商业价值最直观(社交分享、定制礼品、家庭纪念)。
但技术债同样明显。相册标签的准确率、人脸识别的偏见、跨文化家庭的标签混乱(比如东亚家庭"全家福"的构图偏好与西方差异),都会直接暴露在用户面前。谷歌选择先收订阅费、后开放免费,大概率是在用付费用户做压力测试。
更值得玩味的是竞争格局。OpenAI的DALL-E 3、Midjourney都在做个性化,但路径不同:前者靠对话历史微调,后者靠风格参考图。谷歌的优势是Photos这个10亿级用户的视觉数据库,劣势是整合复杂度。谁能先把"记得你"做到无感,谁就可能拿下下一代AI入口。
一个开放问题:当AI足够了解你的视觉历史,生成一张"你从未拍过但完全可信"的照片时,真实与虚构的边界由谁来划定?相册的授权按钮,是否足以承担这个重量?
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.