AI修图早就不是新鲜事,但谷歌这次玩的是另一套:让模型记住你家的猫、你常去的咖啡馆、甚至你去年生日穿的裙子——然后按你的"生活惯性"生成照片。这技术叫个性化图像生成,核心是把用户数据喂给扩散模型(Diffusion Model,一种通过逐步去噪生成图像的AI技术)。
你的记忆成了训练素材
![]()
Gemini for Home的扩张不只是地区解锁。谷歌在2025年4月17日的更新里埋了个关键能力:用户上传的照片会被编码成"记忆向量"(Embedding,将图像信息压缩为数字向量的技术),模型后续生成时会调用这些向量作为条件约束。简单说,AI不再凭空造图,而是基于"你之前给过什么"来造图。
这解决了生成式AI的一个老毛病:结果太通用。你要一张"周末早晨",模型可能给你阳光早餐;但如果你家实际养了两只柯基、阳台朝北,通用模板就失真。个性化技术把"谁在用"写进了生成公式。
数据闭环的商业算盘
谷歌敢这么玩,底气在于生态锁死。Gemini for Home绑定Google Photos——全球超过20亿用户的图库。竞争对手做个性化,得求用户一张张上传;谷歌用户早就在免费备份里交完了素材。
更隐蔽的是成本结构。训练一个能记住用户偏好的扩散模型,推理阶段需要额外的条件编码器(Condition Encoder,将用户输入转化为模型可理解条件的组件),谷歌用自研的张量处理单元(TPU,谷歌专为机器学习设计的芯片)把这部分算力压到了消费级设备可承受的范围。
这解释了为什么功能 rollout 到更多国家比技术发布晚了将近一年:不是模型做不好,是算贵了的商业模式跑不通。
隐私条款里的灰色地带
争议点在于"记忆"的定义边界。谷歌的隐私政策写明:用于个性化的数据不会用于广告定向——但没说会不会用于改进基础模型。如果1000万个"柯基阳台"向量被匿名聚合,理论上可以反向优化出更懂"城市养宠青年"的通用模型。
用户协议里的 opt-out 选项藏得也深。关闭个性化生成,不等于删除已提取的记忆向量;向量可能仍以"去标识化"形式留在系统里。这对25-40岁、习惯用云相册的科技从业者是个提醒:你以为的"删除",和技术层面的"遗忘",是两件事。
为什么这事值得盯紧
个性化生成正在从"功能"变成"基础设施"。谷歌这次扩张覆盖的是Gemini for Home,但技术栈明显可迁移到Workspace、Android相机、甚至搜索。一旦用户接受"AI记得我"的交互范式,数据飞轮就转起来了:用得多→记得准→更好用→用更多。
国内厂商跟不跟?跟的话,用户图库分散在阿里云盘、百度网盘、iCloud,没有统一入口;不跟的话,生成结果永远差一层"懂我"。这是谷歌生态位的一次精准卡位。
谷歌Photos 2024年财报显示,其订阅收入同比增长23%,而存储成本因TPU优化下降了11%。个性化生成是这盘账里最新的乘数。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.