网易首页 > 网易号 > 正文 申请入驻

S2Vec:AI学会读懂城市建筑环境的语言

0
分享至


我们介绍S2Vec,这是一个自监督学习框架,能够将复杂的地理空间数据转换为通用嵌入向量,用于预测全球的社会经济和环境模式。

当我们思考人工智能和地理的关系时,往往会关注导航或从A点到B点的路径规划。然而,建筑环境——由道路、建筑物、商业设施和基础设施组成的复杂网络——包含的信息远比地图上的坐标要丰富得多。这些特征讲述着关于社会经济健康、环境模式和城市发展的故事。

直到最近,将这些多样化的地理空间特征转换为机器学习模型可以理解的格式仍然是一个手工和劳动密集型的过程。研究人员往往需要为每个新问题手工制作特定的指标。在Google Research,我们作为Google Earth AI计划的一部分开发了一种新方法来弥合这一差距,该计划使用基础模型和先进的AI推理将行星信息转化为可执行的智能。

与EarthAI愿景一致,我们最近推出了S2Vec,这是一个专门设计用于学习建筑环境通用嵌入向量(即紧凑的数值摘要)的自监督框架。S2Vec让AI能够像人类一样理解社区的特征,识别加油站、公园和住房分布的模式,并利用这些知识来预测重要的指标,从人口密度到环境影响。在我们的评估中,S2Vec在社会经济预测任务中表现出与基于图像的基准相媲美的性能,特别是在地理适应(外推)方面,同时显示在环境任务(如树木覆盖和海拔)中仍有明显的改进空间。

地理空间数据解析的挑战

地理空间数据出了名的难以处理,因为它是多模态的,规模变化极大。一个城市街区可能包含数百个数据点(建筑物、咖啡馆、公交站),而农村地区可能只有几个。标准的机器学习模型更偏好结构化、统一的数据,比如照片中的像素网格。

为了解决这一挑战,S2Vec使用两步过程来栅格化世界:

首先,将地理空间特征(如建筑物、道路、兴趣点)映射到标准化网格上。每个网格单元计算其边界内每种特征类型的数量。

然后,将这些计数转换为多通道图像,其中每个通道代表不同的特征类型(建筑物通道、道路通道等)。

这种转换允许我们像处理AI可以"看见"的数字照片一样处理建筑环境的地理数据。反过来,这种栅格化开启了计算机视觉技术的广阔而成熟的工具箱,这些技术在很大程度上已经解决了自然图像理解的问题。

掩码自编码器:教AI理解空间语言

将建筑环境转换为栅格化特征图像后,S2Vec使用掩码自编码(MAE)这种强大的自监督学习技术来分析它们。传统机器学习依赖手工制作的标签(例如,手动为收入水平或空气质量标记区域),而自监督学习消除了这一瓶颈。由于标记整个地球是不可能的任务,MAE允许我们在不需要手工制作标签的情况下获得全球洞察。

MAE过程系统性地向模型展示建筑环境的一个"补丁",同时隐藏(掩码)其中的某些部分。然后模型仅基于周围的上下文重建缺失的部分:

输出是一个通用嵌入向量:一个独特的数学简写,捕获了位置的特征。这些数字串代表了位置的特征,创建了一个基础,然后可以为一系列任务进行适应。

即使没有被告知什么是"金融区"或"郊区住宅区",模型也可以纯粹基于其特征的空间关系将它们分组在一起。

性能评估:与现有方法的比较

我们将S2Vec的地理空间性能与几种地理空间和基于图像的嵌入方法进行了比较,包括:SATCLIP、GEOCLIP、RS-MaMMUT、Hex2vec和GeoVeX。这些模型在多个地理空间回归基准上进行了评估,特别是预测社会经济指标(如美国范围内的人口密度和收入中位数),以及环境因素(包括碳排放、树木覆盖和海拔)。

通常发现S2Vec是零样本地理适应任务的最佳单个模型,例如预测美国范围内的收入中位数或未见区域的人口密度。

将S2Vec与基于图像的嵌入(多模态融合)结合通常优于使用任何单一模态。

虽然S2Vec在预测碳排放等环境因素方面具有竞争力,但结果表明仅仅"建筑环境"数据并不总是足够的。对于这些任务,S2Vec与卫星图像嵌入结合时表现最佳,后者捕获了建筑物计数可能遗漏的交通、植被和地形特征。

迈向地理空间基础智能

S2Vec代表了朝着地理基础智能迈出的重要一步。通过创建一种可扩展的、自监督的方式来表示建筑环境,我们正在摆脱利基的、手工制作的模型,转向更通用的地理空间AI形式。

这种工作的影响是广泛的。城市规划师可以使用从这些嵌入和其他类似嵌入中获得的洞察,更好地理解基础设施变化如何影响社区健康,而环境研究人员可以更准确地模拟快速发展城市的碳足迹。

教AI"阅读"我们街道和建筑的语言产生了对我们所建世界更深入的、数据驱动的理解。这与我们更广泛的Earth AI使命一致,即将行星信息转化为可执行的智能——这一目标得到了我们现有的基础模型生态系统的支持,包括人口动态基础模型(PDFM)和远程感知基础的RS-MaMMUT VLM模型。这些工具共同提供了映射和管理我们对地球影响所需的规模和精度。

Q&A

Q1:S2Vec是什么?它有什么特殊能力?

A:S2Vec是Google Research开发的自监督学习框架,能够将复杂的地理空间数据转换为通用嵌入向量。它的特殊能力是像人类一样理解社区特征,通过识别加油站、公园、住房分布的模式来预测人口密度、环境影响等重要指标。

Q2:S2Vec如何处理复杂的地理空间数据?

A:S2Vec使用两步栅格化过程:首先将地理空间特征映射到标准化网格上,计算每个网格单元内各种特征类型的数量;然后将这些计数转换为多通道图像,每个通道代表不同的特征类型,让AI能像处理数字照片一样分析地理数据。

Q3:掩码自编码在S2Vec中起什么作用?

A:掩码自编码(MAE)是S2Vec的核心学习技术,它系统性地向模型展示建筑环境的片段,同时隐藏某些部分,让模型基于周围上下文重建缺失部分。这种自监督学习方式无需手工标注就能训练模型,输出独特的数学嵌入向量来捕获位置特征。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
西安赛格国际购物中心回应一商户负责人坠亡

西安赛格国际购物中心回应一商户负责人坠亡

界面新闻
2026-07-02 20:40:37
继巴西后,西班牙成第2支世界杯淘汰赛两名20岁以下球员首发球队

继巴西后,西班牙成第2支世界杯淘汰赛两名20岁以下球员首发球队

懂球帝
2026-07-03 03:00:07
世界杯11队晋级16强!西班牙终于破16年魔咒,亚马尔延续全胜纪录

世界杯11队晋级16强!西班牙终于破16年魔咒,亚马尔延续全胜纪录

侃球熊弟
2026-07-03 05:07:26
125分钟点球绝杀!世界杯最伟大的反转:罪人变英雄,全队膜拜

125分钟点球绝杀!世界杯最伟大的反转:罪人变英雄,全队膜拜

体坛小李
2026-07-02 09:17:44
西安赛格购物中心坠楼发酵!离职10年的员工发声:严总做人特别好

西安赛格购物中心坠楼发酵!离职10年的员工发声:严总做人特别好

火山詩话
2026-07-02 04:50:43
记者:西海岸主帅郑智共停赛8场,战海港仍无法在替补席指挥

记者:西海岸主帅郑智共停赛8场,战海港仍无法在替补席指挥

懂球帝
2026-07-02 21:52:05
2026金球奖战力榜:凯恩领跑,法国三剑客紧随其后

2026金球奖战力榜:凯恩领跑,法国三剑客紧随其后

仰卧撑FTUer
2026-07-02 21:21:10
西安赛格商户老板疑被罚千万终跳楼,商场有无罚款权?

西安赛格商户老板疑被罚千万终跳楼,商场有无罚款权?

法度law
2026-07-02 16:58:22
老牌国货发文:价值观冲突,全面停止合作

老牌国货发文:价值观冲突,全面停止合作

南方都市报
2026-07-02 08:21:48
西班牙3-0奥地利,赛后评分:不是亚马尔第一,西班牙21号排第一

西班牙3-0奥地利,赛后评分:不是亚马尔第一,西班牙21号排第一

侧身凌空斩
2026-07-03 04:58:56
人民币升值到底是为了什么?说白了就是为了化债

人民币升值到底是为了什么?说白了就是为了化债

流苏晚晴
2026-07-02 20:03:30
捐588万出家!慧闵师父见女心切,因伤病无力干活被寺庙劝返红尘

捐588万出家!慧闵师父见女心切,因伤病无力干活被寺庙劝返红尘

时尚的弄潮
2026-07-02 05:11:39
让你考上才不正常!女孩哭诉备考5年没上岸,过来人一眼看穿症结

让你考上才不正常!女孩哭诉备考5年没上岸,过来人一眼看穿症结

林林先生
2026-07-02 11:14:07
疯狂2-0!世界杯最大黑马诞生:彻底打破40年魔咒,4场全胜0失球

疯狂2-0!世界杯最大黑马诞生:彻底打破40年魔咒,4场全胜0失球

童叔不飙车
2026-07-03 01:01:29
泽连斯基紧急回国!

泽连斯基紧急回国!

每日经济新闻
2026-07-02 17:59:23
曼城官宣夏窗首签!安德森加盟,转会费1.16亿,队史最贵引援

曼城官宣夏窗首签!安德森加盟,转会费1.16亿,队史最贵引援

奥拜尔
2026-07-02 21:12:06
金·卡戴珊只穿内衣对镜自拍,仅用细绳遮点

金·卡戴珊只穿内衣对镜自拍,仅用细绳遮点

赴一场山海啊
2026-07-03 00:59:33
A股:刚刚,证监会发布,释放一重要信号!明日分化将进一步加剧

A股:刚刚,证监会发布,释放一重要信号!明日分化将进一步加剧

虎哥闲聊
2026-07-03 00:00:06
突然崩了!一大群网友已炸锅:不会办公了……

突然崩了!一大群网友已炸锅:不会办公了……

极目新闻
2026-07-02 17:59:52
西安赛格坠楼热搜刷屏:我看到谋生的严总,走上绝路时的无助

西安赛格坠楼热搜刷屏:我看到谋生的严总,走上绝路时的无助

李晚书
2026-07-02 18:44:26
2026-07-03 06:15:00
至顶科技 incentive-icons
至顶科技
科技产业媒体与 AI 产业服务机构
19821文章数 49713关注度
往期回顾 全部

科技要闻

马斯克不承认,但SpaceX就该造AI手机

头条要闻

西班牙3-0奥地利进16强 奥亚萨瓦尔双响波罗头槌

头条要闻

西班牙3-0奥地利进16强 奥亚萨瓦尔双响波罗头槌

体育要闻

韩国人,为什么恨透了洪明甫?

娱乐要闻

众星祝福祖国,曾沛慈原形毕露?

财经要闻

千亿茶市场无赢家:澜沧巨亏 八马停"蹄"

汽车要闻

有纯电有增程 还有二代VLA支持 小鹏MONA L03预售价14.38万起

态度原创

健康
亲子
手机
数码
教育

这4类消化病患者 吃粘食管住嘴

亲子要闻

费列罗“健达快乐运动”游戏盒子将走进上海150所小学及幼儿园

手机要闻

Android 17缺的原生应用锁功能,谷歌仍在持续打磨

数码要闻

卓威同步发布XQ2766X显示器:27" QHD 360Hz TN

教育要闻

大名县东关小学2026年一年级新生招生简章

无障碍浏览 进入关怀版