![]()
张延吉
探索街景图像大数据中的社会事实
作者 |张延吉
作者单位 |福州大学
原文 |
《中国城市社会空间分异的现状、变迁及影响因素——基于街景深度学习方法》一文有幸在《社会学研究》2026年第1期发表。应编辑部邀请,撰写这篇作者手记,我想从交叉学科如何切入社会学研究的角度分享这篇论文的成稿过程。
社会空间分异是各类社会分层现象在空间上的投射,可从两个视角进行考察:一是关注不同群体在城市内部空间分布上的差异;二是关注社会环境、空间品质、公服资源在城市内部的非均质分布。肇始于芝加哥学派,欧美社会学界对城市社会空间分异的量化方法、发展趋势、形成机制、社会效应开展了大量研究。可惜的是,鲜见涵盖中国所有城市的社会空间分异状况及其演进规律的研究,主要原因在于数据可得性。与量化收入或财富差距可依赖抽样调查数据不同,对社会空间分异的测度需要小尺度空间单元(如社区、1km×1km单元网格)的社会经济地位(SES)指标,而后者在数据获取上存在障碍。
为了探究中国城市的社会空间分异状况,我们开展了一些前期研究,它们构成了本文的基础。2022年我在Journal of Transport Geography发表Temporal variation in activity-space-based segregation: A case study of Beijing using location-based service data一文。该文利用手机信令大数据,估计了北京市某一工作日和休息日每小时的社会空间分异程度。这项工作突破了只从居住地的静态视角探讨社会空间分异的局限。以此为基础,我在Annals of the American Association of Geographers发表From residential neighborhood to activity space: The effects of educational segregation on crime and their moderation by social context一文,探讨了社会空间分异对犯罪活动的影响机制。遗憾的是,手机信令等大数据获取昂贵、推断社区SES指标的AI算法存在黑箱,致使这项工作仅限于北京,无法拓展到更多城市。
2023年贺琼博士(现任教于香港大学)给我推荐了一篇Leckie(2012)的论文,该文巧妙地使用多层模型在各层的随机效应量化特定尺度上的社会空间分异程度,借此绕开需要全域覆盖、小微尺度SES指标的数据要求,转而可用抽样调查数据测度城市社会空间分异。受此启发,我们运用某项全国社会调查在区县、街道乡镇、居委村委三个尺度上对中国各地级市的社会空间分异状况进行了测度和解释。详见2025年我们在Applied Geography发表的Understanding multi-scale educational and hukou segregation in urban China: A multilevel modeling approach一文。但该文的不足在于样本的代表性问题,国内常用的CGSS、CSS调查数据样本仅在全国尺度具有代表性,人口普查微观调查数据只在地级市及以上尺度具有代表性。受成本所限,社会抽样调查很难在街道乡镇、社区等中微观尺度上具有样本代表性,这也制约了社会空间分异研究结论的可靠性。
2023年我和我的硕士生(也是本文的第二作者)游永熠同学在完成由我主持的有关犯罪社会学的国家社科基金项目过程中,开始学习街景图像挖掘和计算机视觉算法,为本研究储备了所需数据和方法。我们的第一项工作是探究破窗效应对犯罪活动的影响,破窗理论特别提及物理失序(physical disorder)概念,将其定义为城市景观中的杂乱破败现象及衰退失控信号,如垃圾、涂鸦、建筑破败。一个社区的物理失序程度是该地社会经济地位的晴雨表,这为我们将物理失序作为社区SES代理变量,进而测度社会空间分异埋下了种子。在2024年发表的《物理失序对盗窃犯罪的影响及其在3D建成环境影响中的调节作用——基于街景图像深度学习的上海案例》一文中,我们以上海为案例,掌握了街景图像获取方法和目标检测算法,由训练而得的目标检测模型可对全域大规模街景图像中的物理失序现象进行高效率、高精度的自动识别。
我们的第二项工作受到MIT Place Pulse项目的启发,在对训练集中街景图像的主观感知(如安全感、富裕感)完成标注后,执行图像回归的深度学习任务,可对全域大规模街景图像中的主观感知水平实现高效率、高精度的自动识别。我们首先将这一思路运用于犯罪恐惧感(fear of crime)的测度,并在北京完成首次尝试。详见2024年发表的《犯罪恐惧感的空间格局、影响因素及其与犯罪活动的异同》。社研论文中富裕感知的测度也遵循了上述思路。
这两项探索性研究的成功促使我回到社会空间分异议题。我意识到,通过结合街景图像大数据与深度学习方法,可望在全国所有城市实现跨时期、广覆盖、小尺度、高精度、低成本的社会环境测度,能在一定程度上克服长期以来社会空间分异研究中存在的数据局限。2023年春,我和几位学生一起开始进行全国街景图像收集、物理失序数据集标注、感知水平数据集标注等工作,历时大半年。宋广文教授以及游永熠、庄宇丹、黄宏祥、黄佳玲、叶诚楷、潘振宇等学生参与其中。借此机会对他们的贡献深表感谢!
2025年秋,我们收到编辑部发来的外审专家意见。意见详实、尖锐、富有建设性,其中最具挑战性的两条意见涉及概念界定和解释框架。在概念界定方面,本文分别采用各城市中各社区物理失序面积或富裕感知得分的
Gini指数和空间
Gini指数测度社会空间分异。审稿人指出,两者的区别应在概念命名上有所体现。我联想到,用以测度多人群空间分布差异的D指数(Dissimilarity Index)在提出之初,仅考虑城市内部各地理单元人群构成比例的相似性,即使各地理单元位置有变,也不会改变D指数大小,因此被认为是不具有空间性质的社会空间分异指标(aspatial index),其特征类似于测度单一经济社会变量在各地理单元之间差异性的
Gini指数。后续学者提出的空间D指数则在考虑本地理单元人群构成的基础上,也考虑周边地理单元的人群构成,以从空间视角反映社会空间分异(spatial index),其特征类似于测度单一经济社会变量在局部邻里环境中分异状况的空间
Gini指数。可惜的是,既有文献并未统一两者命名,若将其分别称之为“非空间社会空间分异”和“空间社会空间分异”容易产生混淆。我草拟了几个概念的提法,听取了芝加哥大学社会学系蔡樑博士的意见,最终我们决定将两者分别命名为“社会空间全域分异”和“社会空间邻域分异”。全域分异反映资源禀赋及社会环境在城市内部各地理单元间的离散程度,属于非空间性概念,可用D指数、
Gini指数测量;邻域分异聚焦个体在小尺度局部相邻环境中体验到的社会空间分化,属于空间性概念,可用空间D指数、空间
Gini指数测量。为便于理解两者的意涵及其差异,我们还在修改稿中新增了示意图进行解读(图1)。希望学界对我们的这一概念分析框架提出批评建议。
![]()
图1 城市社会空间结构的模拟示意
关于解释框架,写作初稿时我们引入西方文献中提及的几个经典理论,试图检验中国城市社会空间分异的影响因素。这些理论包括:①全球城市理论,强调城市嵌入国际分工体系的影响;②空间同化理论,强调贫富差距的影响;③福利国家理论,强调政府再分配政策的影响。审稿人指出,这些理论关注的影响因素并无空间属性,用非空间因素解释社会空间分异存在不足。受此启发,我们提出了市场-政府“双主体”与宏观环境-微观空间“双视角”的解释框架(图2),该框架既可把现有理论囊括在内,也能补充市场主体和政府政策的微观空间特征。为此,我们增补了外企与本土企业空间分布的相似性指数、外来人口与本地人口分布的孤立指数、公共设施的空间集聚度、绅士化与郊区化程度等空间类指标,以充实解释框架的内容。这些空间类变量的测量需要用到各种大数据,如居住人数来自WorldPop数据库(https://hub.worldpop.org)、土地出让数据来自土地市场网(https://www.landchina.com)、企业数据来自工商企业注册数据库(https://shiming.gsxt.gov.cn/corp-query-homepage)、POI取自高德地图(https://lbs.amap.com)、道路矢量地图取自OpenStreetMap。要在一个月的返修期内完成对全国范围内大量数据的收集、整理、清洗、计算是一大挑战。除游永熠同学的辛劳工作外,硕士生潘振宇同学在AI指导下编写了用以数据整理和变量测量的Python代码,这一创新极大提高了工作效率,特此感谢!
![]()
图2 “双主体-双视角”解释框架示意图
最后,我要感谢外审专家、编辑部各位老师在本文修改中提出的真知灼见!感谢政光景老师在三轮校稿过程中对本文进行的细致修改!感谢《社会学研究》对交叉研究的支持和对青年学人的勉励!也要特别感谢福州大学社会学系和城乡规划系,福州大学允许我同时在两个专业招收硕士研究生、给两个专业的同学上课,这使我的小团队中始终充满多学科交叉氛围,各位同学在互学所长、追求前沿的过程中获得进步,也令这项具有空间视角、融合计算机前沿方法的社会学研究成为可能。在本文写作期间,我迎来了女儿的诞生,由衷感谢家人们的高效协作和互相支持,让我能有比较充足的时间和精力投入研究。热切期待各位学界前辈和同仁对本文提出批评建议,来信可发送至chairman7up@126.com。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.