原文发表于《科技导报》2025 年第18 期 《 遥感多维数据格式研究进展 》
遥感是全球变化研究最重要的技术手段之一,多维数据的获取与应用成为研究热点。《科技导报》邀请中国科学院空天信息创新研究院遥感科学国家重点实验室、中国科学院空天信息创新研究院遥感卫星应用国家工程研究中心研究员张立福团队撰文,文章综述了遥感多维数据格式(特别是多维时空谱数据)的国内外发展情况、最新研究成果、当前技术难点以及未来发展方向。介绍了中国科学院空天信息创新研究院在国际上首次提出的多维数据格式及其多维遥感数据综合与表征的理论和技术体系。旨在将这一创新成果传递给更广泛的读者和科技爱好者,共同推动遥感科学与技术的发展和应用。
遥感是全球变化研究最重要的技术手段之一,已从军事和科研扩展到广泛的民用领域,提供实时、大范围的地理信息。随着技术的进步,遥感数据的分辨率、覆盖范围在不断提升,通过遥感卫星长时间连续地观测,积累了大量长时间序列、多分辨率、多光谱系列数据。多维数据的获取与应用成为研究热点,对遥感数据的组织和存储提出了更高要求。
目前缺乏完全由中国原创且与国际完全不同体系的遥感数据格式,并且现有格式在一定程度上存在局限性。中国科学院空天信息创新研究院张立福团队基于遥感多时相、多空间、多光谱等数据特点,在国际上首次提出时空谱多维数据格式(MDD),为遥感数据的组织和存储带来了新的突破,提高了长时序遥感数据的利用价值。为便于多维时−空−谱数据的构建读取和分析,我们的研究配套研发并出版了多维分析(MDA)软件模块,该模块集成于多维遥感分析(MARS)软件中。
1 研究意义
多维数据格式通过全方位地记录并一体化组织地球表面的各种信息,可以构建更完整、精确的地球系统模型,有助于深入研究地球的大气、陆地、海洋等各圈层之间的相互作用和物质能量循环。同时,多维数据格式解决了现有数据格式以及传统时间序列变化检测存在的部分问题。
1)解决数据格式兼容性问题。随着遥感技术的发展,多种卫星平台和传感器不断涌现,各自采用不同的数据格式,这种格式差异使得数据难以直接整合和共享。因此,实现对多源长时间序列遥感数据的统一管理,对科学研究是极为重要的。
2)传统遥感时间序列变化检测仍存在问题。
在时间维上,仅针对单一像元的时间序列数据进行分析,忽略了像元邻域的空间信息;
在空间维上,没有考虑像元之间的空间相关性,部分融合空间特征的算法对空间信息的利用依然很少。
2 国内外研究进展
2.1 国外发展现状
国际上,遥感数据格式种类繁多,广泛应用于不同遥感平台和传感器数据。国际上常见的遥感数据格式虽然在各自的应用领域有一定的优势,但也存在局限性。这些格式在数据组织和存储方面,没有对不同应用场景进行详细的划分,导致在一些特定的应用中,难以满足针对性的需求。
2.1.1 HDF−EOS
HDF−EOS数据格式是美国伊利诺伊大学国家超级计算应用中心(NCSA)于1987年研制开发的一种软件和函数库,主要用来存储由不同计算机平台产生的各种类型科学数据,适用于多种计算机平台,易于扩展。其核心存储原理围绕分层数据管理、地理空间数据类型标准化和元数据自描述性展开。HDF−EOS在遥感数据处理中展现的核心优势在于其多源数据整合能力与地理空间标准化支持。
尽管HDF−EOS功能强大,但其在应用中仍面临显著挑战。首先是复杂性带来的技术门槛,用户需同时掌握HDF5数据模型、EOS扩展类型定义和地理编码规则。存储效率问题在大规模遥感场景中凸显,强制嵌入的元数据(尤其是XML格式的全局元数据)可能导致文件体积膨胀,而HDF5的块状存储机制(chunking)在未合理配置时,会使高频访问小范围数据的效率低下。
2.1.2 NetCDF
NetCDF是由美国大学大气研究协会的Unidata项目科学家针对科学数据的特点开发的,是一种面向数组型数据的科学数据格式,可以有效存储多维度、多变量的遥感数据,并支持数据的压缩、子集提取等操作。它广泛应用于大气科学、水文、海洋学、环境模拟、地球物理等诸多领域。
NetCDF能够存储多维数组数据,但是NetCDF格式通常依赖于复杂的数据结构,如树或链表来组织信息,并且建立在三维立方体模型上,难以用于长时间的数据序列分析。其复杂的数据模型和长时序处理瓶颈仍制约着超大规模遥感应用。
2.1.3 GeoTIFF
GeoTIFF是在TIFF基础上扩展而来的。GeoTIFF可以存储单波段或多波段的遥感图像数据,通过其中的地理参考信息,使用者能够方便地将图像数据与实际地理空间位置关联起来。
在遥感领域,GeoTIFF的核心优势在于地理空间直读性与广泛兼容性。但是在处理复杂的多维时空谱遥感数据时,GeoTIFF具有一些局限性。例如,对于包含多个时间序列、多种光谱波段和不同空间分辨率的数据,其组织方式可能会比较繁琐。虽然GeoTIFF允许通过自定义标签添加元数据(如传感器参数、大气校正系数),但其标签体系缺乏结构化层次。对三维(如大气垂直剖面)或四维数据(时间×高度×纬度×经度)缺乏原生支持。同时,由于GeoTIFF主要侧重于图像数据和地理参考信息的存储,对于添加新的数据类型(如传感器的其他辅助数据)的灵活性相对较低。
2.2 国内发展现状
中国在遥感数据处理与应用中对HDF5格式的优化改进,主要集中在元数据扩展、存储结构优化、性能提升和工具链适配等方面,以满足国产卫星数据的特殊需求并提升数据处理效率。
遥感数据具有多样性和复杂性,包括不同的分辨率、光谱波段、投影方式等。因此,设计能够兼容各种类型遥感数据的存储格式是一个巨大挑战。此外,遥感数据量巨大,如何高效地利用存储空间,避免浪费,是研发遥感存储格式时需要重点考虑的问题。
3 最新研究进展
在遥感多维数据格式方面,中国取得了重大的创新突破与丰硕成果。
在国际上首次提出多维数据格式MDD,构建了多维遥感数据综合与表征的理论和技术体系,促进了国内在数据组织方面研究的发展,并获授权PCT发明专利,实现了中国在遥感数据格式领域专利的突破。目前,MDD成为国家对地观测科学数据中心、全球变化数据出版系统认可的数据格式。
研发了国际首个“遥感多维数据格式互操作分析软件系统”,在全球变化数据出版系统出版。
同时,研究成果在多个行业用户单位进行广泛推广和应用,产生较好的社会效益和经济效益。
此外,牵头编写的团体标准《遥感时空谱多维数据格式》被中国地理信息产业协会批准发布实施,成为国家对地观测科学数据中心、全球变化数据出版系统认可的数据格式。
3.1 多维数据的组织与存储
由于不同传感器数据,其波段设置、光谱响应函数、空间几何成像等不同,难以直接应用于时序分析,因此需要进行数据的重构:
根据应用需求或目标,获取多源遥感数据;
进行标准化预处理,即投影转换、几何纠正、拼接、裁剪等。
为了准确提取时序特征,一般需要对其进行插值、滤波和融合重构。
针对长时序遥感数据的组织和存储问题,MDD数据集将多维数据的空间、时间和光谱构建成一个四维数据集,以此来实现对长时序数据的统一管理。多维数据格式的头文件中记录了用于表达和解析影像数据体文件的所有元数据信息(表1)。同时,多维数据结构可以对已生成的文件进行增加或者删减图像数据等操作。MDD数据体文件是存储影像数据的文件,采用二进制的字节流。
表1 头文件中包含的信息
![]()
类似于传统遥感数据的存储,MDD数据依照存储方式的差异,可分为5种存储方式,分别如图1~图5所示。
TSB数据结构适用于对一个时间上或若干个波段的数据进行空间维度的处理,可应用于提取一个或多个时间所有波段组成的光谱立方体数据,方便进行光谱邻域运算和空间域滤波等。
![]()
图1 数据存储的TSB格式结构
TSP数据结构适用于对一个时间的光谱数据进行操作,可应用于提取一个像元或者一片区域的光谱曲线或者对不同时间的影像进行光谱特征化。
![]()
图2 数据存储的TSP格式结构
TIB数据结构适用于提取某个波段的时间序列立方体数据,可应用于提取一个波段的时间序列立方体,可以进行光谱时间序列分析或针对某个波段选择3个时间的数据假彩色合成显示。
![]()
图3 数据存储的TIB格式结构
TIP格式适用于对像元的时间谱进行处理与分析,可应用于提取一个像元或者一片区域在某个波段的时谱曲线,在时间维度进行平滑和滤波处理,对时谱曲线进行拟合,以及进行预测分析等。
![]()
图4 数据存储的TIP格式结构
TIS数据结构适用于提取像元光谱曲线的时间序列数据,可应用于提取某一个像元在一个时间范围内的所有光谱曲线并对这些曲线进行三维可视化,并分析该像元的光谱随着时间变化的特征。
![]()
图5 数据存储的TIS格式结构
MDD数据格式具有灵活性、多维性、扩展性、完整性的特点。
3.2 MDD的计算机配套系统(MARS软件)
为了使用户理解和应用.mdd数据格式,研发了可用于.mdd数据输入、存储、分析和输出的计算机软件模块,命名为MDA多维分析计算机软件模块,该模块集成于遥感多维数据格式互操作分析软件系统(简称MARS 1.0)中。
MDA是基于MDD多维数据格式开发的集多维数据构建、多维数据分析和多维数据可视化于一体的遥感数据时空谱多维分析软件模块,其具体功能如图6所示。
![]()
图6 MARS软件功能介绍
目前,MDA模块已经集成了对原始MODIS、原始Landsat和经处理为ENVI标准数据格式的遥感数据的MDD数据构建。利用MDA将原始Landsat数据构建为MDD数据的总体流程如图7所示。
![]()
图7 利用MDA模块以Landsat为数据源构建MDD的总体流程
3.3 时谱的定义
传统遥感时序数据的存储和处理方式通常采用离散时间点管理,本质上仍停留在三维数据处理层面,未能实现对长时序数据四维特征的有机整合与深度挖掘。针对这一研究空白,张立福团队在继承前人研究成果的基础上创新性地提出了“时谱”理论。该理论借鉴光谱概念,将地物目标在不同时相的遥感特征序列定义为时谱特征。如图8所示,特定地物在时间序列上的时谱特征值变化轨迹被称作时谱曲线。
![]()
图8 植被指数时谱曲线示例
时谱特征是指从时谱曲线中提取的统计或时序特征(如最大值、最小值、均值、方差等),用于表征单个像元在某一波段上的时间动态变化规律及其光谱特性。多波段时谱特征则是从多波段时谱曲线中提取的复合特征,能够更全面地刻画地物的时空−光谱联合变化模式。
3.4 遥感时谱理论的应用
在生态环境领域,能够有效提升对森林演替过程以及发展态势的理解能力,基于时空谱信息的森林扰动检测具有更高的敏感度和精准性。在生态保护修复工程需求的基础上可形成星空地协同作用的技术框架,有效提升生态保护修复的效果。
徐权选取了GI、SRI、NDVI和NGRDI 4种常用的植被指数作为光谱特征空间进行分析,构建了时间序列的无人机遥感影像,有效地解决了单一时期影像的弊端,进一步提高了农作物的分类精度和效率。
地表覆盖变化检测方法,通过对土地变化检测以及调查农作物种植情况,不仅可以为国家的农业政策及时提供资料,同时也可以使土地利用更加充分,促进人与自然之间的和谐关系。
时谱的出现使地物有了一种不同的方式来表现其特点,在土地种植类型判断的问题上就有了别样的方法和思路。基于时空谱的耕地类型分析也具有全物候的特点,可以很好地消除季节因素引起的伪变化。Lin等提出了基于时谱特征的地表覆盖变化检测方法,如图9所示。结果表明所提出方法的有效性和稳定性,在不影响定量分析遗漏率的情况下,该方法的错误检测显著减少。
![]()
图9 基于时空谱特征的变化检测方法
4 技术优势
MDD格式通过一体化存储时间、空间、光谱维度的信息,解决了数据格式不统一的问题,提高了数据管理的便捷性和效率。统一的数据格式和一体化组织方式使得不同学科的数据能够更好地共享和交互,促进了跨学科的研究合作。
多维时空谱数据一体化组织减少了数据整合过程中的冗余操作和数据转换的复杂性。新的数据格式可将时空谱信息有机结合,在数据读取、预处理、特征提取等环节实现更高效的算法设计和计算流程优化。
统一数据格式是实现遥感数据广泛共享和互操作的基础。在国际合作、不同研究机构和企业之间的数据交流中,标准化的数据格式能够确保数据的无缝对接和正确解读。
5 未来展望
MDD的提出加强了与国际组织和其他国家的合作,推动了遥感数据格式的标准化和互操作性,为遥感技术的国际交流与合作提供了新机遇。未来通过拓展MDD数据格式在农业、气象、环境监测、城市规划等领域的应用,可以推动遥感技术与GIS、物联网等技术的融合,提升数据服务水平和应用效果。
MDD格式为遥感分析带来效率和精度的显著提高,并在多个行业用户单位进行广泛推广和应用,产生较好的社会效益和经济效益。
此外,研发的国际首个“遥感多维数据格式互操作分析软件系统”,在全球变化数据出版系统出版后,被多个行业用户单位广泛应用。
6 结论
MDD格式的提出促进了国内在遥感数据存储和组织方面研究的发展,并获得了国际PCT专利授权,有助于推动遥感技术的标准化和国际化进程,增强国际交流与合作。MDD格式及配套软件为遥感数据的时空谱多维联合分析提供了支持,显著提升了数据处理效率和准确性,有助于深入挖掘遥感数据中的信息,为科学研究和应用提供更有力的支持。未来,随着技术的不断创新和应用领域的不断拓展,遥感多维数据格式将发挥更加重要的作用,为人类社会发展和科学研究提供有力支持。
本文作者:张立福、张赛、孙雪剑、赵淑馨、黄长平、高宇、童庆禧
作者简介:张立福,中国科学院空天信息创新研究院遥感科学国家重点实验室、中国科学院空天信息创新研究院遥感卫星应用国家工程研究中心,研究员,研究方向为高光谱遥感机理及多学科应用;孙雪剑(通信作者),中国科学院空天信息创新研究院遥感科学国家重点实验室、中国科学院空天信息创新研究院遥感卫星应用国家工程研究中心,副研究员,研究方向为高光谱数据融合。
文章来 源 : 张立福, 张赛, 孙雪剑, 等. 遥感多维数据格式研究进展[J]. 科技导报, 2025, 43(18): 67−76 .
本文有删改,
内容为【科技导报】公众号原创,欢迎转载
白名单回复后台「转载」
《科技导报》创刊于1980年,中国科协学术会刊,主要刊登科学前沿和技术热点领域突破性的研究成果、权威性的科学评论、引领性的高端综述,发表促进经济社会发展、完善科技管理、优化科研环境、培育科学文化、促进科技创新和科技成果转化的决策咨询建议。常设栏目有院士卷首语、科技新闻、科技评论、专稿专题、综述、论文、政策建议、科技人文等。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.