传感器、通信、计算机等技术的革新促进了对地观测及相关产业蓬勃发展。国外主要的高分辨率遥感卫星系统,如美国的Landsat、Terra、Aqua,欧洲的Spot、ERS、ENVISA等卫星系统持续建设。中国也将自主遥感对地观测体系作为重点发展领域。尤其在国家高分辨率对地观测系统重大科技专项的支持下,近年来遥感卫星的数量迅速增长。如
遥感大数据兼具大数据典型的“4V”特征(
事实上,从遥感影像获取到产品生成,再到按需分发是一个相当长的链路,涉及数据引接、数据传输、成像处理、信息提取、共享分发、定制应用等多个环节(
现有技术条件下,针对单颗卫星或单类载荷的成像处理和信息提取方法已较为完善。由于遥感数据资源的丰富与定标手段的改进,针对单颗卫星或单类载荷的几何定标与辐射定标精度越来越高,成像质量大幅提升。同时,得益于遥感样本数据的不断累积和深度学习方法的引入,针对特定载荷中部分目标类别的提取精度大幅提升,在一定程度上解决了单星单载荷处理和应用的问题。
值得注意的是,相比单传感器,多星协同的对地观测可提供多分辨、多光谱、多时相的遥感数据,为地物分析、区域监测等各类应用提供更丰富的价值信息(
相比观测手段的进步,多星数据的处理和应用技术仍处于探索阶段,其技术瓶颈主要在于:每颗卫星的传感器类型或特点不同,导致成像数据间非线性辐射差异大、同名点匹配难度大,数据质量难以得到统一保障。对于此,现有的多星一体化处理主要体现在系统架构和数据组织上,处理算法上的统一相对较少。现行方案大多将多源数据统一在一个系统上,以德国布罗克曼公司构建的Calvalus系统为例(
在多星多载荷信息分析方面,随着以深度学习为代表的机器学习技术被广泛用于遥感数据解译,已有少量基于简单数据融合或模型叠加的多星并行信息提取研究,一定程度上提升了图像中典型目标的提取性能,但距离实用尚有一定差距。究其原因,除了受载荷特性、成像质量影响外,一方面是尚不具备真正的多要素多任务并行处理能力,现有方法针对不同输入、不同目标的特征提取过程各自独立,尚未充分利用不同模态之间的互补信息,实现多源信息联合优化建模,容易陷入针对特定任务的局部最优,模型泛化能力较弱;另一方面是模型在多个任务并行处理时存在“记忆缺失”,不同任务之间的差异较大,在已有任务上学习到的知识难以直接迁移到层出不穷的新目标、新类别,往往需全样本重新训练,资源耗费较大。
综上,本文在系统阐述遥感成像处理与信息提取技术发展现状的基础上,提出了一种遥感大数据条件下的多星一体化处理与分析新思路。相比现有方法,更充分的利用不同卫星和载荷之间、不同任务和目标之间的共性特征和互补信息,即基于持续积累并不断更新的图像数据,对多星传感器全链路处理中各环节的误差定量分析。并构建多星一体化成像处理模型,通过对成像参数的逼近估计,实现高精度的几何和辐射校正,生成高质量的海量样本数据。进而,构建面向复杂场景的多任务共享学习网络模型,突破对新旧任务“记忆保持”的能力瓶颈,实现面向多星数据中多类地物要素的并行精准提取。通过多星一体化处理的新方法框架,实现多传感器成像质量和目标对象提取精度的同步提升,进一步发挥遥感数据的应用效益。
本文的遥感卫星“成像处理”是指从卫星接收到原始数据到生成交付应用的图像产品的过程。对于光学而言,主要是几何校正和辐射校正,对于SAR而言,则首先需要聚焦成像,再进行几何和辐射校正。在此过程中最重要的是要获得准确的成像处理参数,包括系统参数、轨道参数、大气参数等,其中部分参数通过外源数据获得经验值,部分参数通过地面测量和内定标测量得到,其他未知参数则主要通过人工外场定标得到。
人工外场定标法是国际普遍采用的方法,但该方法需要大量定标设备和地面同步观测数据,耗费巨大人力、物力、财力,需定期进行,容易受场地和天气条件的限制,所能提供的定标参数数量有限,无法及时发现传感器的各种状态变化。此外,定标器和辐射定标场地表类型往往过于单一,无法进行多点定标及真实性检验的需求。
随着遥感分辨率提升至亚米级,几何辐射精度要求不断提高,其对成像参数的精度要求也随之提升,依靠少量定标器有限次的定标测量,越来越难以满足高分辨率高精度成像对各参数获取的需求,亟需利用多星多载荷的优势,发展新的处理思路。
聚焦成像主要针对SAR而言。经典的SAR成像处理都是基于卫星成像几何物理模型构建严密的系统传递函数,基于此推导兼顾效率和精度的成像算法,如经典的BP算法、RD算法(
上述成像处理算法解决了模型参数已知条件下的精确聚焦问题,然而轨道、系统、大气以及地面目标自身均存在不确定的误差因素,会引起聚焦精度下降。此时,需研究参数估计和自聚焦的方法,这一直是SAR成像处理中的难题。现有的自聚焦方法包括Mapdrift、PGA(
成像处理方法
类型 | 方法 | 特点 | |
---|---|---|---|
参数已知下的成像处理 | 频域为主 | RD、CS、WK、及其改进算法,如NLCS、AP-NLCS等 | 效率高,但对参数的时变和空变性适应能力较弱;经典算法适合传统条带模式,复杂模式需要针对性的改进算法 |
时域为主 | BP、FBP、FFBP等 | 效率较低,但对参数的时变和空变性适应能力强,适合各种模式 | |
时频混合 | CMBP算法等 | 效率/精度可调,适合高分辨率复杂模式 | |
参数未知下的成像处理 | 参数法估计 | Mapdrift、稀疏处理方法 | 物理模型约束,结果比较可靠,但若模型不合适,则结果较差 |
非参数法估计 | PGA、MEA等 | 无模型约束,适应能力强,但不如参数法估计可靠 |
在几何和辐射校正方面,已发展出针对不同类型卫星的经典物理模型。
在几何校正方面,SAR主要基于距离—多普勒模型,光学主要基于有理函数模型RFM(Rational Function Model)进行几何校正。经过几十年的发展,上述模型已相当成熟,随着分辨率和几何精度的提升,近年来的研究重点在于如何更加精确的对各种误差因素进行建模、标定和补偿。在光学方面,
在辐射校正方面,SAR的辐射校正包括系统增益控制校正、接收链路增益校正、天线方向图校正、处理增益校正、斜距衰减校正等,主要基于经典的雷达方程建立全链路辐射误差校正模型,并在此基础上通过人工定标器测量得到定标常数,用该常数校正后便可从图像的像素值得到地物散射值。光谱辐射校正主要包括传感器灵敏度特性、光照条件差异、大气校正、地形校正等,目前主要基于经典的辐射传输模型基础上基于大气、地形等外源数据进行校正,并通过人工外场定标得到辐射定标常数值。
随着卫星数量和卫星影像资源不断丰富,单星或单载荷的成像处理往往精度有限,利用多星多载荷综合开展成像处理成为重要的研究与发展趋势。
在成像处理方面,为简化系统的设计和维护,德国DLR等提出多模式一体化处理算法框架(
在几何校正方面,随着卫星影像的丰富,在一个地区覆盖有多星、多传感器的影像,利用异源影像交叉定标或联合平差,引起了国内外学者的兴趣。
在辐射校正方面,已有部分多传感交叉辐射定标的研究。
综上,目前在多星多载荷成像处理方面,或以一个已定标的卫星影像作为基准来校正另一个影像,或基于多影像各自成像物理模型的联合解算从统计上减小误差。当多星同时存在待标定的参数时,要如何一体化进行误差参数标定和校正,相关研究还较少,尚缺乏一套通用的、可兼容各种卫星各类处理的一体化处理思路和方法。未来多星一体化成像处理是一个值得深入研究的方向。
早期的遥感数据解译受分辨率等因素的限制,数据中反映的信息有限,待解译的要素多为植被、水体、建筑区等大型自然或人造地物要素,且局限于目标检测和地物要素分类等单一任务。随着分辨率和图像质量提升,遥感数据中反映的地物要素信息越来越丰富,人们不仅希望能从遥感数据中知道目标是否存在并获取目标的位置信息,还希望区分目标类型并获得目标的形状、姿态以及尺寸等物理信息。为此,亟需突破面向遥感数据的多要素多任务智能解译方法。
传统多要素解译与信息提取通常采用“单入单出”解译模式,即针对不同要素或任务设计专用模型或方法,多个任务并行开展。现实情况下,面向待解译场景,通常会获取到多源多模态遥感数据,传统方法虽然针对单一要素或任务能够取得良好的性能,但面对这类“多入多出”(多类数据输入、多任务输出)应用场景其适用性有限,一是专用模型的可拓展性较低,面临新场景或任务时性能难以保证;二是由于特征提取过程各自独立,各类模型或方法的简单叠加难以取得性能线性增益的效果;三是这种专用模型叠加会导致模型计算时间和空间复杂度的大幅提升,实用性较差。
围绕上述问题,近年来,陆续出现多要素信息并行提取方面开展研究工作,力求实现多源数据间互补特性、多要素间表示特征的有机结合,改善模型的泛化性能。
如上文所述,经典遥感要素信息提取通常针对不同要素或任务设计专用模型或方法,其研究问题可大致归纳为两类,一是遥感数据和要素特性分析,以此为基础构建遥感数据要素特征/特性体系,为后续模型构建提供基础依据;二是遥感专用模型构建,即在通用模型或方法的基础上,构建符合遥感领域知识或数据特性的信息提取模型,提升其在遥感要素信息提取中的应用性能。
由于遥感数据获取和成像方式的特殊性,遥感数据和要素特性分析重点聚焦于成像特性(如电磁波散射机制)、影像表观特性(如光照、纹理等)、要素分布特性等的分析,以此为基础进行数据特性信息提取或数据仿真。
遥感专用模型构建方面,传统研究主要针对要素多尺度、类间分布规律等特性进行相应模型结构或信息提取流程,增强传统模型或方法面向遥感数据的适用性。
现有方法大都基于单一源数据的仿真或特性信息提取,而在多要素信息并行提取中,往往面临同一任务中需要结合不同的特性信息,如在目标检测时同时考虑目标多尺度、多角度、目标类型分布、多时相数据纹理变化等多种特性,目前尚缺乏对各类特性信息的统一分析和提取框架,造成各类特性融合分析存在要素约束尺度不统一、特征共享互补难等问题,制约了一体化要素分析和信息提取的发展,因此亟需研究统一模型框架下的多任务多要素信息并行提取方法。
在多要素信息并行提取方面,近年来的主要研究方向是如何在同一个模型中并行实现目标或要素类型、位置、深度等多类信息的提取,期望通过相关信息间信息共享表示,提升模型的整体泛化性能。针对上述“多入多出”应用场景,现有方法主要聚焦于专用模型近输出端的多要素数据特征共享和和输入端的多模态数据融合两方面问题(
多要素信息并行提取方法总结
方法 | 特点 | 应用领域 | |
---|---|---|---|
多任务 特征共享 | 基于硬参数共享的方法 | 主干网络共享,模型结构简单,任务间关联性较弱 | 地物要素分类、建筑物提取、深度估计、图像重建、图像锐化、边界检测等 |
基于软参数共享的方法 | 不同模型间信息互换,以共享连接或递归方式改善每个任务的输出 | 地物要素分类、极化SAR图像地物要素分类、高光谱图像地物要素分类、高光谱目标检测等 | |
多模态 数据融合 | 简单融合方式 | 实现相对简单,计算高效,精度较为一般 | 多模态数据分类 |
双线性池融合 | 可获得更加充足的特征表示,计算复杂度较高 | 遥感数据语义检索 | |
基于注意力的融合 | 能够基于统一模型架构实现,架构相对复杂 | 遥感数据语义检索 |
多要素特征共享方面,根据参数共享方式的不同,主要分为两类方法,一是基于硬参数共享(hard-parameter sharing)的方法,即多类要素提取模型共享同一个主干网络,通过在模型输入、输出端融合多个不同分支模型实现多任务的预测;二是基于软参数共享(soft-parameter sharing)的方法,即面向不同要素提取的多个独立网络通过共享连接的方式进行融合,从而实现多个类信息的并行输出。
基于硬参数共享的方法在主干网络中共享多要素特征,然后使用一组独立的头处理任务。
基于软参数共享的方法首先利用多个网络进行初始任务预测,然后利用这些初始预测的特征,以共享连接或递归的方式进一步改善每类要素信息的输出。
此外,不同任务的输入数据往往呈现出多模态的特点,如可见光图像数据含有丰富的纹理信息、高程数据能反映地物目标的三维特性、矢量数据包含了不同地物的拓扑结构特性,通过各类模态数据的有效融合分析,有望提升各类任务模型的泛化性能。
上述方法虽初步实现了在同一框架下多要素信息的并行提取,但本质仍是单一类型输入数据下多个专用模型或网络分支的叠加,而不同类型、不同来源的遥感数据往往存在不同的维度特性,现有方法尚难以在统一框架下实现不同维度多要素输入的融合分析,使其进一步提升性能的空间有限,同时在进行不同成像条件下的数据解译或新任务扩展时,由于特征域分布的差异容易导致模型综合性能大幅下降。此外,现有多模态数据处理方法多针对地物要素分类等单一任务,因此需探究如何实现多模态数据多任务学习,在多任务模型构建过程中充分融合多模态数据的各自优势以进一步提升性能。
多星一体化处理和分析,是借助持续积累的遥感数据样本优势,将统计学习、机器视觉等智能方法与以载荷机理、目标特性为基础的成像计算和目标识别方法相结合,实现多传感器成像质量和目标对象提取精度共同提升的基础应用技术。这是一个具有通用性的模型框架,可适用并贯穿于不同类型卫星的成像处理和信息提取全流程,从而对于一些多载荷多目标共有的误差参数和干扰因子,可以一体化地进行学习求解。
相比传统面向单星单载荷的成像和分析方法,多星一体化处理和分析主要具有以下特点:(1)通过将多星传感器各项参数、各类地物要素的特征信息,以及处理分析流程中的各环节误差纳入一个统一的框架,进行定量综合计算,能够更加充分的利用不同卫星和载荷之间、不同任务和目标之间的共性特征和互补信息;(2)处理和分析两个环节相互促进,通过构建面向多源载荷一体化的成像优化处理,旨在生成高质量的多模态遥感数据;基于高质量遥感数据,通过构建面向多任务多目标的优化网络模型,实现复杂遥感场景下的多类信息提取,生成高精度的遥感解译标注结果。可见,该技术与现有技术存在实质的不同,是一种全新的技术思路。
为实现多星一体化处理和分析目的,需从海量遥感数据中挖掘成像处理与信息提取两个关键环节所蕴藏的各类共享信息。为此,该方法主要涉及多星高精度成像中全链路误差建模与估计、多目标多任务特征共享网络构建与求解两大核心科学问题。
(1)多星高精度成像中全链路误差建模与估计。星载传感器信号地面处理的本质是针对电磁波“天—地”两次循环中全链路产生的各类误差进行校正,实现目标特性的高精度反演。这些误差包括:载荷误差(衰减、噪声、幅度、相位等)、平台误差(位置、速度、姿态等)、数传误差(误码、丢帧、饱和等)、大气影响(温度、湿度、压强、气溶胶、颗粒物、电子浓度等)众多因素(
从成像结果来看,上述误差高度耦合,难以构建解析的参数化成像模型,从图像结果反推各类误差,并依据成像模型进行精确误差补偿。另一方面,采用定标技术覆盖所有成像条件和工作模式,需投入大量的人力物力,并且难以获取时间非平稳的随机性系统误差。在遥感大数据背景下,系统误差和图像质量之间映射关系的可重复性,为多星一体化成像模型构建提供了一种新的途径。为此,迫切需要构建一种面向多星数据的一体化成像模型,能够基于大数据自适应学习逼近成像参数的最优估计。
(2)多目标多任务特征共享网络构建与求解。多星一体化信息提取本质是从多域复杂信息全集中并行提取多类要素的问题,该方面存在几个难点:1)遥感场景下多类目标特征各异,存在尺度差异大、角度变化多、小目标分布密集等特点,尤其对于多源数据,不同目标之间、甚至同一目标在不同模态之间的特征更加多变,以SAR图像为例,部分目标的后向散射系数对角度较为敏感,不同观测角度下目标特性存在显著差异,如飞机、复杂建筑群等(
针对上述问题,现有方法的思路大多仅依靠数据融合、模型叠加,或多类模型并行分布式处理实现,其本质上仍是通过特征升维实现模型性能提升,难以从根本上实现在多目标多任务一体化建模过程中对领域知识构建和共享特征提取过程的联合优化,在实际的复杂环境应用中面临着泛化性能、实用性能的瓶颈。因此,需要创新性发展基于多目标多任务特征共享网络的多星一体化信息分析方法,实现通过相关任务间信息共享过程的动态优化,突破现实识别分类应用中的性能瓶颈。
此外,在上述问题解决的基础上,也可以进一步探究成像处理与信息提取的一体化协同机制。可以通过深度学习提取目标特征,并结合目标物理特性作为先验知识,指导全链路校正参数,而更新后的校正参数则反馈给神经网络,提高深度学习特征提取精度,由此过程不断迭代,持续优化校正误差和特征提取误差。
针对高分辨率下高维耦合成像参数估计困难的问题,一个可行的思路是创建嵌入生成对抗网络的成像物理模型,以不同成像误差参数和大量存档数据为输入,通过成像物理模型得到大量的半物理仿真数据,建立以成像误差参数为标签的仿真数据集作为训练集。在此基础上构建生成对抗网络,习得仿真结果和高维误差参数之间的回归关系。从而,在应用阶段,对于实测数据,可以通过训练好的网络预测得到实测数据对应的比较准确的误差参数估计值。应用这些成像估计得到的成像参数,就可以在成像物理模型中进行很好地校正,从而可以得到优质的成像结果(
该方案具有良好的开放性和通用性。以SAR为例,接收到的信号可以概要表示为
式中,
成像的过程,就是由
式中,
为验证该思路的可行性,对基于对抗学习的多通道SAR相位误差估计进行初步试验验证。方位多通道SAR成像处理中,通道间的相位误差是影响成像质量的关键因素。卫星姿态、接收通道、天线等多种因素会导致通道间相位误差,该误差会造成图像中存在虚假目标,影响解译应用。随着通道数的增加,待估计量的空间维度升高,相位误差估计难度随之增大。本文采用上述技术思路,通过构建生成对抗网络,实现了误差的估计,并在低信噪比下依然具有较好的估计性能(
测试结果评价表
序号 | 信噪比/dB | 相位误差估计值与真值均方误差/(°) |
---|---|---|
1 | 10 | 0.0540 |
2 | -5 | 0.6257 |
针对多模态数据下的多任务信息提取,一个可行思路是创建可持续学习的、记忆保持的多任务特征共享网络模型,并引入小样本增量训练机制,实现多模态数据下多要素的并行提取,解决新任务加入或动态变化,导致原有旧任务学习精度难以保持、需要全样本重新训练的难题,思路如
对于多模态输入,本文通过特征共享层学习多模态下目标的共性特征,在模型末端设置面向不同任务的分类器,实现多任务的高精度输出。此外,通过在模型中嵌入记忆保持单元,对网络学到的多任务的特征进行存储,以对抗新任务到来时网络的遗忘问题。设计多模态联合优化凸非负矩阵因子,实现在同一个目标函数中对多模态数据的处理,利用多源数据中目标、场景之间的相似性减少噪声的影响,提升多模态数据关联特性。
具体为:对输入的
式中,
式中,
式中,
设模型共享参数为
对于第
这里,采用元学习器
从而得到新的预测模型
则,整个模型的联合目标函数为
式中,
为验证该思路的可行性,本文利用多模态影像开展多任务信息提取初步试验验证。输入数据选用光学Worldview遥感影像(分辨率0.3 m),与SAR高分三号遥感影像(分辨率1 m),同时进行目标检测与语义分割两项任务。试验结果如
不同模态输入试验结果表
输入数据 | AP | AP50 | AP75 |
---|---|---|---|
光学/Worldview | 29.3 | 50.7 | 30.7 |
SAR/高分三号 | 20.7 | 40.0 | 18.5 |
光学+SAR | 31.8 | 53.4 | 34.2 |
本文回顾了当前多星一体化成像处理和多要素信息提取的解决思路、技术现状和局限性,指出不同的卫星,成像机理显著不同,处理与信息提取方法差异大,尚未充分利用有效互补信息,成为制约当前对地观测遥感发挥效益的瓶颈难题。
为此,文中提出了一种遥感大数据条件下多星一体化处理新方法。在成像处理方面,对多星传感器全链路处理中各环节的误差定量分析,构建了多星一体化成像处理物理模型,实现高精度的几何和辐射校正。在信息提取方面,通过构建多任务特征共享与小样本增量学习网络模型,实现面向多模态数据的多类典型地物要素的并行精准提取。与传统方法相比,本文方法利用不同卫星和载荷之间的信息互为补充,实现了多星一体化处理。
在后续工作中,将着眼于遥感领域成像处理与信息提取脱节的问题,在成像处理与信息提取环节建立良性互馈机制。在信息提取过程中,引入载荷特性、载荷参数等成像机理,构建成像参数逼近估计和地物目标特征迭代双向驱动的网络学习方法,持续提高模型提取精度。同时,根据用户需求反过来对载荷类型、参数、成像质量等提出优化指导要求,促进对地观测数据的分辨率与质量的提升。从而形成多星一体化处理的双向良性互馈机制,最大化发挥遥感大数据的效益。