1 引 言

传感器、通信、计算机等技术的革新促进了对地观测及相关产业蓬勃发展。国外主要的高分辨率遥感卫星系统,如美国的Landsat、Terra、Aqua,欧洲的Spot、ERS、ENVISA等卫星系统持续建设。中国也将自主遥感对地观测体系作为重点发展领域。尤其在国家高分辨率对地观测系统重大科技专项的支持下,近年来遥感卫星的数量迅速增长。如图1所示,截至2020-12,中国已发射对地观测卫星190余颗,在轨卫星数量居全球第2。相应的,每日获取遥感数据量呈指数级增长,以高景一号卫星为例,日采集范围可达90万km2Liang,2017),珠海一号系列卫星日数据采集量可达近20 TB(Bai,2019)。可以说,中国正在快速步入遥感大数据时代。

10.11834/jrs.20211058.F0012014年—2020年间中国和全球对地观测卫星发射数量比对(UCS, 2021; <xref ref-type="bibr" rid="R32">Liu等, 2020</xref>)Comparison of the earth observation satellites number of China and global from 2014 to 2020 (UCS, 2021; <xref ref-type="bibr" rid="R32">Liu et al., 2020</xref>)

遥感大数据兼具大数据典型的“4V”特征(Viktor等,2013),同时还呈现出新的“四多”特点(图2)。(1)“多载荷”,可见光、红外、高光谱、微波等传感器类型越发丰富,但不同传感器间成像机理不同、预处理方式不同、数据内容和表现形式差异大;(2)“多分辨”,卫星数据的空间分辨率与光谱分辨率不断提高,对目标的细节特征展示更为充分,但相应的背景干扰也越发明显;(3)“多时相”,通过定性或定量方式获取并计算同一区域和地物要素不同时相的变化过程,能够获取该目标对象更为丰富的属性信息;(4)“多要素”,遥感数据覆盖区域范围大、场景杂、类别多,包括植被、道路、水域等多类地物,以及船舶、飞机、车辆等多类目标,各类目标之间尺寸、纹理、颜色等特征差异大,不同目标之间、甚至同类目标在不同模态数据中的特征也不尽相同。可以说,“四多”特点为卫星数据应用效益的发挥带来新的挑战。

10.11834/jrs.20211058.F002遥感大数据的“四多”新特点The new characteristics of remote sensing big data

事实上,从遥感影像获取到产品生成,再到按需分发是一个相当长的链路,涉及数据引接、数据传输、成像处理、信息提取、共享分发、定制应用等多个环节(图3)。其中,成像处理和信息提取是较为主要的两个核心环节。成像处理的重点任务是对传感器获取的光谱反射或雷达回波数据等进行处理,通过定标、几何校正、辐射校正等方法恢复与观测对象有关的信息。信息提取的任务,则是通过特征映射与计算来对成像数据中的地物要素进行解译提取,最终建立从数据到知识的映射。

10.11834/jrs.20211058.F003遥感大数据处理链路The chain of remote sensing big data processing

现有技术条件下,针对单颗卫星或单类载荷的成像处理和信息提取方法已较为完善。由于遥感数据资源的丰富与定标手段的改进,针对单颗卫星或单类载荷的几何定标与辐射定标精度越来越高,成像质量大幅提升。同时,得益于遥感样本数据的不断累积和深度学习方法的引入,针对特定载荷中部分目标类别的提取精度大幅提升,在一定程度上解决了单星单载荷处理和应用的问题。

值得注意的是,相比单传感器,多星协同的对地观测可提供多分辨、多光谱、多时相的遥感数据,为地物分析、区域监测等各类应用提供更丰富的价值信息(Hu等,2017Li等,2017Nan等,2019)。如图4所示,在2020年中国南方大面积洪涝灾害中,利用高分、哨兵系列多颗卫星对鄱阳湖附近乡村等灾区进行成像,为防汛减灾提供数据支撑(新华社,2020)。2020年初新冠肺炎疫情突发之时,综合利用高分二号、吉林一号、珠海一号等30余颗卫星对重点省市的防疫生产生活进行监测分析,尤其是对火神山、雷神山医院搭建过程的全覆盖观测(Jin,2020),为抗疫防护和复工复产发挥了积极作用(Zhang,2020)。

多星协同对地观测Multi-satellite coordinated earth observation10.11834/jrs.20211058.F004对鄱阳湖附近灾区成像Imaging of Poyang lake disaster areas10.11834/jrs.20211058.F005对火神山医院建设情况成像Imaging of the construction of Huoshenshan hospital

相比观测手段的进步,多星数据的处理和应用技术仍处于探索阶段,其技术瓶颈主要在于:每颗卫星的传感器类型或特点不同,导致成像数据间非线性辐射差异大、同名点匹配难度大,数据质量难以得到统一保障。对于此,现有的多星一体化处理主要体现在系统架构和数据组织上,处理算法上的统一相对较少。现行方案大多将多源数据统一在一个系统上,以德国布罗克曼公司构建的Calvalus系统为例(Brockmann,2019),通过对大量卫星数据的批量处理,完成定标/校验和原始数据处理功能,加快更新周期。上述工作虽实现了数据管理和算法软件的集中,但仅在几何校正等少量处理技术方面统一考虑,性能也有待进一步提升。

在多星多载荷信息分析方面,随着以深度学习为代表的机器学习技术被广泛用于遥感数据解译,已有少量基于简单数据融合或模型叠加的多星并行信息提取研究,一定程度上提升了图像中典型目标的提取性能,但距离实用尚有一定差距。究其原因,除了受载荷特性、成像质量影响外,一方面是尚不具备真正的多要素多任务并行处理能力,现有方法针对不同输入、不同目标的特征提取过程各自独立,尚未充分利用不同模态之间的互补信息,实现多源信息联合优化建模,容易陷入针对特定任务的局部最优,模型泛化能力较弱;另一方面是模型在多个任务并行处理时存在“记忆缺失”,不同任务之间的差异较大,在已有任务上学习到的知识难以直接迁移到层出不穷的新目标、新类别,往往需全样本重新训练,资源耗费较大。

综上,本文在系统阐述遥感成像处理与信息提取技术发展现状的基础上,提出了一种遥感大数据条件下的多星一体化处理与分析新思路。相比现有方法,更充分的利用不同卫星和载荷之间、不同任务和目标之间的共性特征和互补信息,即基于持续积累并不断更新的图像数据,对多星传感器全链路处理中各环节的误差定量分析。并构建多星一体化成像处理模型,通过对成像参数的逼近估计,实现高精度的几何和辐射校正,生成高质量的海量样本数据。进而,构建面向复杂场景的多任务共享学习网络模型,突破对新旧任务“记忆保持”的能力瓶颈,实现面向多星数据中多类地物要素的并行精准提取。通过多星一体化处理的新方法框架,实现多传感器成像质量和目标对象提取精度的同步提升,进一步发挥遥感数据的应用效益。

2 多星成像处理2.1 难点挑战

本文的遥感卫星“成像处理”是指从卫星接收到原始数据到生成交付应用的图像产品的过程。对于光学而言,主要是几何校正和辐射校正,对于SAR而言,则首先需要聚焦成像,再进行几何和辐射校正。在此过程中最重要的是要获得准确的成像处理参数,包括系统参数、轨道参数、大气参数等,其中部分参数通过外源数据获得经验值,部分参数通过地面测量和内定标测量得到,其他未知参数则主要通过人工外场定标得到。

人工外场定标法是国际普遍采用的方法,但该方法需要大量定标设备和地面同步观测数据,耗费巨大人力、物力、财力,需定期进行,容易受场地和天气条件的限制,所能提供的定标参数数量有限,无法及时发现传感器的各种状态变化。此外,定标器和辐射定标场地表类型往往过于单一,无法进行多点定标及真实性检验的需求。

随着遥感分辨率提升至亚米级,几何辐射精度要求不断提高,其对成像参数的精度要求也随之提升,依靠少量定标器有限次的定标测量,越来越难以满足高分辨率高精度成像对各参数获取的需求,亟需利用多星多载荷的优势,发展新的处理思路。

2.2 研究现状2.2.1 经典成像处理

聚焦成像主要针对SAR而言。经典的SAR成像处理都是基于卫星成像几何物理模型构建严密的系统传递函数,基于此推导兼顾效率和精度的成像算法,如经典的BP算法、RD算法(Bennett等,1979)、CS算法(Papoulis,1968)、Omega-K算法(Bamler,1992)等。随着SAR卫星功能不断拓展,发展出滑动聚束、滑动扫描、方位/距离多波束等新的体制模式,从而针对性的提出了许多改进的成像算法,包括NLCS(Qiu等,2008)、高阶扰动变标(Wei,2001)等,以修正原有算法中近似误差项。随着分辨率的进一步提升和参数空变效应的不断凸显,逐点的BP算法得到了关注,发展出了CMBP等时频混合的快速算法(Meng等,20152017)。

上述成像处理算法解决了模型参数已知条件下的精确聚焦问题,然而轨道、系统、大气以及地面目标自身均存在不确定的误差因素,会引起聚焦精度下降。此时,需研究参数估计和自聚焦的方法,这一直是SAR成像处理中的难题。现有的自聚焦方法包括Mapdrift、PGA(Wahl等,1994)、以及基于稀疏的处理方法(Chen等,2017),其中参数化稀疏处理的方法还可获得图像增强的效果。但对于高阶复杂误差则目前仍无法有效聚焦,例如,海面船只具有俯仰、偏航、横滚和起伏等复杂多变的运动,目前的聚焦算法无法实现空间非一致性运动误差的准确估计和补偿,对于这类复杂运动引起的高阶非一致性误差的估计和目标自聚焦,仍是待突破的难题(表1)。

10.11834/jrs.20211058.T001

成像处理方法

Imaging processing method
类型方法特点
参数已知下的成像处理频域为主RD、CS、WK、及其改进算法,如NLCS、AP-NLCS等效率高,但对参数的时变和空变性适应能力较弱;经典算法适合传统条带模式,复杂模式需要针对性的改进算法
时域为主BP、FBP、FFBP等效率较低,但对参数的时变和空变性适应能力强,适合各种模式
时频混合CMBP算法等效率/精度可调,适合高分辨率复杂模式
参数未知下的成像处理参数法估计Mapdrift、稀疏处理方法物理模型约束,结果比较可靠,但若模型不合适,则结果较差
非参数法估计PGA、MEA等无模型约束,适应能力强,但不如参数法估计可靠

在几何和辐射校正方面,已发展出针对不同类型卫星的经典物理模型。

在几何校正方面,SAR主要基于距离—多普勒模型,光学主要基于有理函数模型RFM(Rational Function Model)进行几何校正。经过几十年的发展,上述模型已相当成熟,随着分辨率和几何精度的提升,近年来的研究重点在于如何更加精确的对各种误差因素进行建模、标定和补偿。在光学方面,Grodecki等(2003)基于IKNOS卫星影像数据开展严密几何模型和有理函数模型的对比,有理函数模型在更为稳定,在定位精度上也达到了严密几何模型相似的效果。Li等(2014)将有理函数模型的像方误差分为随机部分与函数部分,基于最小二乘法迭代求解RFM像方误差修正参数,提升几何定位精度。潘红播(2013)等将资源三号原始的分配CCD投影为虚拟CCD,消除投影误差以及交会误差之后再生成有理参数模型,提高了模型的精度。在SAR方面,最早Lebera等(1973)提出一种零多普勒模型可用于机载SAR几何校正。Wivell等(2002)给出一种基于DEM与RD模型的SAR影像正射校正方法,该方法通过建立卫星的位置与速度随时间的变化运动方程进行求解。国内方面,张永红等(2002)提出引入外部DEM作为辅助数据,在构建在RD模型的基础上,提升SAR影像的几何定位精度提升。丁赤飚等(2017)分析了高分三号SAR影像的几何定位精度,并证明精细处理后精度可接近3 m。上述方式主要还是基于人工外场定标和外部支撑数据实现高精度几何校正。

在辐射校正方面,SAR的辐射校正包括系统增益控制校正、接收链路增益校正、天线方向图校正、处理增益校正、斜距衰减校正等,主要基于经典的雷达方程建立全链路辐射误差校正模型,并在此基础上通过人工定标器测量得到定标常数,用该常数校正后便可从图像的像素值得到地物散射值。光谱辐射校正主要包括传感器灵敏度特性、光照条件差异、大气校正、地形校正等,目前主要基于经典的辐射传输模型基础上基于大气、地形等外源数据进行校正,并通过人工外场定标得到辐射定标常数值。

2.2.2 多星多载荷成像处理

随着卫星数量和卫星影像资源不断丰富,单星或单载荷的成像处理往往精度有限,利用多星多载荷综合开展成像处理成为重要的研究与发展趋势。

在成像处理方面,为简化系统的设计和维护,德国DLR等提出多模式一体化处理算法框架(Breit等,2004),在统一的成像算法框架下,通过接入不同的功能模块,用同一套软件实现条带、滑动聚束、滑动扫描模式的成像,实现成像算法框架的一体化。多种成像模式虽然在分辨率、测绘带宽等性能上有很大差别,但由于星地基本的几何关系是相同的,对某一目标来说,各模式的多普勒历程并没有本质区别,对多模式信号进行处理的关键在于如何有效地解决信号混叠问题。目前有分子孔径处理方法、时/频域扩展技术方法等(Chen等,2012)可以高效地处理多模式的回波数据。通用的SAR多模式一体化成像处理算法通过消除多模式SAR回波时频历程的差异,简化处理算法设计的复杂性,使多模式成像算法形成系统的统一框架,方便系统设计和维护的同时也可以节约硬件成本提高算法运行效率,是重要的发展方向。

在几何校正方面,随着卫星影像的丰富,在一个地区覆盖有多星、多传感器的影像,利用异源影像交叉定标或联合平差,引起了国内外学者的兴趣。Li等(2007)利用佛罗里达地区的IKONOS和QuickBird立体像对和航空影像,开展基于RFM的区域网平差,发现单张高精度的航空影像即可改善IKONOS和QuickBird立体像对的定位精度。Tang等(2016)引入高精度Pleiades-1卫星影像,并在平差解算时考虑主导定位精度的卫星影像RPC参数和连接点坐标,使资源三号和SPOT-7影像的无控平面定位精度由16 m和6 m提升至5 m和2.5 m。Jeong等(2015)利用韩国大田地区的IKONOS、QuickBird和KOMPSAT-2卫星影像,进行不同影像组合下基于RFM的区域网平差试验。结果表明,基于多个光学卫星影像的联合定位可有效改善平面定位精度,但不一定能提高高程精度,尤其在影像弱交会的情况下,因此需要对影像数据进行筛选。利用多个SAR卫星影像进行联合平差实现几何精度提升的研究也已有不少。Bresnahan等(2016)分别基于Cosmo-Skymed卫星影像中的6景Spotlight和4景StripMap成像模式数据联合几何校正,结果表明定标后的几何定位精度优于4 m。吴颖丹等(2012)利用四川地区的2景ENVISAT ASAR影像和1景Radarsat-1影像,基于不同的控制点布设方案,进行基于严格模型和基于RFM模型的区域网平差,平面和高程精度分别为35 m和25 m左右。吕冠南等(2018)仅用5个控制点完成北京、天津、河北地区的5景GF-3影像、3景TanDEM-X以及3景TerraSAR-X的联合几何定标。Jiao等(2019)提出一种新的斜距修正模型和误差加权策略,基于多景GF-3数据提升联合定位精度。以上多星联合几何校正仅限于同源卫星,由于SAR影像和光学影像具有截然不同的成像几何,其联合定位挑战更大。为此,国内外学者也开展了异源联合几何校正的研究。Zhang等(2011)将RPC模型用到SAR/光学立体像对的定向中,证明在合理布设控制点的条件下,基于RPC模型的SAR-SAR、SAR-SPOT影像对可达到1 m的平面/高程精度。程春泉等(2017)建立像方补偿参数先验精度信息的RFM光学/SAR平差模型,用12景TerraSAR和12景SPOT-5影像进行区域网平差试验,发现少量SAR影像即可将区域网无控制定位精度大幅提升至平面6 m和高程4.2 m。

在辐射校正方面,已有部分多传感交叉辐射定标的研究。Thome等(2013)将EO-1搭载的ALI和Hyperion同ETM+和MODIS进行交叉对比研究,发现ETM+辐射误差小于10%。Helder等(2013)利用MODIS数据和Hyperion数据,构建Libya4的定标场地模型,实现了Landsat卫星的时间序列定标。国内邵琦等(2017)对Landsat 5 TM、Landsat7 ETM+及Landsat 8 OLI交叉定标,得到不同遥感器间的辐射性能差异。杨磊等(2015)对高分一号和Landsat8数据的交叉定标建模,获取有效的定标系数。Zhang等(2018)提出基于ASTER和Landsat ETM+的时间序列定标方法,以内蒙巴丹吉林沙漠作为研究区,实现HJ卫星CCD相机的在轨辐射定标。

综上,目前在多星多载荷成像处理方面,或以一个已定标的卫星影像作为基准来校正另一个影像,或基于多影像各自成像物理模型的联合解算从统计上减小误差。当多星同时存在待标定的参数时,要如何一体化进行误差参数标定和校正,相关研究还较少,尚缺乏一套通用的、可兼容各种卫星各类处理的一体化处理思路和方法。未来多星一体化成像处理是一个值得深入研究的方向。

3 多要素信息提取3.1 难点挑战

早期的遥感数据解译受分辨率等因素的限制,数据中反映的信息有限,待解译的要素多为植被、水体、建筑区等大型自然或人造地物要素,且局限于目标检测和地物要素分类等单一任务。随着分辨率和图像质量提升,遥感数据中反映的地物要素信息越来越丰富,人们不仅希望能从遥感数据中知道目标是否存在并获取目标的位置信息,还希望区分目标类型并获得目标的形状、姿态以及尺寸等物理信息。为此,亟需突破面向遥感数据的多要素多任务智能解译方法。

传统多要素解译与信息提取通常采用“单入单出”解译模式,即针对不同要素或任务设计专用模型或方法,多个任务并行开展。现实情况下,面向待解译场景,通常会获取到多源多模态遥感数据,传统方法虽然针对单一要素或任务能够取得良好的性能,但面对这类“多入多出”(多类数据输入、多任务输出)应用场景其适用性有限,一是专用模型的可拓展性较低,面临新场景或任务时性能难以保证;二是由于特征提取过程各自独立,各类模型或方法的简单叠加难以取得性能线性增益的效果;三是这种专用模型叠加会导致模型计算时间和空间复杂度的大幅提升,实用性较差。

围绕上述问题,近年来,陆续出现多要素信息并行提取方面开展研究工作,力求实现多源数据间互补特性、多要素间表示特征的有机结合,改善模型的泛化性能。

3.2 研究现状3.2.1 典型地物要素提取

如上文所述,经典遥感要素信息提取通常针对不同要素或任务设计专用模型或方法,其研究问题可大致归纳为两类,一是遥感数据和要素特性分析,以此为基础构建遥感数据要素特征/特性体系,为后续模型构建提供基础依据;二是遥感专用模型构建,即在通用模型或方法的基础上,构建符合遥感领域知识或数据特性的信息提取模型,提升其在遥感要素信息提取中的应用性能。

由于遥感数据获取和成像方式的特殊性,遥感数据和要素特性分析重点聚焦于成像特性(如电磁波散射机制)、影像表观特性(如光照、纹理等)、要素分布特性等的分析,以此为基础进行数据特性信息提取或数据仿真。Kusk等(2016)和Hansen等(2017)构建了一套针对SAR影像仿真方法,对成像过程中的地形、噪声等进行仿真,并通过3D CAD对不同地物进行建模。Yan等(2019)面向点云数据在三维空间上对舰船目标进行建模,通过投影变换生成仿真舰船数据。Ma等(2018)设计了一种可增强样本真实性的损失函数,可对模型的生成网络和判别网络联合约束。Zhan等(2017)和Zhu等(2017)面向高光谱图像分类,构建了生成对抗分类网络模型。Zhang等(2018)提出了适用于飞机目标识别的条件生成对抗网络模型,实现了飞机目标的高精度仿真。

遥感专用模型构建方面,传统研究主要针对要素多尺度、类间分布规律等特性进行相应模型结构或信息提取流程,增强传统模型或方法面向遥感数据的适用性。Zhou等(2018)构建了面向高光谱影像的深度模型,通过使网络聚焦源域与目标域的共性特征,并辅以先验信息,提升了高光谱影像分割效果。Luo等(2018)提出对类内分布施加最大均值差异约束进行域间特征对齐来用于高光谱分割任务。在基于度量学习的方法方面,Rao等(2019)面向高光谱地物要素分类,构建了一种可自适应选择距离度量方式的分类器,提升了分类精度。Kampffmeyer等(2016)针对土地监测任务中类别存在的要素分布不均衡问题,突出基于区域分组和像素分组策略的方法。Liu等(2017)针对光学遥感图像中目标多尺度特性,采用沙漏型编解码结构提取更丰富的多尺度上下文信息来提升模型分类精度。

现有方法大都基于单一源数据的仿真或特性信息提取,而在多要素信息并行提取中,往往面临同一任务中需要结合不同的特性信息,如在目标检测时同时考虑目标多尺度、多角度、目标类型分布、多时相数据纹理变化等多种特性,目前尚缺乏对各类特性信息的统一分析和提取框架,造成各类特性融合分析存在要素约束尺度不统一、特征共享互补难等问题,制约了一体化要素分析和信息提取的发展,因此亟需研究统一模型框架下的多任务多要素信息并行提取方法。

3.2.2 多要素信息并行提取

在多要素信息并行提取方面,近年来的主要研究方向是如何在同一个模型中并行实现目标或要素类型、位置、深度等多类信息的提取,期望通过相关信息间信息共享表示,提升模型的整体泛化性能。针对上述“多入多出”应用场景,现有方法主要聚焦于专用模型近输出端的多要素数据特征共享和和输入端的多模态数据融合两方面问题(表2)。

10.11834/jrs.20211058.T002

多要素信息并行提取方法总结

Multi-type feature extraction methods
方法特点应用领域

多任务

特征共享

基于硬参数共享的方法主干网络共享,模型结构简单,任务间关联性较弱地物要素分类、建筑物提取、深度估计、图像重建、图像锐化、边界检测等
基于软参数共享的方法不同模型间信息互换,以共享连接或递归方式改善每个任务的输出地物要素分类、极化SAR图像地物要素分类、高光谱图像地物要素分类、高光谱目标检测等

多模态

数据融合

简单融合方式实现相对简单,计算高效,精度较为一般多模态数据分类
双线性池融合可获得更加充足的特征表示,计算复杂度较高遥感数据语义检索
基于注意力的融合能够基于统一模型架构实现,架构相对复杂遥感数据语义检索

多要素特征共享方面,根据参数共享方式的不同,主要分为两类方法,一是基于硬参数共享(hard-parameter sharing)的方法,即多类要素提取模型共享同一个主干网络,通过在模型输入、输出端融合多个不同分支模型实现多任务的预测;二是基于软参数共享(soft-parameter sharing)的方法,即面向不同要素提取的多个独立网络通过共享连接的方式进行融合,从而实现多个类信息的并行输出。

基于硬参数共享的方法在主干网络中共享多要素特征,然后使用一组独立的头处理任务。Liebel等(2020)通过将深度估计和建筑物分类两个任务共享编码器,同时各自独享解码器,实现基于遥感图像的城市建设情况评估。Papadomanolaki等(2019)将地物要素分类模型的基础上并行地加入一个解码器分支进行图像重建,其重建结果作为一种正则化约束地物要素分类的结果。Wang等(2020)使用共享编码器和私有解码器的模型结构完成地物要素分类、深度估计和边缘检测3个任务,其中边缘检测作为辅助任务用于在特征空间和输出空间对另外两个主任务进行正则化。Khalel等(2019)提出在共享编码器的基础上实现图像锐化和地物要素分类两个任务。Rosa等(020)提出了一种基于全卷积回归网络的多任务学习方法,用于农作物的种植和监控。

基于软参数共享的方法首先利用多个网络进行初始任务预测,然后利用这些初始预测的特征,以共享连接或递归的方式进一步改善每类要素信息的输出。Volpi等(2018)针对地物要素分类任务,通过输入原始图像和条件随机场建模数据,分别学习类别内部相似度预测和边界值预测两个独立的任务分支,实现利用多任务框架提升地物要素分类精度。Zhang等(2019)针对极化SAR的复数型数据,将幅值和相位提取作为模型的输入,使用中间分类器对各自独立的特征提取过程进行约束,从而提升地物要素分类精度。Shi等(2020)设计了一种用于高光谱图像地物要素分类的多任务集成学习模型,将光谱特征子空间的生成归结为一个多任务优化问题,并行寻找多个分类器的最优特征子空间。Zhang等(2016)针对高光谱图像的目标检测,使用光谱分组策略探索谱间相关性,相邻波段间的光谱相似性作为任务的相关性约束,从而提升目标检测精度。Li等(2015)提出超像素稀疏表示分类方法,通过多任务特征融合,结合不同特征的互补信息,突出空间相似区域内像素的主要模式,增强超像素的识别能力。

此外,不同任务的输入数据往往呈现出多模态的特点,如可见光图像数据含有丰富的纹理信息、高程数据能反映地物目标的三维特性、矢量数据包含了不同地物的拓扑结构特性,通过各类模态数据的有效融合分析,有望提升各类任务模型的泛化性能。Chen等(2019)在单分支卷积网络中完成了多模态特征的多尺度融合,实现了基于多模态数据融合的航空影像地物要素分类。Longbotham等(2012)通过利用多时相和多模态图像检测洪水泛滥地区,获得了较单模态图像更好的效果。Fernandez等(2018)提出了一种新的基于主题的图像融合框架,用于融合合成孔径雷达和多光谱成像数据进行无监督地物要素分类。Benson等(2017)提出了一种森林生物量和平均冠层高度估计方法,该方法仅需少量地面特性辅助数据即可有效提升三维场景的估计精度。

上述方法虽初步实现了在同一框架下多要素信息的并行提取,但本质仍是单一类型输入数据下多个专用模型或网络分支的叠加,而不同类型、不同来源的遥感数据往往存在不同的维度特性,现有方法尚难以在统一框架下实现不同维度多要素输入的融合分析,使其进一步提升性能的空间有限,同时在进行不同成像条件下的数据解译或新任务扩展时,由于特征域分布的差异容易导致模型综合性能大幅下降。此外,现有多模态数据处理方法多针对地物要素分类等单一任务,因此需探究如何实现多模态数据多任务学习,在多任务模型构建过程中充分融合多模态数据的各自优势以进一步提升性能。

4 遥感大数据条件下多星一体化处理和分析4.1 基本概念

多星一体化处理和分析,是借助持续积累的遥感数据样本优势,将统计学习、机器视觉等智能方法与以载荷机理、目标特性为基础的成像计算和目标识别方法相结合,实现多传感器成像质量和目标对象提取精度共同提升的基础应用技术。这是一个具有通用性的模型框架,可适用并贯穿于不同类型卫星的成像处理和信息提取全流程,从而对于一些多载荷多目标共有的误差参数和干扰因子,可以一体化地进行学习求解。

相比传统面向单星单载荷的成像和分析方法,多星一体化处理和分析主要具有以下特点:(1)通过将多星传感器各项参数、各类地物要素的特征信息,以及处理分析流程中的各环节误差纳入一个统一的框架,进行定量综合计算,能够更加充分的利用不同卫星和载荷之间、不同任务和目标之间的共性特征和互补信息;(2)处理和分析两个环节相互促进,通过构建面向多源载荷一体化的成像优化处理,旨在生成高质量的多模态遥感数据;基于高质量遥感数据,通过构建面向多任务多目标的优化网络模型,实现复杂遥感场景下的多类信息提取,生成高精度的遥感解译标注结果。可见,该技术与现有技术存在实质的不同,是一种全新的技术思路。

4.2 核心科学问题

为实现多星一体化处理和分析目的,需从海量遥感数据中挖掘成像处理与信息提取两个关键环节所蕴藏的各类共享信息。为此,该方法主要涉及多星高精度成像中全链路误差建模与估计、多目标多任务特征共享网络构建与求解两大核心科学问题。

(1)多星高精度成像中全链路误差建模与估计。星载传感器信号地面处理的本质是针对电磁波“天—地”两次循环中全链路产生的各类误差进行校正,实现目标特性的高精度反演。这些误差包括:载荷误差(衰减、噪声、幅度、相位等)、平台误差(位置、速度、姿态等)、数传误差(误码、丢帧、饱和等)、大气影响(温度、湿度、压强、气溶胶、颗粒物、电子浓度等)众多因素(图5)。随着传感器体制的日益复杂,以及分辨率的不断提高,以往一些可以忽略的误差小量,如轨道摄动、卫星颤振等,也需精细获取和补偿,否则参数估计的微小偏差会造成图像质量的显著下降,例如,每0.01°的姿态误差就可能会引起近100 m的几何误差,以及近1 dB的辐射误差。

10.11834/jrs.20211058.F006电磁波循环过程中产生的各类误差Errors in the electromagnetic wave cycle

从成像结果来看,上述误差高度耦合,难以构建解析的参数化成像模型,从图像结果反推各类误差,并依据成像模型进行精确误差补偿。另一方面,采用定标技术覆盖所有成像条件和工作模式,需投入大量的人力物力,并且难以获取时间非平稳的随机性系统误差。在遥感大数据背景下,系统误差和图像质量之间映射关系的可重复性,为多星一体化成像模型构建提供了一种新的途径。为此,迫切需要构建一种面向多星数据的一体化成像模型,能够基于大数据自适应学习逼近成像参数的最优估计。

(2)多目标多任务特征共享网络构建与求解。多星一体化信息提取本质是从多域复杂信息全集中并行提取多类要素的问题,该方面存在几个难点:1)遥感场景下多类目标特征各异,存在尺度差异大、角度变化多、小目标分布密集等特点,尤其对于多源数据,不同目标之间、甚至同一目标在不同模态之间的特征更加多变,以SAR图像为例,部分目标的后向散射系数对角度较为敏感,不同观测角度下目标特性存在显著差异,如飞机、复杂建筑群等(图6);2)多个任务并行处理时存在“记忆缺失”,如图7所示,不同任务差异较大,其特征域通常分布于不同维度,且难以保证服从相同统计分布,导致现有算法面向持续输入数据的拓展学习能力弱,泛化性不高;3)相比视觉场景,遥感数据具备大场景、多类别与小目标、少样本的矛盾,本质存在小样本问题,部分目标数量屈指可数,甚至只有个位数,如改装车辆、核电厂等,存在样本不平衡现象,如图8所示。

10.11834/jrs.20211058.F007遥感图像中的典型场景Typical scenes in remote sensing images10.11834/jrs.20211058.F008模型“记忆缺失”Memory loss of the model10.11834/jrs.20211058.F009遥感图像DIOR数据集(<xref ref-type="bibr" rid="R27">Li等, 2019</xref>)中的典型目标实例数量统计(该数据集共包含20类目标192472个目标实例,其中12类目标实例数低于5000个,8类目标实例数量低于2000个)Statistics on the number of instances in the remote sensing image DIOR dataset (<xref ref-type="bibr" rid="R27">Li et al., 2019</xref>)(The data set contains a total of 192,472 instances with 20 classes. There are twelve classes with instances number less than 5000, and eight classes with instances number less than 2000)

针对上述问题,现有方法的思路大多仅依靠数据融合、模型叠加,或多类模型并行分布式处理实现,其本质上仍是通过特征升维实现模型性能提升,难以从根本上实现在多目标多任务一体化建模过程中对领域知识构建和共享特征提取过程的联合优化,在实际的复杂环境应用中面临着泛化性能、实用性能的瓶颈。因此,需要创新性发展基于多目标多任务特征共享网络的多星一体化信息分析方法,实现通过相关任务间信息共享过程的动态优化,突破现实识别分类应用中的性能瓶颈。

此外,在上述问题解决的基础上,也可以进一步探究成像处理与信息提取的一体化协同机制。可以通过深度学习提取目标特征,并结合目标物理特性作为先验知识,指导全链路校正参数,而更新后的校正参数则反馈给神经网络,提高深度学习特征提取精度,由此过程不断迭代,持续优化校正误差和特征提取误差。

4.3 研究思路与解决方案4.3.1 多星一体化成像处理

针对高分辨率下高维耦合成像参数估计困难的问题,一个可行的思路是创建嵌入生成对抗网络的成像物理模型,以不同成像误差参数和大量存档数据为输入,通过成像物理模型得到大量的半物理仿真数据,建立以成像误差参数为标签的仿真数据集作为训练集。在此基础上构建生成对抗网络,习得仿真结果和高维误差参数之间的回归关系。从而,在应用阶段,对于实测数据,可以通过训练好的网络预测得到实测数据对应的比较准确的误差参数估计值。应用这些成像估计得到的成像参数,就可以在成像物理模型中进行很好地校正,从而可以得到优质的成像结果(图9)。

基于生成对抗网络的成像物理参数逼近Approximation of physical parameters of imaging based on generative countermeasure network10.11834/jrs.20211058.F010训练阶段Training phase10.11834/jrs.20211058.F011应用阶段Application phase

该方案具有良好的开放性和通用性。以SAR为例,接收到的信号可以概要表示为

Si,?j=gi,?j,?x,?y,?z,?t,?η,?vv,?ss,?θp,?A,???σx,?y,?zPtGaθ,?φ,?θpλ2rgraDaR4LsysLatmo

式中,S(i,j)为第i个时刻接收到的一帧信号的第j个采样,g(*)为系统传递函数,σ(x,y,z)为目标后向散射系数,(x,y,z)为目标空间位置,t,η为对应于微波传播速度的快时间和对应于卫星飞行速度的慢时间,vv,ss,θp为卫星的位置、速度和姿态参数,A,?分别为SAR系统相关的幅度和相位参数,Pt为发射功率,Ga(θ,φ,θp)为天线增益随角度的变化和受姿态的影响,λ为波长,rgra分别为距离向和方位向分辨率,Da为接收天线面积,R为卫星到目标的距离,LsysLatmo表示系统和大气带来的损耗。

成像的过程,就是由S(i,j)恢复σ(x,y,z)的过程,也即

σx,?y,?z=Si,?jR4LsysLatmoPtGaθ,?φ,?θpλ2rgraDa?hi,?j,?x,?y,?z,?t,?η,?vv,?ss,?θp,?A,??

式中,hg的逆函数。成像处理的关键在于如何构造该逆函数,以及如何高精度地获取h的各个参数。经过长期发展,对于各类卫星而言,前者已经较好解决,重点需要突破后者。

为验证该思路的可行性,对基于对抗学习的多通道SAR相位误差估计进行初步试验验证。方位多通道SAR成像处理中,通道间的相位误差是影响成像质量的关键因素。卫星姿态、接收通道、天线等多种因素会导致通道间相位误差,该误差会造成图像中存在虚假目标,影响解译应用。随着通道数的增加,待估计量的空间维度升高,相位误差估计难度随之增大。本文采用上述技术思路,通过构建生成对抗网络,实现了误差的估计,并在低信噪比下依然具有较好的估计性能(Cui等,2020)。在网络训练阶段,设置场景和不同通道误差仿真得到不同通道误差下的回波,将其用于训练,使网络学习到回波与通道相位误差之间的对应关系。在应用阶段,将网络应用与实测回波之上,测到该实测回波对应的通道高维相位误差。

图10表3给出了信噪比10 dB和-5 dB下的通道相位误差估计结果,可见该方法在通道达到8,且信噪比只有-5 dB时仍然具有很好的估计性能,相位估计精度达到1°以内。

试验结果Results of experimental10.11834/jrs.20211058.F012训练阶段Training phase10.11834/jrs.20211058.F013应用阶段Application phase10.11834/jrs.20211058.F01410.11834/jrs.20211058.T003

测试结果评价表

Experimental results
序号信噪比/dB相位误差估计值与真值均方误差/(°)
1100.0540
2-50.6257
4.3.2 多星一体化信息分析

针对多模态数据下的多任务信息提取,一个可行思路是创建可持续学习的、记忆保持的多任务特征共享网络模型,并引入小样本增量训练机制,实现多模态数据下多要素的并行提取,解决新任务加入或动态变化,导致原有旧任务学习精度难以保持、需要全样本重新训练的难题,思路如图11所示。

10.11834/jrs.20211058.F015多模态多任务特征共享网络模型Multi-modal and multi-task feature sharing network model

对于多模态输入,本文通过特征共享层学习多模态下目标的共性特征,在模型末端设置面向不同任务的分类器,实现多任务的高精度输出。此外,通过在模型中嵌入记忆保持单元,对网络学到的多任务的特征进行存储,以对抗新任务到来时网络的遗忘问题。设计多模态联合优化凸非负矩阵因子,实现在同一个目标函数中对多模态数据的处理,利用多源数据中目标、场景之间的相似性减少噪声的影响,提升多模态数据关联特性。

具体为:对输入的N个模态,令Xi表示模态i的特征,对模态i构建内部损失函数L(Xi,H),该损失函数考虑模态i的内部特性关系。构建指示矩阵H连接N个模态,该矩阵融合N个模态目标、场景间的特性关系,指导多模态数据的对齐、信息扩充,构建联合优化模型:

i=1nargminWi,HλiLXi,Hλi=1,λ0,1

式中,λ表示线性组合系数。定义损失函数L(Xi,H)如式(4)

LXi,H=Xi-FiHTF2

式中,H为非负矩阵,为便于解释,使Fi=XiWi,则上式变为

LXi,H=Xi-XiWiHTF2

式中,WiH为非负矩阵,这一约束为凸非负矩阵因子化。FXi中每一列的凸组合,反映数据聚类中心点。Wi中每一列的元素值表示每一个数据对于该聚类中心的重要性。H为指示矩阵,表示每个数据属于哪个聚类中心,其每一行中最大元素所在的列表示该数据属于这一聚类中心。当加入新任务时,本文构建如下元学习增量学习机制:

设模型共享参数为φ,现有N个任务对应的分类器参数为θ=θii=1N,其中θi表示第i任务对应的分类器参数,模型T对输入图像X的预测为

Y?=TX,φ,θ

对于第N+1个新任务,其对应的分类器参数为θN+1,此时的分类器参数为θ''=θii=1N+1,此时,模型对于输入图像X''的预测为

Y?''=T''X'',φ,θ''

这里,采用元学习器MPθN+1进行预测,MP以原有任务的分类器参数θ=θii=1N以及第N+1任务的特征为输入,输出第N+1个任务的分类器参数:

θN+1=MPXt'',θ

从而得到新的预测模型T'',此时的目标函数如下式,其中Y''为对应的标签:

φ,θ''argminφ,θ''LT''(X'',φ,θ''),Y''

则,整个模型的联合目标函数为

loss=i=1nargminWi,HλiLXi,H+βargminφ,θ''LT''X'',φ,θ'',Y''s.t.i=1nλi=1,λ,β0,1

式中,β控制对新任务的学习。

为验证该思路的可行性,本文利用多模态影像开展多任务信息提取初步试验验证。输入数据选用光学Worldview遥感影像(分辨率0.3 m),与SAR高分三号遥感影像(分辨率1 m),同时进行目标检测与语义分割两项任务。试验结果如图12表4所示。对比试验结果可得,仅使用单模态数据的提取结果中存在较多缺失信息,通过联合使用多模态数据,可提升模型目标检测与语义分割中的效果。

10.11834/jrs.20211058.F016不同模态输入试验结果Experiment results of different input modal10.11834/jrs.20211058.T004

不同模态输入试验结果表

Experimental results of different input modal
输入数据APAP50AP75
光学/Worldview29.350.730.7
SAR/高分三号20.740.018.5
光学+SAR31.853.434.2
5 结论

本文回顾了当前多星一体化成像处理和多要素信息提取的解决思路、技术现状和局限性,指出不同的卫星,成像机理显著不同,处理与信息提取方法差异大,尚未充分利用有效互补信息,成为制约当前对地观测遥感发挥效益的瓶颈难题。

为此,文中提出了一种遥感大数据条件下多星一体化处理新方法。在成像处理方面,对多星传感器全链路处理中各环节的误差定量分析,构建了多星一体化成像处理物理模型,实现高精度的几何和辐射校正。在信息提取方面,通过构建多任务特征共享与小样本增量学习网络模型,实现面向多模态数据的多类典型地物要素的并行精准提取。与传统方法相比,本文方法利用不同卫星和载荷之间的信息互为补充,实现了多星一体化处理。

在后续工作中,将着眼于遥感领域成像处理与信息提取脱节的问题,在成像处理与信息提取环节建立良性互馈机制。在信息提取过程中,引入载荷特性、载荷参数等成像机理,构建成像参数逼近估计和地物目标特征迭代双向驱动的网络学习方法,持续提高模型提取精度。同时,根据用户需求反过来对载荷类型、参数、成像质量等提出优化指导要求,促进对地观测数据的分辨率与质量的提升。从而形成多星一体化处理的双向良性互馈机制,最大化发挥遥感大数据的效益。