光谱维特征提取方法
2020-01-17 · 技术研发知识服务融合发展。
特征是对象所表现出来的各种属性与特点。在遥感图像分析中特征提取可以从两个意义上来实施:一种是按照一定的准则直接从原始空间中选出一个子集(即子空间),实践中的波段选择即属于此类;另一类是在原始特征空间和新特征空间之间找到某种映射关系P,P:x→y,将原始特征空间x={x1,x2…,xn} 映射到维数降低了的特征空间y中去,y={y1,y2…,ym},m<n。对于用于分类目的的特征提取,好的特征提取方法能使同类物质样本的分布具有密集性,而不同类物质的样本在特征空间中能够隔离分布,为进一步分类打下良好基础。因为高光谱数据具有波段多、波段间相关性高及数据冗余度高等特点,所以对高光谱遥感数据的特征提取具有特殊意义。遥感图像特征提取包含的内容非常广泛,提取方法也很多,光谱维特征提取和空间维特征提取是表现图像特征提取的两种主要方法。这里主要介绍适用高光谱数据的一些光谱维特征提取方法,主要涉及主成分分析法,典范变量分析法及改进的CA方法。
主成分分析是一种把原来多个指标化为少数几个相互独立的综合指标的一种分析技术。对波段间高度相关的数据非常有效(Cloutis,1996)。PCA技术已被用在不同的地质遥感项目,包括宽波段和高光谱数据(Lee等,1990;Resmini等,1997,Fujimura & Kiyasu,1994)。由于高光谱数据波段间的相关性、高冗余度,直接利用所有的原始波段作分类或特征提取显得很不经济。因此先对原始数据作PCA变换,然后对少数几个综合指标(成分)分析将会收到事半功倍的效果。在高光谱数据分析中,PCA技术可将总体大部分方差集中在前面少数几个主成分中。于是,人们利用这少数几个主成分做一些地质分析,如利用前3个主成分的假彩色合成图判读地质矿物信息,进而成图。但在主成分合成图上的彩色在不同的图像上是变化的,并不代表一定的地质矿物成分,除非有相似的地质露头和覆盖,更困难的是,我们不能根据岩石、土壤和矿物等反射光谱作指示来判读主成分合成图上的彩色。另外,确定每个主成分的物理意义也相当困难。再者,矿物的显著变异可能仅引起光谱的细微差异,这种细微差异常被淹没在高方差的主成分中而被忽略。因此PCA可能较适宜用来粗略地识别光谱差异显著的矿物和岩性类别,而不是定量的矿物识别和制图(Coutis,1996)。
Jia&Richards(1999)发展的分块主成分分析法用于特征提取,取得了一定的分类和显示效果。类似3.3,4中建立的SMLDF判别函数的思想,他们将全部波段的相关阵按照相邻波段的相关性分成若干块。一般高度相关的块沿对角线分布,而相关性低的块远离对角线。块矩阵本身集合了相邻波段间相关性高的波段。因此沿相关矩阵对角线可分成若干块(波段组),并对每组进行主成分变换,最后将每组的重要特征(主成分)再重新组合在一起作为进一步主成分分析与特征选择之用。
典范分析也是将较多的变量化为少数几个典范变量,通过这较少的典范变量之间的相关性来综合地描述两个多元随机变量之间关系的一种数学方法(唐守正,1986)。假如我们有两个多元随机变量(设x为p维随机变量,y是q维随机变量),如何描述这两个多元随机变量之间关系的紧密程度呢?直接的方法就是逐一计算两个多元随机变量各分量之间的相关系数或其他相似系数,可计算出p×q个相关系数。但这样做既繁琐,也不能本质地说明这两个随机变量总体相关水平。类似主成分分析,从每个多元随机变量中造就数个“综合变量”——典范变量。在求算两随机变量各自典范变量过程中得到的特征根即为对应典范变量对的典范相关系数。如果将非零特征根按从大到小排列,则最大的特征根即为第一对典范变量(分别对应x和y)的相关系数,如果典范相关系数越大,则说明这一对典范变量关系越紧密。一般在实践中只取前面k(k<p,q)个典范相关系数和典范变量进行分析,舍去后面的典范变量已无关紧要,这达到了特征提取的目的。在利用高光谱数据进行岩性识别分类时,首先可以将高光谱图像数据分成若干未知岩性的类别,然后在每个类别中抽取一定的样本(象元)数,同时抽取已知岩性一定的样本数,组成两个类似前述的多元随机变量(一个为已知岩性,另一个为未知岩性)的样本并计算它们前面数对典范变量。如前面数对典范变量(通常为3对)关系紧密(反映在它们相应的特征根上),这个未知岩性的类别就很有可能与已知岩性为同类岩性,反之就可能不是。实践中前面数对典范变量关系紧密程度靠经验裁定。以此类推,可以将研究区内所有未知岩性的类别与已知岩性的类别求算两两典范变量对,并根据它们各自的相关紧密程度和判据决定未知岩性类别的归属。
PCA主要想最大限度地将不同类别分开,而典范分析则是在低维变量间寻找能代表高维变量的相关性,以达到分类、识别目标物的目的。典范分析在高光谱地质应用中潜在的功用与PCA技术大部分是一致的。
刘建贵(1999)在分析K-L变换性质的基础上,根据高光谱数据用于城市目标物识别提取的特点,提出了面向分类的特征提取的CA改进方法。选择适当的变换矩阵,同时考虑类内与类间距离的CA方法,设法使原特征空间的各类的样本点在光谱维上的投影能使类间距离与类内距离的比值达到最大。这种比值称为广义瑞利商。根据这一原则来决定变换矩阵的选择。刘建贵(1999)用这种改进的方法实施对北京市沙河镇城市地物特征的提取。具体处理过程:①对原始高光谱图像进行预处理,得到相对反射率图像;②选择最终成分光谱,即需要分类的类别数,最终成分光谱根据图像及地面调查的情况进行,共找出11个类别;③对每一类统计出均值向量和协方差阵;④求出每两个类别对之间的类间和类内距离,利用CA变换方法求出变换特征;⑤求出该两个类别对应于每个原始波段的巴氏距、加载系数(刘建贵,1999)以及变换域每个特征的巴氏距、每个特征度量维上的类间类内距离比,加载系数可通过CA变换成分与波段间的相关性求算;⑥找出最优特征。实验结果表明这种特征提取方法非常有效。采用这种方法,提取的特征能够增加样本的类内凝聚度和扩大类间距离,同时消除波段问的相关性,因而能改善分类性能。
2023-06-13 广告
广告 您可能关注的内容 |