|
|
|
|

基于小波核的双重加权支持向量机分类模型

0 引言 遥感影像分类的最终目的是将图像中每个像元根据其在不同波段的光谱亮度、空间结构特征或者其他信息特征,按照某种规则或算法划分为不同的类别。然而,由于“同物异谱”、“同谱异物”现象的存在,对于两类识别特性相似的地物,势必会造成分类的混...

作者:潘 琛,冯 琰,郭容寰来源:2014测绘学|2015年02月28日

0 引言

遥感影像分类的最终目的是将图像中每个像元根据其在不同波段的光谱亮度、空间结构特征或者其他信息特征,按照某种规则或算法划分为不同的类别。然而,由于“同物异谱”、“同谱异物”现象的存在,对于两类识别特性相似的地物,势必会造成分类的混淆和错误[1]。因此,寻求更先进的分类器更好地表达地物特征是提高遥感信息提取精度与可靠性的有效方法。

支持向量机(SVM)作为一种最新的也是最有效的统计学习方法,近年来成为模式识别与机器学习领域的研究热点,在遥感分类中的一些实验表明它能够取得比传统最大似然分类器、人工神经网络分类器更高的精度[2]。并且随着小波理论、模糊理论等理论方法的引入,为SVM分类器的改善和优化提供了新的思路。例如,李元诚等在SVM核方法和小波框架理论的基础上,提出了一种称为小波支持向量机(Wavelet Support Vector MachinesWSVM)的新的机器学习构造方法[3]Zhang. Q等提出了一种基于小波分析和人工神经网络相结合的小波神经网络方法,它能实现复杂的非线性映射,有效地应用在数据分类和函数逼近方面[4]

此外,不同类别样本数量的不均衡和不同特征对于分类的重要性不同都会对最终分类结果的精度产生影响,因此本论文在相关工作基础上,通过研究核函数的构建和加权方式的组合来进一步改进SVM分类器的泛化能力和分类性能,从而更有效地提高遥感影像分类的精度。

 

1 小波核函数的构建

基于小波理论构建的核函数按照是否可以分解成两个相同函数的点积形式,主要分为两大类:一种是在希尔伯特(Hilbert)空间的框架概念下构建的核函数;另一种是满足Mercer条件的平移不变核函数。

给定母小波为伸缩参数或尺度参数,为平移参数,如果,对某些核函数,很难将它们分解成两个相同函数的点积形式,那么这时还存在一种平移不变核。平移不变核函数的充分必要条件是[3,5]是一个允许SVM核,当且仅当它的傅立叶变换

                         (1

成立。这样就可以构造允许SVM核函数了,满足平移不变核定理的小波核函数可表示为[5,6,7]

                                  (2

将母小波函数替换成某些具体形式,就可以得到相应的小波核函数。在本文中,考虑到Morlet小波核函数计算简单、构造方便,因此选择下式用于构建分类模型中的支持向量机。

         (3

2 类别样本数与特征重要性的双重加权

加权能进一步提高SVM算法的泛化能力和分类性能,也是本文分类模型构建的关键组成部分之一。目前对传统SVM进行加权的方式主要有三种[8]:(1)对不同类别赋以权重;(2)对每个样本赋以权值;(3)对每个特征属性赋以权重。本文选择第(1)和第(3)两种方式对SVM进行加权,提出了一种类别样本数差异与特征重要性差异相结合的双重加权方法,对SVM分类器的加权方式进行探讨,下面就两种方式的加权算法分别进行详细阐述。

 

2.1 类别样本数差异的加权

某一类样本的边界支持向量与样本总数的比例反映了该类的分类正确率。设分别代表负类和正类的边界支持向量个数,分别代表负类和正类的支持向量个数,分别代表负类样本数量、正类样本数量和样本总数。

引入拉格朗日因子,设,由为常量,可得:

                             (4

由上式可知,在不同类别的样本数量差异较大的情况下,支持向量机分类器的分类结果会偏向于样本数量较大的一类[9]。在实际应用中,有时重要的类别信息由于采样困难或是本身数量较少等原因导致能够选择的样本数量会大大少于非重要类别,这时必须考虑对标准SVM进行改进,即使牺牲整体的错分率,以提高小样本的重要类别的正确率。

为类别权重,由下式给定:

                              (5

将上式代入式(4)可得:

                            (6

由上式可以看到,对于数量大的类别,通过赋予小的权值,使其错分率上界增大;而对于数量小的类别,通过赋予大的权值,使其错分率上界下降,从而起到平衡作用。对于多类别情况,式(5)可引申为:

                                  (7

式中,为类别的样本数。

 

2.2 特征重要性差异的加权

对不同类别进行加权区分了不同类别的重要程度,在本文中,各个特征属性的重要程度也是不同的,因此在对决策函数的训练过程中,依据某种准则对样本集中的各个特征赋予一定的权值,以提高机器学习算法的性能。

在特征加权中权重向量的求取是关键。特征权重的计算通常是根据某种度量方法来度量特征的重要性从而量化特征与给定类别之间的相关性[7,10]。本文采用基于信息增益(比)率的评价函数进行特征相关分析。

信息增益(比)率函数为[1]

                            (8

式中,表示利用一个特征划分集合的信息增益;表示特征中包含的信息熵。

具有最高信息增益率的特征,具有最高的类别区分度,对分类来说重要性也会最大,本文采用向量来构造特征权重向量。基于上述构建的特征权重向量,采用阶对角阵线性变换得到特征加权核函数,实现对不同影像特征的重要性加权。在训练决策函数的过程中,基于特征重要性加权的支持向量机优化问题的对偶形式如下式所示:

                 (9

经过线性变换之后,特征空间的形状改变了,从而有可能在改变之后的特征空间中找到更好的线性分类超平面,提高SVM的分类性能,并且能够有效避免被一些弱相关或不相关的特征所支配,从而期望获得更好的分类结果。

 

2.3 双重加权

根据上述分析,综合考虑到类别样本数差异与特征重要性差异对支持向量机分类结果的影响,最终可将双重加权的支持向量机优化问题转变为:

              (10

双重加权在平衡不同类别样本数差异的同时,加强了重要特征属性在决策过程中的作用,能够有效地利用较重要的特征属性,找到更好的分类超平面,并且减小某些小样本类别的错分率。后面的实验肯定了这个结论。其实现步骤如下。

Step 1根据带有类别标记的训练样本集的数据,统计不同类别(如正类和负类)样本数量和样本总数,由式(5)或(7)计算得到不同类别的权重

Step 2 中非类别标记的特征属性记为),按照信息增益率方法计算各个特征的重要性,构造特征权重向量和线性变换对角阵P)。

Step 3 利用对角阵P对原有的特征空间进行线性变换,得到特征加权核函数

Step 4 将类别权重和特征加权核函数带入到式(10)中,以替换标准SVM的核函数和约束条件,实现训练样本集的分类决策。

 

3 分类模型的实现步骤与流程

本文提出的基于小波核的双重加权SVM模型将小波核函数和双重加权方式相结合,既利用了小波分析在影像细节方面具有的良好表现能力,又平衡了不同样本类别分类的正确率,并能有效避免被弱相关或不相关特征所支配。根据上文的推导,基于小波核的双重加权SVM分类模型可描述为:

11

分类模型的流程如图1。基于MATLAB7.7.0R2008b)平台,利用libsvm_mat3.0工具包,编写特征重要性加权、小波核函数等相关程序,其实现步骤如下:

Step 1 根据训练样本集的统计,得到类别权重

Step 2 构造特征权重向量和线性变换对角阵P,对原有的多维特征空间进行线性变换,实现特征重要性加权。

Step 3 对特征加权后的影像多维属性集计算小波核函数。

Step 4 使用上述小波核函数和双重加权方式,并根据SVM算法构建最优分类决策面。

Step 5 基于最优决策超平面,得到影像分类图。

 

图1 基于小波核的双重加权SVM模型流程图

 

4 实验分析与结果

实验数据为200787日长三角某区域的IRS-P6 LISS3多光谱影像,具有四个光谱波段,分别位于可见光、近红外与短波红外区域,影像空间分辨率是23.5米,大小为350行×350列,如图2所示。结合对实验区域的目视解译,充分考虑到各种地物的光谱结构和纹理特征,将地物类别划分为6类,分别为:河流和湖泊(C1)、池塘和水田(C2)、农田(C3)、其它植被(包括林地、草地等,C4)、建筑物(C5)和道路(主要是水泥路面,C6)。

根据对实验区的目视解译以及对照相关土地利用图,经过人机交互筛选共选择1551个样本,其中60%931个)作为训练样本,其余作为检验样本。6个类别的训练样本数分别为:150C1)、82C2)、274C3)、142C4)、176C5)和107C6),根据式(3.22)得到类别权重为:0.840.910.710.850.810.89

图2 实验区域IRS-P6 LISS3影像(RGB-543)

选取影像4个波段,以及归一化建筑指数NDBI、归一化差异水体指数NDWI和归一化差值植被指数NDVI3个指数特征,共7维特征组成特征向量,用于下面分类实验。根据以上的训练样本,基于信息增益率获得的特征权重向量为[0.49750.57220.55490.61370.23210.43690.3410]。采用Morlet小波核函数,设置惩罚系数80,尺度参数0.6,根据1-Against-1SVM多类方法得到实验区分类结果,如图3所示。

 图3 基于小波核的双重加权SVM分类结果

为了验证上述分类模型的优势,本文选择最小距离法、最大似然法、径向基核函数SVM分类法和Morlet小波核函数SVM分类法这四种方法进行对比分析。图4是基于相同的训练样本得到的四幅实验区分类结果。

 

 (a) 最小距离法        (b) 最大似然法       (c) RBF核SVM分类 (d) Morlet小波核SVM分类法

图4 四种分类方法的结果图

 

从图3和图4可以看出,传统的最小距离法和最大似然法分类效果较差,在相似类别的区分上表现得不够理想。三种SVM分类法优于传统方法,特别是与RBF核相比,两种小波核能更有效地避免影像噪声,比较完整地保持类别信息。利用相同的检验样本对五种分类结果进行定量比较,表1是本文方法的分类误差矩阵,表2是五种方法的分类精度比较。

 

表1 基于小波核双重加权SVM分类模型的误差矩阵

 

河流和湖泊

池塘和水田

农田

其它

植被

建筑物

道路

使用者精度

河流和湖泊

93

2

0

0

0

0

97.9%

池塘和水田

7

52

0

0

0

0

88.1%

农田

0

0

183

0

0

0

100%

其它植被

0

0

0

95

0

0

100%

建筑物

0

0

0

0

83

9

90.2%

道路

0

0

0

0

34

62

64.6%

生产者精度

93.0%

96.3%

100%

100%

70.9%

87.3%

 

总体分类精度:91.6129%                      Kappa系数:0.8965

 

表2 不同方法的分类精度

分类方法

总体分类精度(%

Kappa系数

传统方法

最小距离法

76.1290

0.7090

最大似然法

85.1613

0.8177

SVM分类方法

RBF

87.4194

0.8455

小波核

89.3548

0.8690

小波核双重加权

91.6129

0.8965

以上使用到三种不同核函数或是约束条件的SVM分类法,表3为这三种方法的支持向量个数比较。

 

表3 不同SVM分类法的支持向量个数

分类方法

RBF

小波核

小波核双重加权

支持向量个数

226

161

157

5 结论

根据分类实验,可以得到以下结论:

1)本文构建的小波核双重加权SVM模型的总体分类精度(检验样本总体分类正确率)达到91.6%Kappa系数超过0.89。和其它四种方法相比,该模型的精度最高,并能有效地区分河流湖泊和池塘水田、农田和其它植被、建筑物和道路等相似类别,更加完整和准确地获得大面积分类信息。

2SVM分类器通过核函数建立分类超平面,比传统方法具有更优的分类性能。小波核函数通过引入小波分析能更好地表达影像细节信息,因此两种小波核SVMRBF核具有更高的分类精度和Kappa系数,特别是对于小斑块地物——道路的识别更有优势。

3)结合类别样本数和特征重要性的双重加权方式平衡了不同地物类别的样本数差异,提高了小样本类别——池塘水田和道路的分类精度,同时减少了支持向量的个数,进一步提高了SVM分类器的泛化能力。

参考文献

[1]潘琛,林怡,陈映鹰.基于多特征的遥感影像决策树分类.光电子·激光,2010Vol215):731-736.

[2]杜培军,林卉,孙敦新.基于支持向量机的高光谱遥感分类进展.测绘通报,20061237-40.

[3]李元诚,方廷健.小波支持向量机.模式识别与人工智能,2004Vol172):167-172.

[4]Zhang QBenveniste AHogskola LWavelet networksIEEE Transactions on Neural Networks1992Vol3(6)889-898.

[5]武方方,赵银亮.一种基于Morlet小波核的约简支持向量机.控制与决策,2006Vol218):848-856.

[6]任世锦,吴铁军.基于径向基小波核的多尺度小波支持向量机.电路与系统学报,2008Vol134):70-76.

[7]张绍明.支持向量机在SAR景象匹配中的应用研究:[博士学位论文].上海:同济大学,2008.

[8]马会敏.几种特征加权支持向量机方法的比较研究:[硕士学位论文].河北,保定:河北大学,2010.

[9]范昕炜,杜树新,吴铁军.可补偿类别差异的加权支持向量机算法.中国图象图形学报,2003Vol89):1037-1042.

[10]汪廷华,田盛丰,黄厚宽.特征加权支持向量机.电子与信息学报,2009Vol313):514-518.

上一篇:局部区域表面一致性约束的三维模型纹理映…

下一篇:信息化航测生产技术体系构建探讨