首页 / 专利库 / 人工智能 / 误差反向传播算法 / 基于栈式边界辨别自编码器的高光谱图像分类方法

基于栈式边界辨别自编码器的高光谱图像分类方法

阅读:444发布:2020-05-15

专利汇可以提供基于栈式边界辨别自编码器的高光谱图像分类方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于栈式边界辨别自 编码器 的高 光谱 图像分类方法,主要解决高光谱图像分类性能不佳的问题。其实现方案是:将多个自编码器网络堆叠形成栈式自编码器网络,利用栈式自编码器网络逐层学习特征,引入了边界辨别约束,通过约束样本类内 对比度 和类间分离度,充分考虑样本的分布特性,增强自编码器学习特征的能 力 ,采用最小化误差函数学习出权值和偏差;用学到的栈式自编码器网络对未知高光谱图像分类。本发明采用的栈式自编码器网络分类方法,提高了特征学习能力,改善了分类性能,图像分类 精度 高,适用不同类型的复杂数据图像的处理,可用于农业监测、地质勘探、灾害环境评估等领域地物的区分和辨别。,下面是基于栈式边界辨别自编码器的高光谱图像分类方法专利的具体信息内容。

1.一种基于栈式边界辨别自编码器的高光谱图像分类方法,其特征在于,包括有如下步骤:
(1)获取高光谱图像的训练样本集Xp和测试样本集Xq:
(1a)将三维的高光谱图像X转换为二维高光谱图像Xa,Xa∈Rb×m,该图像Xa包含b个光谱波段,m个样本;
(1b)随机取Xa的10%样本组成初始训练样本集:Xpp,Xpp∈Rb×pp,其余的90%样本组成初始测试样本集Xqq,Xqq∈Rb×qq,其中,pp,qq分别代表初始训练样本和初始测试样本的数量,满足pp+qq=m;
(1c)对初始训练样本集Xpp和初始测试样本集Xqq分别按照光谱波段进行归一化操作,得到归一化后的训练样本集Xp和测试样本集Xq;
(2)获取高光谱图像的第l+1层隐藏层特征集a(l+1):
(2a)抽取训练样本集Xp,设训练样本集Xp位于自编码器网络的第一层,即第l层,即自编码器网络的第一层输入样本用a(l)表示;
(2b)利用自编码器网络计算第l+1层隐藏层特征:
a(l+1)=f(Z(l+1))=f(w(l)a(l)+b(l)),w(l)是第l层输入层和第l+1层隐藏层之间的权值,b(l)是它对应的偏差,Z(l+1)是第l层输入和l+1层隐藏层的权值和,a是隐藏层Z通过激活函数f的映射值;
(2c)利用自编码器网络计算第l+2层重构层特征:
是第l+1层隐藏层和相应的解码层的连
接权值, 是第l+1层相应的偏差;
(3)计算高光谱图像训练样本的类内对比度SS和类间分离度SD:
通过计算训练样本的类内对比度SS和类间分离度SD,引入边界辨别约束:最小化类内相似度,最大化类间边界样本的相似度;
计算高光谱图像样本类内对比度,按如下步骤进行:
通过引入边界辨别约束,计算高光谱图像样本的类内对比度:
其中A={a·1(l+1),…,a·m(l+1)}是样本矩阵,LS=D-W是图拉普拉斯矩阵,对矩阵Dii=∑jWij,Wij测量两个样本的接近程度,T表示转置,tr表示矩阵的迹, 是由xi在相同类的k1近邻样本组成的集合;
计算高光谱图像样本的类间分离度:
类间分离度描述了不同类样本中边界样本的分离程度,其中,LD=D-W,对于每一类c,如果样本对(i,j)是集合 中k2近邻对中的一个,则Wij=1;
(4)获取第一层自编码器网络的权值w(l)和偏差b(l):
通过最小化均方误差函数J(w,b),获取第一层自编码器网络的权值w(l)和偏差b(l);
(5)获取第二层自编码器网络的权值w(l+1)和偏差b(l+1):
第一层自编码器网络的输出特征a(l+1)作为第二层自编码器网络的输入特征,计算第二层自编码器网络的输出特征,即第l+1层,重复步骤(2)-(4),获取第二层自编码器网络的权值w(l+1)和偏差b(l+1),直至获取整个栈式自编码器网络所有层的权值和偏差;
(6)获得高光谱图像分类结果:
将测试样本集Xq输入训练完成的栈式自编码器网络,通过栈式自编码器网络逐层学习得到栈式自编码器网络的最后一层的输出特征,将输出特征通过softmax逻辑回归分类器进行分类,得到测试样本的类别标签Yq,即为高光谱图像的分类结果。
2.根据权利要求1所述的基于栈式边界辨别自编码器的高光谱图像分类方法,其特征在于,其中步骤(4)中通过梯度下降法计算网络的权值w(l)和b(l),按如下步骤进行:
(l) (l)
(4.1)通过最小化均方误差函数,获取自编码器网络的权值w 和b :
其中λ是辨别约束项系数;
(4.2)对于解码层,计算解码层残差:
(4.3)对于编码层,计算编码层残差:
(4.4)更新参数:
其中α是学习速率;
(4.5)重复步骤(4.2)-(4.4),直至J(w,b)不再改变;
(4.6)采用反向传播算法微调网络参数。
3.根据权利要求1所述的基于栈式边界辨别自编码器的高光谱图像分类方法,其特征在于,步骤(6)中通过softmax逻辑回归分类器对测试样本集合Xq进行分类,得到所有测试样本的类别标签Yq,按如下步骤进行:
输入测试样本集Xq,根据训练好的栈式自编码器网络,通过栈式自编码器网络逐层学习特征,获得栈式自编码器网络最后一层的输出特征,将特征送入softmax逻辑回归分类器进行分类,得到所有测试样本的类别标签Yq。

说明书全文

基于栈式边界辨别自编码器的高光谱图像分类方法

技术领域

[0001] 本发明属于图像处理技术领域,主要涉及高光谱图像分类,具体是一种基于栈式边界辨别自编码器的高光谱图像分类方法,用于农业,测绘,军事,考古,环境和灾害监测等领域。

背景技术

[0002] 随着科学技术的发展,高光谱遥感技术得到了巨大的发展。高光谱数据可表示为高光谱数据立方体,是三维数据结构。高光谱数据可视为三维图像,在普通二维图像之外又多了一维光谱信息。其空间图像为描述地表二维空间特征,其光谱维揭示了图像每一像元的光谱曲线特征,由此实现了遥感数据图像维与光谱维信息的有机融合。高光谱遥感图像含有丰富的光谱信息,可以提供空间域信息和光谱域信息,具有“图谱合一”的特点,可以实现对地物精确的辨别与细节提取,对于认识客观世界提供了有利条件。由于高光谱图像独有的特点,高光谱遥感技术已经广泛的应用在不同的领域。在民用领域,高光谱遥感影像已经被用于城市环境监测、地表土壤监测、地质勘探、灾害评估、农业产量估计、农作物分析等方面。在军用领域,高光谱遥感展现出了强大的探测能,可用于障碍物识别、地表部队识别、坦克军舰识别、下障碍物判断以及敌军的火力分布等情报。高光谱遥感技术已经广泛的应用于人们的日常生活和军事领域。因此,设计实用高效的高光谱图像分类方法,已经成为现代社会必不可少的科技需求。
[0003] 目前,研究人员已经提出了许多经典的分类方法用于高光谱图像分类,代表性的分类方法包括神经网络(NN),K-近邻(KNN),支持向量机(SVM)等。NN的目标是像人类的大脑一样以同样的方式解决问题。为了模拟人类大脑的思维方法和解决问题的能力,近些年来,研究人员提出了类似于人脑思维方式的深度学习方法。SVM如何确核函数,现在还没有合适的方法,所以对于一般的问题,SVM只是把高维空间的复杂性的困难转为了求核函数的困难.而且即使确定核函数以后,在求解问题分类时,要求解函数的二次规划,这需要大量的存储空间.这也是SVM的一个问题。目前,由于深度学习在语音和图像领域表现出的强大优势,深度学习的应用也变得更加广泛。深度学习可以从原始的复杂数据中分层次地学习到更加抽象的高级特征。Hinton提出了栈式自编码的概念(SAE)。在SAE中,高维数据可以通过训练多层神经网络转换成低维数据。SAE具有强大的特征表示和对复杂任务建模的能力。为了提高SAE分类性能,Jaime Zabalza等人提出了基于分割的自编码器(Seg-SAE)的高光谱图像分类方法。该方法将每个样本的光谱波段分割成几个不同的区域,单独的应用自编码器。这种方法可以大大降低自编码器的计算复杂度。然而,高光谱图像的辨别信息和样本的分布特性没有考虑到自编码器中,可能丢失在自编码器的隐层特征中。
[0004] 综上,已有高光谱图像分类方法直接用于高光谱图像分类,存在核函数求解困难、特征选择单一、缺少先验信息和约束信息、分类精度差的问题。

发明内容

[0005] 本发明的目的在于针对上述已有方法的不足,提出一种分类精度高,能够适用于图像处理的基于栈式边界辨别自编码器的高光谱图像分类方法。
[0006] 本发明是一种基于栈式边界辨别自编码器的高光谱图像分类方法,其特征在于,包括有如下步骤:
[0007] (1)获取高光谱图像的训练样本集Xp和测试样本集Xq:
[0008] (1a)将三维的高光谱图像X转换为二维高光谱图像Xa,Xa∈Rb×m,该图像Xa包[0009] 含b个光谱波段,m个样本;
[0010] (1b)随机取Xa的10%样本组成初始训练样本集:Xpp,Xpp∈Rb×pp,其余的90%样本组成初始测试样本集Xqq,Xqq∈Rb×qq,其中,pp,qq分别代表初始训练样本和初始测试样本的数量,满足pp+qq=m;
[0011] (1c)对初始训练样本集Xpp和初始测试样本集Xqq分别按照光谱波段进行归一化操作,得到归一化后的训练样本集Xp和测试样本集Xq;
[0012] (2)获取高光谱图像的第l+1层隐藏层特征集a(l+1):
[0013] (2a)抽取训练样本集Xp,设训练样本集Xp位于自编码器网络的第一层,即第l层,1(l)≤l,即自编码器网络的第一层输入样本可以用a 表示;
[0014] (2b)利用自编码器网络计算第l+1层隐藏层特征:
[0015] a(l+1)=f(Z(l+1))=f(w(l)a(l)+b(l)),w(l)是第l层输入层和第l+1层隐藏层之间的权值,b(l)是它对应的偏差,Z(l+1)是第l层输入和l+1层隐藏层的权值和,a是隐藏层Z通过激活函数f的映射值;
[0016] (2c)利用自编码器网络计算第l+2层重构层特征:
[0017] 是第l+1层隐藏层和相应的解码层的连接权值, 是第l+1层相应的偏差;
[0018] (3)计算高光谱图像训练样本的类内对比度SS和类间分离度SD:
[0019] 通过计算训练样本的类内对比度SS和类间分离度SD,引入边界辨别约束:最小化类内对比度,最大化类间边界样本的分离度;
[0020] (4)获取第一层自编码器网络的权值w(l)和偏差b(l):
[0021] 通过最小化均方误差函数J(w,b),获取第一层自编码器网络的权值w(l)和偏差b(l);
[0022] (5)获取第二层自编码器网络的权值w(l+1)和偏差b(l+1):
[0023] 第一层自编码器网络的输出特征a(l+1)作为第二层自编码器网络的输入特征,计算第二层自编码器网络的输出特征,即第l+1层,重复步骤(2)-(4),获取第二层自编码器网络的权值w(l+1)和偏差b(l+1),直至获取整个栈式自编码器网络所有层的权值和偏差。
[0024] (6)获得高光谱图像分类结果:
[0025] 将测试样本集Xq输入训练完成的栈式自编码器网络,通过栈式自编码器网络逐层学习得到栈式自编码器网络的最后一层的输出特征,将输出特征通过softmax逻辑回归分类器进行分类,得到测试样本的类别标签Yq,即为高光谱图像的分类结果。
[0026] 本发明引入了边界辨别约束,通过约束高光谱图像样本的类内对比度和类间分离度,充分考虑挖掘了数据样本的分布特性,以改善高光谱分类性能,提高分类精度,能够适用于图像处理中不同类型数据的处理。
[0027] 本发明与现有技术相比具有如下优点:
[0028] A、本发明利用栈式自编码器模型,通过逐层学习,能够将高维数据转换为低维数据;引入了边界辨别约束,通过约束样本的类内对比度和类间分离度,充分考虑挖掘了数据样本的分布特性,增强了自编码器学习特征的能力,能够获得具有辨别力的特征,提高了高光谱图像的分类性能;
[0029] B、本发明采用了自编码器深度学习的分类方法,具有强大的表达能力,它能够学习得到能更好地表示输入数据的特征,能够不断的自动学习特征,自编码器的更深层网络能够学习到更高阶的特征。对比于经典的K近邻,Fisher分类器,SVM分类器,自编码器能够处理更加复杂的数据,能够适用于图像处理中不同类型的数据处理附图说明
[0030] 图1是本发明的实现流程图
[0031] 图2是本发明仿真使用的Indian Pines高光谱图像的三维真实图像,伪彩图和分类参考图;
[0032] 图3是用本发明及现有四种方法对Indian Pines高光谱图像的分类结果对比图。

具体实施方式

[0033] 实施例1
[0034] 高光谱图像分类是一种常见的遥感图像处理技术,高光谱图像是由成像光谱仪获取的,成像光谱仪为每个像元提供数十至数百个窄波段光谱信息,产生一条完整而连续的光谱曲线。高光谱图像包含从可见光谱到红外光谱的数百个光谱带。在高光谱图像中,每个像素用一个向量表示,它对应于在特定波长的光谱反射率。高光谱图像丰富的光谱信息可以提供潜在的利用价值。由于这种优势,它已被应用在不同的领域,如农业,测绘,军事,考古,环境和灾害监测等。
[0035] 针对高光谱图像分类方法直接用于高光谱图像分类的现有方案中,存在特征选择单一、缺少先验信息和约束信息、分类精度差的问题,为此,本发明开展了研究与创新,提出一种基于栈式边界辨别自编码器的高光谱图像分类方法,参见图1,本发明的高光谱图像分类过程包括有如下步骤:
[0036] (1)获取高光谱图像的训练样本集Xp和测试样本集Xq:
[0037] (1a)将三维的高光谱图像X转换为二维高光谱图像Xa,Xa∈Rb×m,该图像Xa包含b个光谱波段,m个样本;
[0038] (1b)随机取二维高光谱图像Xa的10%样本组成初始训练样本集:Xpp,Xpp∈Rb×pp,其余的90%样本组成初始测试样本集Xqq,Xqq∈Rb×qq,其中,pp,qq分别代表初始训练样本和初始测试样本的数量,满足pp+qq=m;
[0039] (1c)对初始训练样本集Xpp按照每个光谱波段进行归一化操作,将第一个光谱波段数据减去第一个光谱波段的最小值,除以第一个光谱波段数据的最大值与最小值的差值,直至将每一个光谱波段进行归一化操作。将初始测试样本集Xqq的第一个光谱波段数据减去初始训练样本集Xpp第一个光谱波段数据的最小值,除以初始训练样本集Xpp第一个光谱波段数据的最大值与最小值的差值,直至将每一个光谱波段进行归一化操作,得到归一化后的训练样本集Xp和测试样本集Xq;
[0040] (2)获取高光谱图像训练样本集Xp的第l+1层隐藏层特征集a(l+1):
[0041] (2a)抽取训练样本集Xp,设训练样本集Xp位于网络的第一层,即第l层,1≤l,即网络的第一层输入样本用a(l)表示;
[0042] (2b)利用自编码器通过前向传播进行编码,计算第l+1层隐藏层特征a(l+1):
[0043] a(l+1)=f(Z(l+1))=f(w(l)a(l)+b(l)),w(l)是第l层输入层和第l+1层隐藏层之间的权值,b(l)是它对应的偏差,Z(l+1)是第l层输入和l+1层隐藏层的权值和,a是隐藏层Z通过激活函数f的映射值。该特征a(l+1)将高光谱图像从高维特征转换为低维特征,提取了高光谱图像有代表性的特征,能够展示自编码器强大的特征表示能力;
[0044] (2c)利用自编码器进行解码,计算第l+2层重构层特征
[0045] 是第l+1层隐藏层和相应的解码层的连接权值, 是第l+1层相应的偏差。该特征 是a(l)解码之后的特征,和a(l)特征维度一致,该特征 与a(l)计算重构误差反向传播更新网络的参数;
[0046] (3)计算高光谱图像训练样本的类内对比度SS和类间分离度SD:
[0047] 通过计算训练样本的类内对比度SS和类间分离度SD,引入边界辨别约束:最小化类内相似度,最大化类间边界样本的相似度。本发明采用类内对比度阐明了同一类样本点的邻接关系,每个样本和它同一类的K个近邻样本相连接。类间分离度阐明了不同类样本位于边缘点的邻接关系,不同类别的K对边缘点连接在一起。通过约束高光谱图像样本的类内对比度和类间分离度,充分考虑挖掘了高光谱图像数据样本的分布特性,提供了先验信息和约束信息、改善了自编码器对高光谱图像的分类性能。
[0048] (4)获取第一层网络的权值w(l)和偏差b(l):
[0049] 通过最小化均方误差函数J(w,b),根据特征 与a(l)计算重构误差,将重构误差进行反向传播,采用梯度下降法获取第一层网络的权值w(l)和偏差b(l);
[0050] (5)获取第二层网络的权值w(l+1)和偏差b(l+1):
[0051] 第一层网络的输出特征a(l+1)作为第二层网络的输入特征,计算第二层网络的输出特征,即第l+1层输出特征a(l+2),重复步骤(2)-(4),获取第二层网络的权值w(l+1)和偏差b(l+1),通过自编码器逐层学习的方法,将前一层网络的输出特征作为下一层网络的输入特征,直至获取整个栈式自编码器网络所有层的权值和偏差,自编码器网络也可称作自编码器模型。本发明使用的栈式自编码器网络拥有自编码器网络将高维数据转换为低维数据的能力,拥有强大的特征表示能力。
[0052] (6)获得高光谱图像分类结果:
[0053] 通过自编码器网络逐层学习的方法,计算每一层的网络特征,通过误差反向传播更新每一层的权值和偏差,训练整个网络模型,将测试样本集Xq输入训练完成的自编码器网络,通过栈式自编码器网络逐层学习得到网络的最后一层的输出特征,将输出特征通过softmax逻辑回归分类器进行分类,得到测试样本的类别标签Yq,即为高光谱图像的分类结果。
[0054] 本发明的技术方案是利用栈式自编码器逐层提取高光谱图像的特征;通过引入边界辨别约束挖掘图像数据的分布特性,增强自编码器提取有辨别性特征的能力。边界辨别约束包括两部分:一部分是类内对比度,描述类内样本的邻接关系,每个样本和属于同一类的k近邻样本之间相连接的关系;另一部分是类间分离度,描述不同类样本中处于边界样本的分离程度的关系;通过回归分类器对测试样本进行分类,得到高光谱图像分类结果。
[0055] 实施例2
[0056] 基于栈式边界辨别自编码器的高光谱图像分类方法同实施例1,本发明在步骤(3)中计算高光谱图像样本类内对比度,按如下步骤进行:
[0057] 通过计算l+1层隐藏层样本a·i(l+1)的类内对比度,将a·i(l+1)的转置与LS和a·i(l+1)本身进行乘积操作,得到的SS就是l+1层隐藏层训练样本a·i(l+1)的类内对比度:
[0058]
[0059] 其中A={a·1(l+1),…,a·m(l+1)}是样本矩阵,LS=D-W是图拉普拉斯矩阵,对矩阵Dii=∑jWij,Wij测量两个样本的接近程度,T表示转置,tr表示矩阵的迹, 是由xi在相同类的k1近邻样本组成的集合。
[0060] 类内对比度本身就富含同类样本间的边界辨别信息,本发明通过引入边界辨别约束,充分考虑挖掘了同类数据样本之间的分布特性,有利于提取每一类样本具有辨别力的特征,有利于增强自编码器提取有辨别力的特征。
[0061] 实施例3
[0062] 基于栈式边界辨别自编码器的高光谱图像分类方法同实施例1-2,本发明在步骤(3)中还计算高光谱图像样本类间分离度,按如下步骤进行:
[0063] 通过计算l+1层隐藏层样本a·i(l+1)的类间分离度,将a·i(l+1)的转置与LD和a·i(l+1)本身进行乘积操作,得到的SD就是样本a·i(l+1)的类间分离度:
[0064]
[0065] 它描述了不同类样本中边界样本的分离程度。LD=D-W,对于每一类c,如果样本对(i,j)是集合 中k2近邻对中的一个,则Wij=1。
[0066] 类间分离度本身就富含不同类样本间的边界辨别信息,本发明通过引入边界辨别约束,约束高光谱图像样本的类间分离度,充分考虑挖掘了数据不同类样本之间的分布特性,有利于提取不同类样本之间具有辨别力的特征,有利于增强自编码器提取有辨别力的特征。
[0067] 实施例4
[0068] 基于栈式边界辨别自编码器的高光谱图像分类方法同实施例1-3,步骤(4)中通过梯度下降法计算自编码器第一层网络的权值w(l)和b(l),按如下步骤进行:
[0069] (4.1)将高光谱图像隐藏层样本a·i(l+1)的类内对比度SS=tr(ALSAT)与类间分离度SD=tr(ALDAT)的差值,通过辨别约束项系数λ与自编码器样本 的重构误差相结合,得到误差函数J(w,b)。
[0070]
[0071] (4.2)对于网络的解码层,通过误差函数J(w,b)采用梯度下降法,将J(w,b)对重构特征 进行偏导操作,得到解码层残差:
[0072]
[0073] 其中f'是导数;
[0074] (4.3)对于网络的编码层,通过误差函数J(w,b)采用梯度下降法,将J(w,b)对隐藏层特征 进行偏导操作,得到编码层残差:
[0075]
[0076] 其中sl是网络第l层的特征维度,1≤k≤sl,i是第l+1层的第i个特征维度,解码层残差 可以用编码层残差 部分表示。
[0077] (4.4)根据得到的高光谱图像编码层残差更新权值w(l)和偏差b(l):
[0078]
[0079]
[0080] 其中α是学习速率;
[0081] (4.5)重复步骤(4.2)-(4.4),直至误差函数J(w,b)不再改变;
[0082] (4.6)采用误差反向传播算法微调自编码器网络的参数,包括权值w(l)和偏差b(l)。
[0083] 本发明通过自编码器网络的训练,主要得到自编码器网络的最优参数,通过自编码器网络的最优参数,训练完成栈式自编码器网络。本发明中的一些先验信息或约束信息对于自编码器网络的特征学习是必不可少的。作为深度学习模型的主要组成部分之一,自动编码器网络主要完成了转换学习任务,通过自编码器网络将高维数据转换为低维数据,展示了强大的特征表示和模型泛化能力。
[0084] 实施例5
[0085] 基于栈式边界辨别自编码器的高光谱图像分类方法同实施例1-4,步骤(6)中通过softmax逻辑回归分类器对测试样本集合Xq进行分类,得到所有测试样本的类别标签Yq,按如下步骤进行:
[0086] 输入测试样本集Xq,根据训练完成的自编码器网络,通过栈式自编码器网络逐层学习特征,获得网络最后一层的输出特征,将特征送入softmax逻辑回归分类器进行分类,得到所有测试样本的类别标签Yq。
[0087] 在训练样本集Xp训练完成自编码器网络后,将测试样本集Xq输入训练完成的自编码器网络进行分类,得到高光谱图像分类的结果。
[0088] 实施例6
[0089] 基于栈式边界辨别自编码器的高光谱图像分类方法同实施例1-5,
[0090] 步骤1,输入高光谱图像Indian Pines,参见图2(a),图2(a)是Indian Pines高光谱图像,是本发明实验使用的数据,从Indian Pines高光谱图像中获取训练样本Xp和测试样本Xq。
[0091] (1a)将三维的高光谱图像Indian Pines转换为二维高光谱图像Xa,Xa∈R220×21025,该图像Xa包含220个光谱波段,21025个样本,类别标签为1到16的样本共有10249个;
[0092] (1b)将Xa中类别标签为1到16的样本随机取10%样本组成初始训练样本集:Xpp,Xpp∈R220×1025,其余的90%样本组成初始测试样本集Xqq,Xqq∈R220×9224,其中,pp,qq分别代表初始训练样本和初始测试样本的数量,满足pp+qq=10249;
[0093] 步骤2,对训练样本集Xpp和测试样本集Xqq分别按照220维光谱波段进行归一化操220×1025 220×9224
作,得到归一化后的训练样本集Xp,Xp∈R 和测试样本集Xq,Xq∈R 。
[0094] 步骤3,获取第2层隐藏层特征集a(2):
[0095] (3a)抽取初始训练样本集Xp,设初始训练样本集Xp位于网络的第一层,即网络的第一层输入样本可以用a(1)表示;
[0096] (3b)利用输入样本a(1)输入自编码器,通过前向传播计算第2层隐藏层特征a(2),自编码器能够将高光谱图像高维样本a(1)转换为低维特征a(2):
[0097] a(2)=f(Z(2))=f(w(1)a(1)+b(1))        <1>
[0098] w(1)是第1层输入层和第2层隐藏层之间的权值,b(1)是它对应的偏差,Z(2)是第1层输入和2层隐藏层的权值和,a是隐藏层Z通过激活函数f的映射值。
[0099] (3c)利用自编码器计算第3层重构层特征 该特征 能够用于计算与样本a(1)的重构误差,重构层特征 为:
[0100]
[0101] 是第2层隐藏层和相应的解码层的连接权值, 是第2层相应的偏差。
[0102] 步骤4,获取高光谱图像训练样本的类内对比度SS和类间分离度SD;
[0103] (4a)通过引入边界辨别约束,计算高光谱图像样本a·i(2)的类内对比度:
[0104]
[0105] 其中A={a·1(2),…,a·m(2)}是样本矩阵,LS=D-W是图拉普拉斯矩阵,对角矩阵Dii=∑jWij,Wij测量两个样本的接近程度,T表示转置,tr表示矩阵的迹, 是由xi在相同类的k1近邻样本组成的集合,该类内对比度能够挖掘同类样本之间的分布特性,有利于提取有辨别力的特征,有利于高光谱图像的分类,如图3(e)所示,可以看到本发明对Indian Pines分类同类样本的区域一致性比较好;
[0106] (4b)计算高光谱图像样本a·i(2)的类间分离度:
[0107]
[0108] 它描述了不同类样本的边界样本的分离程度。LD=D-W对于每一类c,如果样对(i,j)是集合 中k2近邻对中的一个,则Wij=1,该类间分离度能够探索不同类样本之间的分布特性,有利于提取有辨别力的特征,有利于提高高光谱图像分类效果,如图3(e)所示,可以看到本发明对Indian Pines分类样本的边缘保持较好。
[0109] 步骤5,获取第一层网络的权值w(1)和b(1);
[0110] (5a)将高光谱图像隐藏层样本a·i(2)的类内对比度SS=tr(ALSAT)与类间分离度SD=tr(ALDAT)的差值,通过辨别约束项系数λ与自编码器样本 的重构误差相结合,得到误差函数J(w,b);
[0111]
[0112] (5b)对于解码层,计算解码层残差,该残差可以算出网络输出值与实际值之间的差距:
[0113]
[0114] (5c)对于编码层,计算编码层残差,该残差表明了编码层特征对最终输出值的残差产生多大的影响:
[0115]
[0116] (5d)更新自编码器网络的权值w(1)和偏差b(1):
[0117]
[0118] (5e)重复步骤5b-5d,直至J(w,b)不再改变。
[0119] 步骤6,第一层网络的输出特征a(2)作为第二层网络的输入特征,计算第二层网络的输出特征,即第2层,重复步骤3-5,获取第二层网络的权值w(2)和b(2);
[0120] 步骤7,将测试样本集Xq输入自编码器网络,通过栈式自编码器网络逐层学习得到网络的最后一层的输出特征,将输出特征通过softmax逻辑回归分类器进行分类,得到测试样本的类别标签Yq,即为本发明高光谱图像的分类结果如图3(e)所示。
[0121] 下面通过仿真实验对本发明的技术效果进行说明。
[0122] 实施例8
[0123] 基于栈式边界辨别自编码器的高光谱图像分类方法同实施例1-7,
[0124] 仿真条件
[0125] 实验采用的数据是典型的AVIRIS高光谱图像:该数据是美国印第安纳州西北部印第安遥感试验区的高光谱图像,总共有16类地物,成像时间为1992年6月。数据共有220个波段,每个波段图像的大小为145×145,空间分辨率为20m。由第50个,第27个和第17个波段构成伪彩色图像,如图2(b)所示。该图像的真实标记图如图2(c)所示。Indian Pines图像由16类地物组成,具体包括:alfalfa,corn-notill,corn-mintill,corn,grass-pasture,grass-trees,grass-pasture-mowed,hay-windrowed,oats,soybean-notill,soybean-mintill,soybean-clean,wheat,woods,building-grass-trees-drives,stone-steel-towers种类。
[0126] 仿真实验在CPU为Intel Core(TM)2Duo、主频2.33GHz、内存4G的WINDOWS 7系统上使用MATLAB R2014进行仿真。
[0127] 仿真内容
[0128] 在实验中,采用本发明与已有四种方法对Indian Pines高光谱图像进行分类。已有的四种方法包括:基于径向基函数的支持向量机RBF-SVM,K最近邻方法KNN,基于独立成分分析的支持向量机ICA-SVM,栈式自编码器SAE。
[0129] 在实验中,从每一类中随机选取10%的样本作为训练样本,剩余的90%样本作为测试样本。实验进行30次独立迭代,列举了相应指标的均值和标准差结果。这里使用的评估分类结果的指标包括:正确分类的测试样本数目和整体测试样本数目之比OA、所有类别分类精确度的均值AA和评估分类结果一致性的Kappa系数。
[0130] 以图3(a)-(e)中,下方的矩形框区域为例,该区域对应的是图2(c)中下方相应区域,图2(c)是本发明使用的高光谱图像真实的类别标签图。图3(a)中下方矩形框中四周边缘噪声点比较多,图3(b)中下方矩形框中中间区域噪声点比较多,图3(c)和图3(d)下方矩形框中左右边缘噪声点比较多,而在图3(e)中,本发明分类图下方矩形框中左边和中间区域一致性比较好,噪声点比较少,右边区域有部分噪声点,但是相比图3(a)-(d)中相应区域的噪声点相比而言,本发明的分类图图3(e)效果更佳,再则,该区域右边噪声点也是原图的真实反映。
[0131] 实施例9
[0132] 基于栈式边界辨别自编码器的高光谱图像分类方法同实施例1-8,仿真条件和内容同实施例8
[0133] 从人眼目视效果可以看出来一定的效果,但是数据更是能从精确的角度表现分类结果。
[0134] 用本发明与已有的RBF-SVM、KNN、ICA-SVM、SAE这四种方法对Indian Pines高光谱图像进行分类,结果如表1所示。
[0135] 表1 五种方法对Indian Pines高光谱图像的分类结果
[0136]
[0137]
[0138] 在表1中,展示了五种方法对于Indian Pines高光谱图像中每种类别的分类精度和对所有类别的OA、AA、和Kappa结果。
[0139] 从表1可以看出,由于RBF-SVM和ICA-SVM在小样本非线性问题上的卓越性能,RBF-SVM和ICA-SVM取得了比KNN更好的分类性能。对比于RBF-SVM,KNN,ICA-SVM,SAE,本发明通过样本的边界辨别约束自编码器,引入样本的类内对比度和类间分离度,可以提供先验信息和约束信息,更高效的提取有辨别力的特征,获得更好的分类性能,本发明取得了比其它四种对比方法更好的分类精度。对于所有类别的OA、AA、Kappa指标,本发明方法也取得了比其它四种对比方法更好的结果。
[0140] 用RBF-SVM,KNN、ICA-SVM、SAE这四种方法和本发明对Indian Pines高光谱图像通过实验比对进行分类,得到五种方法对16类地物的真实分类,如图3所示,其中:图3中(a)-(e)分别是RBF-SVM、KNN、ICA-SVM、SAE和本发明对Indian Pines高光谱图像的分类图。
[0141] 比较图3中左侧和右侧区域的矩形框标注的类别的分类结果,可以发现使用本发明方法比其它对比方法具有更好的区域一致性。比较图3中中间和下方区域的矩形框标注的类别的分类结果,可见使用本发明方法比其它对比方法具有更好的边界保持能力。
[0142] 综上,本发明利用自编码器模型,通过栈式自编码器网络逐层学习的方法,通过样本的类内对比度和类间分离度,引入边界辨别约束,挖掘探索了样本的分布特性,获得了有辨别力的特征,提高了高光谱图像分类效果。
[0143] 简而言之,本发明公开的一种基于栈式边界辨别自编码器的高光谱图像分类方法,主要解决现有技术对高光谱图像分类性能不佳的问题。其实现方案是:将多个自编码器网络堆叠形成栈式自编码器网络,利用栈式自编码器网络逐层学习特征,利用样本间的分布特性,通过类内对比度和类间分离度对栈式自编码器进行边界辨别约束,提高栈式自编码器网络学习特征能力;通过最小化栈式自编码器网络的误差函数,学习出栈式自编码器网络的权值和偏差;用学习到的栈式自编码器网络,对未知高光谱图像分类。本发明采用的栈式自编码器网络分类方法,提高了特征学习能力,改善了分类性能,图像分类精度高,适用不同类型的复杂数据图像的处理,可用于农业监测、地质勘探、灾害环境评估等领域地物的区分和辨别。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈