首页 / 专利库 / 人工智能 / 人工神经网络 / 前馈神经网络 / 多层感知器 / 一种基于GAN的高光谱遥感影像分类方法

一种基于GAN的高光谱遥感影像分类方法

阅读:108发布:2020-05-11

专利汇可以提供一种基于GAN的高光谱遥感影像分类方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于GAN的高 光谱 遥感影像分类方法,包括如下步骤:将噪声 信号 作为生成器G的输入,利用神经网络前向传播 算法 得到新生成的光谱图像;将真实图像数据和新生成的图像数据作为判别器D的输入,利用神经网络前向传播算法输出输入数据被判别为真实数据的概率;根据判别结果分别计算生成器G和判别器D的损失函数,利用神经网络反向传播算法,更新权重与偏置参数;利用训练好的生成式对抗网络生成可分性更高的图像,将图像输入到一个三层的多层 感知 器,最后采用softmax分类器,利用神经网络前向传播算法进行图像分类。本发明能够解决原始光谱样本数据量小且存在噪声信号以及梯度消失的问题,保证生成样本的多样性。,下面是一种基于GAN的高光谱遥感影像分类方法专利的具体信息内容。

1.一种基于GAN的高光谱遥感影像分类方法,其特征在于,包括如下步骤:
(1)将噪声信号作为生成器G的输入,利用神经网络前向传播算法得到新生成的光谱图像;
(2)将真实图像数据和新生成的图像数据作为判别器D的输入,利用神经网络前向传播算法输出输入数据被判别为真实数据的概率;
(3)根据判别结果分别计算生成器G和判别器D的损失函数,利用神经网络反向传播算法,更新权重与偏置参数;
(4)利用训练好的生成式对抗网络生成可分性更高的图像,将图像输入到一个三层的多层感知器,最后采用softmax分类器,利用神经网络前向传播算法进行图像分类。
2.如权利要求1所述的基于GAN的高光谱遥感影像分类方法,其特征在于,步骤(1)中,神经网络前向传播算法具体为:
L L L L-1 L
a=θ(z)=θ(wa +b)                         (2)
L为神经网络层数,z为神经元输出值,a为迭代步长,W为权重参数,b为偏置参数。
3.如权利要求1所述的基于GAN的高光谱遥感影像分类方法,其特征在于,步骤(3)中,神经网络反向传播算法具体为:
L为神经网络层数,a为迭代步长,W为权重参数,b为偏置参数。
4.如权利要求1所述的基于GAN的高光谱遥感影像分类方法,其特征在于,步骤(4)中,生成式对抗网络的优化函数具体为:
式(1)中,V(G,D)是用来衡量Pdata(x)与PG(x,θ)相近似的程度,x为输入数据,z为生成器输出数据,D为判别器输出的概率值,E为加权平均。
5.如权利要求1所述的基于GAN的高光谱遥感影像分类方法,其特征在于,步骤(4)中,softmax分类器函数具体为:
式(5)中,S为分类器输入值,Sj为S中的第j个元素。

说明书全文

一种基于GAN的高光谱遥感影像分类方法

技术领域

[0001] 本发明涉及图像处理技术领域,尤其是一种基于GAN的高光谱遥感影像分类方法。

背景技术

[0002] 高光谱图像富含了大量的地物光谱信息和空间信息,但是其较高的光谱分辨率依然带来了许多研究难题。第一,数据量较大。第二,大量的数据使得数据间的冗余度增高,在数据处理方面带来巨大困难,影响分类精度。第三,波段间相关性较高,在精确分类的目的下,需要提供大量的数据样本。同时,当样本数据一定时,高光谱图像的分类精度会随着波段数量先增加而增加,达到一个极大值,然后随着波段数量增加而减小,该现象被称为Hughes现象。
[0003] 在传统的图像分类方法中,将空间滤波和KNN算法结合,最终有效地消除了图像噪声,使得最终分类的精度得到了提高。在图像分类器中有一项重要指标是原子表达能,如何对这种表达能力进行提高也是现阶段的研究方向,利用加权融合核稀疏与协同表示进行分类的方法,最终也得到了很好的表现。感知损失,结构相似性损失等都是运动图像中常常会出现的问题,针对这些图像模糊问题,利用生成式对抗网络将图像的噪声去除,直接对图像进行恢复,即不进行估计模糊核的过程,从而增加感知损失作为损失项,但是引进了结构相似性损失函数作为约束项,提高生成图片的清晰度与真实性。
[0004] 深度学习的核心是神经网络模型,许多研究人员也都针对生成式对抗网络进行了深入的研究与分析。传统的图像分类算法存在一个缺陷,当含有多个对象的时候,传统方法往往只针对单个对象进行处理而忽略多个对象之间存在的关系。基于卷积神经网络人脸识别算法利用网络结构的深度和优化训练模型做到了提取高层语义特征的效果,提高了分类精度。图像的分类问题实际上是一种标签分配问题,利用深度学习方法对高光谱遥感图像进行标签分类,采用深度学习中的堆叠降噪自动编码器提取图像中每个像素的深层次特征。在特征学习方面,利用生成式对抗网络减少在训练的过程中对已标记样本的需求,同时获取地物的光谱特征,并预测样本的所属类别。此外基于非局部均值滤波的高光谱图像空谱联合网络的分类方法,该方法采用皮尔逊相关系数来度量像素间的相似程度,并用此相似程度来构造非局部滤波器的滤波权值,进行非局部均值滤波,最后利用SVM进行分类。

发明内容

[0005] 本发明所要解决的技术问题在于,提供一种基于GAN的高光谱遥感影像分类方法,能够解决原始光谱样本数据量小且存在噪声信号以及梯度消失的问题,保证生成样本的多样性,利用生成式对抗网络生成可分性更高的图像,再利用简单的多层感知器对生成的图像进行分类。
[0006] 为解决上述技术问题,本发明提供一种基于GAN的高光谱遥感影像分类方法,包括如下步骤:
[0007] (1)将噪声信号作为生成器G的输入,利用神经网络前向传播算法得到新生成的光谱图像;
[0008] (2)将真实图像数据和新生成的图像数据作为判别器D的输入,利用神经网络前向传播算法输出输入数据被判别为真实数据的概率;
[0009] (3)根据判别结果分别计算生成器G和判别器D的损失函数,利用神经网络反向传播算法,更新权重与偏置参数;
[0010] (4)利用训练好的生成式对抗网络生成可分性更高的图像,将图像输入到一个三层的多层感知器,最后采用softmax分类器,利用神经网络前向传播算法进行图像分类。
[0011] 优选的,步骤(1)中,神经网络前向传播算法具体为:
[0012] aL=θ(zL)=θ(wLaL-1+bL)   (2)
[0013] 式(2)中L为神经网络层数,z为神经元输出值,a为迭代步长,W为权重参数,b为偏置参数。
[0014] 优选的,步骤(3)中,神经网络反向传播算法具体为:
[0015]
[0016]
[0017] 式(3)中L为神经网络层数,a为迭代步长,W为权重参数,b为偏置参数。
[0018] 优选的,步骤(4)中,生成式对抗网络的优化函数具体为:
[0019]
[0020] 式(1)中,V(G,D)是用来衡量Pdata(x)与PG(x,θ)相近似的程度,x为输入数据,z为生成器输出数据,D为判别器输出的概率值,E为加权平均。
[0021] 优选的,步骤(4)中,softmax分类器函数具体为:
[0022]
[0023] 式(5)中,S为分类器输入值,Sj为S中的第j个元素。
[0024] 本发明的有益效果为:本发明能够解决原始光谱样本数据量小且存在噪声信号以及梯度消失的问题,保证生成样本的多样性,利用生成式对抗网络生成可分性更高的图像,再利用简单的多层感知器对生成的图像进行分类。附图说明
[0025] 图1为本发明的方法流程示意图。
[0026] 图2为本发明的整体网络架构示意图。
[0027] 图3为本发明的生成对抗网络原理示意图。
[0028] 图4为本发明的判别网络训练流程示意图。
[0029] 图5为本发明的生成网络训练流程示意图。
[0030] 图6为本发明的多层感知器结构示意图。
[0031] 图7为本发明的Indian Pines数据集地标图与本发明方法实验结果示意图。
[0032] 图8为本发明的Pavia University数据集地标图与本发明方法实验结果示意图。
[0033] 图9为SVM、PCA-SVM、EMP、EPF与本发明方法在Indian Pines数据集上的分类结果示意图。
[0034] 图10为SVM、PCA-SVM、EMP、EPF与本发明方法在Pavia University数据集上的分类结果示意图。

具体实施方式

[0035] 如图1所示,一种基于GAN的高光谱遥感影像分类方法,包括如下步骤:
[0036] S1:使用python语言,基于keras库搭建一个生成式对抗网络以及一个三层的多层感知器。生成式对抗网络由一个生成网络与一个判别网路构成,生成网络由3层反卷积层构成,判别网络由3层卷积层组成。将噪声信号作为生成器G的输入,得到新生成的光谱图像D(z);
[0037] S2:将真实图像数据和新生成的图像数据作为判别器D的输入,判别器的输出值存储为一个score值,代表判别器将输入数据判别为真实数据的概率;
[0038] S3:根据判别结果分别计算生成器G和判别器D的损失函数,并进行网络的反向传播,更新权重与偏置等参数;
[0039] S4:利用训练好的生成式对抗网络生成可分性更高的图像,将图像输入到一个三层的多层感知器,最后采用softmax分类器进行图像分类。整体网络架构如图2所示。
[0040] 生成式对抗网络的优化函数:
[0041]
[0042] 式(1)中,V(G,D)是用来衡量Pdata(x)与PG(x,θ)相近似的程度,x为输入数据,z为生成器输出数据,D为判别器输出的概率值,E为加权平均。
[0043] 神经网络前向传播算法:
[0044] aL=θ(zL)=θ(wLaL-1+bL)   (2)
[0045] 神经网络反向传播的函数:
[0046]
[0047]
[0048] 式(2),式(3)与式(4)中,L为神经网络层数,a为迭代步长,W为权重参数,b为偏置参数。
[0049] softmax分类器函数具体为:
[0050]
[0051] 式(5)中,S为分类器输入值,Sj为S中的第j个元素。
[0052] 生成式对抗网络(GAN)由生成模与判别模块两个模块组成。G是生成器(generator),作用是生成新的数据并尽可能使其接近给定的样本数据。D是判别器(discriminator),作用是将真实数据与生成数据区分开。对抗网络是一种特殊的网路结构,图3给出了GAN的模型。当输入样本数据时,生成模型对样本数据进行特征提取,尽可能的创造一个和样本数据无限接近的新的数据。判别模型的输入是样本数据和生成模型生成的新数据,判别模型的任务是将生成模型生成的新数据与样本数据区别开。在训练时,两个模型不会单独训练,在训练开始时就进行对抗训练,即生成模型产生一个假的数据混在真实数据中去欺骗判别模型,判别模型判别数据真假,在对抗训练过程中,两个模型的能力都得到增强,相互博弈达到平衡点即纳什均衡。
[0053] 生成式对抗网络的优化函数:
[0054]
[0055] 由式(1)得,在模型训练时,判别器D需要不停的被修改以至函数V最大化。生成器G也需要不停的被修改,使得函数V最大化,即G尽可能生成与真实数据接近的虚假数据来欺骗D。
[0056] 生成式对抗网络的反向传播训练中,并不会完全将D与G的训练分隔开,而是在训练判别模型D的同时也训练生成模型G,因为D的输入数据集中也包括生成模型的输出。当训练D的时候,上一轮G产生的图片和真实图片直接合并在一起作为输入,然后按照既定顺序摆放1和0,真实数据对应1,虚假数据对应0。当训练G的时候,需要把G和D当作一个整体,模型会输出一个数值score,数值范围在0-1之间,然后根据输出值y与score得到一个损失函数,利用最小化损失函数的方法反向传播,修改网络参数。图4与图5分别给出了判别模型的训练过程与生成模型的训练过程。
[0057] 前馈神经网络是最早的人工神经网络,图6为多层感知器的结构图。除输入层外,所有连接都有权重。输入节点(Input Nodes),输入层中的节点,主要作用是接受外部的输入信息。在输入节点中,并不会对数据进行计算处理,输入节点的作用就是将外部信息传递给隐藏层。隐藏层(Hidden Nodes),接收来自输入节点的数据,并对数据进行计算,然后将计算后的数据信息传递给输出层。多层感知器(MLP)含有多个隐藏层。输出节点(Output Nodes),输出层的主要作用是对数据信息进行计算,并将数据传递给外部。
[0058] 多层感知器通过输入输出,在训练学习过程中得到一个线性模型,进而得到输出结果Z,然后利用激活函数得到希望的结果,
[0059]
[0060] 多层感知器的训练方法通常会采用反向传播算法(BP)。反向传播算法可以理解为一种错误学习算法,对错误进行纠正进而优化参数。多层感知器(MLP)的相邻层之间配有权重,训练MLP的目的是为了选择正确的权重值。当输入信息时,这些权重可以决定输出信息。监督学习的思想是给定样本数据的标签,使得网络模型的输出结果为已知的。
[0061]
[0062]
[0063] 本发明从Indian Pines的10249个样本,Pavia University的42776个样本中随机抽取30%数据作为判别器的训练样本,其余70%样本数据作为实验的测试样本,两个数据集的样本类别如表1、表2所示。
[0064] 表1 Indian Pines数据集各类别样本数
[0065]
[0066] 表2 Pavia University数据集各类别样本数
[0067]
[0068]
[0069] 使用python语言,基于tensorflow库搭建生成式对抗网络模型:生成器、判别器以及多层全连接网络,分类器为softmax函数,
[0070]
[0071] 激活函数为非线性函数Relu函数,
[0072]
[0073] 网络模型中的超参数设置,学习率数值为0.01,数据批量大小200,默认训练洲际epoch=100,网络初始偏置为0,初始权重设置为标准差为0.01的高斯分布数据。对于Indian Pines数据集的波段数为200,对于Pavia University数据集的波段数为103。实验结果精度分析采用总体分类精度OA、平均分类精度AA以及Kappa系数,OA总体分类精度是被正确分类的像元总数除以像元总数得到的。输入数据中所有真实的参考源的像元个数即公式中的像元总数,在使用总体分类精度的时候,往往会进行一个混淆矩阵的操作,被正确分类的像元会作为混淆矩阵的对线元素分布。与总体分类精度OA相对应的还有一个平均精度AA,两者的不同点在于,总体分类精度OA针对的是整个数据集,而平均分类精度针对的是每一个类别的数据集,通过最终平均值得到整体分类精度。
[0074] Kappa系数主要用于数据一致性检验分析,即判断统一数据集上使用的不同处理方法和模型的预测结果是否一致,以及模型的输出结果是否与实际结果一致。通常kappa值高于0.75时则认为一致性较好,低于0.4则表示一致性较差。Kappa系数不能显示结果相关性的程度,只能表达结果是否一致。
[0075] Kappa系数的公式,
[0076]
[0077] 判别器和生成器的内部结构设置如表3与表4所示。
[0078] 表3判别器的网络结构
[0079] 网络层 Fliter sizeconv1 4×4
conv2 4×4
conv3 4×4
[0080] 表4生成器的网络结构
[0081] 网络层 Fliter sizeDeconv1 4×4
Deconv2 4×4
Deconv3 4×4
[0082] 图7左图为Indian Pines数据集的地标图,右图为GAN-MLP的实验结果图。GAN-MLP的OA、AA核Kappa参数值如表5所示。GAN-MLP在Indian pines数据集上的分类结果总体分类精度96.77%,平均分类精度97.79%,Kappa系数达到了0.9612,故图像的分类精度较高。
[0083] 图8左图为Pavia University数据集的地标图,右图为GAN-MLP的实验结果图。GAN-MLP的OA、AA核Kappa参数值如表6所示。GAN-MLP在Pavia University数据集上的分类结果总体分类精度97.48%,平均分类精度97.62%,Kappa系数达到了0.9662,故图像的分类精度较高。
[0084] 表5 Indian Pines分类精度结果
[0085]
[0086] 表6 Pavia University分类精度结果
[0087]
[0088] 图9为基于SVM、PCA-SVM、EMP、EPF与本发明方法在Indian Pines数据集上的分类结果图。图10为基于SVM、PCA-SVM、EMP、EPF与本发明方法在Pavia University数据集上的分类结果图。
[0089] 支持向量机(SVM)基于为待测数据集寻找分割线或平面,尽可能分离数据集中两种不同类型的数据,并在构建模型的过程中尽可能最大化分割区间的原则。对于线性SVM,又可以分为两类:线性可分SVM算法以及线性不可分SVM算法,线性可分SVM算法主要利用间隔分割最大化的分类方法。线性不可分SVM算法:利用非线性映射,将低维数据映射到高维数据空间,使得不能在低维被区分的数据可以在高维进行线性分区。该算法解决了使用线性算法分析高维特征空间样本的非线性特征时的困难。基于主成分分析的支持向量机分类(PCA-SVM),主成分分析法是一种被广泛使用的数据降维方法。主成分分析的核心思想是将输入数据的N维数据特征映射到K维空间,这是一个全新的正交特征,也称为主成分。
[0090] Bendiktsson等人在2005年,将形态学方法进行了扩展,得到了扩展形态学方,为了提取图像特征,首先对高光谱图像数据进行主成分分析(PCA),然后利用前几个主成分来进行形态学特征提取。
[0091] EMP={MP(PC1),MP(PC2)...,MP(PCc)}   (9)
[0092] 基于边缘滤波方法(EPF)本质上是一种区分高斯模糊的方法,它区分具有较大差异的像素点区域(即边缘是像素差异最大的地方),而不是统一加权。EPF的操作具体有两种做法:高斯双边模糊,均值迁移模糊。
[0093] 表7和表8分别为基于SVM、PCA-SVM、EMP、EPF与本发明方法在Indian Pines数据集和Pavia University数据集上的分类精度结果。
[0094] 表7 Indian Pinses数据集上各分类方法的分类精度
[0095]
[0096]
[0097] 表8 Pavia University数据集上各分类方法的分类精度
[0098]
[0099] 图9与图10中的第一、二个图片分别为基于SVM和PCA-SVM算法实现Indian Pines数据集和Pavia University数据集的分类结果。两个数据集的分类结果中很明显的存在着大量噪声,这说明整体的分类精度较低,其原因在于支持向量机(SVM)在图像分类的特征提取过程中忽略了图像空间特征,进而导致了分类精度不高。
[0100] 图9与图10的第三个图为EMP算法在Indian pines数据集与Pavia University数据集上的分类结果。扩展形态学方法EMP考虑了图像的空间特征,分类效果较佳,噪声较少,但是该方法在图像的小区域内的分类存在明显的偏差,存在一定量的噪声,因为EMP算法在数据的预处理中也采用了PCA方法,仅仅提取了前几个主成分而忽略了部分数据特征。
[0101] 图9和图10中的第四个图为EPF算法在Indian pines数据集与Pavia University数据集上的分类结果。由图可得基于边缘滤波的方法EPF分类效果较佳,噪声较少,但是该方法在图像的小区域内的分类同样存在明显的偏差,存在一定量的噪声。EPF算法的局限在于仅仅针对较大差异的像素点,而忽略了部分存在差异的像素点,进而影响了分类精度。
[0102] 表7为Indian Pines数据集上基于SVM、PCA-SVM、EMP、EPF以及本文方法GAN-MLP的实验分类精度结果。在总体分类精度上本文方法达到了96.77%,相比较于SVM提高了15.46%,相较于EMP11.29%,相较于EPF10.33%。在平均分类精度上,本文方法相较于SVM提高了12.93%,相较于PCA-SVM提高了19.04%,相较于EMP提高了8.9%,相较于EPF提高了
6.22%。在Kappa系数上,本文方法相较于SVM提高了0.1743,相较于PCA-SVM提高了0.1766,相较于EMP提高了0.1407,相较于EPF提高了0.1243。
[0103] 表8为Pavia University数据集上基于SVM、PCA-SVM、EMP、EPF以及本文方法MGAN的实验分类精度结果。在Pavia University数据集的实验中,本文方法的总体分类精度达到了97.48%,相比较SVM提高了6.36%,相比较EMP提高了4.94%,相比较于EPF提高了5.21%。在平均分类精度上,本文方法相较于SVM提高了8.02%,相较于PCA-SVM提高了
6.54%,相较于EMP提高了5.21%,相较于EPF提高了92.74%。在Kappa系数上,本文方法相较于SVM算法提高了0.0896,相较于PCA-SVM提高了0.1125,相较于EMP提高了0.0697,相较于EPF提高了0.0654。
[0104] 支持向量机(SVM)与基于主成分分析的支持向量机(PCA-SVM)在特征提取过程中忽略了图像的空间特征,进而导致了分类精度较差。扩展形态学(EMP)与基于边缘滤波算法(EPF)算法则由于在数据降维的过程中忽略了部分差异性特征,进而导致分类精度不佳。而本课题方法MGAN基于生成式对抗网络对图像进行特征提取,利用深度学习手段使计算机自主获取深层次,更完整的特征,进而取得了更好的分类精度。
[0105] 本发明为基于生成式对抗网络的高光谱影像分类方法,利用生成式对抗网络对图像进行特征提取,将高光谱原始波段作为真实样本,对抗生成新的样本,新的样本作为输入数据输入到多层感知器,利用softmax分类器进行分类。通过在Indian Pines数据集与Pavia University数据集上进行实验仿真,并与传统分类方法支持向量机(SVM)、扩展形态学(EMP)以及基于边缘滤波算法(EPF)进行对比分析,得出该方法在分类精度上有着更好的表现。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈