首页 / 专利库 / 数学与统计 / 模糊逻辑 / 基于三边滤波器和堆栈稀疏自动编码器的图像分类方法

基于三边滤波器和堆栈稀疏自动编码器的图像分类方法

阅读:1038发布:2020-05-21

专利汇可以提供基于三边滤波器和堆栈稀疏自动编码器的图像分类方法专利检索,专利查询,专利分析的服务。并且本 发明 提供的是一种基于三边 滤波器 和堆栈稀疏自动 编码器 的图像分类方法。首先,使用三边滤波器获取平滑的图像,提取所述图像的 像素 的 光谱 ‑空间特征的同时滤除退化图像的高斯、斑点和脉冲噪声;其次,使用改进的堆栈稀疏自动编码器进行高阶特征提取;最后,利用 随机森林 分类器进行有监督微调网络和分类。本发明将改进的堆栈稀疏自动编码器和随机森林分类器引入到高光谱数据分类中,作为一种 深度学习 架构,改进的堆栈稀疏自动编码器可以逐层地提取光谱数据的抽象的和有用的深层次特征,从而提高光谱数据的分类性能。本发明不仅适用于对高光谱图像进行分类,同时也可以对其他图像进行分类。具有很强的可移植性,更易满足图像分类的需求。,下面是基于三边滤波器和堆栈稀疏自动编码器的图像分类方法专利的具体信息内容。

1.一种基于三边滤波器和堆栈稀疏自动编码器的图像分类方法,其特征是:
首先,使用三边滤波器获取平滑的图像,提取所述图像的像素光谱-空间特征的同时滤除退化图像的高斯、斑点和脉冲噪声;
其次,使用改进的堆栈稀疏自动编码器进行高阶特征提取;
最后,利用随机森林分类器进行有监督微调网络和分类;
所述使用改进的堆栈稀疏自动编码器进行高阶特征提取具体包括:
稀疏自动编码器尝试提取隐藏特征以至译码层的重构矢量近似于输入层的输入数据,D S
即输入矢量x∈R被映射到隐藏层和产生一个线性组成z∈R ,然后采用一个非线性激活函数f(x)=(1+exp(-x))-1获取输出a,如下所示
z=wx+b1,a=f(z)
其中,w∈RS×D和b1∈RS×1分别代表输入层到隐藏层的权重和偏置,D代表输入数据维数、S代表隐藏层神经元个数,为了验证是否获取的重构y近似于初始输入,对获取的a进行译码,如下所示:
t=va+b2,y=f(t)
其中,v∈RD×S、b2∈RD×1分别代表隐藏层到输出层的权重和偏置,初始输入x和重构y之间的最小误差 被计算;为了发现初始输入的一些特定结构和相关
性,稀疏约束和权重惩罚项被添加到网络中,目标函数J如下所示:
其中,M是样本个数,xm和ym分别代表第m个输入和输出,λ代表权重惩罚参数,η代表稀疏惩罚项的权重, 代表l层的第i个隐层神经元和l-1层的第j个输入神经元之间的连接权重;此外, 代表隐藏单元的目标平均激活函数r和隐
藏神经元i的平均激活函数
采用改进的人工鱼群智能优化算法优化每一层稀疏自动编码器的目标函数,具体方案如下:
设鱼群总数为n,每一条鱼代表一个神经网络和任意两条鱼的差值和加性值仍然代表一个神经网络,稀疏自动编码器的优化参数包括两个权重矩阵[w]与[v]和阈值向量b;在当前的位置,个体鱼的食物浓度为Y=1/E,两个个体鱼Xp和Xq之间的距离如下:
其中,输出层神经元个数是N,wij(p)和wij(q)分别代表人工鱼Xp和Xq的参数矩阵[w]中第i行、第j列的元素,vki(p)和vki(q)分别代表人工鱼Xp和Xq的参数矩阵[v]中第k行、第i列的元素,bi(p)和bi(q)分别代表人工鱼Xp和Xq的阈值向量b中第i行的元素,bk(p)和bk(q)分别代表人工鱼Xp和Xq的阈值向量b中第k行的元素,dpq代表两个个体鱼Xp和Xq之间的距离;
觅食行为:w(p)是个体鱼的当前状态,然后在视野范围内随机地选择一个新的状态w(q),如果食物浓度Yq>Yp,w(p)按照公式
被更新;否则,
再一次选择一个新的状态来判断是否满足前进条件,如果在执行最大尝试次数后仍然不满足前进条件,个体鱼将按照公式w(pnext)=w(p)+rand()×step+χ×(wij(best)-wij(l)),if(Yq≤Yp)执行随机行为,
其中,w(pnext)是个体鱼的下一步状态,rand()是[0,1]之间均匀地产生一个随机数,wij(best)和wij(l)分别代表当前最优人工鱼Xbest和随机鱼Xl的参数矩阵[w]中第i行、第j列的元素,χ是黄金比例系数λ和偏移 的乘积表示为:
其中, 代表标准均匀分布的一个随机值和取值区间为
利用模糊逻辑系统来动态地调整视野距离V和移动步长M,鱼群位置的分散度和迭代次数作为输入变量,同时V和M作为输出变量,分散性测度表达公式如下:
其中,鱼群总数为n,k代表当前迭代, 和 分别代表第k次迭代时的人工鱼Xp和最优人工鱼Xbest,F代表模糊系统的输入变量即鱼群之间的分散性,迭代和分散性度量被归一化在0到1之间,如下所示:
KNorm=k/Kmax
式中,KNorm和FNorm分别为将当前迭代次数k与分散性F进行标准正态化后的模糊系统输入参数;Kmax为最大迭代次数;Fmin和Fmax分别为每次迭代中分散性的最小值和最大值。
2.根据权利要求1所述的基于三边滤波器和堆栈稀疏自动编码器的图像分类方法,其特征是:所述三边滤波器的像素更新公式为:
其中,t和v分别代表像素的坐标,Sp代表像素t的邻域的集合,δs、δr和δd分别为控制空间参数、幅值参数和脉冲参数,I(t)是初始图像的中心像素,I(v)是邻域窗口内的像素,J(t)和J(v)分别是基于参考图像的中心像素和邻域窗口内的像素,Wt是空间邻近性加权相似性加权 和脉冲加权
的乘积,Wt进一步表示为:
ROAD为等级
排序绝对差。
3.根据权利要求2所述的基于三边滤波器和堆栈稀疏自动编码器的图像分类方法,其特征是:在执行脉冲加权时,采用等级排序绝对差来确定样本点是图像的边缘点或是被脉冲噪声污染的像素点,相应的计算公式如下:
d[t,v]=|I(t)-I(v)|
rf(t,v)=fthsmallest d[t,v]
其中,rf(t,v)代表增序排列的绝对差异值d[t,v],即从小到大累计选取f个d[t,v]值,2
2
≤g≤w-2,w是窗口尺寸,在等式 中,ROAD统计被用来度量中心像素
和第g个邻域像素的邻近程度。
4.根据权利要求1、2或3所述的基于三边滤波器和堆栈稀疏自动编码器的图像分类方法,其特征是:所述图像为高光谱图像。

说明书全文

基于三边滤波器和堆栈稀疏自动编码器的图像分类方法

技术领域

[0001] 本发明涉及的是一种图像分类方法,特别是一种联合三边滤波器和深度学习理论的高光谱图像分类方法。

背景技术

[0002] 高光谱遥感利用很多很窄的电磁波段从感兴趣的物体获取图像数据,一般从可见光到热波红外波段范围内设置了几十到数百个连续波段,其光谱分辨率可高达纳米数量级。对于每一个被记录的像素,丰富的光谱信息可以提供观测地表的完整的光谱描述和特性,因此在物质辨别时可以被看作是一个有效的工具。目前高光谱成像已经成为一种重要的遥感成像探测手段,其本质在于能够同时提供地物分布的空间信息和较高分辨率的光谱信息。虽然高光谱图像数据有着比以往数据更显著的优势和发展潜,但在对高光谱图像数据进行空间信息和光谱信息提取与应用过程中,出现了很多技术上的难题,给研究者们带来了巨大的挑战。另一方面,在利用高光谱传感器捕获和传输高光谱图像过程中,通常高斯噪声和脉冲噪声等会引入到图像中,导致产生的图像质量下降,从而很大程度上制约图像的分类精度。因此,如何有效地提高图像质量和提取像素的光谱-空间信息,从而实现高光谱数据的有效分类得到越来越广泛的关注。
[0003] 在对高光谱图像分类中,去除图像噪声和提取光谱-空间特征尤为重要。这是因为噪声导致图像的质量严重退化,从而很大程度上制约图像的分类精度。其次,在一个局部区域内的像素通常代表相同的物质和具有相似的光谱特性,因此综合利用高光谱数据的空间信息被期待获取更好的分类性能。然而,现有的文献通常只利用了像素的光谱-空间信息,没有考虑局部区域内像素的几何邻近性,而且不能有效滤除退化图像的高斯,斑点和脉冲噪声等。
[0004] 另一方面,目前大多较为流行的分类器通常被看作是浅层学习模型,例如线性支持向量机,逻辑回归,最大似然分类器和稀疏表示基分类器等。然而这些分类器不能有效地提取光谱数据的高阶特征。

发明内容

[0005] 本发明的目的在于提供一种能够提高光谱数据的分类性能的基于三边滤波器和堆栈稀疏自动编码器的图像分类方法。
[0006] 发明是这样实现的:
[0007] 首先,使用三边滤波器获取平滑的图像,提取所述图像的像素的光谱-空间特征的同时滤除退化图像的高斯、斑点和脉冲噪声;
[0008] 其次,使用改进的堆栈稀疏自动编码器(SSA)进行高阶特征提取;
[0009] 最后,利用随机森林分类器进行有监督微调网络和分类。
[0010] 本发明还可以包括:
[0011] 1、所述图像为高光谱图像。
[0012] 2、所述三边滤波器的像素更新公式为:
[0013]
[0014] 其中,t和v分别代表像素的坐标,Sp代表像素t的邻域的集合,δs、δr和δd分别为控制空间参数、幅值参数和脉冲参数,I(t)是初始图像的中心像素,I(v)是邻域窗口内的像素,J(t)和J(j)分别是基于参考图像的中心像素和邻域窗口内的像素,Wt是空间邻近性加权 相似性加权 和脉冲加权的乘积,Wt进一步表示为:
[0015]
[0016] 在执行脉冲权重因子时,采用等级排序绝对差(Rank-Ordered Absolute Differences(ROAD))来确定样本点是图像的边缘点或是被脉冲噪声污染的像素点,相应的计算公式如下:
[0017] d[t,v]=|I(t)-I(v)|
[0018] rf(t,v)=fth smallest d[t,v]
[0019]
[0020] 其中,rf(t,v)代表增序排列的绝对差异值d[t,v],即从小到大累计选取f个d[t,v]值,2≤g≤w2-2,w是窗口尺寸,在等式 中,ROAD统计被用来度量中心像素和第g个邻域像素的邻近程度。
[0021] 3、使用改进的堆栈稀疏自动编码器进行高阶特征提取具体包括:
[0022] 稀疏自动编码器尝试提取隐藏特征以至译码层的重构矢量近似于输入层的输入数据,即输入矢量x∈RD被映射到隐藏层和产生一个线性组成z∈RS,然后采用一个非线性激-1活函数f(x)=(1+exp(-x)) 获取输出a,如下所示
[0023] z=wx+b1,a=f(z)
[0024] 其中,w∈RS×D和b1∈RS×1分别代表输入层到隐藏层的权重和偏置,D代表输入数据维数、S代表隐藏层神经元个数,为了验证是否获取的重构y近似于初始输入,对获取的a进行译码,如下所示:
[0025] t=va+b2,y=f(t)
[0026] 其中,v∈RD×S、b2∈RD×1分别代表隐藏层到输出层的权重和偏置,初始输入x和重构y之间的最小误差 被计算;为了发现初始输入的一些特定结构和相关性,稀疏约束和权重惩罚项被添加到网络中,目标函数J如下所示:
[0027]
[0028] 其中,M是样本个数,xm和ym分别代表第m个输入和输出,λ代表权重惩罚参数,η代表稀疏惩罚项的权重, 代表l层的第i个隐层神经元和l-1层的第j个输入神经元之间的连接权重;此外, 代表隐藏单元的目标平均激活函数r和隐藏神经元i的平均激活函数
[0029] 采用改进的人工鱼群智能优化算法优化每一层稀疏自动编码器的目标函数,具体方案如下:
[0030] 设鱼群总数为n,每一条鱼代表一个神经网络和任意两条鱼的差值和加性值仍然代表一个神经网络,稀疏自动编码器的优化参数包括两个权重矩阵[w]与[v]和阈值向量b;在当前的位置,个体鱼的食物浓度为Y=1/E,两个个体鱼Xp和Xq之间的距离如下:
[0031]
[0032] 其中,输出层神经元个数是N,wij(p)和wij(q)分别代表人工鱼Xp和Xq的参数矩阵[w]中第i行、第j列的元素,vki(p)和vki(q)分别代表人工鱼Xp和Xq的参数矩阵[v]中第k行、第i列的元素,bi(p)和bi(q)分别代表人工鱼Xp和Xq的阈值向量b中第i行的元素,bk(p)和bk(q)分别代表人工鱼Xp和Xq的阈值向量b中第k行的元素,dpq代表两个个体鱼Xp和Xq之间的距离。
[0033] 觅食行为:w(p)是个体鱼的当前状态,然后在视野范围内随机地选择一个新的状态w(q),如果食物浓度Yq>Yp,w(p)按照公式被更新;否则,
再一次选择一个新的状态来判断是否满足前进条件,如果在执行最大尝试次数后仍然不满足前进条件,个体鱼将按照公式w(pnext)=w(p)+rand()×step+χ×(wij(best)-wij(l)),if(Yq≤Yp)执行随机行为,
[0034] 其中,w(pnext)是个体鱼的下一步状态,rand()是[0,1]之间均匀地产生一个随机数,wij(best)和wij(l)分别代表当前最优人工鱼Xbest和随机鱼Xl的参数矩阵[w]中第i行、第j列的元素,χ是黄金比例系数λ和偏移 的乘积表示为:
[0035]
[0036] 其中, 代表标准均匀分布的一个随机值和取值区间为
[0037] 利用模糊逻辑系统来动态地调整视野距离V和移动步长M,鱼群位置的分散度和迭代次数作为输入变量,同时V和M作为输出变量,分散性测度表达公式如下:
[0038]
[0039] 其中,鱼群总数为n,k代表当前迭代, 和 分别代表第k次迭代时的人工鱼Xp和最优人工鱼Xbest,D代表模糊系统的输入变量即鱼群之间的分散性,迭代和分散性度量被归一化在0到1之间,如下所示:
[0040] KNorm=k/Kmax
[0041]
[0042] 式中,KNorm和DNorm分别为将当前迭代次数k与分散性D进行标准正态化后的模糊系统输入参数;Kmax为最大迭代次数;Dmin和Dmax分别为每次迭代中分散性的最小值和最大值。
[0043] 本发明将改进的堆栈稀疏自动编码器和随机森林分类器引入到高光谱数据分类中,作为一种深度学习架构,改进的堆栈稀疏自动编码器可以逐层地提取光谱数据的抽象的和有用的深层次特征,从而提高光谱数据的分类性能。
[0044] 本发明提出的联合三边滤波器与堆栈稀疏自动编码器的分类方法不仅适用于对高光谱图像进行分类,同时也可以对其他图像进行分类。具有很强的可移植性,更易满足图像分类的需求。
[0045] 本发明的优点如下:
[0046] 1)在计算相似性权重wr过程中,使用的是基于双树复小波变换的参考图像,而不是初始的高光谱图像。这一步的实现可以提高灰度测度计算的稳定性从而获得更加准确的结果。
[0047] 2)在像素更新公式中,引入脉冲权重因子。通过综合考虑像素的光谱相似性和几何邻近性,从而有效地获得高光谱图像的光谱和空间特征,同时最大限度地滤除图像在产生和传输过程中产生的高斯噪声和脉冲噪声等。
[0048] 3)利用改进的稀疏自动编码器(ISA)逐层提取光滑图像的特征表示,采用人工鱼群智能优化算法优化ISA的目标函数,从而降低传统的反向传播算法易于陷入局部极值的可能性同时加快算法的收敛速度。进一步采用堆栈稀疏自动编码器自适应地提取光谱数据的高阶特征。为获取最优分类准确度提供可能。附图说明
[0049] 图1是一幅光谱-空间信息联合的高光谱图像分类流程图
[0050] 图2是一幅人工鱼群算法优化稀疏自动编码器的流程图;
[0051] 图3是人工鱼模型;
[0052] 图4(a)-图4(c)是模糊逻辑系统的输入和输出变量;
[0053] 图5是基于三边滤波器和堆栈稀疏自动编码器的空谱联合的高光谱图像分类框架
[0054] 图6(a)是印第安纳农场数据的九种地物的真实分布图;
[0055] 图6(b)是基于对比算法OS-SVM的印第安纳农场数据的总体分类精度图;
[0056] 图6(c)是基于对比算法BF-SVM的印第安纳农场数据的总体分类精度图;
[0057] 图6(d)是基于对比算法TF-SVM的印第安纳农场数据的总体分类精度图;
[0058] 图6(e)是基于对比算法OS-SSAR的印第安纳农场数据的总体分类精度图;
[0059] 图6(f)是基于对比算法BF-SSARF的印第安纳农场数据的总体分类精度图;
[0060] 图6(g)是基于对比算法TF-SSARF的印第安纳农场数据的总体分类精度图;
[0061] 图6(h)是基于对比算法TF-ISSARF的印第安纳农场数据的总体分类精度图;
[0062] 图7(a)是肯尼迪航天中心数据的十三种地物的真实分布图;
[0063] 图7(b)是基于对比算法OS-SVM的肯尼迪航天中心数据的总体分类精度图;
[0064] 图7(c)是基于对比算法BF-SVM的肯尼迪航天中心数据的总体分类精度图;
[0065] 图7(d)是基于对比算法TF-SVM的肯尼迪航天中心数据的总体分类精度图;
[0066] 图7(e)是基于对比算法OS-SSARF的肯尼迪航天中心数据的总体分类精度图;
[0067] 图7(f)是基于对比算法BF-SSARF的肯尼迪航天中心数据的总体分类精度图;
[0068] 图7(g)是基于对比算法TF-SSARF的肯尼迪航天中心数据的总体分类精度图;
[0069] 图7(h)是基于对比算法TF-ISSARF的肯尼迪航天中心数据的总体分类精度图;
[0070] 图8(a)描述基于三边滤波器的空间参数,幅值参数和脉冲参数对印第安纳农场数据的总体分类精度的影响;
[0071] 图8(b)描述基于三边滤波器的空间参数,幅值参数和脉冲参数对肯尼迪航天中心数据的总体分类精度的影响;
[0072] 图9(a)描述基于三边滤波器的空间邻近性加权的窗口尺寸对印第安纳农场数据的总体分类精度的影响;
[0073] 图9(b)描述基于三边滤波器的空间邻近性加权的窗口尺寸对肯尼迪航天中心数据的总体分类精度的影响。

具体实施方式

[0074] 下面举例对本发明做更详细的描述。
[0075] 首先,在执行高光谱图像分类之前,使用三边滤波器获取平滑的高光谱图像。提取像素的光谱-空间特征的同时滤除退化图像的高斯、斑点和脉冲噪声等。
[0076] 其次,使用改进的堆栈稀疏自动编码器(SSA)进行高阶特征提取。
[0077] 最后,利用随机森林分类器进行有监督微调网络和分类。
[0078] 本发明提出的联合三边滤波器与堆栈稀疏自动编码器的分类方法不仅适用于对高光谱图像进行分类,同时也可以对其他图像进行分类。具有很强的可移植性,更易满足图像分类的需求。
[0079] 本发明具体包括:
[0080] 1、本发明提出运用三边滤波器对初始的退化图像进行平滑滤波。提出的三边滤波器的像素更新公式如下所示:
[0081]
[0082] 其中,t和v分别代表像素的坐标。Sp代表像素t的邻域的集合。δs,δr和δd分别控制空间参数,幅值参数和脉冲参数。I(t)是初始图像的中心像素和I(v)是邻域窗口内的像素。J(t)和J(j)分别是基于参考图像的中心像素和邻域窗口内的像素。Wt是空间邻近性加权相似性加权 和脉冲加权
的乘积,可以进一步表示为:
[0083]
[0084] 在执行脉冲权重因子时,采用等级排序绝对差(Rank-Ordered Absolute Differences(ROAD))来确定样本点是图像的边缘点或是被脉冲噪声污染的像素点。相应的计算公式如下:
[0085] d[t,v]=|I(t)-I(v)|  (3)
[0086] rf(t,v)=fth smallest d[t,v]  (4)
[0087]
[0088] 其中,rf(t,v)代表增序排列的绝对差异值d[t,v],即从小到大累计选取f个d[t,v]值。2≤g≤w2-2,w是窗口尺寸。在等式(5)中,ROAD统计被用来度量中心像素和第g个邻域像素的邻近程度。
[0089] 通常,如果图像内不存在噪声像素,在邻域窗口内大部分像素点展现相似的强度值和产生低的ROAD值。相反,如果像素被脉冲噪声污染,被污染像素的光谱强度和邻域像素存在较大差异,导致产生高的ROAD函数值。特别地,如果图像中至少存在一个噪声样本或者产生高的ROAD值,此时脉冲权重被激活和通过公式(1)更新当前的像素值。相反地,如果图像中不存在脉冲像素或者高的ROAD值,脉冲权重因子被抑制,即wd=0,此时使用双边滤波器对初始图像进行平滑滤波。
[0090] 2、利用上述三边滤波器获取平滑的高光谱图像后,提出一种改进的堆栈稀疏自动编码器自适应地提取平滑图像的高阶特征表示。
[0091] 具体实现如下所示:
[0092] 稀疏自动编码器尝试提取隐藏特征以至译码层的重构矢量近似于输入层的输入数据。即输入矢量x∈RD被映射到隐藏层和产生一个线性组成z∈RS,然后采用一个非线性激活函数f(x)=(1+exp(-x))-1获取输出a,如下所示.
[0093] z=wx+b1,a=f(z)  (6)
[0094] 其中,w∈RS×D(D代表输入数据维数和S代表隐藏层神经元个数)和b1∈RS×1分别代表输入层到隐藏层的权重和偏置。进一步,为了验证是否获取的重构y近似于初始输入,对获取的a进行译码,如下所示:
[0095] t=va+b2,y=f(t)  (7)
[0096] 其中,v∈RD×S、b2∈RD×1分别代表隐藏层到输出层的权重和偏置。初始输入x和输出y之间的最小重构误差 被计算。特别地,为了发现初始输入的一些特定结构和相关性,稀疏约束和权重惩罚项被添加到网络中,目标函数J如下所示:
[0097]
[0098] 其中,M是样本个数,xm和ym分别代表第m个输入和输出。λ代表权重惩罚参数和η代表稀疏惩罚项的权重。 代表l层的第i个隐层神经元和l-1层的第j个输入神经元之间的连接权重;此外, 代表r(隐藏单元的目标平均激活函数)和 (隐藏神经元i的平均激活函数)的相对熵。
[0099] 如公式(8),通常采用梯度下降和反向传播算法更新隐藏层的权重和偏置,从而实现优化目标函数J。然而,再进行目标函数优化过程中,模型较难选取适当的初始权重和偏置,优化过程易于陷入局部极值。为了寻址上述难题,本发明提出利用改进的人工鱼群智能优化算法替代梯度下降和反向传播算法,采用改进的人工鱼群智能优化算法优化每一层稀疏自动编码器的目标函数。改进的原因是由于人工鱼群算法展现鲁棒的追踪性能,快的收敛速度和高的全局优化能力。具体实施方案如下:
[0100] 设鱼群总数为n,每一条鱼代表一个神经网络和任意两条鱼的差值和加性值仍然代表一个神经网络,稀疏自动编码器的优化参数包括两个权重矩阵[w]与[v]和阈值向量b;在当前的位置,个体鱼的食物浓度为Y=1/E,两个个体鱼Xp和Xq之间的距离如下:
[0101]
[0102] 其中,输出层神经元个数是N,wij(p)和wij(q)分别代表人工鱼Xp和Xq的参数矩阵[w]中第i行、第j列的元素,vki(p)和vki(q)分别代表人工鱼Xp和Xq的参数矩阵[v]中第k行、第i列的元素,bi(p)和bi(q)分别代表人工鱼Xp和Xq的阈值向量b中第i行的元素,bk(p)和bk(q)分别代表人工鱼Xp和Xq的阈值向量b中第k行的元素,dpq代表两个个体鱼Xp和Xq之间的距离。
[0103] 本发明研究和改进了鱼群的四个生物学行为,包括觅食行为,聚群行为,跟随行为和随机行为。
[0104] 觅食行为:w(p)是个体鱼的当前状态,然后在视野范围内随机地选择一个新的状态w(q),如果食物浓度Yq>Yp,w(p)按照公式(10)被更新;否则,再一次选择一个新的状态来判断是否满足前进条件,如果在执行最大尝试次数后仍然不满足前进条件,个体鱼将按照公式(11)执行随机行为。
[0105]
[0106] w(pnext)=w(p)+rand()×step+χ×(wij(best)-wij(l)),if(Yq≤Yp)  (11)[0107] 其中,w(pnext)是个体鱼的下一步状态,rand()是[0,1]之间均匀地产生一个随机数。本发明提出将χ×(wij(best)-wij(l))添加到鱼群位置更新公式中,被称作为全局最优导向鱼群搜索项。其中,wij(best)和wij(l)分别代表当前最优人工鱼Xbest和随机鱼Xl的参数矩阵[w]中第i行,第j列的元素。χ是黄金比例系数λ和偏移 的乘积,如下所示:
[0108]
[0109] 其中, 代表标准均匀分布的一个随机值和取值区间为 在这里从公式(12)可知,产生的新解没有呆在相同的位置,而是转移一个度,从而使得个体鱼在搜索空间内获得更多的位置信息。
[0110] 另一方面,为了克服传统人工鱼群算法存在后期迭代收敛速度慢的不足,本发明提出利用模糊逻辑系统来动态地调整视野距离(V)和移动步长(M)。在这个设计的系统中,鱼群位置的分散度和迭代次数作为输入变量。同时V和M作为输出变量。分散性测度表达公式如下:
[0111]
[0112] 其中,鱼群总数为n和k代表当前迭代。 和 分别代表第k次迭代时的人工鱼Xp和最优人工鱼Xbest。D代表模糊系统的输入变量即鱼群之间的分散性。大体上,鱼群越接近时分散性越低,反之亦然。在上述公式(13)中,欧式距离被用来测量个体鱼和最优鱼之间的分散度。此外,为了方便计算,迭代和分散性度量被归一化在0到1之间,如下所示:
[0113] KNorm=k/Kmax  (14)
[0114]
[0115] 式中,KNorm和DNorm分别为将当前迭代次数k与分散性D进行标准正态化后的模糊系统输入参数;Kmax为最大迭代次数;Dmin和Dmax分别为每次迭代中分散性的最小值和最大值。
[0116] 需要注意的是,上述的位置信息更新规则同样适用于聚群行为和跟随行为。为了每一条鱼,通过执行上述描述的四种行为模式来搜索最优解。然后,选择最好的行为模式来更新当前状态。最后需要对公告板进行更新,即人工鱼的最优状态和最大的食物浓度被记录在公告板上,在移动之后每一条鱼被更新,然后比较公告板和产生的新的状态。如果人工鱼的当前状态优于公告板,公告板上的值将被替代。
[0117] 在训练完每一个稀疏自动编码器之后,重构层被移除和提取的特征保存于隐藏层,然后被用来作为下一个隐藏层的输入,从而产生更高阶特征。进一步,通过堆叠多个非监督特征学习层来构建堆栈稀疏自动编码器。最后,随机森林分类器被级联到堆栈稀疏自动编码器的最后一层,当训练分类器时对学习到的高阶特征进行有监督的微调,然后通过最大投票规则判别测试集的类别标签。
[0118] 图1是一幅空谱联合的高光谱图像分类流程图,在提出的三边滤波器中,通过综合考虑高光谱图像的光谱和空间邻近性从而产生光谱-空间信息特征集。获得的平滑图像可以有效地滤除高斯噪声,斑点噪声和脉冲噪声等,同时保留图像的细节信息。此外,本发明采用改进的堆栈稀疏自动编码器和随机森林分类器对获取的平滑图像进行非监督的训练和有监督的微调与分类。所提出的深度学习机模型可以逐层地提取数据的抽象的和有用的高阶特征表示,从而提高高光谱数据的分类性能。
[0119] 图2是一幅人工鱼群算法优化稀疏自动编码器的流程图。在改进的深度学习模型中,将全局最优导向鱼群搜索项和模糊逻辑规则引入到鱼群行为模式中,实现优化目标函数J。该方法的提出可以保持鱼群的多样性并同时避免算法在后期迭代收敛慢的不足,从而有效地避免深度学习模型在优化目标函数过程中易于陷入局部极值,从而获取全局最优解。
[0120] 图3是一个人工鱼模型, 和 为两条任意鱼,Xp为当前人工鱼,step为移动步长,visual为其感知范围,然后在视野范围内随机地选择一个新的人工鱼Xq,如果食物浓度值Yq>Yp,人工鱼Xp的当前状态w(p)被更新;如果人工鱼Xq的新的状态w(q)不比当前状态更优,则继续巡视感知范围内的其它位置,来判断是否满足前进条件。如果在执行完最大尝试次数后仍然不满足前进条件,个体鱼将任意移动一步。大体上,鱼群移动的最终目标是通过执行最优的行为模式从而获取最优解。
[0121] 参图4(a)-图4(c),该图被用来显示模糊逻辑系统的输入和输出变量。系统中,鱼群位置的分散度和迭代次数作为输入变量。同时视野范围和移动步长作为输出变量。图4(a)-图4(c)中L,M,H,ML和MH分别代表低,中,高,中低和中高值。通常在早期迭代过程中,视野范围和移动步长应该取较大值以致搜索更大范围和确保全局最优化。然后,随着迭代的进行,视野范围和移动步长应该逐步降低以确保算法在邻近全局最优解范围内执行最优化,从而获得高精度解。
[0122] 图5是基于三边滤波器和堆栈稀疏自动编码器的空谱联合的高光谱图像分类框架。
[0123] 首先,采用提出的三边滤波器提高图像质量,即将空间信息整合到光谱域中同时降低由噪声引起的退化现象。进一步,采用改进的堆栈稀疏自动编码器提取平滑的图像的高阶特征。最后,将获取的抽象的高阶特征作用于随机森林分类器中,通过主要投票准则获取最终的分类结果。
[0124] 图6(a)-图6(h)是一幅真实的高光谱图像数据,这组数据由AVIRIS传感器于1992年在美国印第安纳州西北部的农场上空获取。AVIRIS数据包含224个波段,它的空间分辨率为20m和光谱覆盖范围为0.2~2.4μm。在去除20个吸收波段和4个噪声波段,剩余200个波段用于分类实验。整幅图大小为144x144个像素点,包含从20到2468个像素不等的16类地物。为了使实验分析更加显著,七类关于小样本的地物被移除和剩余的九类大样本地物被保留。图6(a)表示场景的真实地物分布,图6(b)-(d)代表初始光谱数据集,来自于双边滤波器的空谱联合特征和来自于提出的三边滤波器的空谱联合特征被分别送入到支持向量机分类器的分类图(即分别表示为OS-SVM,BF-SVM,和TF-SVM)。图6(e)-(g)代表初始光谱数据集,来自于双边滤波器的空谱联合特征和来自于三边滤波器的空谱联合特征被分别送入到堆栈稀疏自动编码器和随机森林分类器(即分别表示为OS-SSARF,BF-SSARF,和TF-SSARF)。最后,图6(h)代表来自于三边滤波器的空谱联合特征被送入到改进的堆栈稀疏自动编码器和随机森林分类器(即为TF-ISSARF)。从图6可以看出,相比于对比算法,所提出的TF-ISSARF方法获得最好的分类图(即图6(h))。
[0125] 图7(a)-图7(h)是一幅真实的高光谱图像数据,这组数据同样是由AVIRIS传感器获取得到的,它拍摄于1996年的美国肯尼迪航天中心上空。数据构成特点与印第安农场数据集一致。经数据预处理,保留176个波段进行分类实验。图像大小为614×512像素,空间分辨率18m。在图7(a)中,我们给出了场景的真实地物分布。图7(b)-(h)分别为对比算法和所提出的算法的分类图。与预期结果相一致,所提出的TF-ISSARF方法获得最好的分类图(即图7(h))和它基本接近真实的地物分布。
[0126] 参照图8(a)-图8(b),研究和分析了总体分类准确度随着三边滤波器的空间参数,幅值参数和脉冲参数取值的变异性,在图8(a)中,对于印第安纳农场数据,当δs=7,δr=0.4,和δd=8时提出的TF-ISSARF分类方法获得最优的总体分类准确度。对于肯尼迪航天中心数据,从图8(b)可知当δs=8,δr=0.4,和δd=7时,取得最优的总体分类准确度。
[0127] 参照图9(a)-图9(b),研究和分析了三边滤波器的邻域窗口尺寸对总体分类准确度的影响。为了获得最优的窗口尺寸,对于印第安纳农场数据,固定δs=7,δr=0.4,和δd=8,分析总体分类准确度随着窗口尺寸的变化。从图9(a)可知,当窗口尺寸w=7时,农场数据获得最好的分类结果。对于图9(b),当窗口尺寸w=9时,肯尼迪航天中心数据获得最好的分类结果。
[0128] 上述为本发明特举之实施例,并非用以限定本发明。本发明提供的基于三边滤波器和堆栈稀疏自动编码器的高光谱图像分类方法同样适用于分类其他的非高光谱图像。在不脱离本发明的实质和范围内,可做些许的调整和优化,以本发明的保护范围以权利要求为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈