热词 | sar 卷积 神经网络 图像 网络 神经 relu 训练 分类 识别 | ||
专利类型 | 发明公开 | 法律事件 | 公开; 实质审查; 授权; |
专利有效性 | 有效专利 | 当前状态 | 授权 |
申请号 | CN202310371119.9 | 申请日 | 2023-04-10 |
公开(公告)号 | CN116524322A | 公开(公告)日 | 2023-08-01 |
申请人 | 北京盛安同力科技开发有限公司; | 申请人类型 | 企业 |
发明人 | 张福旺; | 第一发明人 | 张福旺 |
权利人 | 北京盛安同力科技开发有限公司 | 权利人类型 | 企业 |
当前权利人 | 北京盛安同力科技开发有限公司 | 当前权利人类型 | 企业 |
省份 | 当前专利权人所在省份:北京市 | 城市 | 当前专利权人所在城市:北京市海淀区 |
具体地址 | 当前专利权人所在详细地址:北京市海淀区双榆树知春路82号19楼1001-1020室 | 邮编 | 当前专利权人邮编:100089 |
主IPC国际分类 | G06V10/82 | 所有IPC国际分类 | G06V10/82 ; G06V10/774 ; G06N3/0464 ; G06N3/08 |
专利引用数量 | 6 | 专利被引用数量 | 0 |
专利权利要求数量 | 8 | 专利文献类型 | A |
专利代理机构 | 北京国翰知识产权代理事务所 | 专利代理人 | 张振; |
摘要 | 本 发明 关于基于 深度神经网络 的SAR 图像识别 方法,包括:构建 卷积神经网络 架构,包括卷积层、relu层、批量归一化层和最大 池化 层;构建深度神经网络架构,包括 输入层 、多层卷积神经网络架构、全连接层、softmax层和分类层;训练网络,设置相应的网络参数,对分好的图像数据训练集、验证集和测试集进行网络训练;识别,最后使用经过训练完成的网络识别验证数据并计算最终的识别率。方法融合了特征提取与分类识别,用 深度学习 来代替手工选取特征和分类器,减少目标识别中人为的工作量,提高了SAR图像目标识别及分类的性能,验证表明测试准确度达99.88%,非常接近验证准确度,表明构建的网络模型具有极强的鲁棒性。 | ||
权利要求 | 1.基于深度神经网络的SAR图像识别方法,其特征在于包括: |
||
说明书全文 | 基于深度神经网络的SAR图像识别方法技术领域背景技术[0002] 合成孔径雷达(Synthetic Aperture Radar,SAR)是属于微波成像传感器中的一种,不同于被动式传感器,SAR能够主动自发地发射电磁波并且接收返回的信号进行成像和探测。SAR不受外部光源的约束,所以能够全天时对地面数据进行提取,并且由于其电磁波波段拥有较强穿透性,浓雾、大气烟雾以及云层都可以无障碍穿透。SAR工作不受光照、气候的影响,这一优势是其他传感器无法比拟的。SAR拍摄的高分辨率图像能反映目标的散射特性并含有利用其他传感器所获取的图像所不具有的大量信息,因此SAR在军事和民用均有广泛应用。 [0003] 雷达图像是地物目标的后向散射形成的图像信息,基于极化分解矩阵的特征检测算法,可以将复杂的散射机制分解成多种简单的极化散射机制,在此基础上,通过对简化极化散射机制的信息含量进行研究和分析,从而得到雷达目标的极化散射特性,获得所需目标的空间结构特征。 [0004] 雷达图像中的目标物和背景存在不同的深浅程度,而不同的目标之间又存在的不同的形状特征,这些都包含了SAR图像丰富的纹理特征,所以基于Gabor、LBP、SIFT等纹理特征的检测算法由之产生。 [0005] 通过对图像中的地物目标之间的空间关系进行解析,从基本物理特征中获取空间语义特征的检测算法,可以对目标进行提取和分类。 [0006] 另外近些年广泛发展的机器学习检测算法例如支持向量机、随机森林、随机树等方法与传统的算法有很大的区别,无需像传统方法那样进行人工设计特征,而是从数据中挖掘更深层次信息,统计和学习其中的知识,并形成了一套完整的训练体系。 [0007] 近年来,深度学习快速发展,卷积神经网络(Convolutional Neural Network,CNN)在图像分类识别领域展现出优异的性能。CNN是一种直接将原始图像作为输入的端到端的处理架构,不需要人为参与特征提取,降低了对图像数据预处理的要求,提高了效率。此外,局部连接、权值共享和池化操作可以有效降低网络的复杂度,使得CNN模型对平移或失真具有不变性。 [0008] 具体到对SAR图像的识别算法,基于极化分解矩阵的特征检测算法利用极化SAR数据的不同特征进行特征提取和检测。雷达目标的极化效应可以用一个复二维散射矩阵来表示,但其适用对象是确定性目标,对于起伏目标,电磁散射特性不再是固定的,而是具有一定的随机性,有些目标仅由较少的散射点组成没有清晰的轮廓,缺少外部结构特征,此外SAR图像存在斑点噪声,干扰了目标的准确定位。 [0009] 基于纹理特征的检测算法,在对SAR图像进行检测时,一般需要先对图像进行去斑去噪的预处理,然后对图像利用特征算子进行提取,这样无形中会增大算法的计算量;另一方面是对图像处理的实时性较低,因此会导致图像和传统方法不匹配的问题,在图像分辨率低,质量差的情况下,难以得到满意的检测识别效果。 [0010] 基于空间语义特征的检测算法,相比于基于纹理特征的检测算法,使用范围广,并且可以提供处理有意和无意目标遮挡的能力。然而,对于SAR图像的深度多层次描述还存在不足,特别是当这些描述隐含物理语义时。 [0011] 基于机器学习的检测算法,主要包括人工神经网络,支持向量机(SVM),随机森林等。SVM则是在基于小样本统计理论的基础上,利用空间的核函数,再利用在线性可分的情况下的求解方法对高维空间进行求解,达到简化高维空间问题的求解难度目的。随机森林是多重决策树的组合,由于其非常稳定,具有很强的抗干扰能力,如果有很大一部分的特征遗失,用随机森林算法仍然可以维持准确度,并且可以处理高维的数据,不用做特征选择,因此大部分用来解决分类和回归问题。 [0012] 传统的SAR图像目标识别算法主要由预处理、特征提取、识别等独立步骤组成,然而这种方法需要对原始图像进行预处理、且需要大量的SAR知识才能提取到较为有效的分类特征。对于SAR图像,提取的特征缺乏有效性,无法准确表征目标有效特征并且这些特征提取算法都需要专业技术高超的工程师和经验丰富的领域专家来设计,耗时费力;分类器选择缺乏适用性,分类器与特征的关联性较差,不能对选取的特征形成一个反馈,无形中加重了工作量。由于SAR图像目标的多变性以及传统算法难以进行整体优化,导致了SAR图像目标识别率和识别效率的提升受限。 [0013] 前述背景技术知识的记载旨在帮助本领域普通技术人员理解与本发明较为接近的现有技术,同时便于对本申请发明构思及技术方案的理解,应当明确的是,在没有明确的证据表明上述内容在本专利申请的申请日前已公开的情况下,上述背景技术不应当用于评价本申请技术方案的新创性。 发明内容[0014] 为解决上述背景技术中提及的至少一种技术问题,本发明的目的旨在提供基于深度神经网络的SAR图像识别方法,融合了特征提取与分类识别,用深度学习来代替手工选取特征和分类器,减少目标识别中人为的工作量,提高了SAR图像目标识别及分类的性能,验证表明测试准确度达99.88%,非常接近验证准确度,进一步表明构建的网络模型具有极强的鲁棒性。 [0015] 一种基于深度神经网络的SAR图像识别方法,包括: [0016] 构建卷积神经网络架构,通过卷积层、relu层、批量归一化层、最大池化层构建卷积神经网络架构; [0018] 训练网络,设置相应的网络参数,对分好的图像数据训练集、验证集和测试集进行网络训练; [0019] 识别,最后使用经过训练完成的网络识别验证数据并计算最终的识别率。 [0020] 在具体的部分实施方案,所述通过卷积层、relu层、批量归一化层、最大池化层构建卷积神经网络架构包括依次设置卷积层‑relu层‑卷积层‑批量归一化层‑relu层‑最大池化层‑relu层。 [0021] 在具体的部分实施方案,所述采用输入层、多层卷积神经网络架构、全连接层、softmax层、分类层构建深度神经网络架构包括依次设置输入层‑多层卷积神经网络架构‑全连接层‑softmax层‑分类层。 [0022] 在具体的部分实施方案,所述多层卷积神经网络架构的层数不少于两层。 [0023] 在具体的部分实施方案,所述多层卷积神经网络架构‑全连接层之间还设置有卷积层、relu层和dropout层。 [0024] 在具体的部分实施方案,所述对分好的图像数据训练集、验证集和测试集进行网络训练包括:首先对SAR图像数据集加载,然后进行图像数据分析,将图像数据经数据拆分与扩充后分为图像数据训练集、验证集和测试集,最后以图像数据训练集、验证集和测试集对构建完成的深度神经网络进行训练。 [0025] 本发明主要涉及了一种基于深度神经网络的SAR图像识别方法,首先通过卷积层、ReLU层、批量归一化层、最大池化层构建卷积神经网络架构,然后通过输入层、多层卷积神经网络架构以及全连接层、softmax层、分类层构建深度神经网络架构,设置网络参数后进行网络训练,最后使用训练完成的网络识别SAR图像数据并计算识别率,利用海量的训练数据构建一个深度层次的机器学习模型,从而获取数据的分层式特征信息,深度学习的目的是模拟大脑视觉系统处理信息的过程,实现高效准确的信息表示。深度神经网络融合了特征提取与分类识别,可以取代手工选取特征和分类器的工作内容,减少SAR图像识别过程中因人工操作而产生的误差,提高了SAR图像目标识别及分类的性能。 [0026] 本申请的有益效果为: [0027] 本发明采用了深度神经网络的SAR图像识别方法,利用海量的训练数据构建一个深度层次的机器学习模型,从而获取数据的分层式特征信息,深度学习的目的是模拟大脑视觉系统处理信息的过程,实现高效准确的信息表示。深度学习融合了特征提取与分类识别,用深度学习来代替手工选取特征和分类器,主动学习底层特征并组合为高层的非线性特征,从而减少目标识别中人为的工作量,并且对于数据的各种变化因素具有较强的不变性,提高了SAR图像目标识别及分类的性能,进一步实现军事战场的现代化、信息化和高效化。附图说明 [0028] 为让本发明的上述和/或其他目的、特征、优点与实例能更明显易懂,下面将对本发明的具体实施方式中所需要使用的附图进行简单的介绍,显然地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的情况下还可以根据这些附图获得其他的附图。 [0029] 图1是深度神经网络的SAR图像识别网络架构图; [0030] 图2是深度神经网络的SAR图像识别方法实现流程图; [0031] 图3是MSTAR数据集的光学图像和SAR图像; [0032] 图4是训练进度图; [0033] 图5是SAR目标分类混淆矩阵图。 具体实施方式[0034] 本领域技术人员可以借鉴本文内容,适当替换和/或改动工艺参数实现,然而特别需要指出的是,所有类似的替换和/或改动对本领域技术人员来说是显而易见的,它们都被视为包括在本发明。本发明所述产品和制备方法已经通过较佳实例进行了描述,相关人员明显能在不脱离本发明内容、精神和范围内对本文所述的产品和制备方法进行改动或适当变更与组合,来实现和应用本发明技术。 [0035] 除非另有定义,本文所使用的技术和科学术语,具有本发明所属领域的普通技术人员通常所理解的相同的含义。本发明使用本文中所描述的方法和材料;但本领域中已知的其他合适的方法和材料也可以被使用。本文中所描述的材料、方法和实例仅是说明性的,并不是用来作为限制。所有出版物、专利申请案、专利案、临时申请案、数据库条目及本文中提及的其它参考文献等,其整体被并入本文中作为参考。若有冲突,以本说明书包括定义为准。 [0036] 除非具体说明,本文所描述的材料、方法和实例仅是示例性的,而非限制性的。尽管与本文所述的那些方法和材料类似或等同的方法和材料可用于本发明的实施或测试,但本文仍描述了合适的方法和材料。 [0037] 为了便于理解本发明的技术方案和实施例,首先对本发明实施例中可能涉及的缩略语和关键术语进行解释说明或定义。 [0038] input、input层:输入层; [0039] conv:卷积层; [0040] BN:批量归一化层; [0041] mp:最大池化层; [0042] fc:全连接层; [0043] classoutput:分类层。 [0044] 本发明提供一种基于深度神经网络的SAR图像识别方法,包括: [0045] 构建卷积神经网络架构,通过卷积层、relu层、批量归一化层、最大池化层构建卷积神经网络架构; [0046] 构建深度神经网络架构,采用输入层、多层卷积神经网络架构、全连接层、softmax层、分类层构建深度神经网络架构; [0047] 训练网络,设置相应的网络参数,对分好的图像数据训练集、验证集和测试集进行网络训练; [0048] 识别,最后使用经过训练完成的网络识别验证数据并计算最终的识别率。 [0049] 在具体的部分实施方案,所述通过卷积层、relu层、批量归一化层、最大池化层构建卷积神经网络架构包括依次设置卷积层‑relu层‑卷积层‑批量归一化层‑relu层‑最大池化层‑relu层。多层交替卷积、归一化和池化可以学习层次特征表示。 [0050] 在具体的部分实施方案,所述卷积层学习输入层所输入图像的不同的特征。 [0051] 在具体的部分实施方案,relu层在于去除卷积结果中的负值,保留正值不变。relu层主要是一个激活函数,只在输入大于0时才激活一个点,当输入小于0时,则输出为零,当输入不小于0时,则输出等于输入;激活函数可表示为: [0052] [0053] 在具体的部分实施方案,批量归一化层对通过网络传播的激活和梯度进行归一化,使网络训练更容易优化。 [0054] 在具体的部分实施方案,池化层将空间域形状聚合到高维特征空间以减小特征图的空间大小并去除冗余空间信息。 [0055] 在具体的部分实施方案,所述采用输入层、多层卷积神经网络架构、全连接层、softmax层、分类层构建深度神经网络架构包括依次设置输入层‑多层卷积神经网络架构‑全连接层‑softmax层‑分类层。 [0057] 在具体的部分实施方案,所述多层卷积神经网络架构的层数不少于两层,优选2‑10层,更优选5‑10层,最优选7层。卷积神经网络层的目的是提取输入的不同特征,如边缘、线条和角特征等层级,更多层的网络能从低级特征中迭代提取更复杂的特征。 [0058] 在具体的部分实施方案,所述多层卷积神经网络结构的最后一层结构的最大池化层后未设置relu层。 [0059] 在具体的部分实施方案,所述多层卷积神经网络架构‑全连接层之间还设置有卷积层、relu层和dropout层。 [0060] 在具体的部分实施方案,所述全连接层设置有两层。全连接层,是每一个结点都与上一层的所有结点相连,用来把前面各层提取到的特征综合起来,结合了前面各层在图像中学习到的所有特征以识别更大的模。 [0061] 在具体的部分实施方案,所述两层全连接层中设置有relu层。 [0062] 在具体的部分实施方案,所述深度神经网络架构具体为:输入层‑(卷积层‑relu层‑卷积层‑批量归一化层‑relu层‑最大池化层‑relu层)n‑(卷积层‑relu层‑卷积层‑批量归一化层‑relu层‑最大池化层)‑卷积层‑relu层‑dropout层‑全连接层‑relu层‑全连接层‑softmax层‑分类层,n∈{1,2,3,4,5,6,7,8,9}。 [0063] 在具体的部分实施方案,所述softmax层的softmax激活函数对全连接层的输出进行归一化用作分类层的分类概率。 [0064] 在具体的部分实施方案,所述分类层使用softmax激活函数为每个输入返回的概率将输入分配给互斥类并计算损失。 [0065] 在具体的部分实施方案,所述对分好的图像数据训练集、验证集和测试集进行网络训练包括:首先对SAR图像数据集加载,然后进行图像数据分析,将图像数据经数据拆分与扩充后分为图像数据训练集、验证集和测试集,最后以图像数据训练集、验证集和测试集对构建完成的深度神经网络进行训练。 [0066] 一种计算机可读存储介质,所述计算机可读存储介质内存储有可被处理器执行的计算机程序,所述计算机程序被处理器执行时运行前述所述基于深度神经网络的SAR图像识别方法中的至少一个步骤。 [0067] 一种计算机设备,所述计算机设备包括存储器、处理器、通信接口以及通信总线;其中,所述存储器、处理器、通信接口通过所述通信总线进行相互间的通信;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的计算机程序,所述处理器执行所述计算机程序时实现前述所述基于深度神经网络的SAR图像识别方法中的至少一个步骤。 [0068] 以下详细描述本发明。 [0069] 实施例1: [0070] 提供一种基于深度神经网络的SAR图像识别方法,包括: [0071] 构建卷积神经网络结构,如图1所示,依次设置卷积层‑relu层‑卷积层‑批量归一化层‑relu层‑最大池化层‑relu层构建一层卷积神经网络结构; [0072] 构建深度神经网络架构,如图1所示,依次设置输入层input‑多层卷积神经网络结构‑卷积层‑relu层‑dropout层‑全连接层‑relu层‑全连接层‑softmax层‑分类层,其中多层卷积神经网络结构的最后一层结构的最大池化层后未设置relu层; [0073] 训练网络,设置相应的网络参数,训练网络,如图2所示,具体包括:首先对SAR图像数据集加载,然后进行图像数据分析,将图像数据经数据拆分与扩充后分为图像数据训练集、验证集和测试集,最后以图像数据训练集、验证集和测试集对构建完成的深度神经网络进行训练; [0074] 识别,最后使用经过训练完成的网络识别验证数据并计算最终的识别率。 [0075] 提供的卷积神经网络架构采用卷积层‑relu层‑卷积层‑批量归一化层‑relu层激活函数层‑最大池化层mp结构。其中,卷积层学习不同的特征,批量归一化层对通过网络传播的激活和梯度进行归一化,使网络训练更容易优化,池化层将空间域形状聚合到高维特征空间以减小特征图的空间大小并去除冗余空间信息,多层交替卷积、归一化和池化可以学习层次特征表示。 [0076] 而深度神经网络架构采用输入层‑多层卷积神经网络架构‑全连接层‑softmax层‑分类层结构,在全连接层前加dropout层,防止模型过拟合。其中,输入层主要用于指定输入图像大小,卷积网络层的目的是提取输入的不同特征,如边缘、线条和角特征等层级,更多层的网络能从低级特征中迭代提取更复杂的特征。这些特征能从多个角度来描述图像,同时在不同的操作中形成更加全局化和抽象化的特征表征。全连接层结合了前面各层在图像中学习到的所有特征以识别更大的模。softmax层的softmax激活函数对全连接层的输出进行归一化用作分类层的分类概率。分类层使用softmax激活函数为每个输入返回的概率将输入分配给互斥类并计算损失。 [0077] 实施例2: [0078] 在前述实施例的基础上,使用深度神经网络架构的SAR图像识别方法对MSTAR数据集进行图像识别。MSTAR目标数据集,包含来自7个地面车辆和一个校准目标的8688个SAR图像。数据是在聚光灯模式下使用X波段传感器收集的,分辨率为1英尺。使用的目标类型是步兵战车(BMP2)、装甲车(BTR70)和坦克(T72)。图像是在15度和17度两个不同的俯角下拍摄的,有190到300个不同的纵横比版本,它们是超过360度的全纵横比覆盖。这三种目标及其复制目标的光学图像和SAR图像如图3所示。 [0079] 训练进度如图4所示,训练进度图显示了小批量损失和准确度以及验证损失和准确度。损失是交叉熵损失。准确率是网络正确分类的图像的百分比。图中的实线表示模型在训练数据上的准确度,而虚线表示模型在验证数据上的准确度(与训练分开)。验证准确率达到99.89%。而且,验证准确度和训练准确度是相似的,这表明构建的网络分类器是健壮的。 [0080] 使用经过训练的网络预测验证数据的标签并计算最终准确度。准确度是网络正确预测的标签的比例。测试准确度为99.88%,非常接近验证准确度,进一步表明构建的网络模型具有极强的鲁棒性。 [0081] 本实施例中,使用混淆矩阵来更详细地研究模型的分类行为,SAR目标分类混淆矩阵图如图5所示,强中心对角线代表准确的预测。理想情况下,希望在对角线上看到小的、随机定位的值。对角线外的较大值可能表明模型存在困难的特定场景。从图5可以看出,在8个类别中,构建的模型几乎能够实现类的100%以上的准确率。 [0082] 实施例3: [0083] 在前述实施例的基础上,提供一种计算机可读存储介质,所述计算机可读存储介质内存储有可被处理器执行的计算机程序,所述计算机程序被处理器执行时运行前述实施例所述基于深度神经网络的SAR图像识别方法中的至少一个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。 [0084] 实施例4: [0085] 在前述实施例的基础上,还提供了一种计算机设备,所述计算机设备包括存储器、处理器、通信接口以及通信总线;其中,所述存储器、处理器、通信接口通过所述通信总线进行相互间的通信;所述存储器,用于存放计算机程序;所述处理器,用于执行所述存储器上所存放的计算机程序,所述处理器执行所述计算机程序时实现前述实施例所述基于深度神经网络的SAR图像识别方法中的至少一个步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。 [0086] 计算机可读介质包括永久性和非永久性、可移动和非可移动媒体,可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PR AM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD‑ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。 [0087] 上述实施例中的常规技术为本领域技术人员所知晓的现有技术,故在此不再详细赘述。 [0088] 本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。 [0089] 尽管对本发明已作出了详细的说明并引证了一些具体实施例,但是对本领域熟练技术人员来说,只要不离开本发明的精神和范围可作各种变化或修正是显然的。 [0090] 虽然上述具体实施方式已经显示、描述并指出应用于各种实施方案的新颖特征,但应理解,在不脱离本公开内容的精神的前提下,可对所说明的装置或方法的形式和细节进行各种省略、替换和改变。另外,上述各种特征和方法可彼此独立地使用,或可以各种方式组合。所有可能的组合和子组合均旨在落在本公开内容的范围内。上述许多实施方案包括类似的组分,并且因此,这些类似的组分在不同的实施方案中可互换。虽然已经在某些实施方案和实施例的上下文中公开了本发明,但本领域技术人员应理解,本发明可超出具体公开的实施方案延伸至其它的替代实施方案和/或应用以及其明显的修改和等同物。因此,本发明不旨在受本文优选实施方案的具体公开内容限制。 [0091] 本发明未尽事宜均为公知技术。 |