专利汇可以提供一种深度学习网络实现大类别图像识别的方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 深度学习 网络实现大类别 图像识别 的方法,包括训练和识别过程,训练过程中,首先提取样本图片的Gabor特征并进行最大选取,此后使用经过聚类处理的特征码本进行线性局部编码,最后使用空间金字塔方法进行特征矢量的导出,并使用 支持向量机 分类器进行训练;识别过程中,将测试图片的特征矢量使用训练好的支持向量机分类器进行识别。本发明克服传统方法提取局部特征时语义信息的缺乏,能显著提升多类别图像识别的识别率。,下面是一种深度学习网络实现大类别图像识别的方法专利的具体信息内容。
1.一种深度学习网络实现大类别图像识别的方法,其特征在于,采用深度学习网络进行大类别图像识别,所述深度学习网络包括第一简单层S1层,第一复杂层C1层,第二简单层S2层和第二复杂层C2层;
识别过程包括以下步骤:
(1)训练过程:
(11)对样本图片进行预处理,所述样本图片包括多种类别;
(12)对样本图片进行Gabor特征提取,得到Gabor特征矩阵,即S1层中的特征矩阵;
(13)对步骤(12)得到的S1层中的特征矩阵进行局部最大选取,得到局部最大化的Gabor特征矩阵,即C1层中的特征矩阵;
(14)使用特征码本对步骤(13)得到的C1层中的特征矩阵进行局部线性编码,得到S2层中的特征矩阵;
(15)使用空间金字塔方法对步骤(14)得到的S2层中的特征矩阵进行最大选取,得到视觉图像特征和局部线性编码相结合的特征矢量,即C2层的特征矢量:
(16)将步骤(15)得到的C2层的特征矢量送入支持向量机分类器进行训练;
(2)识别过程:
(21)对测试图片进行预处理;
(22)对测试图片进行Gabor特征提取,得到Gabor特征矩阵,即S1层中的特征矩阵;
(23)对步骤(22)得到的S1层中的特征矩阵进行局部最大选取,得到局部最大化的Gabor特征矩阵,即C1层中的特征矩阵;
(24)使用特征码本对步骤(23)得到的C1层中的特征矩阵进行局部线性编码,得到S2层中的特征矩阵;
(25)使用空间金字塔方法对步骤(24)得到的S2层中的特征矩阵进行最大选取,得到视觉图像特征和局部线性编码相结合的特征矢量,即C2层的特征矢量:
(26)将步骤(25)得到的C2层的特征矢量送入步骤(16)训练好的支持向量机分类器进行识别。
2.根据权利要求1所述的深度学习网络实现大类别图像识别的方法,其特征在于,步骤(14)所述使用特征码本对步骤(13)得到的C1层中的特征矩阵进行局部线性编码,具体为:
在C1层中,对于样本图片中任意点,当以该点为基点时,在该基点周围提取特征码本中的特征模板大小内的各点,并转为一维特征矢量,使用特征码本对一维特征矢量进行局部线性编码;对样本图像所有基点进行局部线性编码后,得到C1层中的特征矩阵经过局部线性编码的编码结果,此编码结果为S2层中的特征矩阵;
其中,所述局部线性编码具体实现如下:假设当前一维特征矢量是xi,其特征码本是B,设定经过局部线性编码后的输出为ci,一维特征矢量xi、特征码本B和输出ci必须满足下面最优化公式,其数学表达式如下所示:
T
s.t.1ci=1
其 中 dist(xi,B)=[dist(xi,b1),...,dist(xi,bi)]T 为 一
维特征矢量与特征码本的距离向量, 为元素间相乘;该局部线性编码有解析解为所述特征码本的提取过程如下:
在每张样本图片的C1层中,随机选取20个4x4的块,15个8x8的块,10个12x12的块及5个16x16的块,按空间顺序转为一维量后用k-means方法按大小分别对所有块进行聚类,将聚类后的中心作为特征码本。
3.根据权利要求2所述的深度学习网络实现大类别图像识别的方法,其特征在于,步骤(24)使用特征码本对步骤(23)得到的C1层中的特征矩阵进行局部线性编码,具体为:
使用步骤(14)得到的特征码本对步骤(23)得到的C1层中的特征矩阵进行局部线性编码。
4.根据权利要求1所述的深度学习网络实现大类别图像识别的方法,其特征在于,步骤(15)使用空间金字塔方法对步骤(14)得到的S2层中的特征矩阵进行最大选取,得到视觉图像特征和局部线性编码相结合的特征矢量,具体为:
先对样本图片的S2层中的特征矩阵进行一次全局最大选取;再将样本图片划分成2x2的小区域,对各小区域的S2层中的特征矩阵分别进行最大选取,将全局最大选取和各小区域的最大选取结果统一转换成一维特征矢量,得到视觉图像特征和局部线性编码相结合的特征矢量。
5.根据权利要求1所述的深度学习网络实现大类别图像识别的方法,其特征在于,步骤(25)使用空间金字塔方法对步骤(24)得到的S2层中的特征矩阵进行最大选取,得到视觉图像特征和局部线性编码相结合的特征矢量,具体为:
先对测试图片的S2层中的特征矩阵进行一次全局最大选取;再将测试图片划分成2x2的小区域,对各小区域的S2层中的特征矩阵分别进行最大选取,将全局最大选取和各小区域的最大选取结果统一转换成一维特征矢量,得到视觉图像特征和局部线性编码相结合的特征矢量。
6.根据权利要求1所述的深度学习网络实现大类别图像识别的方法,其特征在于,步骤(11)所述对样本图片进行预处理,具体为:
将样本图片进行灰度化处理,并调整为140x140的尺度,再以2^1/4的比例进行N-1次缩小,得到N个图像层,N>2。
7.根据权利要求1所述的深度学习网络实现大类别图像识别的方法,其特征在于,步骤(21)所述对测试图片进行预处理,具体为:
将测试图片进行灰度化处理,并调整为140x140的尺度,再以2^1/4的比例进行N-1次缩小,得到N个图像层,N>2。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于视觉测量的消防机器人上水带接头对接方法及系统 | 2020-06-12 | 0 |
一种基于深度学习的全自动电路板缺陷检测系统及方法 | 2020-07-18 | 2 |
非接触式与接触式协同的实时情绪智能监测系统 | 2020-08-14 | 1 |
模型训练方法、装置、计算机设备和存储介质 | 2020-07-11 | 0 |
一种人体体内声音收集处理方法及系统 | 2021-02-01 | 0 |
一种光伏电站集群的高精度动态建模方法 | 2021-11-10 | 2 |
一种基于深度学习的航道内运动船舶目标检测方法 | 2022-01-15 | 0 |
大数据风控管理系统 | 2020-05-13 | 1 |
基于深度学习的尿沉渣显微图像有形成分识别方法 | 2021-05-19 | 2 |
一种设备风险控制方法、装置、设备及介质 | 2020-07-05 | 0 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。