专利汇可以提供一种基于深度学习的自然图像中显著区域的检测方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种利用 深度学习 进行自然图像中显著区域的检测方法,在训练阶段,首先在自然图像 数据库 上选取一定数量的图片提取基本特征,构成训练样本,然后利用深度学习模型对已提取特征进行再学习,从而得到更抽象更有区分能 力 的增强型高级特征,最后用学习到的特征训练分类器。在测试阶段,对于任意一幅测试图像,首先提取基本特征,然后利用训练好的深度模型,提取增强型高级特征,最后利用分类器进行显著性与否的预测,并把每个 像素 点的预测值作为这点的显著值。这样我们就得到整幅图像的显著图,显著值越大,就越显著。,下面是一种基于深度学习的自然图像中显著区域的检测方法专利的具体信息内容。
1.一种基于深度学习的数据图像中显著区域的检测方法,其特征在于步骤如下:
步骤1、提取任意一幅待检测图像数据的视觉特征:
对任意一幅待检测图像数据进行下采样,然后进行N维特征的提取:
1.对下采样后的图像数据提取图像RGB通道的每个通道的特征值;
2.将下采样后的图像数据从RGB颜色空间转换到LAB颜色空间,并提取LAB颜色空间三个通道中每个通道的特征值;
分别计算L通道在灰度级参数bin1=8的直方图HL,A通道在灰度级参数bin2=16时的直方图HA,B通道在灰度级参数bin3=16时的灰度分布直方图HB,利用下述公式计算HL,HA,和HB三个直方图融合后的LAB颜色直方图Q:
Q=(HL-1)*bin2*bin3+(HA-1)*bin3+HB+1
3.将下采样后的图像数据从RGB颜色空间转换到HSV颜色空间,分别计算H通道在灰度级参数bin=8和S通道在灰度级参数bin=8下的直方图;
4.采用ITTI算法提取图像数据的方向,亮度,颜色对比度三类特征;
5.计算下采样后图像数据在4个方向3个尺度下的可控金字塔子频带特征;
6.采用SR,MZ,GBVS算法计算下采样后图像数据的显著图,并以显著图为显著特征;
7.对下采样后图像数据提取紧密度特征;
8.将下采样后图像数据用窗口为[w,w],偏差为x的高斯低通滤波器平滑,然后采用的Leung-Malik滤波器算法,计算平滑后图像的Leung-Malik滤波器最大响应特征;所述整数w为5~10;所述x为0.25~2.5;
9.计算下采样后图像数据中各个像素点到图像中心像素点的欧氏距离,然后归一化到[0,1]之间得到中心偏置特征;
10.采样水平线检测算法计算下采样后图像数据的水平线特征;
11.采样人脸检测算法提取下采样后图像数据的人脸特征;
12.采样目标银行特征提取算法提取下采样后图像数据的在行人,汽车,花朵,交通标志四种滤波模板下的特征;
将以上提取的特征构成特征矩阵[P,P,N],并将特征矩阵中每一维特征对应的二维矩阵[P,P]转化为长度为P*P的列向量,由此得到新的二维特征矩阵的维数为[P*P,N];其中:P为下采样后图像的长或者宽;
步骤2:利用深度学习中的深度玻尔兹曼机模型,以步骤1得到的二维特征矩阵为输入样本,并提取深度玻尔兹曼机学习的高层特征,并送入softmax分类器进行分类,以分类器对每一个像素点预测为正样本的概率值作为此像素点的显著值,由此得到长度为P*P的显著值列向量,缩放回采样后测试图像的大小,此采样后测试图像的显著图大小为[P,P];最后对得到的显著图像进行归一化操作,并缩放到采样前测试图像的尺度,得到此测试图像的最终显著图;
所述深度玻尔兹曼机和softmax分类器训练:随机选取Z幅图像样本,参照步骤1的特征提取过程,对每幅下采样后的样本图像进行特征提取,得到每幅样本图像的特征矩阵维数为[Py,Py,Ny];按照采样后每幅样本图片的Ground Truth中像素点的显著值大小进行由大到小的排序,在排序结果的前q%中随机选择数量在10~40之间的正样本点,在排序结果的后k%随机选取数量在10~40之间的负样本点;其中q取值为5~20,k取值为30~
70;对于每一个随机选取的样本点来说,它对应N维的特征向量,每个样本的长度为N,得到矩阵维度为[R,N]的样本矩阵,R为样本的数量;并对样本矩阵采用ZCA白化对样本矩阵进行去冗余处理,然后用处理后的样本训练具有多个隐层的深度玻尔兹曼机以进行高层特征学习,并将带有标签信息的高层特征送入softmax分类器进行训练,并利用反向传播算法反向调整深度玻尔兹曼机和softmax分类器的学习参数,以此来实现模型较高的预测和分类能力。
2.根据权利要求1所述基于深度学习的数据图像中显著区域的检测方法,其特征在于:所述ITTI算法采用A Model of Saliency-Based Visual Attention for Rapid Scene Analysis提出的ITTI算法。
3.根据权利要求1所述基于深度学习的数据图像中显著区域的检测方法,其特征在于:所述在4个方向3个尺度下的可控金字塔子频带特征的计算采用Filter Design Technique for Steerable Pyramid Image Transforms中给出的算法。
4.根据权利要求1所述基于深度学习的数据图像中显著区域的检测方法,其特征在于:所述SR,MZ,GBVS算法采用Saliency Detection:A Spectral Residual Approach,Contrast-based image attention analysis by using fuzzy growing,和Graph-based visual saliency中提出的SR,MZ,GBVS算法。
5.根据权利要求1所述基于深度学习的数据图像中显著区域的检测方法,其特征在于:所述紧密度特征的采用Multi-scale Saliency Detection Using Random Walk with Restart中提出的紧密度特征的计算方法。
6.根据权利要求1所述基于深度学习的数据图像中显著区域的检测方法,其特征在于:所述Leung-Malik滤波器算法采用Salient Object Detection:A Discriminative Regional Feature Integration Approach中的Leung-Malik滤波器算法。
7.根据权利要求1所述基于深度学习的数据图像中显著区域的检测方法,其特征在于:所述水平线检测算法采用Modeling the shape of the scene:A holistic representation of the spatial envelope中水平线检测算法。
8.根据权利要求1所述基于深度学习的数据图像中显著区域的检测方法,其特征在于:所述人脸检测算法采用Robust real-time object detection中的人脸检测算法。
9.根据权利要求1所述基于深度学习的数据图像中显著区域的检测方法,其特征在于:所述目标银行特征提取算采用Object Bank:A High-Level Image Representation for Scene Classification and Semantic Feature Sparsification中提出的目标银行特征提取算法。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
用于识别对象的方法和设备 | 2020-05-08 | 102 |
用于图像识别的深度学习模型、该模型的训练装置及方法 | 2020-05-08 | 260 |
一种基于深度学习的领域自适应中文分词方法 | 2020-05-11 | 981 |
基于滑动输入来确定输入字符的系统和方法 | 2020-05-08 | 900 |
一种HLA I型分子与多肽的亲和力预测方法 | 2020-05-08 | 576 |
一种基于深度学习的疲劳检测方法 | 2020-05-08 | 587 |
使用深度学习算法来评价输入数据 | 2020-05-08 | 728 |
一种基于深度学习的商品二维码生成方法及系统 | 2020-05-08 | 40 |
一种基于人物身份的人物实体链接方法 | 2020-05-11 | 959 |
一种并行消息处理方法、系统及相关装置 | 2020-05-08 | 378 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。