专利汇可以提供基于Attention机制的训练图片压缩网络的构建方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于Attention机制的训练图片压缩网络的构建方法及系统,属于图像压缩、Attention机制及 卷积神经网络 领域,本发明要解决的技术问题为如何基于Attention机制去为图片中的每个 像素 点赋予不同的权值,从而使得深度网络在解压时,生成一个视觉效果上比较好的图片,采用的技术方案为:该方法具体如下:将训练图片进行压缩和解压获取重构图片,同时获取 熵编码 R;利用改进的Vgg网络生产关于一个图片的Attention map;在训练压缩和解压网络过程中获取损失函数,公式如下:Loss=R+λD;其中,D是通过训练图片和重构图片之间对应点的MSE获得;λ表示Attention Map矩阵;R表示熵编码参数。该系统包括重构图片获取模 块 、Attention map生成模块及损失函数获取模块。,下面是基于Attention机制的训练图片压缩网络的构建方法及系统专利的具体信息内容。
1.一种基于Attention机制的训练图片压缩网络的构建方法,其特征在于,该方法具体如下:
将训练图片进行压缩和解压获取重构图片,同时获取熵编码R;
利用改进的Vgg网络生产关于一个图片的Attention map;
在训练压缩和解压网络过程中获取损失函数,公式如下:
Loss=R+λD;
其中,D是通过训练图片和重构图片之间对应点的MSE获得;λ表示Attention Map矩阵;
R表示熵编码参数。
2.根据权利要求1所述的基于Attention机制的训练图片压缩网络的构建方法,其特征在于,所述获取重构图片,同时获取熵编码R具体如下:
通过编码器对训练图片进行编码,得到编码后的特征图;
通过量化器对特征图进行量化,得到量化后的特征图;
同时通过熵编码器对量化后特征图进行熵编码,得到熵编码参数;
通过解码器对量化后的特征图进行解码,得到重构图片。
3.根据权利要求2所述的基于Attention机制的训练图片压缩网络的构建方法,其特征在于,所述编码器使用一个3层的神经网络,每一层包括一个卷积、一个下采样和一个Relu激活函数;
所述解码器使用一个3层的神经网络,每一层包括一个反卷积、一个上采样和一个Relu激活函数。
4.根据权利要求1所述的基于Attention机制的训练图片压缩网络的构建方法,其特征在于,所述Vgg网络的改进具体如下:去掉Vgg中的全连接网络,在最后一个卷积层后面加上一个depthwise_conv2d和一个globalpooling层;再接一个全连接层。
5.根据权利要求4所述的基于Attention机制的训练图片压缩网络的构建方法,其特征在于,所述Vgg网络使用mageNet数据集进行训练。
6.根据权利要求1所述的基于Attention机制的训练图片压缩网络的构建方法,其特征在于,所述Attention Map矩阵获取过程如下:
对于训练好的Vgg网络,通过输入一张大小为224*224*3的图片,获得该图片的一个Conv_last,大小为14*14*1024;
global pooling层和Fc输出层之间加入W,W表示1024*1000的矩阵,通过转置运算符,获得一个W_transpose为1000*1024;
从W_transpose选择预测类别最大的那一行的1024个元素,转置成为一个1024*1的矩阵;
把Conv_last矩阵进行双线性差值,成为一个224*224*1024的矩阵;
将224*224*1024的矩阵通过reshape操作变成一个50176*1024的矩阵;
把50176*1024的矩阵与1024*1的矩阵相乘,得到一个50176*1的矩阵;
将50176*1的矩阵进行转置变成224*224*1的Attention map矩阵。
7.一种基于Attention机制的训练图片压缩网络的构建系统,其特征在于,该系统包括,
重构图片获取模块,用于将训练图片进行压缩和解压获取重构图片,同时获取熵编码R;
Attention map生成模块,用于利用改进的Vgg网络生产关于一个图片的Attention map;
损失函数获取模块,用于在训练压缩和解压网络过程中获取损失函数,公式如下:
Loss=R+λD;
其中,D是通过训练图片和重构图片之间对应点的MSE获得;λ表示Attention Map矩阵;
R表示熵编码参数。
8.根据权利要求7所述的基于Attention机制的训练图片压缩网络的构建系统,其特征在于,所述重构图片获取模块包括,
编码器,用于对训练图片进行编码,得到编码后的特征图;编码器使用一个3层的神经网络,每一层包括一个卷积、一个下采样和一个Relu激活函数;
量化器,用于对特征图进行量化,得到量化后的特征图;
熵编码器,用于对量化后特征图进行熵编码,得到熵编码参数;
解码器,用于对量化后的特征图进行解码,得到重构图片;解码器使用一个3层的神经网络,每一层包括一个反卷积、一个上采样和一个Relu激活函数。
9.根据权利要求7所述的基于Attention机制的训练图片压缩网络的构建系统,其特征在于,所述Vgg网络的改进具体如下:去掉Vgg中的全连接网络,在最后一个卷积层后面加上一个depthwise_conv2d和一个globalpooling层;再接一个全连接层;其中,Vgg网络使用mageNet数据集进行训练。
10.根据权利要求7所述的基于Attention机制的训练图片压缩网络的构建系统,其特征在于,所述Attention Map矩阵获取过程如下:
对于训练好的Vgg网络,通过输入一张大小为224*224*3的图片,获得该图片的一个Conv_last,大小为14*14*1024;
global pooling层和Fc输出层之间加入W,W表示1024*1000的矩阵,通过转置运算符,获得一个W_transpose为1000*1024;
从W_transpose选择预测类别最大的那一行的1024个元素,转置成为一个1024*1的矩阵;
把Conv_last矩阵进行双线性差值,成为一个224*224*1024的矩阵;
将224*224*1024的矩阵通过reshape操作变成一个50176*1024的矩阵;
把50176*1024的矩阵与1024*1的矩阵相乘,得到一个50176*1的矩阵;
将50176*1的矩阵进行转置变成224*224*1的Attention map矩阵。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
抑制P/B帧中帧内块呼吸效应的视频编码方法及装置 | 2020-05-11 | 352 |
视频编译中的深度图片编译方法 | 2020-05-12 | 502 |
图像编码装置 | 2020-05-08 | 195 |
一种基于填充Y通道的Bayer图像压缩方法 | 2020-05-11 | 648 |
压缩/解压缩的装置和系统、芯片、电子装置、方法 | 2020-05-12 | 884 |
量化变换系数管理装置及适用于HEVC标准的编码器 | 2020-05-08 | 653 |
图像编码器、图像解码器、图像编码方法和图像解码方法 | 2020-05-08 | 37 |
基于深度神经网络的图像降维和重建方法 | 2020-05-11 | 659 |
图像编码/解码方法和装置以及存储比特流的记录介质 | 2020-05-11 | 674 |
视频解码方法及视频解码器,视频编码方法及视频编码器 | 2020-05-12 | 897 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。