首页 / 专利库 / 门,大门和窗户 / 框架 / 基于卷积神经网络的图像压缩优化方法

基于卷积神经网络的图像压缩优化方法

阅读:976发布:2024-01-12

专利汇可以提供基于卷积神经网络的图像压缩优化方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及卷积网络、 图像处理 ,为解决 卷积神经网络 模型存储资源开销大、参数计算量大、推断时间长等问题,本发明,基于卷积神经网络的图像压缩优化方法,构建包括 编码器 E、 解码器 d和对抗网络GAN的网络模型,编码器E为卷积神经网络,解码器d为进行上 采样 处理的卷积神经网络和进行恢复原始图像维度的反卷积神经网络,由一个discriminator卷积神经网络和一个反卷积神经网络generator构成生成式对抗网络GAN,q为算数运算器,将原始图像x经编码器E编码为特征图w,然后经量化器q量化为 再经解码器d,最后经GAN生成图像 本发明主要应用于图像处理场合。,下面是基于卷积神经网络的图像压缩优化方法专利的具体信息内容。

1.一种基于卷积神经网络的图像压缩优化方法,其特征是,构建包括编码器E、解码器d和对抗网络GAN的网络模型,编码器E为卷积神经网络,解码器d为进行上采样处理的卷积神经网络和进行恢复原始图像维度的反卷积神经网络,由一个discriminator卷积神经网络和一个反卷积神经网络generator构成生成式对抗网络GAN,q为算数运算器,将原始图像x经编码器E编码为特征图w,然后经量化器q量化为 再经解码器d,最后经GAN生成图像 其中,需首先进行所述网络模型的训练;然后对所述网络模型进行剪枝优化;最后对网络模型进行再训练,利用训练好的网络模型实现图像压缩。
2.如权利要求1所述的基于卷积神经网络的图像压缩优化方法,其特征是,剪枝优化具体步骤是:读取训练好的网络模型数据,取一层卷积神经网络的卷积核K,在谷歌开源深度学习框架TensorFlow中卷积核K为四维张量:卷积核高filter_height,卷积核宽filter_width,输入通道数in_channels,输出通道数out_channels,但计算形式为二维矩阵,与二维矩阵相乘,行为filter_height*filter_width*in_channels,列为out_channels,即卷积核k的个数;计算每个卷积核k的L2范式,依据L2范式的大小决定卷积核k对结果的影响程度,若L2范式越小,则卷积核k对结果影响越小;若L2范式越大,则卷积核k对结果影响越大;
根据需求,删减对结果影响最小的那些卷积核k,即减少二维矩阵K的列数,在选取对结果影响最小的卷积核k时,记录k的列号,删减的过程即是分片再合成的过程;
网络层间的参数传递都是一一对应的,前一层的输出结果,是后一层的输入结果,即修剪了前一层的卷积核个数后,导致输出结果减少,与后一层的输入不匹配,从而对后一层的输入,即后一层K的in_channels,进行相应的修剪;
运用上述相同的方法,对网络层中的偏置bias参数也做相应的修剪;
进而一次完整的剪枝优化操作基本完成,之后再进行网络模型训练,以控制精度偏差;
重复上述操作,至网络模型全部剪枝优化结束。

说明书全文

基于卷积神经网络的图像压缩优化方法

技术领域

[0001] 本发明涉及到卷积神经网络领域、图形图像领域及移动终端领域。具体涉及基于卷积神经网络的压缩优化方法。

背景技术

[0002] 图像是对客观事物的一种相似性的、生动的描述,是对客观对象的一种比较直观的表示方式。它包含了被描述对象的有关信息,是人们最主要的信息来源。据统计,一个人获得的信息大约有75%来自视觉。进入信息化时代人们将越来越依靠计算机获取和利用信息,而数字化后的多媒体信息具有数据海量性,与当前硬件技术所能提供的计算机存储资源和网络带宽之间有很大的差距。这样,就对信息的存储和传输造成了很大困难,成为阻碍人们有效获取和利用信息的一个瓶颈问题。图像信息作为计算机上最重要的资源,对其进行有效的压缩处理无疑将给人们带来巨大的好处。
[0003] 近年来,深度学习,如卷积神经网络(CNNs),在图像处理计算机视觉方面取得了很大的成功,特别是在诸如识别和理解等高级视觉应用中。这些网络在感知度量上往往优于最先进的工程编解码器,如BPG、WebP和JPEG 2000。除了在自然图像上实现更高的压缩比外,它们还可以很容易地适应于特定的目标域,如立体图像或医学图像,并承诺直接从压缩表示中处理和索引。这使得图像压缩技术取得了很大的进步。
[0004] 深度神经网络已经发展成为计算机视觉任务的最先进技术。虽然这些神经网络功能强大,但大量的权值消耗了相当大的存储和内存带宽。神经网络模型在移动设备上的存储与计算仍然是一个巨大的挑战。
[0005] 目前工业级和学术界设计轻量化神经网络模型主要有4个方向:(1)人工设计轻量化神经网络模型、(2)基于神经网络架构搜索(Neural Architecture Search,NAS)的自动化设计神经网络;(3)CNN模型压缩;(4)基于AutoML的自动模型压缩。
[0006] 传统的深度网络模型主要由卷积层、非线性激活层、下采样层以及全连接层等模堆叠起来组成。卷积层具有局部连接、权重共享的特点,虽然需要训练的参数不多,但一次前向的耗时较大;相比之下,全连接层虽然参数可达到网络全部参数的80%以上,但占用前向推断的时间不多。经典的深度网络模型可以参考最初用于图像识别的AlexNet或者VGG等网络模型。这些模块大致可分为两类:一类是包括卷积层、全连接层等在内的含有训练参数的模块,其中,参数的数量往往是人为设定的;另一类是包括非线性激活层以及下采样层等在内的不含有任何训练参数的。模型参数在一定程度上代表了模型的复杂度,也在一定程度上决定着模型所占据的空间大小。人为设定的参数数量往往是在实验室经过重复实验调出来的,这种局部最优的超参数并不代表网络的“真正需求”。它们既存在一定程度上的冗余,也没有权衡成本和效果之间的关系。因此,网络压缩的一个方向是通过压缩模型的参数数量来降低模型的复杂度。
[0007] 模型的运算时间成本并不仅仅依赖模型的参数数量,也依赖于模型的深度。以残差网络为例,尽管在何凯明经典论文中,1000多层的残差网络参数数量不到AlexNet的1/10,但其训练以及测试耗时都明显大于AlexNet。更深的网络还会在训练阶段产生更多的中间变量,而这些中间变量是反向传播算法必不可少的。换句话说,更深的网络模型也有着更大的内存空间的需求。从这个度看,深度网络模型的压缩不仅仅是减少模型的参数,更重要的是能够降低模型运算时间,将模型的深度控制在合理的范围之内,从而满足实际应用的需要。
[0008] 模型压缩的主要目标是在满足精度损失要求的情况下,提高模型压缩比例和提升模型预测速度。模型压缩是嵌入式深度学习工程化实现的基础,其可在算法层面对模型体积和计算量进行优化,在此基础上可开展嵌入式架构设计、模型与数据的调度优化等工作。

发明内容

[0009] 为克服现有技术的不足,本发明旨在解决卷积神经网络模型存储资源开销大、参数计算量大、推断时间长等问题,提供一种卷积神经网络的剪枝优化方案。为此,本发明采取的技术方案是,基于卷积神经网络的图像压缩优化方法,构建包括编码器E、解码器d和对抗网络GAN的网络模型,编码器E为卷积神经网络,解码器d为进行上采样处理的卷积神经网络和进行恢复原始图像维度的反卷积神经网络,由一个discriminator卷积神经网络和一个反卷积神经网络generator构成生成式对抗网络GAN,q为算数运算器,将原始图像x经编码器E编码为特征图w,然后经量化器q量化为 再经解码器d,最后经GAN生成图像 其中,需首先进行所述网络模型的训练;然后对所述网络模型进行剪枝优化;最后对网络模型进行再训练,利用训练好的网络模型实现图像压缩。
[0010] 剪枝优化具体步骤是:读取训练好的网络模型数据,取一层卷积神经网络的卷积核K,在谷歌开源深度学习框架TensorFlow中卷积核K为四维张量:卷积核高filter_height,卷积核宽filter_width,输入通道数in_channels,输出通道数out_channels,但计算形式为二维矩阵,与二维矩阵相乘,行为filter_height*filter_width*in_channels,列为out_channels,即卷积核k的个数;计算每个卷积核k的L2范式,依据L2范式的大小决定卷积核k对结果的影响程度,若L2范式越小,则卷积核k对结果影响越小;若L2范式越大,则卷积核k对结果影响越大;
[0011] 根据需求,删减对结果影响最小的那些卷积核k,即减少二维矩阵K的列数,在选取对结果影响最小的卷积核k时,记录k的列号,删减的过程即是分片再合成的过程;
[0012] 网络层间的参数传递都是一一对应的,前一层的输出结果,是后一层的输入结果,即修剪了前一层的卷积核个数后,导致输出结果减少,与后一层的输入不匹配,从而对后一层的输入,即后一层K的in_channels,进行相应的修剪;
[0013] 运用上述相同的方法,对网络层中的偏置bias参数也做相应的修剪;
[0014] 进而一次完整的剪枝优化操作基本完成,之后再进行网络模型训练,以控制精度偏差;
[0015] 重复上述操作,至网络模型全部剪枝优化结束。
[0016] 本发明的特点及有益效果是:
[0017] 本发明提出了一种卷积神经网络的剪枝优化方案,不同于以往的卷积网络模型,我们设计得到的卷积网络模型,可以有效的解决网络模型存储资源开销大,卷积核参数量大,以及计算量大,推断时间长等问题。为嵌入式等移动终端领域实现大规模卷积神经网络提供了技术支持。在本实例中,模型的存储资源降低了75%,推断时间降低了50%。附图说明:
[0018] 图1图像压缩流程图
[0019] 图2剪枝优化流程图。
[0020] 图3卷积核及通道图。
[0021] 图4修剪卷积核图。

具体实施方式

[0022] 本发明设计了一种基于卷积神经网络的压缩优化方案。设计了针对大型卷积神经网络的模型存储量大、参数量大、推断时间长等缺陷的优化方案。实现了卷积网络模型的高压缩比,低参数量,缩短推断时间。设计主要包括三个步骤:1)卷积神经网络的训练;2)网络模型的剪枝优化;3)网络模型的再训练。
[0023] 第一方面,图像压缩GAN网络的训练;
[0024] 第二方面,网络模型的剪枝优化;
[0025] 第三方面,网络模型再训练;
[0026] 本发明设计的是一种基于卷积神经网络的剪枝优化方案。
[0027] 图像压缩GAN网络的训练,根据GAN网络可以生成数据的特性,将其运用在图像压缩领域进而实现图像的极度压缩。
[0028] 将原始图像x经编码器E编码为一串编码w,然后经量化器q量化为 再经解码器d,最后经GAN网络生成图像 从而实现图像的压缩。其中编码器E为卷积神经网络,解码器d、GAN网络包含卷积神经网络和反卷积神经网络,而量化器q为算术运算。
[0029] z=d(q(E(x)))
[0030]
[0031] 网络模型的剪枝优化,在图像压缩GAN网络训练完成后得到最好的网络模型,依次读取每层的网络模型参数,剪枝优化网络模型。
[0032] 在TensorFlow中一层卷积神经网络的卷积核K由一个四维张量[filter_height,filter_width,in_channels,out_channels]表示,其中[filter_height,filter_width]为卷积核K的大小,in_channels为输入通道数,out_channels为输出通道数。本发明的剪枝优化就是在in_channels和out_channels的层面上进行的。
[0033]
[0034] 网络模型再训练,在模型剪枝优化后进行微调,再训练网络模型,反复进行剪枝、再训练以达预期。
[0035] 具体操作:
[0036] 读取训练好的网络模型数据,取一层卷积神经网络的卷积核K,在TensorFlow中卷积核K为四维张量[filter_height,filter_width,in_channels,out_channels],但计算形式为二维矩阵,如上所示,与二维矩阵相乘,行为filter_height*filter_width*in_channels,列为out_channels,即卷积核k的个数。计算每个卷积核k的L2范式,依据L2范式的大小决定卷积核k对结果的影响程度,若L2范式越小,则卷积核k对结果影响越小;若L2范式越大,则卷积核k对结果影响越大。
[0037] 根据需求,删减对结果影响最小的那些卷积核k,即减少二维矩阵K的列数。在选取对结果影响最小的卷积核k时,记录k的列号,删减的过程即是分片再合成的过程。
[0038] 网络层间的参数传递都是一一对应的,前一层的输出结果,是后一层的输入结果,即修剪了前一层的卷积核个数后,导致输出结果减少,与后一层的输入不匹配,从而对后一层的输入,即后一层K的in_channels,进行相应的修剪。
[0039] 运用上述相同的方法,对网络层中的bias(偏置)参数也做相应的修剪。
[0040] 进而一次完整的剪枝优化操作基本完成,之后再进行网络模型训练,以保证精度没有太大的偏差。
[0041] 重复上述操作,至网络模型全部剪枝优化结束。
[0042] 下面结合附图及实例,对本发明进行进一步详细说明。应该指出,此处所描述的具体实施实例仅仅用以解释本发明,并不用于限定本发明。为了使本发明的目的、技术方案和优点更加清晰,本实例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程。
[0043] 本发明是在卷积网络模型训练完成后进行剪枝优化操作,如图1,图2所示。
[0044] 将卷积网络训练完成后,通过TensorFlow读取模型参数数据,即每层卷积核。计算每个卷积核的L2范式,L2范式越小,对卷积结果影响就越小,查找L2范式最小的那些卷积核,即就是要修剪的卷积核,记录修剪卷积核的列号,相应的修剪本层卷积网络的偏置参数,即与修剪卷积核具有相同列号的偏置参数也应修剪掉,由于卷积神经网络上一层的输出即是下一层的输入,所以上一层修剪卷积核的列号即为下一层输入的行号,即输入通道,所以下一层卷积核的输入通道也应对应的修剪掉,如图3所示。修剪卷积核、偏置参数、输入通道的方法是一样的,修剪过程如图4所示。逐层修剪,每次修剪后都要进行再训练,以保证网络精度基本不变,直至修剪完成。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈