首页 / 专利库 / 信号处理 / 小波变换 / 离散小波反变换 / 用于图像和视频压缩编码和解码中的多进小波变换方法及应用

用于图像和视频压缩编码和解码中的多进小波变换方法及应用

阅读:903发布:2020-05-12

专利汇可以提供用于图像和视频压缩编码和解码中的多进小波变换方法及应用专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种用于图像和视频压缩编码和解码中的多进 小波变换 方法,其是采用进制数r高于或等于16的r-进离散双 正交 小波进行图像压缩或解压缩的正向或反向变换。本发明提供了一种新的多进小波变换法,它拥有小波变换的图像没有分 块 效应的优点,又避免了小波变换复杂的 迭代 算法 ,并且这样的多进小波可以转化为小波变换和块变换的乘积,将小波变换与块变换有机联系起来,可实现新旧技术的无缝向下兼容,即老技术是新技术的一个标准子集,新技术能顺利地解码用老技术编码的图像或视频,且有利于并行计算的实现。,下面是用于图像和视频压缩编码和解码中的多进小波变换方法及应用专利的具体信息内容。

1.一种用于图像和视频压缩编码和解码中的多进小波变换方法,其特征在于:采用进制数r高于或等于16的r-进离散双正交小波进行图像压缩或解压缩的正向或反向变换,所述进制数r高于或等于16的r-进离散双正交小波正向变换为:
r-进离散双正交小波的反向变换为:
式中:{hi}和 为低通滤波器对偶, 和 为r-1支高通滤波器
偶, 是变换系数;
所述变换采用r-进离散双正交小波的滤波器组具有下列矩阵形式时,
式中l>r,l为滤波器组的最大长度,并设定r为偶数,{hi}和 为低通滤波器对偶,和 为r-1支高通滤波器对偶,则上述(1)~(4)表达式具有下列
(5)~(8)分解形式:
式中:{si}和 为任意一个双正交2-进小波的低通滤波器,{ti}和 为所述2-进双正交小波的高通滤波器,Pr/2是任意一个r/2维的规范正交矩阵,它的第一行的元素都为其余各行的元素和为0。
2.根据权利要求1所述的用于图像和视频压缩编码和解码中的多进小波变换方法,其特征在于:当r=16时,其滤波器组由32支滤波器构成,其中16支用于正向变换,16支用于反向变换,所述滤波器组为:
1)正向低通滤波器:
{hi}={9/640,-(3/320),-(3/128),1/8,35/128,83/320,151/640,1/4,1/4,1/4,1/4,1/4,1/4,1/4,1/4,1/4,151/640,83/320,35/128,1/8,-(3/128),-(3/320),9/640},
2)15支正向高通滤波器:
3)反向低通滤波器:
4)15支反向高通滤波器:
在上面的滤波器中,所有的
3.根据权利要求2所述的用于图像和视频压缩编码和解码中的多进小波变换方法,其特征在于:生成上述16-进双正交小波滤波器组的2-进小波是一个9-7型双正交小波,其滤波器组为:
而生成这个16-进双正交小波滤波器组的规范正交矩阵为:
其中,

说明书全文

用于图像和视频压缩编码和解码中的多进小波变换方法及

应用

【技术领域】

[0001] 本发明涉及信息技术领域,具体涉及一种用于数字图像和数字视频压缩编码变换方法。【背景技术】
[0002] 随着计算机、微电子信号处理、通信以及激光等技术的迅猛发展,集声音、图像、视频于一体的多媒体技术迅速渗透到计算机、通信、广播电视以及消费娱乐业,在上述各领域中,越来越多地采用通过数字信号传输之数字设备。
[0003] 数字信号有很多优点,但当模拟信号数字化后其频带会大大加宽,如一路6MHz的普通电视信号数字化后,其数码率将高达167Mbps,这对储存器容量和传输带宽要求很大,从而使数字信号失去实用价值。数字压缩技术很好地解决了上述困难,压缩后信号所占用的频带大大低于原模拟信号的频带。因此可以说,数字压缩编码技术是使数字信号走向实用化的关键技术之一,数字图像和数字视频之所以能传输和保存的一个关键因素在于数字图像和数字视频的这种可压缩性。这种压缩是以降低图像或视频的质量为前提的,以牺牲图像或视频的质量换取宝贵的存储空间或传输带宽。当然,这种压缩不能过度,以致图像或视频的视觉效果变得不可接受,这就要求在一定的质量条件下,不断提高压缩效率。此外,压缩行为应该是规范的,这样将有利于信息的传输与共享。
[0004] 为了规范这种压缩编码行为,目前出台了不少国际标准,如图像压缩标准JPEG(国际标准ISO/ICE 10918,大量使用在数码相机和国际互联网),图像压缩标准JPEG2000(ISO/IEC15444-1:2000),视频压缩标准MPEG-1(国际标准ISO/ICE 11172,在VCD里使用)、MPEG-2(国际标准ISO/ICE 13818,使用在DVD和数字电视里)和MPEG-4(国际标准ISO/ICE 14496,使用在流媒体技术中)等。这些标准除了规范了压缩行为外,压缩效率也在不断提高。如MPEG-2的压缩效率高于MPEG-1,MPEG-4的压缩效率高于MPEG-2。
[0005] 在压缩编码标准和技术里,必须使用变换技术。目前,在JPEG、MPEG-1、MPEG-2和MPEG-4里,所用的正交变换方法都是离散余弦变换(Discrete Cosine Transform,简称DCT);而在JPEG2000里,使用了小波变换技术(Discrete Wavelet Transform简称DWT)。
[0006] 小波变换(Wavelet Transform)在图像压缩编码里有较好的表现,因此人们对它寄予厚望,希望能开创图像与视频压缩编码的新时代。但是20年来,小波变换在图像和视频压缩上所发挥的作用并不如想象的那么大。虽然在JPEG2000里使用了DWT,但JPEG2000在芯片里实现非常困难,这是由DWT的特点所决定的。事实上,DWT是一个迭代算法(iterative algorithm,即第二次处理的输入值是第一次处理的输出值),在芯片里需要反复迭代多次,导致芯片里需要大量的存储器,且结构复杂。所以,小波变换芯片实际上只能实现有限的图像变换,一般是128×128或256×256大小的。这使得大幅面的图像必须分成较小的块才能用芯片完成压缩编码。这也就是JPEG2000问世十多年了,依旧无法用于数码相机等手持设备的原因之一。
[0007] 相对而言,视频压缩编码更加复杂,DWT目前用在视频里更加困难。这一点是不难理解的,因为DWT与目前大量使用的DCT等块变换的形式、结构和特点完全不同。所以,一个好的变换不应该是迭代的,即一个小块的图像数据完成变换后就应该立即能接上下一个步骤,在图像和视频压缩编码里,就是一个小块的数据完成变换后,就要能立即开始量化及后续步骤,这是DCT等块变换的优点,而DWT是不具备这一优点的。
[0008] 在现有的技术标准里,虽然新技术的压缩编码效率提高了,但是新旧技术的兼容性却是个大问题。如JPEG2000根本无法兼容JPEG,MPEG-4也根本无法兼容MPEG-2,这极大地限制了新技术的产业化。【发明内容】
[0009] 本发明目的是克服上述现有技术缺陷,提供一种图像与视频压缩编码解码中的多进小波变换方法,在提高编码效率的基础上,能够零成本地兼容现有的JPEG和MPEG的技术,使新技术与现有产业能平稳接轨。
[0010] 为实现上述发明目的,本发明所提出的技术方案是:
[0011] 一种用于图像和视频压缩编码和解码中的多进小波变换方法,其是采用进制数r高于或等于16的r-进离散双正交小波进行图像压缩或解压缩的正向或反向变换,所述进制数r高于或等于16的r-进离散双正交小波正向变换为:
[0012]
[0013] r-进离散双正交小波的反向变换为:
[0014]
[0015] 式中:(hi}和 为低通滤波器对偶, 和 (k=1,...,r-1)为r-1支高通滤波器对偶, 是变换系数;
[0016] 所述变换采用r-进离散双正交小波的滤波器组具有下列矩阵形式时,
[0017]
[0018]
[0019]
[0020]
[0021] 式中l>r,l为滤波器组的最大长度,并设定r为偶数,{hi}和 为低通滤波器对偶, 和 (k=1,...,r-1)为r-1支高通滤波器对偶,则上述(1)~(4)表达式具有下列(5)~(8)分解形式:
[0022]
[0023]
[0024]
[0025]
[0026] 式中:{si}和 为任意一个双正交2-进小波的低通滤波器,{ti}和 为所述2-进双正交小波的高通滤波器,Pr/2是任意一个r/2维的规范正交矩阵,它的第一行的元素都为 其余各行的元素和为0。
[0027] 本发明提供了一种全新的多进小波变换,它拥有小波变换的图像没有分块效应的优点,又避免了小波变换复杂的迭代算法,并且这样的多进小波可以转化为小波变换和块变换的乘积,通过这样的多进小波将小波变换与块变换有机联系起来,可实现新旧技术的无缝向下兼容,即老技术是新技术的一个标准子集,新技术能顺利地解码用老技术编码的图像或视频,且有利于并行计算的实现。【附图说明】
[0028] 图1为本发明用于压缩图像或视频时压缩编码流程框图
[0029] 图2为本发明用于压缩图像或视频时等价的编码流程框图;
[0030] 图3为本发明用于压缩图像或视频时解码流程框图。【具体实施方式】
[0031] 在图像和视频压缩技术领域中,图像压缩是最核心的基础,变换技术是图像和视频压缩编码里必不可少的技术。在图像与视频压缩编码领域,一直是块变换技术独领骚。小波变换(小波变换意指2-进小波变换)的出现改变了这种局面,在新的国际技术标准里小波变换已开始使用。然而,目前的块变换与小波变换是完全不相容的、没有内在联系的两种技术,缺乏兼容性,导致新技术与产业完全脱节。将多进离散小波(Multi-bank Discrete Wavelet Transform,简称MBDWT)引入图像和视频压缩编码和解码的变换环节中,便可实现上述的兼容。当多进小波(Multi-bank Wavelet)的进制数较高时,完成一次变换就相当DWT完成了多次迭代(iteration)。如8-进小波(8-bank Wavelet)分解一次,就相当DWT完成了3次迭代;16-进小波(16-bank Wavelet)分解一次相当DWT完成了4次迭代;32-进小波变换一次相当于DWT完成了5次迭代等等。随之而来的问题是,多进小波的变量成百上千,它的构造是一大挑战。
[0032] 本发明提供了一种多进小波变换方法,用于图像和视频压缩编码和解码中的变换环节,其是采用进制数r高于或等于16的r-进离散双正交小波进行图像压缩或解压缩的正向或反向变换。
[0033] 假定{hi}和 是两支低通滤波器(low-pass filters)对偶, 和 (j=0,1,...,r-1)各为r-1支高通滤波器(high-pass filters)对偶,满足
[0034]
[0035]
[0036]
[0037]
[0038] 这里δj是一个脉冲信号,即δj=1(j=0),或δj=0(j≠0)。则称由和 定义了一个r-进离散双正交小波(r-bank discrete biorthogonalwavelet)。
[0039] 特别,当r=2时,这就是通常的双正交小波,JPEG2000里就是用这样的双正交小波。所以,通常所说的小波也称为2-进小波。r>2时,称为多进小波。在本发明里,“小波”或“DWT”往往是指2-进小波,当有二义性发生时,我们都会特别加以说明。
[0040] 如果 (j=0,1,...,r-1),就称 和 具有消失矩(Vanishing Moment)。
[0041] 如果 则称此时的双正交小波为正交小波(orthogonal wavelet)。所以,正交小波是双正交小波的一个特例。
[0042] 如果{pi}是一个滤波器,i=1,2,...,2N+1,即滤波器的长度为奇数。如果pN+1-i=pN+1+i,i=1,2,..N,就称这个滤波器是对称的(symmetric);如果pN+1-i=-pN+1+i,i=1,2,...N,就称这个滤波器是反对称的(anti-symmetric)。
[0043] 下面的公式(5)定义了一维的r-进离散双正交小波的正向变换(Forward Transform):
[0044]
[0045] 而下面的公式(6)定义了一维的r-进离散双正交小波的反向变换(Inverse Transform):
[0046]
[0047] 对于图像或视频压缩编码,需要完成二维变换。二维正向变换是指对一个矩阵作离散多进小波变换,它是由一维小波变换构成的,即首先对矩阵的所有列依次做列变换,用变换后的数据替代该列。然后,对这个矩阵的所有行依次作行变换。可见二维正向变换就是反复运用(5)的过程。将上述过程反过来,就得到二维反向变换。二维反向变换就是反复运用(6)的过程。
[0048] 图像或视频压缩编码时使用正向变换,图像或视频解码时使用反向变换。当多进小波的进制数足够高时(r≥16),只需作一次正向变换或反向变换,即在(5)和(6)中,取j=-1。此时, 是原始数据。
[0049] 采用r-进离散双正交小波的滤波器组具有下列矩阵形式时,即
[0050]
[0051]
[0052]
[0053]
[0054] 这里l>r是滤波器组的最大长度,并假定r为偶数,本发明一个显著特点是,(7)~(10)可以分解成下列(11)~(14)的形式:
[0055]
[0056]
[0057]
[0058]
[0059] 这里,Pr/2是任意一个r/2维的规范正交矩阵,它的特点是第一行为 其余各行的元素和为0,即具有消失矩。而{si}和 是任意一个双正交DWT的低通滤波器,{ti}和 这个双正交DWT的高通滤波器。
[0060] 用具有(11)、(12)、(13)、(14)这种结构的r-进小波于图像和视频压缩编码和解码的变换环节,而不论Pr/2是何种满足条件的规范正交矩阵及 形成一个什么样的2-进双正交小波。
[0061] 特别地,如果r=16,所对应的Pr/2取8维的离散余弦变换DCT(discrete cosine transform),则不论 构成什么样的双正交小波,具有式(11)、(12)、(13)、(14)结构的r-进小波能兼容DCT。因此,本发明中的16-进小波变换能兼容基于DCT的图像与视频压缩编码解码算法。
[0062] 下面便是一个16-进双正交小波的具体实例(即r=16)。这个滤波器组的长度为23或21,且为对称的或为反对称的。除了低通滤波器外,所有的高通滤波器均有消失矩。
[0063] 1)其正向低通滤波器为:
[0064] {hi}={9/640,-(3/320),-(3/128),1/8,35/128,83/320,151/640,1/4,1/4,1/4,1/4,1/4,1/4,1/4,1/4,1/4,151/640,83/320,35/128,1/8,-(3/128),-(3/320),9/640},[0065] 2)15支正向高通滤波器为:
[0066]
[0067]
[0068]
[0069]
[0070]
[0071]
[0072]
[0073]
[0074]
[0075]
[0076]
[0077]
[0078]
[0079]
[0080]
[0081]
[0082] 3)反向低通滤波器为:
[0083]
[0084] 4)15支反向高通滤波器为:
[0085]
[0086]
[0087]
[0088]
[0089]
[0090]
[0091]
[0092]
[0093]
[0094]
[0095]
[0096]
[0097]
[0098]
[0099]
[0100] 在上面的滤波器中,所有的
[0101] 这个16-进双正交小波满足(1)、(2)、(3)和(4),且具有消失矩。
[0102] 上述实施例中,
[0103]
[0104] 其中,
[0105] 此时,
[0106]
[0107] 其余没有写出的元素全部为0,且
[0108]
[0109] 其余没有写出的元素也为0,而式(13)和(14)的形式也类似:
[0110]
[0111]
[0112]
[0113] 这 里构成一个9-7型双正交2-进小波。
[0114] 本发明将一个进制数很高的多进小波转化为一个较低阶的2-进小波与一个正交矩阵的积,这同时解决了三大难题:一是使得多进小波的设计变为可能;二是使得多进小波变换的计算量得到了有效控制,如2-进小波有高效的lift算法等;三是使得多进小波与块变换建立了一个有机联系,使得新的变换能兼容传统的块变换。
[0115] 例如,如果P8取为8维的DCT,即P8=DCT={{0.353553,0.353553,0.353553,0.353553,0.353553,0.353553,0.353553,0.353553},{0.490393,0.415735,0.277785,
0.0975452,-0.0975452,-0.277785,-0.415735,-0.490393},{0.461940,0.191342,-0.191342,-0.461940,-0.461940,-0.191342,0.191342,0.461940},{0.415735,-0.0975452,-0.490393,-0.277785,0.277785,0.490393,0.0975452,-0.415735},{0.353553,-0.353553,-0.353553,0.353553,0.353553,-0.353553,-0.353553,
0.353553},{0.277785,-0.490393,0.0975452,0.415735,-0.415735,-0.0975452,
0.490393,-0.277785},{0.191342,-0.461940,0.461940,-0.191342,-0.191342,
0.461940,-0.461940,0.191342},{0.0975452,-0.277785,0.415735,-0.490393,
0.490393,-0.415735,0.277785,-0.0975452}};则本发明与DCT就兼容了。事实上,此时DCT是我们的16-进双正交小波的一部分。
[0116] 本发明变换环节用多进小波的结构,所以多进小波的挑选余地很大。只要符合这种结构,都在本发明的权利范围之内,而不必限定特定的DWT和特定的Pr/2。
[0117] 本发明对多进小波的进制数也不限定,但应用注意点主要在2d-进小波上,如16-进和32-进等,只有进制数足够高,才能避免迭代算法。
[0118] 如果我们的DWT选为双正交的,Pr/2有特别优秀的结构(如(15)),则这个多进小波有非常有效的快速计算方法,无论是软件还是芯片实现算法,效率都是非常高的。
[0119] 式(15)还有一个特别的优点。虽然式(15)本身是一个正交矩阵,与DCT完全不同,但对于DCT编码的图像或视频,用式(15)能毫无困难地解码。这意味着我们在芯片或软件里为兼容DCT,不需要特别设计一个DCT的运算单元,只需要设计式(15)就能兼容DCT了,从而极大地节省兼容性带来的经济成本。同DCT相比,式(15)的计算开销是非常经济的。当然,式(15)的编码性能也高于DCT。
[0120] 从本发明的特点,可以看出来,由于本发明的多进小波能分解成两部分,只要这两部分的性能是优良的,就能保证整个多进小波的性能是优良的。我们知道,2-进双正交小波的性能非常优秀,而无论是DCT还是(15),作为块变换,它们都是非常优秀的,所以所设计的多进小波优良性能有确切的保障。
[0121] 参见图1,本发明在用于多进小波压缩图像或视频时,依旧遵循压缩编码的流程。从式(11)、(12)可以看出,这里的变换可以分成两个部分,首先是作一次DWT,将图像“一分为四”,这就是通常的DWT。与通常的DWT不同的是,接下来我们不再作迭代分解,而是将被四分的“图像”(三个高频子图和一个低频子图)都分成(r/2)×(r/2)的块,再用Pr/2对每个块作二维块变换。这样的两阶段的变换算法与(5)或(6)的直接计算方法本质上是等价的(参见图2),而解码图像的过程可参见图3。
[0122] 当然,图2和图3的算法比直接计算要高效多了。DWT保留了小波变换的优点,例如消除块效果。而块变换则能给数据的重要性排定一个“方向”,就像JPEG里的DCT一样,使得数据的能量有序化,从而能吸取和兼容JPEG和MPEG里简洁高效的优秀算法。
[0123] 本发明主要用于图像与视频的压缩编码中的变换技术。在数学上,这些内容都归于对矩阵的操作。在图像里,是对Y、U、V分量分别进行操作;在视频中,对于残差(B帧或P帧)和基准帧(I帧),我们都视其为“图像”。
[0124] 故而,一切采用图像与视频的压缩编码的产品如计算机软件、DSP软件、ASIC芯片或FPGA芯片皆可采用本发明的多进小波变换方法。
[0125] 以上所述实施例仅表达了本发明的几种较佳的实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明的保护范围应以所附权利要求为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈