首页 / 专利库 / 图形技术 / 压缩失真 / 选择编码模式的方法和设备

选择编码模式的方法和设备

阅读:1033发布:2020-11-10

专利汇可以提供选择编码模式的方法和设备专利检索,专利查询,专利分析的服务。并且本 发明 涉及从包括在一组 块 (101)中的块的子集(109)的多个编码模式中选择编码模式(112)的方法。在一组块(101)上对各种编码模式计算(102) 能量 函数(105),存储至少块子集(109)的能量函数(105)的计算元素(103)。在一组块(101)上选择(106)最小化能量函数(105)的第一编码模式(107)。此后,使用存储的块子集(109)的计算元素(103)在块的子集(109)上对各种编码模式计算(108)能量函数(110),并在子集(109)的邻近关系上执行与编码的第一模式不同的编码模式的模式成本的估计(113)。从而在子集(109)上最小化能量函数(110)的编码模式的选择。,下面是选择编码模式的方法和设备专利的具体信息内容。

1.一种从分割为的图像的多个压缩编码模式中选择多个编码模式(112)的方法,编码包括在一组块(101)中的块的子集(109),方法包括步骤:
在一组块(101)上为每一种编码模式计算(102)第一能量函数(105);
为至少块子集(109)存储(104)第一能量函数(105)的计算元素(103);
在一组块(101)上选择(106)最小化第一能量函数(105)的第一编码模式(107);
在块的子集(109)上为每一种编码模式计算(108)第二能量函数(110),使用存储的块子集(109)的计算元素(103)计算第二能量函数(110),并在子集(109)的邻近关系上执行与编码的第一编码模式不同的模式的编码成本估计步骤(113);
在子集(109)上选择(111)最小化编码第二能量函数(110)的第二编码模式(112)。
2.根据权利要求1所述的方法,其特征在于一组块(101)是一组2n*2n块,子集(109)是一组2n-1*2n-1块,其中,n是大于1的自然数。
3.根据权利要求1或2所述的方法,其特征在于邻近关系是在块的子集(109)的下边到右边的一组块(101)。
4.根据权利要求1或2所述的方法,其特征在于计算元素(103)是块的每个子集(109)的编码的失真和编码成本。
5.根据权利要求1或2所述的方法,其特征在于选择编码模式的步骤包括选择编码模式的参数的子步骤。
6.根据权利要求1或2所述的方法,其特征在于在一系列组块的子集上迭代的重复。
7.一种从包括在一组块(101)中的块的子集(109)的多个编码模式中有效选择编码模式的设备,设备包括:
第一计算模块(102),在一组块(101)上对每个编码模式计算第一能量函数(105);
存储器(104),存储至少块的子集(109)的第一能量函数(105)的计算元素(103);
第一模块(106),在一组块(101)上选择最小化第一能量函数(105)的第一编码模式(107);
第二计算模块(108),在块的子集(109)上对每个编码模式计算第二能量函数(110),第二模块(108)通过调用存储的块的子集(109)的计算元素(103)计算第二能量函数(110),并包括估计模块(113),在子集(109)的邻近关系上估计不同于第一编码模式的编码模式的编码成本;
第二模块(111),在子集(109)上选择最小化第二能量函数(110)的第二编码模式(112)。
8.根据权利要求7所述的设备,其特征在于一组块(101)是一组2n*2n块,子集(109)是一组2n-1*2n-1块,其中,n是大于1的自然数。
9.根据权利要求7或8所述的设备,其特征在于邻近关系是块的子集(109)的下边到右边的一组块。
10.根据权利要求7或8所述的设备,其特征在于计算元素(103)是每个块的子集(109)的编码失真和编码成本。
11.根据权利要求7或8所述的设备,其特征在于选择编码模式的模块中的至少一个包括选择编码模式的参数的子模块。
12.一种实现多种编码模式的编码视频图像的方法,其特征在于包括根据权利要求1的方法选择编码模式的阶段。

说明书全文

技术领域

发明涉及从多个图像压缩编码模式中,选择分割为的图像的块的编码模式的方法。方法由迭代选择编码模式组成,以致编码一组块,然后在所述的组块的块的子集上改进此选择。此改进可在子集上迭代的再生它自己,然后处理。

背景技术

因此,本发明的内容是基于MPEG2,MPEG4章节2或10类型的块方法编码方案的压缩,特别是视频压缩。这些压缩方案根据称为宏块的实体运行。在下面的描述中,术语块可表示一组任何尺寸的较小的块,因此特别的可表示宏块。这些方案实现编码决定方法,其目标是对各宏块选择表现最合适的编码模式。此选择可凭经验做,就是说评估所有可能的模式,特别是计算编码的成本和失真。然后选择表现最好的比特率-失真折衷的编码模式。已知的编码决定方法运行在因果关系的方式中:一旦做出关于宏块的决定,继续下一个宏块。这是以图像扫描的顺序实现的。
那么已知的方法不考虑决定对将来宏块的影响。这在表现不均匀度的整个图像上选择模式的映射上有负面的结果。
那么块影响是可见的。因为在左到右和上到下扫描的情况中处于上面和到左的特殊情况中,宏块的编码成本通常非常依赖于邻近宏块的编码模式,这也对编码成本导致负面的结果。关于宏块的决定可以是对此决定最好的,但因为它影响随后的宏块,它的结果对后面的宏块可能是非最佳决定的选择。可使用有几个迭代的方法使得重新考虑前面做的决定成为可能。那么计算量是高的。此外,这些方法只是采用称为随机的张弛策略,它包括特别与视频编码不相容的计算量,使得避免对后面的宏块的非最佳决定成为可能。
基于在一组宏块上计算编码方式的集合的其它方法预示考虑所有可能的编码方式的组合,这在计算时间方面明显的是非常昂贵的。

发明内容

本发明提出编码决定方法,它不会出现上面提到的缺点。因此,根据本发明的编码决定方法使得获得相对于上面提到的常规解决方案更好质量的压缩的图像成为可能,同时优化编码成本。
一种从分割为块的图像的多个压缩编码模式中选择多个编码模式的方法,编码包括在一组块中的块的子集,方法包括步骤:
在一组块上为每一种编码模式计算第一能量函数;
为至少块子集存储第一能量函数的计算元素;
在一组块上选择最小化第一能量函数的第一编码模式;
在块的子集上为每一种编码模式计算第二能量函数,使用存储的块子集的计算元素计算第二能量函数,并在子集的邻近关系上执行与编码的第一编码模式不同的模式的编码成本估计步骤;
在子集上选择最小化编码第二能量函数的第二编码模式。
特别是,本发明提出的多尺度方法使用选择一组块的编码模式,使得此后决定一组块的子集的编码模式。这能使得能在一组块上做出均一的决定。此方法也使得在一组块的能量函数上接近全局的最小值成为可能,因此,特别是,在一组块上最佳化编码成本。不言而喻第一和第二编码模式是清楚的或同样的,给出了一个和同样的编码模式能对一组块或块的子集最小化能量函数。
在实例中,一组块是一组2n*2n块,子集是一组2n-1*2n-1块,其中,n是大于1的自然数。
实例特别在图像编码的结构中是有利的,特别根据MPEG标准,其中,块特别的组成宏块,也特别组合在一起为2n*2n块,其中,n是大于1的自然数。
在实例中,四周邻近是块的子集下面和到右方的一组块。
此实例特别在图像编码的结构中是有利的,特别根据MPEG标准,其中为了编码,块从左到右和从上到下扫描。
在实例中,计算元素是各块的子集的失真度和编码成本。
此特征反映能量函数的性质为根据本发明所计算的。失真度表示在编码的图像和未编码的原始图像之间观察到的误差。编码成本一般表示编码图像必须的比特数。存储这些计算元素,使得能由计算宏块子集的能量函数的步骤调用。
在实例中,选择编码模式的步骤包括选择编码模式的参数的子步骤。
此特征使得本发明的应用扩展到选择特别的编码模式的参数成为可能,例如选择矢量。
在实例中,在一系列一组块的子集上重复迭代根据本发明的方法。
对MPEG编码此实例是特别有用的。例如一组块在要编码的图像中可以有最大可能大小2n的块。根据本发明的方法,那么选择四个子集的编码方法。大小2n-1的各子集成为一组块,那么子集有大小2n-2如此等等,其中,n是大于1的自然数。
本发明也涉及实现如上面描述的方法的设备。
本发明也涉及由根据本发明迭代实现的方法获得的压缩的图像(从分割整个图像为非常大的尺度的块开始一典型的为128×128像元)。
附图说明
从各种实例的描述中本发明其它的特征和优点成为明显的,参考如下附图作描述:
图1根据本发明的设备的框图
图2a和图2b呈现块或宏块的周围近邻在计算编码成本中的作用;
图3说明本发明在一组宏块上的运行的方式;
图4表示各尺度的能量函数;
图5a到图5c说明在一组宏块上操作根据本发明的方法。

具体实施方式

如在图1中表示的,根据本发明的设备100包括计算模块102,在一组块101上对每个编码模式计算能量函数105。存储器104使得存储至少一个块的子集109的能量函数105的计算元素103成为可能。
为了清楚的原因,对几种编码模式计算由单个参考数表示的能量函数105。因此,当存在许多能量函数的值时,存储参考值105作为被评估的编码模式。
设备100包括选择编码模式的模块106,称为第一编码模式107,在一组块101上最小化能量函数105。
编码模式的选择由搜寻一组编码模式M和最小化能量函数105的相关的参数P组成,在公式中由E表示:
Minm,pE(M,P/Icur,Iref)
其中Icur指定当前图像,Iref指定作为时间预测的参考的图像,M={m1,m2,...,mn}是一组N宏块的的编码模式,mi能从一组Q编码模式中取它的准许的值T={t1,t2,...,tq},P是在各位置s与它的模式ms关联的一组参数。这可能是内部编码模式的空间预测的方向,或中间编码模式的双向权重系数的运动矢量的问题。
能量函数E是在一组块上的基本函数之和。如前面描述的,这些基本函数依赖于块的邻近关系。
如在图2a中表示的,在实现左到右和上到下扫描的编码方案中,例如MPEG4章节10的编码方案,在块200上计算的基本函数依赖于在由块201到204组成的邻近关系中选择的编码模式。以互补的方式,如在图2b中表示的,特别是,对块206到209计算的各个基本函数依赖于块205选择的编码模式。
那么基本函数之和可写为:
E(M,P/Icur,Iref)=∑s∈S Es(ms,Ps(ms)/mr,Pr(mr),r∈Vs,Icur,Iref)
其中S是图像的N个宏块的一组位置(或地点),Vs指出位置S的邻近关系,例如在图2a中的块201到204。
函数Es可取几种形式。在凭经验的方法中,可以取以下的形式,用省略条件相关已简化的符号:
Es(m)=D(m,P(m))+λ·C(m,P(m))
其中D是测量的失真,C是测量的编码成本,λ是确定的或计算的参数,常惯上作为块的量化步长的函数。
由最小化上面的函数Es(m)的模式确定在一组块上选择第一编码模式107。
对块的每个子集和估算的每个模式存储在图1中的参考数103的计算元素D和C。根据本发明,存储至少对必须选择编码模式112的子集109的块的计算元素103。
因此,其后的设备100有处理块组101的子集109的可能性。
那么它包括计算模块108,用于在块的子集109上对每个编码模式m计算能量函数110。
其后的图3说明本发明的运行方式。对一组块301已选择第一编码模式。例如对4×4块的子集309,此后计算能量函数110。例如,根据本发明的方法,也可选择大小3×3和在图3中表示为303,组301的任何其它子集。例如,也可在本发明中执行对3×2等的所有其它大小。
根据图1,计算能量函数110的模块108调用块的子集109存储的计算元素103。计算模块108也包括估计模块113,在子集的邻近关系上估计不同于第一编码模式107的编码模式的成本。
根据图3,子集的邻近关系是由处于块的子集309的底部和到右边规定的邻近关系。
特别是,如在图2b中说明的,处于位置s的块205的模式的变化也改变未来块206到209的能量的变化。在公式中未来块标志为Fs。如果在位置s,模式m用m′代替,从那里产生的能量的变化如下:
ΔE=Es(m′,Ps(m′))-Es(m,Ps(m))+∑r∈Fs(Es(Er(mr,Pr(mr)/m′,Ps(m′))-Er(mr,Pr(mr)/m,Ps(m)))
前两项表示根据过去的块的能量函数的改变,第三项表示引起未来块的能量函数的能量函数的变化。
在常规的单尺度因果关系的方法中,那么由测量宏块的能量函数的改变影响编码模式的选择,就是说,不考虑未来块上包括的能量变化的前两项。
这对图像分割为块的小到中的量化步长是明显的,可考虑对邻近关系的更早期块模式改变的块的影响没有承担失真,但承担编码成本。特别是,在解量化后对小到中间范围的量化步长重建的块离原始图像不是太远。在此情况中,不需要重新计算失真。因此,对块的每个子集,向前的最粗尺度计算每个模式的失真。在此情况中,存储的计算元素103使得不必须重新计算它们,容易的调用表示失真D的计算元素103成为可能。
作为对块的子集的工作和在子集中必须有同样的模式的结果,不改变位于块的子集中的块的编码成本。因此可以看到对给定的尺度,由块的子集309的编码模式的改变产生的编码成本的变化只对位于子集309的邻近关系302的块是敏感的。因为只是块的子集309的邻近关系302的块的编码成本变化,这使得大大降低执行的计算量成为可能。子集内部的块的其它编码成本实际上存储为前面看到的计算元素103的方式。特别是,参考图3,编码成本的常规计算给出上升到16+9的计算,因此本发明使得只执行9成为可能。
最后,设备包括模块111,用于选择由计算模块108在子集109上计算的最小化能量函数110的编码模式112。
根据本发明提出的多尺度方法,使得更容易的接近在图像上优化编码的方法成为可能。特别是,当用一组大尺度块实现方法时,多尺度方法使得更有意义的平滑将所有的最小化的函数成为可能。
因此,对本方法来说,在一组起始块的足够高尺度上,函数成为凸起的,并容易地获得到达全局的最小。
图4说明在单维上计算的能量函数的简单情况,沿横坐标表示多个模式。因此,注意到在最小尺度的能量函数曲线403表现几个最小值。因此,如果我们在能量函数最小化时从弱的初始化开始,我们落入本地最小值的险。曲线402表示中间的尺度,除了全局最小值,中间的尺度表现较小显著的本地最小值。曲线401表示最大的尺度,此曲线401只表现明确地获得的一个最小值。如在此最后的图中说明的一样,为了在分割为块的图像上确定最好编码模式的集合,特别是图像的块数,每块的模式数,时空的预测空间,由发现能量函数最小值的配置,用几个维数最小化能量函数是必须的。当使用因果关系的方法时,在最小的尺度,我们最终获得给予的本地最小值,它可能与能量函数的全局最小值差得很多。因此,本发明使得接近编码整个图像的能量函数的最小化成为可能,因为规定一组块作为整个图像是可能的。
参考图5,本发明方法的优点是,在块的组和子集的多个尺度上重复迭代,使得在全部图像上获得优化的编码模式集合。根据此迭代,前面步骤的子集成为下一步的一组,如此以往。有利的,最粗的尺度是整个图像。
根据此迭代原理,在图5a中由8×8块的一组块500表示的第一尺度上计算最小化的能量函数。对第一尺度,子集501到504有大小4×4。对在图5b中表示的第二尺度,前面尺度的子集501到504,每一个都成为本发明实现方法的一组块。现在子集是2×2块的组505到520。最后在第三尺度,现在子集是块521本身。因此,块组合为2n×2n块的子集的组。每个子集的块都必须有相同的编码模式。
本方法使得从粗的尺度承担最优化成为可能。使用因果关系的尺度遍励组中的每个子集。根据本发明,在给定的尺度k为各子集寻找产生最低能量的模式。例如,在图5中,尺度k+1的组500用于确定产生尺度k的子集501到504等的每一个的最低能量的模式。一旦已处理尺度k,对于最低的尺度k-1,我们获得了每一新组尺度k的模式的最初映射。对尺度k-1的各个子集,我们搜寻获得最大能量下降的模式。一旦已处理尺度k-1,我们进入尺度k-2,连续下去直到尺度0,最后到单个块构成子集的位置。
本发明也用于优化能量函数作为编码模式的参数的函数。可考虑两种方法。块的各个子集的参数可以是不同的。因此,子集的编码模式是具有块的各个子集的运动矢量参数的中间模式。或我们运行于给定的参数P,用如在各尺度处理参数P的子集Ps的模式同样的方式。
在两种情况中,估计参数P,如果必要,以完全独立的方式估计Pn。例如,在实现编码决定设备前,在整个图像上进行多尺度的运动估计是可能的。此解决方案比同时估计组Mn和Pn的解决方案有较少昂贵计算的优点。
本发明不限于描述的实例,本领域的技术人员认识到存在各种可选择的实例,如设想计算邻近关系块的编码成本的各种类型邻近关系的可能性。也可注意到由精确的计算,或由使用已知的近似技术的近似计算可估计编码成本。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈