首页 / 专利库 / 信号处理 / 正交 / 视频编码和解码的方法

视频编码和解码的方法

阅读:246发布:2023-02-28

专利汇可以提供视频编码和解码的方法专利检索,专利查询,专利分析的服务。并且本 发明 应用于 视频编码 /解码,并且公开了一种用于通过半 正交 基向量集来执行变换系数和运动画面中剩余 像素 数据之间的变换的方法。基向量从常规DCT或KTL矩阵导出,但是对于正交性、范数相等性和元素大小限制来说在一定程度上放松要求。依照这种方式,本发明与先前使用的整数变换相比较改进了编码效率并且降低了复杂度。,下面是视频编码和解码的方法专利的具体信息内容。

1.一种视频编码方法,利用由多个基向量形成的变换矩阵来变换运动画面的第一剩余像素,以产生相应的第二变换系数块,所述第二变换系数块包括DC和AC变换系数,其中所述多个基向量中的至少一个对应于在所述第二变换系数块中的DC变换系数,所述方法的特征在于,所述变换矩阵从离散余弦变换(DCT)或Karhunen-Loève变换(KLT)导出,所述基向量的范数具有在<0%,1%]范围内的最大偏差,所述基向量的元素小于32,所述基向量的一对或多对是非正交的,并且一对或多对非正交的基向量的内向量积小于与在所述第二变换系数块中的所述DC变换系数相对应的基向量的范数的1%。
2.根据权利要求1所述的方法,其特征在于,分别在第一剩余像素值块的平和垂直方向上使用所述基向量,以产生相应的第二变换系数块。
3.根据前述权利要求中的一个所述的方法,其特征在于,所述块表示在画面中第一
8×8像素正方形区域。
4.根据权利要求3所述的方法,其特征在于,所述基向量被定义为:
[13 13 13 13 13 13 13 13]
[17 16 11 3 -3 -11 -16 -17]
[17 7 -7 -17 -17 -7 7 17]
[16 -3 -17 -11 11 17 3 -16]
[13 -13 -13 13 13 -13 -13 13]
[11 -17 3 16 -16 -3 17 -11]
[7 -17 17 -7 -7 17 -17 7]
[3 -11 16 -17 17 -16 11 -3]
5.一种视频解码方法,利用由多个基向量形成的变换矩阵来变换第一变换系数块,以产生运动画面的相应的第二剩余像素值块,
所述方法的特征在于,所述变换矩阵从离散余弦变换(DCT)或Karhunen-Loève变换(KLT)导出,所述基向量接近于正交而不是完全正交,所述基向量的范数具有在<0,1%]范围内的偏差,并且所述基向量的元素小于32。
6.根据权利要求5所述的方法,其特征在于,分别在所述第一变换系数块的水平和垂直方向上使用所述基向量,以产生相应的第二剩余像素值块。
7.根据权利要求5-6中的一个所述的方法,其特征在于,所述块表示在所述运动画面中的第一8×8像素的正方形区域。
8.根据权利要求7所述的方法,其特征在于,所述基向量被定义为:
T
[13 13 13 13 13 13 13 13]
T
[17 16 11 3 -3 -11 -16 -17]
T
[17 7 -7 -17 -17 -7 7 17]
T
[16 -3 -17 -11 11 17 3 -16]
T
[13 -13 -13 13 13 -13 -13 13]
T
[11 -17 3 16 -16 -3 17 -11]
T
[7 -17 17 -7 -7 17 -17 7]
T
[3 -11 16 -17 17 -16 11 -3]
9.一种视频编码方法,利用由多个基向量形成的变换矩阵来变换运动画面的第一剩余像素值块,以产生相应的第二变换系数块,所述变换矩阵包括以下基向量:
T
[13 13 13 13 13 13 13 13]
T
[17 16 11 3 -3 -11 -16 -17]
T
[17 7 -7 -17 -17 -7 7 17]
T
[16 -3 -17 -11 11 17 3 -16]
T
[13 -13 -13 13 13 -13 -13 13]
T
[11 -17 3 16 -16 -3 17 -11]
T
[7 -17 17 -7 -7 17 -17 7]
T
[3 -11 16 -17 17 -16 11 -3]
10.一种视频解码方法,利用由多个基向量形成的变换矩阵来变换第一变换系数块,以产生运动画面的相应的第二剩余像素值块,所述变换矩阵包括以下基向量:
T
[13 13 13 13 13 13 13 13]
T
[17 16 11 3 -3 -11 -16 -17]
T
[17 7 -7 -17 -17 -7 7 17]
T
[16 -3 -17 -11 11 17 3 -16]
T
[13 -13 -13 13 13 -13 -13 13]
T
[11 -17 3 16 -16 -3 17 -11]
T
[7 -17 17 -7 -7 17 -17 7]
T
[3 -11 16 -17 17 -16 11 -3]

说明书全文

视频编码和解码的方法

技术领域

[0001] 本发明涉及视频压缩系统,并且具体涉及一种整数变换函数。

背景技术

[0002] 在例如像视频会议、网络会议、TV广播和视频电话的若干应用中采用运动画面的实时传送。
[0003] 然而,因为一般通过利用8个比特(1字节)表示画面中的每个像素来描述数字视频,所以表示运动画面需要大量信息。这种未压缩的视频数据产生巨大的比特量,并且由于有限的带宽而无法在常规的通信网络和传输线路上实时传输。
[0004] 因此,为了能够进行实时视频传送需要很大程度的数据压缩。然而,数据压缩可能会损害画面质量。因此,已经投入了很大努来开发压缩技术,使得通过有限带宽的数据连接来实时传送高质量的视频。
[0005] 在视频压缩系统中,主要目标是利用尽可能少的容量来表示视频信息。容量利用比特来定义,被定义为恒定值或比特/时间单位。在这两种情况中,主要目标都是减少比特的数目。
[0006] 在MPEG*和H.26*标准中描述了最常见的视频编码方法。视频数据在传送之前经历四个主要过程,即预测、变换、量化和熵编码
[0007] 预测过程显著地减少了在要传输的视频序列中每个画面所需要的比特量。它利用了序列的一部分与序列的其它部分的相似性。由于预测器部分为编码器解码器所共知,所以只需传送差异。这种差异的表示通常需要少得多的容量。预测主要基于来自先前重构画面的画面内容,其中通过运动向量来定义内容的位置。一般对正方形大小(例如16×16像素)执行预测过程。应该注意,在一些情况下,基于相同画面中的邻近像素而不是先前画面的像素来使用像素的预测。与间预测相对比,这被称作帧内预测
[0008] 被表示为数据块(例如4×4或8×8像素)的剩余仍然包含内部相关性。利用这一点的公知方法是执行二维块变换。ITU推荐标准H.264使用4×4或8×8整型变换。这把n×n像素变换为n×n变换系数,并且与像素表示相比它们通常可以由更少的比特来表示。较之原始的n×n像素块,具有内部相关性的n×n像素阵列的变换可能会产生具有少得多的非零值的n×n变换系数的块。
[0009] 对于许多应用来说,变换系数的直接表示仍然代价太高。执行量化过程以进一步减小数据表示。因此,变换系数再经历量化。变换系数的可能值范围被划分为值区间,每个值区间由最高和最低的判定值来限定并且分配有固定的量化值。然后把变换系数量化成与相应系数所属的区间相关联的量化值。低于最低判定值的系数被量化为零。应当提及的是,这种量化过程导致重构的视频序列与未压缩的序列相比较多少有些不同。
[0010] 概括地说,数字视频画面经过以下步骤:
[0011] ●把画面划分为正方形像素块,例如16×16或8×8个像素。对亮度信息以及色度信息进行此操作。
[0012] ●为块中的像素生成预测。这可以基于已经编码/解码的画面中的像素(被称作帧间预测)或者基于同一画面中已经编码/解码的像素(帧内预测)。
[0013] ●形成待编码像素和预测像素之间的差异。这常常被称为剩余。
[0014] ●对剩余执行二维变换,以产生作为变换系数的表示。变换系数包括DC变换系数和AC变换系数。
[0015] ●对变换系数执行量化。这是用于控制比特生成量和重构画面质量的主要工具。
[0016] ●建立把二维变换系数数据扫描到一维数据集的扫描。
[0017] ●对所量化的变换系数执行无损熵编码。
[0018] 依照编码器的自然次序列出了以上步骤。解码器在一定程度上依照相反的次序来执行操作,并且进行“逆”操作,如逆变换代替变换以及去量化代替量化。

发明内容

[0019] 在独立权利要求中定义的本发明的特征表征了此方法。
[0020] 特别,本发明提供了一种视频编码的方法,该方法用于通过由多个基向量形成的变换矩阵来变换运动画面的第一剩余像素值块,以产生相应的第二变换系数块,其中变换矩阵从DCT或KLT导出,所述基向量接近于正交但不是完全正交的,所述基向量的范数具有小于1%的偏差,并且所述基向量的元素小于32。本发明还提供了用于视频解码的相应的逆方法。

具体实施方式

[0021] 本发明涉及在背景技术部分中描述的编码过程的变换部分。因此,将更深入地回顾变换过程。
[0022] 大部分常规的视频标准生成基于块的剩余,所述剩余在编码端经历二维变换并且在解码端经历相应的逆变换,并且通常使用可分离的变换。这意味着首先在一个方向上(例如平方向)执行一维变换,然后在另一方向上对结果使用同样的一维变换。因此只需定义和使用一维变换。
[0023] 在标准H.261、H.263、H.264和相应的MPEG标准中,使用8点的离散余弦变换(DCT)。根据信号理论,如果在剩余信号中的邻近像素之间的相关性较高,那么DCT接近于最优变换。DCT被定义为如下所列的8个实数值的基向量,精确到3位小数:
[0024] 0.354 0.354 0.354 0.354 0.354 0.354 0.354 0.354[0025] 0.490 0.416 0.278 0.098 -0.098 -0.278 -0.416 -0.490[0026] 0.462 0.191 -0.191 -0.462 -0.462 -0.191 0.191 0.462[0027] 0.416 -0.098 -0.490 -0.278 0.278 0.490 0.098 -0.416[0028] 0.354 -0.354 -0.354 0.354 0.354 -0.354 -0.354 0.354[0029] 0.278 -0.490 0.098 0.416 -0.416 -0.098 0.490 -0.278[0030] 0.191 -0.462 0.462 -0.191 -0.191 0.462 -0.462 0.191[0031] 0.098 -0.278 0.416 -0.490 0.490- 0.416 0.278 -0.098[0032] 这些基向量被认为是标准正交的,这意味着,除沿着每条线的范数或平方和等于1之外,每个向量与所有其它向量正交。
[0033] 现在定义以上数据矩阵T(i,j),i,j=0-7。i表示列编号并且j表示行编号。进一步假定8×8块的8个像素值集合f(i)将被变换为8个变换值F(j)。然后应用以下关系式:
[0034]
[0035] 逆变换或重构像素:
[0036]
[0037] 然后对每个8×8块的8个像素值集合正常地执行变换,并且然后利用相同的变换矩阵对所述结果垂直地重复整个过程。
[0038] 这种变换执行地很好,但是它的缺点在于它基于实数表示。在实现中,这将不可避免地导致一定的不精确。这种不精确对于使用不同实数内部表示的不同实现来说略有不同。这可能导致在不同的重构过程之间的失配。这种实现也较复杂。
[0039] 由于这些原因,希望使用只通过整数来描述的变换。上面定义的标准正交条件仍然是所希望的。利用整数,不可能获得“沿着每条线的平方和等于1”的条件。
[0040] 因此,改变对所有向量范数都相同的要求,但是仍然保持每个向量应当与所有其它向量正交的第一要求,这种方式是更为切实可行的。
[0041] 满足后一要求的基向量的例子是Walsh Hadamard向量。8个点的Hadamard向量如下:
[0042] 1 1 1 1 1 1 1 1
[0043] 1 1 1 1 -1 -1 -1 -1
[0044] 1 1 -1 -1 -1 -1 1 1
[0045] 1 1 -1 -1 1 1 -1 -1
[0046] 1 -1 -1 1 1 -1 -1 1
[0047] 1 -1 -1 1 -1 1 1 -1
[0048] 1 -1 1 -1 -1 1 -1 1
[0049] 1 -1 1 -1 1 -1 1 -1
[0050] 然而,此变换被证明具有其它缺点并且因此并不常使用。
[0051] 发现整数变换的更好的扩展要求集合如下:
[0052] 1.向量应当是正交的;
[0053] 2.用于定义向量的数目很小——一般小于32;
[0054] 3.向量的形状尽可能地接近相应的DCT;
[0055] 4.沿着每条线的范数或平方和对所有向量来说应当是相同的。
[0056] 难以满足所有要求——特别是对于较大的变换来说。因此以上的要求可以被认为是依照优先次序列出的。传统上,1和2被认为是强制性的,3可以只是部分满足,而4大概可以在实现中增加一定复杂度的情况下起作用。
[0057] 在早期开发H.264的过程中,使用了以下变换:
[0058] 13 13 13 13
[0059] 17 7 -7-17
[0060] 13-13-13 13
[0061] 7-17 17-7
[0062] 此向量集满足以上的要求1、2、3、4。
[0063] 近来的H.264和MPEG AVC标准使用4点和8点整数变换两者。
[0064] 对于4点变换来说,基向量是:
[0065] 1 1 1 1
[0066] 2 1-1-2
[0067] 1-1-1 1
[0068] 1-2 2-1
[0069] 此向量集满足上面的要求1、2并且部分满足上面的要求3。
[0070] 对于8点变换来说,基向量是:
[0071] 1 1 1 1 1 1 1 1
[0072] 12 10 6 3 -3 -6-10-12
[0073] 2 1 -1 -2 -2 -1 1 2
[0074] 10 -3-12 -6 6 12 3-10
[0075] 1 -1 -1 1 1 -1 -1 1
[0076] 6-12 3 10-10 -3 12 -6
[0077] 1-2 2 -1 -1 2 -2 1
[0078] 3-6 10-12 12-10 6-3
[0079] 此向量集也满足上面的要求1、2并且部分满足要求3。
[0080] 本发明人已经认识到即使进一步减少要求仍然可以在不损害画面质量的情况下改进编码效率并且减少复杂度。根据上面内容修改对变换的要求:
[0081] 1.向量的形状尽可能地接近最优变换。取决于待编码信号的统计信息,可以是基于所述信号的统计信息的DCT或Karhunen-Loève(KLT)变换。
[0082] 2.用于定义向量的数目很小,特别是<32。
[0083] 3.向量可以不是完全正交的,而是非常接近正交。
[0084] 4.向量的范数可以不是完全相同的,而是非常接近。
[0085] 在要求3和4被放松的情况下,特别是,有更多的余地来改进要求1。本发明人认识到,对3和4的放松可以足够小,使得编码/解码性能实际上是一样的,就好像完全满足3和4。
[0086] 本发明提供了一种变换向量集设计,略微放松的要求3和4而产生更好的编码性能,这主要是由于更好地满足了要求1。基向量具有接近于相应的DCT或KLT的形状,并且同时具有类似的而不是完全相等的范数。在范数之间的最大偏差应当小于1%。
[0087] 另外,基向量接近于正交而不完全正交。
[0088] 在一个方面,如果向量集的一对或多对不是正交的(非正交的),即一对或多对向量的相应向量积不等于零,并且非正交的向量对的相应向量积小于用来计算DC变换系数的基向量的范数的1%,那么基向量被认为是接近于正交而不是完全正交。用于计算DC变换系数的基向量通常是基向量矩阵的上基向量(upper basis vector)。
[0089] 在一个方面,如果向量集的一对或多对不是正交的(非正交的),一对或多对向量的相应向量积大于用来计算DC变换系数的基向量的范数的0.1%,那么基向量被认为是接近于正交而不完全正交。依然,用于计算DC变换系数的基向量通常也是基向量矩阵的上基向量。
[0090] 此外,用于指定变换向量集的数目(即,基向量的元素)很小,并且小于或等于32。
[0091] 在一个方面,基向量的元素为整数。
[0092] 根据本发明用于处理变换向量集合的第一步骤是通过使DCT向量乘以26*√2并且取整到最接近的整数来产生整数版本的DCT向量。结果将如下,在每行的右边是平方和:
[0093] 13 13 13 13 13 13 13 13 1352
[0094] 18 15 10 4 -4 -10 -15 -18 1330
[0095] 17 7 -7 -17 -17 -7 7 17 1352
[0096] 15 -4 -18 -10 10 18 4 -15 1330
[0097] 13 -13 -13 13 13 -13 -13 13 1352
[0098] 10 -18 4 15 -15 -4 18 -10 1330
[0099] 7 -17 17 -7 -7 17 -17 7 1352
[0100] 4 -10 15 -18 18 -15 10 -4 1330
[0101] 平方和指出,对于所有向量来说,范数并不是相同的,并且范数之间的偏差大于1%。
[0102] 然而,作为根据本发明用于处理变换向量集合的第二步骤,略微改变数字可以使每个向量的范数相互更为接近,并且足够接近到被认为它们具有相等的范数。除可以通过略微改变数字来获得非常接近于DCT的向量形状之外,还可以获得足够接近而被认为正交的向量之间的近似正交性。
[0103] 作为根据本发明的适当变换的一个例子,本发明人已经获得以下向量集(在每行右面的数字是相应向量的平方和):
[0104] 13 13 13 13 13 13 13 13 1352
[0105] 17 16 11 3 -3 -11 -16 -17 1350
[0106] 17 7 -7 -17 -17 -7 7 17 1352
[0107] 16 -3 -17 -11 11 17 3-16 1350
[0108] 13 -13 -13 13 13 -13 -13 13 1352
[0109] 11 -17 3 16 -16 -3 17 -11 1350
[0110] 7 -17 17 -7 -7 17 -17 7 1352
[0111] 3 -11 16 -17 17 -16 11 -3 1350
[0112] 如可以看出的,最大偏差小于1%,以及最大向量积与上基向量的范数的偏差也小于1%。
[0113] 在一个方面,最大偏差大于0%。
[0114] 在另一方面,最大偏差大于0.1%。
[0115] 在解码过程中,为了从变换系数获得剩余像素,使用倒转向量集,即,使用上述向量集的转置。
[0116] 本发明适用于任何变换大小。它还不限于近似接近于DCT。近似可以是像KLT的其它最优基向量。
相关专利内容
标题 发布/更新时间 阅读量
三分正交分频器 2020-05-12 116
采样正交解调器 2020-05-12 21
正交连接器系统 2020-05-12 720
正交底板连接器 2020-05-13 512
正交时钟除法器 2020-05-13 113
正交检测器、正交解调器及采样正交解调器 2020-05-11 10
正交望远镜 2020-05-11 174
正交导流整流器 2020-05-12 850
正交调制系统 2020-05-12 384
正交调制系统 2020-05-13 207
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈