首页 / 专利库 / 视听技术与设备 / 视频编码层 / 使用基于多层的加权预测的视频编码方法和装置

使用基于多层的加权预测的视频编码方法和装置

阅读:430发布:2021-07-30

专利汇可以提供使用基于多层的加权预测的视频编码方法和装置专利检索,专利查询,专利分析的服务。并且公开了一种用于在基于多层的视频编 解码器 中使用层间信息的有效编码多个层的方法和装置。 视频编码 方法包括各操作:读一层的加权系数;基于 运动矢量 对当前 帧 执行在参考帧上的 运动补偿 ;通过获得使用所读的加权系数的运动补偿的参考帧的加权和来为当前帧产生预测帧;以及编码在当前帧和预测帧之间的差别。,下面是使用基于多层的加权预测的视频编码方法和装置专利的具体信息内容。

1.一种用于使用在第二层的对应的图像的至少一个加权系数在第一层的 当前图像上执行加权预测的视频编码方法,该视频编码方法包括操作(a)读 该至少一个加权系数;
(b)基于对应的运动矢量对当前图像执行在至少一个参考图像上的运动 补偿;
(c)通过获得使用至少一个加权系数的至少一个运动补偿的参考图像的 加权和来为当前图像产生预测图像;以及(d)编码在当前图像和预测图像之 间的差别。
2.如权利要求1所述的视频编码方法,其中如果在包括当前的第一层 的该当前帧不是同步帧则不使用该至少一个加权系数执行操作(c)。
3.如权利要求2所述的视频编码方法,其中如果在该第二层的包括该对 应的图像的对应的帧的图像顺序计数(POC)与该当前帧的图像顺序计数一致 则确定该当前帧是同步帧。
4.如权利要求2所述的视频编码方法,其中如果该当前帧的参考方法和 参考距离与在第二层的该对应的帧的参考方法和参考距离不一致则不使用该 至少一个加权系数执行操作(c)。
5.如权利要求4所述的视频编码方法,其中该参考距离是在对应帧的 POC和该对应帧的参考帧的POC之间的差别,其中该参考帧在第二层中被用 来预测该对应的图像的帧以编码该对应的图像。
6.如权利要求1所述的视频编码方法,其中该当前图像的单位是帧、分 片、宏或运动块中的至少一种。
7.如权利要求1所述的视频编码方法,其中操作(a)包括检查该对应 的图像的预定的标志。
8.如权利要求7所述的视频编码方法,其中该预定的标志被记录在该对 应的图像的头中。
9.如权利要求1所述的视频编码方法,其中操作(c)包括:
如果有一个运动补偿的参考图像,将该至少一个加权系数乘以所述一个 运动补偿的参考图像;以及
如果有两个或多个运动补偿的参考图像,将该至少一个加权系数乘以各 个运动补偿的参考图像并且将相乘结果相加。
10.一种用于使用在第二层的对应的图像的至少一个加权系数在第一层 的当前图像上执行加权预测的视频解码方法,该视频解码方法包括操作:
(a)从输入比特流中提取在第一层的当前图像的纹理数据、至少一个运 动矢量和至少一个加权系数;
(b)基于在至少一个运动矢量中的对应的运动矢量对当前图像执行在至 少一个参考图像上的运动补偿;
(c)通过获得使用至少一个加权系数的至少一个运动补偿的参考图像的 加权和来为当前图像产生预测图像;以及
(d)将当前图像的纹理数据和预测图像相加。
11.如权利要求10所述的视频解码方法,其中如果在包括当前帧的第一 层的该当前帧不是同步帧则不使用该至少一个加权系数执行操作(c)。
12.如权利要求11所述的视频解码方法,其中如果在该第二层的包括该 对应的图像的对应的帧的图像顺序计数(POC)与该当前帧的图像顺序计数一 致则确定该当前帧是同步帧。
13.如权利要求11所述的视频解码方法,如果该当前帧的参考方法和参 考距离与在第二层的该对应的帧的参考方法和参考距离不一致则不使用该至 少一个加权系数执行操作(c)。
14.如权利要求13所述的视频解码方法,该参考距离是在对应帧的POC 和该对应帧的参考帧的POC之间的差别,其中该参考帧在第二层中被用来预 测该对应的图像的帧以编码该对应的图像。
15.如权利要求10所述的视频解码方法,其中操作(d)的纹理数据是 通过对操作(a)的纹理数据逆量化和然后逆变换而获得的结果。
16.如权利要求10所述的视频编码方法,该当前图像的单位是帧、分片、 宏块或运动块中的至少一种。
17.如权利要求10所述的视频编码方法,其中操作(a)包括检查该对 应的图像的预定的标志。
18.如权利要求17所述的视频编码方法,其中该预定的标志被记录在该 对应的图像的头中。
19.一种视频编码器,包括:
运动估计单元,其通过参考在时间位置上不同于当前图像的位置的至少 一个参考图像执行在第一层的当前图像上的运动估计来获得至少一个运动矢 量;
运动补偿单元,其使用该至少一个运动矢量执行在该至少一个参考图像 上的运动补偿;
加权预测单元,其通过获得使用被用于编码在第二层中的时间上对应的 图像的至少一个加权系数的至少一个运动补偿的参考图像的加权和为当前图 像产生预测图像;和编码在当前图像和预测图像之间的差别的单元。
20.一种视频解码器,包括:
熵解码单元,其从输入比特流中提取在第一层的当前图像的纹理数据、 在第二层中时间上对应的图像的至少一个运动矢量和至少一个加权系数;
运动补偿单元,其使用该至少一个运动矢量执行在该至少一个参考图像 上的运动补偿;
加权预测单元,其通过获得使用至少一个加权系数的至少一个运动补偿 的参考图像的加权和来为当前图像产生预测图像;和
将当前图像的纹理数据和预测图像相加的加法器。

说明书全文

技术领域

与本发明一致的方法和装置一般涉及视频编码,且更具体地,涉及一种 用于在基于多层的视频编解码器中使用层间信息有效地编码多个层的方法和 装置。

背景技术

随着包括因特网的信息和通信技术发展,基于图像的通信,以及基于文 字的通信和基于语音的通信正在增加。现有的基于文字的通信不能够充分满 足消费者的各种需求。因此,能够容纳诸如文字、图像和音乐一样的各种类 型的信息的多媒体服务的提供正在增加。由于多媒体数据的尺寸大,其要求 高容量的存储介质和在传输时的宽带宽。例如,具有解析度640×480的24位 真彩图像要求每640×480×24,即,大约7.37Mbits数据。为了以30帧每秒 的速率传输这样的图像,要求221Mbits/sec的带宽。此外,为了存储90分钟 的电影,要求大约1200Gbits的存储空间。因此,为了传输包括文字、图像和 音频的多媒体数据,使用压缩编码技术是关键。
数据压缩的基本原理是消除数据中的冗余。能够通过消除各种冗余压缩 数据,如空间冗余,诸如在图像中重复一致的颜色或对象的情况;时间冗余, 诸如在相邻帧之间少有改变或重复一致的声音的情况;心理视觉冗余,其考 虑人类视觉和听觉对高频的不敏感性。数据压缩能够被分类为有损/无损压 缩,帧内/帧间压缩,或对称/不对称压缩,这分别取决于源数据是否丢失,压 缩是否对各自帧独立地执行,以及压缩和解压缩是否要求相同的时间量。关 于这点,压缩-解压缩延迟时间不超出50ms的情况被分类为实时压缩,以及 帧的解析度是可变的情况被分类为分层压缩。对于文字数据和医疗数据,主 要利用无损压缩,以及对于多媒体数据,主要利用有损压缩。为了消除空间 冗余,利用帧内压缩,以及为了消除时间冗佘,利用帧间压缩。
性能根据传输介质有区别。当前使用的传输介质具有各种传输速度,范 围从甚高速通信网络的速度(其能够以几十兆bits/s的传输速率传输数据)到 移动通信网络的速度(其能够以384Kbits/s的传输速率传输数据)。诸如运动 图像专家组(MPEG)-1、MPEG-2、H.263和H.264一样的传统视频编码方 案使用运动补偿消除空间冗余,和使用基于运动补偿预测方法的变换编码消 除空间冗余。这些方案获得期望的压缩率,但是对真正分层的比特流不具有 灵活性,因为该主要算法使用递归的办法。因此,最近,正积极地进行基于 小波的分层视频编码。分层的视频编码指的是可分层的视频编码技术。分层 指的是一种特性,在其中,能够根据单个压缩的比特流执行部分解码,即视 频的不同片断的播放。概念分层包括能够调整视频的解析度的空间分层,能 够调整视频质量信噪比(SNR)分层,能够调整帧速率的时间分层,以及 它们的组合。
联合视频组(JVT),即,MPEG和国际电信联盟(ITU)的联合体正将 H.264分层扩展(H.264SE)标准化。H.264特征在于它基本上无改变地采用 绝大部分基于H.264的编码技术,但是使用层间相关性以便编码多个层。多 个层在解析度、帧速率或SNR中有区别。因此,正提出用于当编码上层的数 据时有效地利用有关低层的信息的各种技术。
图1是说明在现有H.264标准中提出的加权预测的图。加权预测指的是 用于通过近似地分层参考帧,而非简单地求参考帧平均,来增加预测效率的 技术。
在当前帧10内的运动11(对其分配运动矢量的宏块或子宏块)经过 前向运动矢量22对应于左参考帧20的图像21,以及经过后向运动矢量32 对应于右参考帧30的图像31。
在从图像21和31中获得预测图像后,编码器通过从运动块11中减去该 预测的图像来减少对于运动块11所需的数据量。
当没有利用加权预测,简单地通过将图像21和31求平均获得预测的图 像。但是,一般,运动矢量块11并不与左图像21和右图像31的平均一致, 从而不可能获得精确的预测图像。
因此,在H.264中,基于分片确定加权系数w0和w1以及使用通过将图 像21和31乘以加权系数w0和w1并将结果相加获得的最终结果作为预测 图像。该分片可以由多个宏块组成,或可以对应于一帧。多个分片可以组成 单个帧。这里,能够通过调整该加权系数w0和w1获得相对运动块11具有 非常小的差别的预测图像,以及通过从运动块11中减去预测图像能够提高编 码效率。

发明内容

技术问题
H.264的加权预测非常有效,但是仅应用于简单的单层编码。当前并未 进行如何将加权预测应用于基于多层的分层视频编码的研究。
本发明的一方面,提供了当为另一层执行加权预测时被使用的一种在基 于多层的视频编解码器中,用于使用加权系数对一层执行加权预测的方法和 装置。
根据本发明的一方面,提供一种使用在第二层的对应的图像的至少一个 加权系数在第一层的当前图像上执行加权预测的视频编码方法,该视频编码 方法包括操作(a)读该至少一个加权系数;(b)基于对应的运动矢量对当前 图像执行在至少一个参考图像上的运动补偿;(c)通过获得使用至少一个加 权系数的至少一个运动补偿的参考图像的加权和来为当前图像产生预测图 像;以及(d)编码在当前图像和预测图像之间的差别。
根据本发明的一方面,提供一种使用在第二层的对应的图像的至少一个 加权系数在第一层的当前图像上执行加权预测的视频解码方法,该视频解码 方法包括操作(a)从输入比特流中提取在第一层的当前图像的纹理数据、至 少一个运动矢量和至少一个加权系数;(b)基于在至少一个运动矢量中的对 应的运动矢量对当前图像执行在至少一个参考图像上的运动补偿;(c)通过 获得使用至少一个加权系数的至少一个运动补偿的参考图像的加权和来为当 前图像产生预测图像;以及(d)将当前图像的纹理数据和预测图像相加。
根据本发明的一方面,提供一种视频编码器,包括运动估计单元,其通 过参考在时间位置上不同于当前图像的位置的至少一个参考图像执行在第一 层的当前图像上的运动估计来获得至少一个运动矢量;运动补偿单元,其使 用该至少一个运动矢量执行在该至少一个参考图像上的运动补偿;加权预测 单元,其通过获得使用至少一个加权系数(其被用于编码在第二层中的时间 上对应的图像)的至少一个运动补偿的参考图像的加权和为当前图像产生预 测图像;以及编码在当前图像和预测图像之间的差别的单元。
根据本发明的一方面,提供一种视频解码器,包括熵解码单元,其从输 入比特流中提取在第一层的当前图像的纹理数据、在第二层中时间上对应的 图像的至少一个运动矢量和至少一个加权系数;运动补偿单元,其使用该至 少一个运动矢量执行在该至少一个参考图像上的运动补偿;加权预测单元, 其通过获得使用至少一个加权系数的至少一个运动补偿的参考图像的加权和 来为当前图像产生预测图像;以及将当前图像的纹理数据和预测图像相加的 加法器。
附图说明
根据结合附图的以下详细描述,本发明的上述和其它目的、特征及优点 将更加清楚,其中:
图1是说明在现有H.264标准中提出的加权预测的图;
图2是说明根据本发明的示范实施例的基于多层的加权预测方法的流程 图;
图3是说明根据本发明的示范实施例的图2的操作S50的详细操作的流 程图;
图4是根据本发明的示范实施例,说明基于多层的视频结构的图,在其 中上层帧的解析度是下层帧的解析度的两倍,以及两层的帧速率相同;
图5是根据本发明的示范实施例,说明基于多层的视频结构的图,在其 中上层和下层均具有MCTF结构;
图6是根据本发明的示范实施例,说明基于多层的视频结构的图,在其 中上层和下层均具有分等级的B结构;
图7是根据本发明的示范实施例,说明基于多层的视频结构的图,在其 中上层具有MCTF结构和下层具有分等级的B结构;
图8是根据本发明的示范实施例,说明基于多层的视频结构的图,在其 中两层的帧速率均相同,以及各帧具有多种参考方法;
图9是显示根据本发明的示范实施例的视频编码器的结构的框图
图10是显示根据本发明的示范实施例的视频解码器的结构的框图;以及
图11说明根据本发明的示范实施例的用于实现视频编码器或视频解码 器的系统的结构的图。

具体实施方式

以下将参照附图来详细描述本发明的示例实施例。
能够使用以下等式1计算基于H.264的加权预测的预测图像(predPart)。 predPartL0指示左参考帧的对应图像以及predPartL1指示右参考帧的对应图 像。
predPart=w0x predPartL0+w1x predPartL1                  (1)
该加权预测包括显式(explicit)加权预测和隐式(implicit)加权预测。
在显式加权预测中,加权系数w0和w1由编码器估计,并且被包括在 分片头中以及被传输到解码器。在隐式加权预测中,加权系数w0和w1不被 传输到解码器。相反,解码器基于参考帧L0(List 0)和参考帧L1(List 1) 的相对时间位置估计加权系数w0和w1。在此情况下,L0指示前向参考帧 (时间上领先的参考帧),而L1指示后向参考帧(时间上在后的参考帧)。
在H.264中,存在诸如I分片类型、P分片类型和B分片类型一样的分 片类型。显式加权预测能够被用于P分片,以及显式加权预测和隐式加权预 测均能够用于B分片。结果,三种类型可以存在。
将一个或多个加权系数分配默认值。因此,在不使用加权预测的模式中, 使用默认值。在双向参考(B分片类型)中,w0和w1的默认值是1/2(简 单平均数)。在单向参考(P和SP分片类型)中,w0或w1的默认值是1。
下面描述在H.264中使用的三种加权预测类型。
第一,当weighted_pred_flag是1时执行关于P分片类型的显式加权预测, 以及参考类型是单向参考。在此情况下,使用下面的公式2能够获得预测图 像。
predPart=wxxpredPartLx
其中x是0或1                                      (2)
在比特流的分片头中编码有关预测系数wx的信息并且然后被传输到解 码器。
第二,当weighted_bipred_flag是1时执行关于B分片类型的显式加权预 测,以及参考类型是双向参考。在此情况下,使用上面的公式1能够获得预 测图像。在比特流的分片头中编码有关预测系数w0和w1的信息并且然后被 传输到解码器。
第三,当weighted_bipred_flag是2时执行关于B分片类型的隐式加权预 测,以及参考类型是双向参考。在此情况下,有关w0和w1的信息没有被传 输到解码器,而是通过H.264解码器的加权预测过程估计和产生。考虑了参 考帧的时间距离来设计该加权预测过程。
隐式预测相对显式预测的优点是不产生开销,因为没有必要在比特流中 记录有关加权预测的分离的信息。然而,隐式预测不够有利的是恢复帧的质 量可能退化,因为在解码器中估计的w0和w1与在编码器中计算的w0和w1 并不一致。
本发明提出一种通过将下层的加权系数应用到上层来在上层执行加权预 测且无需改变多层视频编解码器的方法。联合视频组(JVT)在其工作草案 中采用联合分层视频模型(JSVM)。JSVM的下层与H.264兼容。因此,为 了对JSVM应用本发明,优选的,但不是必须的,与H.264一致地编码该下 层。然而,本发明并不局限于此,而是能够应用于在下层使用加权系数的情 况。
加权预测在淡入或淡出视频序列中工作非常有效。如果由基于多层的编 解码器以如JSVM的相同方式编码该淡入或淡出视频序列,则期望该上层的 加权系数将与下层的加权系数相似。同时,在残差预测的情况下,对具有相 应的下层分片的分片应用相同的加权预测将是更合适的。残差预测是通过将 经过在上层的时间预测产生的残差信号和经过在下层的时间预测产生的并且 位于如以前的残差信号的相同的时间位置处的残差信号彼此相减而进一步增 强编码效率的方法。残差预测是包括在JSVM中的。
图2是说明根据本发明的示范实施例的基于多层的加权预测方法的流程 图。如果在操作S10中输入上层的当前帧,则在操作S20中编码器确定当前 帧是否是同步帧。在本发明中,术语“同步帧”指示在下层具有相应的帧的 上层的帧,即,具有相同时间位置的帧(在下文中指示为“基帧”)。因此, 术语“非同步帧”指示在下层不具有相应的帧的上层的帧。能够依靠在JSVM 中定义的图像顺序计数(POC)是否相同确定该时间位置是否相同。
作为在操作S20中确定的结果,如果当前帧被确定是同步帧(在操作S20 中为YES),则在操作S30中编码器确定该当前帧的参考方法和参考距离分别 地是否与基帧的那些相同。参考方法可以包括前向参考、后向参考、双向参 考和多参考。此外,参考距离指示在参考将对其实现的帧和参考帧之间的时 间距离。在JSVM中,时间距离能够被表示为在参考将对其实现的帧的POC 和参考帧的POC之间的差别。
作为在操作S30中确定的结果,如果确定该当前帧的参考方法和参考距 离是与基帧的那些相同(在操作S30中为YES),则在操作S40中编码器确 定加权预测是否被用于基帧。根据JSVM,能够通过检查基帧(或基分片) 的weighted_pred_flag或weighted_bipred_flag确定加权预测是否被用于基帧。
如上描述的,在基分片是P分片的情况下,当weighted_pred_flag的值是 1时指示使用(显式)加权预测的情况,当weighted_pred_flag的值是0时指 示未使用加权预测的情况。此外,在基分片是B分片的情况下,当 weighted_bipred_flag的值是0时指示未使用加权预测的情况,当 weighted_pred_flag的值是1时指示使用(显式)加权预测的情况,以及当 weighted_bipred_flag的值是1时指示使用(隐式)加权预测的情况。
作为在操作S40中确定的结果,如果确定对基帧使用提出的加权预测(下 文中,层间加权预测)(在操作S40中为YES),则在操作S50中编码器对当 前帧应用加权预测。
同时,如果当前帧是非同步帧(在操作S20中为NO),该当前帧的参考 方法与基帧的参考方法不同(在操作S30中为NO)或未对基帧使用加权预 测(在操作S40中为NO),则在操作S60中不对当前帧应用加权预测或将传 统的加权预测(隐式加权预测、显式加权预测等)应用于当前帧。
图3是说明根据本发明的示范实施例的图2的操作S50的详细操作的流 程图。
在操作S51中,编码器首先读基帧的加权系数w0和/或w1。即使编码器 能够从分片头中读加权系数,其读在被记录到分片头之前,先前存储在存储 器中的加权系数的参数类型。
之后,在操作S52中编码器使用运动矢量为当前帧执行在参考帧上的运 动补偿。在运动补偿过程中,使用经过运动估计过程估计的运动矢量。当存 在多个参考帧时,必须使用相应的运动矢量执行在各自帧的每个上的运动补 偿。
此外,在操作S53中,编码器将运动补偿的参考帧乘以加权系数w0和/ 或w1并且将与加权系数相乘的参考帧与当前帧相加。作为相加的结果获得预 测帧(预测分片)。
在操作S54中,编码器计算在当前帧(或分片)和预测帧(或分片)之 间的差别,以及在操作S55中,编码器编码该计算的差别。
在上层中,没有涉及层间加权预测的额外的标志或加权系数需要被传输 到解码器。解码器能够没有改变地使用下层的标志和加权系数。
图4到8是显示能够应用本发明的各种上下层结构的示范图。在附图中, 图4显示这样的情况,根据本发明的示范实施例,上层(层2)帧的解析度 是下层(层1)帧的解析度的两倍,各层的帧速率均相同,并且两层均具有 单个时间级别。在图4,“I”表示I帧(或分片),“P”表示P帧(或分片) 以及“B”表示B帧(或分片)。
从图4中,能够看到参考帧相对各自的层具有相同位置,因为在各层之 间的对应的帧具有相同的参考方法和参考距离,即便各层具有不同的解析度。 能够无需改变地使用基帧的加权系数编码或解码具有相应的具有相同参考方 法和参考距离的基帧(下层帧)的上层的当前帧。只要与当前帧不相邻的帧 具有相同的参考方法,该帧可以被用作参考帧。
图5显示这样的情况,根据本发明的示范实施例,上层(层2)和下层 (层1)均具有MCTF结构。参考图5,上层的帧速率是下层的两倍。因此, 上层的时间级别的数目比下层的时间级别的数目大1。本发明能够被应用于 上层和下层两者均具有分等级的时间级别结构。即,能够无改变地分别使用 对应的基帧57、58和59的加权系数有效地编码或解码满足结合图2描述的 条件的上层的高频帧的帧54、55和56。然而,仅存在于最高级(级2)的高频 帧50、51、52和53并没有对应的基帧,因此对于高频帧50、51、52和53 不应用加权预测或应用传统的加权预测。
图6显示这样的情况,根据本发明的示范实施例,其中上层(层2)和 下层(层1)均具有H.264的分等级的B结构。在图6中,上层的帧速率是 下层的两倍。在分等级的B结构中,不同于MCTF执行时间解析度。即,级 别越低,帧速率越高。假设上层的帧速率是A,如果解码器想要具有A/4的 帧速率的视频则编码器能够传输仅仅级2的帧,并且如果解码器想要具有A/2 的帧速率的视频则编码器能够传输仅仅存在级2和级1的帧。当然,如果解 码器想要具有A的帧速率的视频,则编码器能够传输全部的帧。
本发明也能够被应用于上下层二者均具有分等级的B结构的情况。例如, 高频帧61具有如对应的基帧64那样的相同的参考方法和参考距离,并且高 频帧62具有如对应的基帧65那样的相同的参考方法和参考距离。因此,能 够无改变地使用对应的基帧64和65的加权系数在高频帧61和62上执行加 权预测。相反,高频帧63不具有对应的基帧,并且因此不应用加权预测或对 其应用传统的加权预测。
图7说明这样的情况,根据本发明的示范实施例,其中上层(层2)具 有MCTF结构和下层(层1)具有分等级的B结构。在此情况下,存在于上 层的级2的高频帧不具有对应的基帧,并且因此不应用加权预测或对其应用 传统的加权预测。同时,存在于级1或级0的高频帧具有对应的基帧。例如, 高频帧72的对应基帧是帧75。帧72和帧75是彼此不同的,因为帧72是 MCTF帧而帧73是分等级的B帧。然而,只要各帧具有相同的参考方法和参 考距离,能够无妨碍地对其应用层间加权预测。由于帧72具有如同帧75的 相同参考方法和参考距离,能够使用对其应用层间加权预测。以相同的方式, 能够无改变地使用帧74的加权系数在帧73上执行层间加权预测。
图8说明这样的情况,根据本发明的示范实施例,其中上层和下层每个 具有单个时间级,并且上层的全部高频帧具有相应的基帧。然而,具有如基 帧的相同的参考方法和参考距离的高频帧,和不具有如基帧的相同的参考方 法和参考距离的高频帧同时存在。
例如,高频帧81具有如同相应的基帧85的相同的参考方法和参考距离, 因为它们具有双向参考方法和参考距离为1。高频帧82具有如同相应的基帧 86的相同的参考方法和参考距离,因为它们具有后向参考方法和参考距离为 1。然而,高频帧83和84不具有如同相应的基帧的相同的参考方法,且因此 不应用加权预测或对其应用传统的加权预测。
图9是说明根据本发明的示范实施例的视频编码器100的结构的框图。 将当前帧F输入运动估计单元105、减法单元115和向下采样器170。
下采样器170对当前帧F空间上和/或时间上向下采样,并且提供向下 采样的当前帧至下层编码器180。下层编码器180接收向下采样的当前帧并 且输出下层的编码数据B。下层编码器180使用各种类型的编码方法的一种, 并且提供包括加权系数的下层信息到加权预测单元160。在本发明的示范实 施例中,由于对于下层编码器180具有用于经过传统的加权预测执行编码的 功能是足够的,关于下层的编码算法不在本发明的示范实施例的范围内。因 此,下层编码器180由一个模块表示。然而,由于使用加权预测的H.264被 用于当前单个层,下层编码器180优选地基于H.264的编码器,但这不是必 须的。
以下详细描述上层的操作。
运动估计单元105通过参考在时间位置不同于当前帧的时间位置的参考 帧执行在当前帧上的运动估计获得运动矢量。同时,原始图像Fr(对于开环 编码)或解码图像Fr‘(对于闭环编码)能够被用作参考帧。假设本发明的示 范实施例的视频编码器100使用闭环编码方法给出以下说明。
对于运动估计,块匹配算法被广泛地使用。即,该块匹配算法提供当在 参考帧的指定搜索区域内基于像素或子像素(1/2像素或1/4像素)移动预定 块时估计作为运动矢量具有最小误差的位移的过程。尽管对于运动估计可以 使用固定的块,可以使用基于分等级的不同大小块匹配(HVSBM)的分等级方 法。
运动补偿单元110通过使用运动矢量在参考帧Fr′上执行运动补偿获得 运动补偿帧mc(Fr′)。如果存在多个参考帧Fr′,则应当对多个参考帧运动 补偿。
加权预测单元160根据参考图2描述的算法确定是否对当前帧应用层间 加权预测。为此,加权预测单元160能够接收有关下层帧的时间位置的信息 (例如,POC),有关参考方法的信息(例如,L0、L1),有关参考距离的信 息(例如,POC差异)和加权系数(例如,w0和w1)。
如果确定应当应用层间加权预测,则能够通过获得使用基帧的加权系数 的运动补偿参考帧mc(Fr′)的加权和产生关于当前帧的预测帧P。术语“加 权和”指示各个加权系数和相应的参考帧(运动补偿的参考帧)的乘积和乘 积的相加。当有一个参考帧时,加权系数简单地与参考帧相乘。
同时,如果确定不应当应用层间加权预测,则使用加权系数的默认值产 生预测帧P,即不使用基帧的加权系数。因此,在双向参考的情况下,能够 通过将每个运动补偿参考帧乘以1/2并且然后将相乘结果相加来产生预测帧 P。在单向参考的情况下,运动补偿参考帧能够无改变地被用作预测帧P。
减法单元115提供参差信号R到变换单元120,通过从当前帧F中减去 预测帧计算该参差信号R。
变换单元120通过使用离散余弦变换(DCT)、小波变换或其它执行在参 差信号R上的空间变换产生变换系数RT。当使用DCT时,变换系数是DCT 系数。当使用小波变换时,变换系数是小波系数。
然后,量化单元125量化变换系数。术语“量化”指示将作为预定实数 的变换系数表示为离散值。例如,量化单元125能够通过将变换系数除以预 定的量化步长并且将结果取整为整数值来执行量化。
通过量化单元125获得的量化结果,即,量化系数RQ,被提供到熵编码 单元150和逆量化单元130。
逆量化单元130逆量化该量化系数。逆量化过程是从在量化过程中使用 在量化过程中使用的量化步长产生的索引中恢复匹配值的过程。
逆变换单元135在逆量化结果上执行逆变换过程。按相对变换单元120 的变换过程的逆向的方式执行逆变换过程。更具体地,可以使用逆DCT变换、 逆小波变换或其它。加法器140能够通过将逆变换结果和在运动补偿单元110 的运动补偿过程中使用的预测帧P相加产生恢复的当前帧F′。
缓冲器145存储由加法器140提供的结果。因此,缓冲器145可以不仅 存储该恢复的当前中F′而且存储恢复的参考帧Fr。
熵编码单元150无损地将在运动估计单元105中估计的运动矢量MV、 由量化单元125输出的量化系数RQ、以及由下层编码器180输出的数据B编 码成比特流。诸如霍夫曼编码、算术编码和可变长编码一样的各种方法之一, 可以被用于该无损编码方法。
图10是显示根据本发明的示范实施例的视频解码器200的结构的框图。
熵解码单元210无损地解码输入的比特流,并且提取下层的编码数据B、 上层的运动矢量MV和上层的纹理数据RQ。无损解码是以相对在编码器中执 行的无损编码过程的逆向的方式执行的过程。
提取的下层的编码数据B被提供给下层解码器290,提取的运动矢量MV 被提供给运动补偿单元260,以及纹理数据RQ被提供给逆量化单元220。
下层解码器290使用相应于图9的下层编码器180使用的方法的解码方 法,并且提供包括加权系数的下层信息到加权预测单元270。下层信息能够 被插入比特流。尤其,可以在帧头或分片头中记录加权系数。下层解码器290 将下层信息提供给加权预测单元270。下层解码器290能够是基于H.264的 解码器。
逆量化单元220逆量化纹理数据RQ。逆量化过程是从在量化过程中使用 在量化过程中使用的量化表产生的索引中恢复匹配值的过程。
逆变换单元230在逆量化结果上执行逆变换过程。按相对在编码器中执 行的变换过程的逆向的方式执行逆变换过程。更具体地,可以使用逆DCT变 换、逆小波变换或其它。作为逆变换的结果恢复的残差信号R′被送至加法 器240。
运动补偿单元260通过使用提取的运动矢量MV在先前恢复的且存储在 缓冲器250中的下层的参考帧Fr′上执行运动补偿产生运动补偿帧mc(Fr′), 并且发送该产生的运动补偿帧mc(Fr′)至加法器240.如果存在多个参考帧 Fr',则必须在多个参考帧的每个上执行运动补偿。
加权预测单元270根据参考图2描述的算法确定是否对当前帧应用层间 加权预测。为此,加权预测单元270能够接收有关下层帧的时间位置的信息 (例如,POC),有关参考方法的信息(例如,L0、L1),有关参考距离的信 息(例如,POC差异)和加权系数(例如,w0和w1)。
如果确定应当应用层间加权预测,则通过将运动补偿参考帧mc(Fr′) 乘以加权系数来产生预测帧P。当然,如果存在多个参考帧时,则能够通过 将相应的参考帧乘以加权系数,并且然后将相乘结果相加来产生预测帧P。
同时,如果确定不应当应用层间加权预测,则使用加权系数的默认值产 生预测帧P,即不使用基帧的加权系数。因此,在双向参考的情况下,能够 通过将每个运动补偿参考帧乘以1/2并且然后将相乘结果相加来产生预测帧 P。在单向参考的情况下,运动补偿参考帧能够无改变地被用作预测帧P。
加法器240将接收的R′和P相加并且输出恢复的当前帧F′。缓冲器 250临时存储该恢复的帧F′。因此,缓冲器250不仅存储帧F′而且存储先 前存储的参考帧Fr′。
虽然已经作为基于帧执行描述了凭借下层的加权系数的上层的层间加权 预测,这仅是说明性的。能够与在下层使用的一致的基础(帧、分片、宏块、 运动块等)上执行上层的层间加权预测。虽然如具有两层一上层和下层的多 层已经被描述,这仅是说明性的。那些本领域的技术人员将理解本发明能够 被应用于介于对其已经应用加权预测的一层到另一层之间,即使存在三或更 多层。
图11说明根据本发明的示范实施例的用于实现视频编码器100或视频解 码器200的系统的结构的图。该系统可以是电视机(TV)、机顶盒、台式计 算机、膝上型计算机、掌上型计算机、个人数字助理(PDA)或视频或图像 存储设备(例如,视频盒式录像机(VCR)或数字视频录像机(DVR))。此 外,该系统可以是以上描述的设备的组合,或以上描述的设备的一个可以被 包括在另一个中。该系统可以包括至少一个视频源910、至少一个输入/输出 (I/O)设备920、处理器940、存储器950和显示设备930。
视频源910可以是TV接收器、VCR或另一类型的视频存储设备。此外, 视频源910可以是用于经由因特网、广域网(WAN)、局域网(LAN)、陆地 广播系统、有线网络、卫星通信网络、无线网络、电话网络等从服务器接收 视频的至少一种网络连接。此外,视频源可以是以上描述的网络的组合,或 以上描述的网络的一个可以被包括在另一个中。
I/O设备920、处理器940和存储器950经由通信介质960彼此通信。通 信介质960可以是通信总线、通信网络或至少一种内部连接电路。可以由处 理器940依照存储在存储器950中的至少一种软件程序处理从视频源910接 收的输入视频数据,并且可以由处理器940执行以致于产生提供给显示设备 930的输出视频。
尤其,存储在存储器950中的软件程序可以包括执行根据前述的本发明 的示范实施例的方法的基于多层的视频编解码器。该编解码器可以被存储在 存储器950中,可以从诸如CD-ROM或软盘一样的存储介质中读取,或可以 经由各种网络之一从预定的服务器中下载。该编解码器可以是完全基于软件 的,完全基于硬件的或软件和硬件电路的组合。
工业适用性
如上描述,依照根据本发明的示范实施例的视频编码器/解码器,能够无 改变地使用相应基帧的加权系数。因此,加权预测能够被有效地在增强层的 各帧上执行而无须向解码器传送额外的信息。
经过加权预测进一步提高视频数据的编码效率是可能的。
虽然出于说明的目的已经公开了本发明的优选实施例,本领域的那些技 术人员将理解各种修改、增加和替换是可能的,且不脱离如同所附权利要求 中公开的本发明的范围和宗旨。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈