首页 / 专利库 / 视听技术与设备 / 视频编码层 / 分层视频编码系统、译码系统及其编码方法和译码方法

分层视频编码系统、译码系统及其编码方法和译码方法

阅读:785发布:2021-09-15

专利汇可以提供分层视频编码系统、译码系统及其编码方法和译码方法专利检索,专利查询,专利分析的服务。并且用于在分层 视频编码 框架 中实现复杂度可缩放性的 编码器 和译码器系统。分层视频编码器包括:基本层编码器,用于接收视频 信号 和输出基本 层流 ;和增强层编码器,它包括多个离散余弦变换(DCT)模 块 和用于选择其中一个DCT模块的选择系统。分层视频译码系统包括:基本层译码器,用于接收和译码基本层 视频流 ;和增强层译码器,用于接收增强层视频流和所译码的基本层流,并生成译码的增强的视频输出,其中该增强层译码器包括:多个反离散余弦变换(IDCT)模块;和用于选择其中一个IDCT模块的选择系统。,下面是分层视频编码系统、译码系统及其编码方法和译码方法专利的具体信息内容。

1.一种分层视频编码系统,包括:-基本层编码器(14),用于接收视频信号(20)和输出基本层流(22);以及-增强层编码器(32),所述系统的特征在于:该增强层编码器包括多个离散余弦变换模(30)和一个用于选择其中一个离散余弦变换模块的选择系统(34)。
2.权利要求1的分层视频编码系统,其中多个离散余弦变换模块(30)中的每个包括不同的精度
3.权利要求1的分层视频编码系统,其中选择系统(34)基于从以下列表中选定的准则来选择其中一个离散余弦变换模块:-可用的计算资源平;-编码比特率;-所要求的质量水平;-译码器能;以及-带宽可用性。
4.一种以分层的方式编码视频信号的方法,该方法包括:-在基本层编码系统(14)中接收该视频信号(20);-输出所编码的基本层流(22);-从基本层编码系统接收数据到增强层编码系统(32)中;-在增强层编码系统(32)中配置多个离散余弦变换模块(30);所述方法的特征在于:-选择多个离散余弦变换模块之一;以及-使用所选择的离散余弦变换模块来生成编码的增强层流。
5.一种分层视频译码系统,包括:-基本层译码器(42),用于接收和译码基本层视频流(54);以及-增强层译码器(60),用于接收增强层视频流(52)和生成译码的增强的视频输出(72),所述系统的特征在于该增强层译码器(60)包括:-多个反离散余弦变换模块(68);以及-用于选择其中一个反离散余弦变换模块的选择系统(64)。
6.权利要求5的分层视频译码系统,其中多个反离散余弦变换模块(68)中的每个包括不同的精度。
7.权利要求5的分层视频译码系统,其中选择系统(64)基于根据下列项组成的组中的一个来选择其中一个反离散余弦变换模块:-可用的计算资源水平;-优选的比特率;-所要求的质量水平;以及-通信带宽
8.一种译码分层视频流的方法,该方法包括:-接收所编码的基本层流(54)到基本层译码器(42)中;-译码所编码的基本层流和生成所译码的基本层流;-配置增强层译码器(60);所述方法的特征在于所述增强层译码器具有多个反离散余弦变换模块(68),所述方法还包括:-接收所编码的增强层流(52)到增强层译码器(60)中;-选择多个反离散余弦变换模块之一;以及-使用所选择的反离散余弦变换模块来译码该编码的增强层。

说明书全文

分层视频编码系统、译码系统及其编码方法和译码方法

技术领域

发明总地涉及在视频编码器和译码器系统中复杂度可缩放性(complexity scalability)的实现,更具体地,涉及在实施分层的视频编码框架,诸如精细粒度可扩展性(Fine-Granularity-Scalability(FGS),技术的编码器和译码器系统中用于实现增强层中复杂度可缩放性的系统和方法。

背景技术

在诸如MPEG-2,MPEG-4等等的视频编码系统中,离散余弦变换(DCT)和反离散余弦变换(IDCT)运算对于编码质量是关键的。不幸地是,这些运算给视频数据的编码和译码增加了很大的计算复杂性和成本。计算上的费用导致对通过无线或有线网络采用的实时视频压缩/传输应用的显著的约束。
在基于运动估计的视频框架中(即,MPEG),一个正向DCT和一个IDCT被嵌入在编码器的运动估计环路中。正如所指出的,在IEEE1180-1990中标准化的DCT的精度对于编码效率是关键的。在译码器方面,IDCT必须具有相同的精度以保持译码质量。DCT与IDCT的精度之间的任何失配将造成偏移,所述偏移导致总的视频质量的显著恶化。
给定这些精度要求后,很难提供一种允许缩放DCT和IDCT运算以满足各个系统的计算要求的编码器和译码器系统。然而,在分层的视频编码框架中,诸如MPEG-4中的精细粒度可扩展性(FGS)编码配置文件中,视频序列被编码成两个比特流:基本层(BL)视频流和增强层(EL)视频流。在FGS中,只有BL通过利用运动估计编码方案的非可缩放的编码方案来编码。通过使用比特平面编码对在DCT域的原始信号与BL信号之间的差值进行编码的EL不使用运动估计编码。因此,在分层视频编码系统中存在缩放DCT和IDCT运算的机会。

发明内容

本发明通过提供具有多种精度DCT/IDCT的复杂度可缩放性的增强层处理而解决上述的问题以及其他问题。第一方面,本发明提供分层的视频编码系统,包括:基本层编码器,用于接收视频信号和输出基本层流;和增强层编码器,所述系统的特征在于:该增强层编码器包括多个离散余弦变换(DCT)模和用于选择其中一个DCT模块的选择系统。
第二方面,本发明提供存储在可记录媒体上的、用于编码分层的视频信号的程序产品,该程序产品包括:用于接收视频信号和输出编码的基本层流的装置;和用于编码增强层的装置,其中增强层编码装置包括多个离散余弦变换(DCT)模块和用于选择其中一个DCT模块的选择装置。
第三方面,本发明提供以分层的方式编码视频信号的方法,该方法包括:在基本层编码系统中接收视频信号;输出所编码的基本层流;从基本层编码系统接收数据到增强层编码系统中;在增强层编码系统中配置多个离散余弦变换(DCT)模块;所述方法的特征在于:选择多个DCT模块之一;以及使用所选择的DCT模块来生成编码的增强层流。
第四方面,本发明提供分层视频译码系统,包括:基本层译码器,用于接收和译码基本层视频流;和增强层译码器,用于接收增强层视频流和生成所译码的增强的视频输出,所述系统的特征在于增强层译码器包括:多个反离散余弦变换(IDCT)模块;和用于选择其中一个IDCT模块的选择系统。
第五方面,本发明提供存储在可记录的媒体上的、用于译码分层视频流的程序产品,该程序产品包括:用于接收和译码基本层视频流的装置;和用于接收增强层视频流和生成所译码的增强的视频输出的装置,包括:多个反离散余弦变换(IDCT)模块;和用于选择其中一个IDCT模块的装置。
第六方面,本发明提供译码分层视频流的方法,该方法包括:接收编码的基本层流到基本层译码器中;译码所编码的基本层流和生成译码的基本层流;配置具有多个反离散余弦变换(IDCT)模块的增强层译码器;所述方法的特征在于所述增强层译码器具有多个反离散余弦变换模块,所述方法还包括:接收所编码的增强层流到增强层译码器中;选择多个IDCT模块之一;以及通过使用所选择的IDCT模块译码所编码的增强层。
附图说明
结合附图,将从本发明的各个方面的以下详细说明中更容易地理解本发明的这些和其他特性,其中:图1描绘已知技术的FGS编码器。
图2描绘按照本发明的一个实施例的、具有多重精度DCT的FGS编码器。
图3描绘已知技术的FGS译码器。
图4描绘按照本发明的一个实施例的、具有多重精度IDCT的FGS译码器。
图5描绘表示速率失真相对复杂性的曲线图。

具体实施方式

对于本说明来说,以下的实施例是参考SNR(信号噪声比)-FGSMPEG4视频编码框架描述的。然而,应当理解,本发明可应用于其中增强层没有运动估计环路的任何分层的视频编码框架。实例包括MJPEG以及大多数SNR可缩放的框架。预期:SNR-FGS系统的原理和概念对于本领域技术人员是已知的,所以,这里不描述这样的细节。
现在参照附图,图1是现有技术FGS编码器10的图。FGS编码器10包括基本层编码器14和增强层编码器12。基本层编码器14接收视频输入20和输出基本层(BL)流22。增强层编码器12通过使用DCT 16和比特平面DCT扫描与熵编码系统18,来生成增强层(EL)流24。增强层编码器12接收来自基本层编码器的各个部件(包括IDCT 11和求和器13)的数据,该求和器13计算视频输入20与运动补偿15之间的差值。
现在参照图2,图上显示改进的FGS编码器。可包括与以上相同的BL编码器14的改进的编码器在增强层编码器32中具有多个变化精度的DCT 30(即,多精度DCT)。同样包括在EL编码器32中的有DCT选择系统34,该系统包括作出判决的机制,用于例如根据关于编码器的瞬时计算资源的信息来选择适当的DCT。通常,DCT精度越高,编码增强层所需要的计算资源越多。选择适当的DCT可以基于任何相关的准则,包括编码比特率、可用的带宽、所期望的质量(即,SNR)、译码器能等等。
其中在增强层编码中具有可选择DCT可能是有用的系统的一个例子如下。当编码器正使用电话线对一组用户广播时,最大可用的带宽是事先知道的。因此,以大于最大带宽的速率发送增强层将是浪费。在这种情形下,使用与基本层中使用的同样高精度的DCT来编码增强层是无意义的,因为比特平面将被大大截短来满足带宽可用性。因此,在这种情形下,较低精度的DCT可用于实现较低的计算复杂性,而不引起附加的失真。而且,通过使用较低精度的DCT,在发送机站址处的编码和在接收机站址处的译码都能更快速地运行,以达到更高的速率。
现在参照图3,示出现有技术平的FGS译码器,该FGS译码器接收EL流52和BL流54,以及输出增强的视频48(以及可任选的BL视频输出50)。现有技术水平的FGS译码器包括BL译码器42和EL译码器40。EL译码器40包括FGS比特平面VLD 44、IDCT 46和求和器47,用于对IDCT 46的输出与BL视频输出50求和。
图4显示按照本发明的新颖的FGS译码器。可包括与以上所示相同的BL译码器42的新颖译码器在EL译码器60中具有多个变化精度的IDCT 68(即,多精度IDCT)。同样包括的有IDCT选择系统64,该选择系统包括作出判决的机制,用于根据任何有关的准则来选择适当的IDCT。这样的准则可包括可用的计算资源、质量要求、帧速率优选项、优选的比特率、通信带宽等等。因此,即使编码器发送高质量的增强层,本译码器也有基于呈现给译码器的约束条件而使用较低精度的IDCT的自由。
因此,考虑其中用户正在使用移动设备观看在发送地点某个人的视频的情形。这样的设备典型地可以预期具有有限的计算能力。然而,因为屏幕是相对小的,可能不需要高质量的视频。而且,对于这类应用,通常优选地为较高的帧速率,以避免抖动。因此,在这种情形下,在移动设备上的译码器可以截短该增强层,以及使用较低精度的IDCT来译码所截短的增强层,以减小复杂性并达到较高的帧速率。
在视频会议的情形下,视频设备必须同时执行编码和译码,使得双方都可接收视频信号。由于编码器的复杂性通常比译码器的复杂性高许多倍,因此译码器可用的计算资源可被大大地减小,以及计算复杂度的优雅(graceful)缩减是极其必要的。通过利用较低精度的IDCT,可以达到优雅缩减。
参照图5,描绘了显示在示例性的IDCT组68(IDCT1-IDCT4)的速率失真特性与计算复杂度之间的关系的曲线图。
在分层的视频编码框架中,基本层典型地以非常低的比特率被编码。这样,在基本层使用较高精度的DCT或IDCT并不消耗很大的资源,因为以这样的低比特率,大多数DCT块在量化后具有零的系数。这阻止偏移(即,失真的积累),从而保护编码质量。因此,最密集的基于变换的计算被移到增强层,特别是在SNR-FGS系统的情形下。所以,通过降低在增强层中DCT和/或IDCT的精度,便减少计算复杂度/而不引入偏移,以及可以达到质量的优雅降级。
可以理解,这里描述的系统、功能、机制、方法、和模块可以以硬件软件、或硬件与软件的组合来实施。它们可以由任何类型的计算机系统或其他适合于实行这里描述的方法的其他设备来实施。硬件和软件的典型组合可以是带有计算机程序的通用计算机系统,当该计算机程序在被装载和执行时,控制计算机系统,以使得该计算机执行这里描述的方法。替换地,也可以利用包含用于执行本发明的一个或多个功能任务的专化硬件的专用计算机。本发明还能被嵌入计算机程序产品中,该程序产品包括使能实施这里描述的方法和功能的所有特性,以及(它在被装载到计算机系统中时)能够执行这些方法和功能。计算机程序、软件程序、程序、程序产品或软件,在本上下文中是指以任何语言、代码、或符号的一组指令的任何表达方式,该组指令打算使得具有信息处理能力的系统直接地或在以下任一项或二项之后执行特定的功能:(a)变换到另一种语言、代码或符号;和/或(b)以不同的材料形式重现。
本发明的优选实施例的以上说明是为了说明和描述而给出的。它们不打算是穷举的或使本发明限于所揭示的精确的形式,以及显然,从以上的教导看来,许多修正和变化是可能的。对于本领域技术人员显而易见的是:这样的修正和变化打算包括在由所附的权利要求定义的、本发明的范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈