首页 / 专利库 / 企业组织 / 流程图 / 二进制化逻辑确定(612)。视频编码器20可随后用于上下文自适应二进制算术译码的上下 基于所述P切片预测类型语法元素和所述B切片文缩减 预测类型语法元素的所述二进制化对视频数据

二进制化逻辑确定(612)。视频编码器20可随后用于上下文自适应二进制算术译码的上下 基于所述P切片预测类型语法元素和所述B切片文缩减 预测类型语法元素的所述二进制化对视频数据

阅读:52发布:2020-09-03

专利汇可以提供二进制化逻辑确定(612)。视频编码器20可随后用于上下文自适应二进制算术译码的上下 基于所述P切片预测类型语法元素和所述B切片文缩减 预测类型语法元素的所述二进制化对视频数据专利检索,专利查询,专利分析的服务。并且进行编码(614)。图6是图解说明本 发明 的实例性 视频编码 方法的 流程图 。图6的方法可由视频 编码器 20实施。视频编码器20可经配置以确定P切片中的视频数据 块 的第一预测类型(602),且将第一预测类型表示为P切片预测类型语法元素(604)。视频编码器20可进一步经配置以确定B切片中的视频数据块的第二预测类型(606),且将第二预测类型表示为B切片预测类型语法元素(608)。P切片预测类型语法元素和B切片预测类型语法元素 指定 预测模式和分区类型。预测模式可包含 帧 间预测和 帧内预测 中的一者。分区类型可包含对称分区和不对称分区中的一者。视频编码器20可进一步经配置以确定用于P切片预测类型语法元素的P切片二进制化(610),且确定用于B切片预测类型语法元素的B切片二进制化,其中P切片预测类型语法元素和B切片预测类型语法元素是使用相同的,下面是二进制化逻辑确定(612)。视频编码器20可随后用于上下文自适应二进制算术译码的上下 基于所述P切片预测类型语法元素和所述B切片文缩减 预测类型语法元素的所述二进制化对视频数据专利的具体信息内容。

1.一种对视频数据进行编码的方法,其包括:
确定P切片中的视频数据的第一预测类型;
将所述第一预测类型表示为P切片预测类型语法元素;
确定B切片中的视频数据块的第二预测类型;
将所述第二预测类型表示为B切片预测类型语法元素;
确定所述P切片预测类型语法元素的P切片二进制化;
确定所述B切片预测类型语法元素的B切片二进制化,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素是使用相同的二进制化逻辑来确定;以及基于所述P切片预测类型语法元素和所述B切片预测语法元素的所述二进制化对所述视频数据进行编码。
2.根据权利要求1所述的方法,其中对所述视频数据进行编码包括:
用所确定P切片二进制化对所述P切片预测类型语法元素进行二进制化;
用所确定B切片二进制化对所述B切片预测类型语法元素进行二进制化;
将上下文自适应二进制算术译码CABAC应用于所述经二进制化P切片预测类型语法元素;以及
将上下文自适应二进制算术译码CABAC应用于所述经二进制化B切片预测类型语法元素。
3.根据权利要求1所述的方法,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素指定预测模式和分区类型。
4.根据权利要求3所述的方法,其中所述预测模式包含间预测和帧内预测中的一者。
5.根据权利要求3所述的方法,其中所述分区类型包含对称分区和不对称分区中的一者。
6.一种对视频数据进行解码的方法,其包括:
使用用于P切片中的视频数据块的二进制化映射将经二进制化P切片预测类型语法元素映射到预测类型;
使用用于B切片中的视频数据块的相同二进制化映射将经二进制化B切片预测类型语法元素映射到预测类型;以及
基于所述经映射预测类型对所述视频数据进行解码。
7.根据权利要求6所述的方法,其进一步包括:
接收指示P切片中的所述视频数据块的所述预测类型的经上下文自适应二进制算术译码的P切片预测类型语法元素;以及
接收指示B切片中的所述视频数据块的所述预测类型的经上下文自适应二进制算术译码的B切片预测类型语法元素,
其中对所述视频数据进行解码进一步包括:
对所述P切片预测类型语法元素进行解码以产生所述经二进制化P切片预测类型语法元素;以及
对所述B切片预测类型语法元素进行解码以产生所述经二进制化B切片预测类型语法元素。
8.根据权利要求6所述的方法,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素指定预测模式和分区类型。
9.根据权利要求8所述的方法,其中所述预测模式包含帧间预测和帧内预测中的一者。
10.根据权利要求8所述的方法,其中所述分区类型包含对称分区和不对称分区中的一者。
11.一种经配置以对视频数据进行编码的设备,其包括:
用于确定P切片中的视频数据块的第一预测类型的装置;
用于将所述第一预测类型表示为P切片预测类型语法元素的装置;
用于确定B切片中的视频数据块的第二预测类型的装置;
用于将所述第二预测类型表示为B切片预测类型语法元素的装置;
用于确定所述P切片预测类型语法元素的P切片二进制化的装置;
用于确定所述B切片预测类型语法元素的B切片二进制化的装置,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素是使用相同的二进制化逻辑来确定;以及用于基于所述P切片预测类型语法元素和所述B切片预测语法元素的所述二进制化对所述视频数据进行编码的装置。
12.根据权利要求11所述的设备,其中所述用于对所述视频数据进行编码的装置包括:
用于用所确定P切片二进制化对所述P切片预测类型语法元素进行二进制化的装置;
用于用所确定B切片二进制化对所述B切片预测类型语法元素进行二进制化的装置;
用于将上下文自适应二进制算术译码CABAC应用于所述经二进制化P切片预测类型语法元素的装置;以及
用于将上下文自适应二进制算术译码CABAC应用于所述经二进制化B切片预测类型语法元素的装置。
13.根据权利要求11所述的设备,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素指定预测模式和分区类型。
14.根据权利要求13所述的设备,其中所述预测模式包含帧间预测和帧内预测中的一者。
15.根据权利要求13所述的设备,其中所述分区类型包含对称分区和不对称分区中的一者。
16.一种经配置以对视频数据进行解码的设备,其包括:
用于使用用于P切片中的视频数据块的二进制化映射将经二进制化P切片预测类型语法元素映射到预测类型的装置;
用于使用用于B切片中的视频数据块的相同二进制化映射将经二进制化B切片 预测类型语法元素映射到预测类型的装置;以及
用于基于所述经映射预测类型对所述视频数据进行解码的装置。
17.根据权利要求16所述的设备,其进一步包括:
用于接收指示P切片中的所述视频数据块的所述预测类型的经上下文自适应二进制算术译码的P切片预测类型语法元素的装置;以及
用于接收指示B切片中的所述视频数据块的所述预测类型的经上下文自适应二进制算术译码的B切片预测类型语法元素的装置,
其中所述用于对所述视频数据进行解码的装置进一步包括:
用于对所述P切片预测类型语法元素进行解码以产生所述经二进制化P切片预测类型语法元素的装置;以及
用于对所述B切片预测类型语法元素进行解码以产生所述经二进制化B切片预测类型语法元素的装置。
18.根据权利要求16所述的设备,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素指定预测模式和分区类型。
19.根据权利要求18所述的设备,其中所述预测模式包含帧间预测和帧内预测中的一者。
20.根据权利要求18所述的设备,其中所述分区类型包含对称分区和不对称分区中的一者。
21.一种经配置以对视频数据进行编码的设备,其包括:
视频编码器,其经配置以:
确定P切片中的视频数据块的第一预测类型;
将所述第一预测类型表示为P切片预测类型语法元素;
确定B切片中的视频数据块的第二预测类型;
将所述第二预测类型表示为B切片预测类型语法元素;
确定所述P切片预测类型语法元素的P切片二进制化;
确定所述B切片预测类型语法元素的B切片二进制化,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素是使用相同的二进制化逻辑来确定;以及基于所述P切片预测类型语法元素和所述B切片预测语法元素的所述二进制化对所述视频数据进行编码。
22.根据权利要求21所述的设备,其中所述视频编码器进一步经配置以:
用所确定P切片二进制化对所述P切片预测类型语法元素进行二进制化;
用所确定B切片二进制化对所述B切片预测类型语法元素进行二进制化;
将上下文自适应二进制算术译码CABAC应用于所述经二进制化P切片预测类型语法元素;以及
将上下文自适应二进制算术译码CABAC应用于所述经二进制化B切片预测类型语法元素。
23.根据权利要求21所述的设备,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素指定预测模式和分区类型。
24.根据权利要求23所述的设备,其中所述预测模式包含帧间预测和帧内预测中的一者。
25.根据权利要求23所述的设备,其中所述分区类型包含对称分区和不对称分区中的一者。
26.一种经配置以对视频数据进行解码的设备,其包括:
视频解码器,其经配置以:
使用用于P切片中的视频数据块的二进制化映射将经二进制化P切片预测类型语法元素映射到预测类型;
使用用于B切片中的视频数据块的相同二进制化映射将经二进制化B切片预测类型语法元素映射到预测类型;以及
基于所述经映射预测类型对所述视频数据进行解码。
27.根据权利要求26所述的设备,其中所述视频解码器进一步经配置以:
接收指示P切片中的所述视频数据块的所述预测类型的经上下文自适应二进制算术译码的P切片预测类型语法元素;
接收指示B切片中的所述视频数据块的所述预测类型的经上下文自适应二进制算术译码的B切片预测类型语法元素;
对所述P切片预测类型语法元素进行解码以产生所述经二进制化P切片预测类型语法元素;以及
对所述B切片预测类型语法元素进行解码以产生所述经二进制化B切片预测类型语法元素。
28.根据权利要求26所述的设备,其中所述P切片预测类型语法元素和所述B切片预测类型语法元素指定预测模式和分区类型。
29.根据权利要求28所述的设备,其中所述预测模式包含帧间预测和帧内预测中的一者。
30.根据权利要求28所述的设备,其中所述分区类型包含对称分区和不对称分区中的一者。

说明书全文

用于上下文自适应二进制算术译码的上下文缩减

[0001] 本申请案主张2011年11月8日申请的第61/557,325号美国临时申请案和2011年11月20日申请的第61/561,911号美国临时申请案的权益,以上两个美国临时申请案以全文引用方式并入本文。

技术领域

[0002] 本发明涉及视频译码,且特定来说涉及在视频译码中使用的上下文自适应二进制算术译码(CABAC)。

背景技术

[0003] 数字视频能可并入到广泛多种装置中,包含数字电视机、数字直播系统、无线广播系统、个人数字助理(PDA)、膝上型或桌上型计算机、平板计算机、电子书阅读器、数码相机、数字记录装置、数字媒体播放器、视频游戏装置、视频游戏控制台、蜂窝式或卫星无线电电话、所谓的“智能电话”、视频电话会议装置、视频流式传输装置和类似装置。数字视频装置实施视频压缩技术,例如由MPEG-2、MPEG-4、ITU-T H.263、ITU-T H.264/MPEG-4第10部分高级视频译码(AVC)界定的标准、当前在开发的高效视频译码(HEVC)标准以及此些标准的扩展中描述的那些技术。视频装置可通过实施此些视频压缩技术来较有效地发射、接收、编码、解码和/或存储数字视频信息。
[0004] 视频压缩技术执行空间(图片内)预测和/或时间(图片间)预测以减少或移除视频序列中固有的冗余。对于基于的视频译码,可将视频切片(即,视频图片或视频图片的一部分)分割为若干视频块,所述视频块也可称为树块、译码单元(CU)和/或译码节点。图片的经内译码(I)切片中的视频块是使用相对于同一图片中的相邻块中的参考样本的空间预测来编码。图片的经帧间译码(P或B)切片中的视频块可使用相对于同一图片中的相邻块中的参考样本的空间预测或相对于其它参考图片中的参考样本的时间预测。图片可称为帧,且参考图片可称为参考帧。
[0005] 空间或时间预测得到待译码块的预测块。残余数据表示待译码的原始块与预测块之间的像素差。经帧间译码块是根据指向形成预测块的参考样本的块的运动向量以及指示经译码块与预测块之间的差的残余数据来编码。经帧内译码块是根据帧内译码模式和残余数据来编码。为了进一步压缩,可将残余数据从像素域变换到变换域,从而得到残余变换系数,所述系数随后可经量化。可扫描初始以二维阵列布置的经量化变换系数以便产生变换系数的一维向量,且可应用熵译码以实现甚至更多的压缩。

发明内容

[0006] 大体上,本发明描述用于视频译码过程中的上下文自适应二进制算术译码(CABAC)的技术。特定来说,本发明提出用于一个或多个语法元素的CABAC上下文的数目的缩减,所述语法元素的非限制性实例包含pred_type、merge_idx、inter_pred_flag、ref_idx_lx、cbf_cb、cbf_cr、coeff_abs_level_greater1_flag和coeff_abs_level_greater2_flag。所述修改可缩减多达56个上下文,其中译码效率改变可忽略。所提出的语法元素的上下文缩减可单独使用或以任一组合使用。
[0007] 在本发明的一个实例中,一种对视频进行编码的方法可包含:确定P切片中的视频数据块的第一预测类型,将第一预测类型表示为P切片预测类型语法元素,确定B切片中的视频数据块的第二预测类型,将第二预测类型表示为B切片预测类型语法元素,确定P切片预测类型语法元素的P切片二进制化,确定B切片预测类型语法元素的B切片二进制化,其中P切片预测类型语法元素和B切片预测类型语法元素是使用相同二进制化逻辑来确定,且基于P切片预测类型语法元素和B切片预测类型语法元素的二进制化对所述视频数据进行编码。
[0008] 在本发明的另一实例中,一种对视频进行解码的方法可包含:使用P切片中的视频数据块的二进制化映射将经二进制化P切片预测类型语法元素映射到预测类型,使用B切片中的视频数据块的相同二进制化映射将经二进制化B切片预测类型语法元素映射到预测类型,且基于经映射预测类型对所述视频数据进行解码。
[0009] 在本发明的另一实例中,一种对视频数据进行编码的方法包括:确定视频数据块的预测模式的分区类型,使用具有单个上下文的CABAC对视频数据块的预测类型语法元素的分区类型二进位进行编码,其中所述单个上下文对于任一分区类型是相同的,且在旁路模式中使用CABAC对视频数据块的预测类型语法元素的分区大小二进位进行编码。
[0010] 在本发明的另一实例中,一种对视频数据进行解码的方法包括:接收已使用CABAC译码的视频数据块的预测类型语法元素,所述预测类型语法元素包含表示分区类型的分区类型二进位和表示分区大小的分区大小二进位,使用具有单个上下文的上下文自适应二进制算术译码对预测类型语法元素的分区类型二进位进行解码,其中所述单个上下文对于任一分区类型是相同的,且在旁路模式中使用CABAC对所述预测类型语法元素的分区大小二进位进行解码。
[0011] 在本发明的另一实例中,一种对视频数据进行译码的方法包括:使用CABAC对视频数据块的Cb色度经译码块旗标进行译码,其中对Cb色度经译码块旗标进行译码包括使用包含一个或多个上下文的上下文集合作为CABAC的部分,且使用CABAC对Cr色度经译码块进行译码,其中对Cr色度经译码块旗标进行译码包括使用与Cb色度经译码块旗标相同的上下文集合作为CABAC的部分。
[0012] 本发明还鉴于经配置以执行所述技术的设备以及鉴于存储指令的计算机可读存储媒体来描述上述技术,所述指令在执行时致使一个或多个处理器执行所述技术。
[0013] 在附图和以下描述中陈述一个或一个以上实例的细节。从描述和图式以及从权利要求书将明了其它特征、目的和优点。

附图说明

[0014] 图1是图解说明可利用本发明中描述的技术的实例性视频编码和解码系统的框图
[0015] 图2是图解说明可实施本发明中描述的技术的实例性视频编码器的框图。
[0016] 图3是图解说明可实施本发明中描述的技术的实例性视频解码器的框图。
[0017] 图4是展示正方形和非正方形分区类型的概念图
[0018] 图5是展示不对称分区类型的概念图。
[0019] 图6是图解说明本发明的实例性视频编码方法的流程图
[0020] 图7是图解说明本发明的实例性视频解码方法的流程图。
[0021] 图8是图解说明本发明的实例性视频编码方法的流程图。
[0022] 图9是图解说明本发明的实例性视频解码方法的流程图。
[0023] 图10是图解说明本发明的实例性视频译码方法的流程图。

具体实施方式

[0024] 本发明描述用于对例如视频数据等数据进行译码的技术。特定来说,本发明描述可促进使用上下文自适应熵译码过程对视频数据的有效译码的技术。更具体来说,本发明提出用于对语法元素进行译码的CABAC上下文的数目的缩减,所述语法元素例如pred_type、merge_idx、inter_pred_flag、ref_idx_lx、cbf_cb、cbf_cr、coeff_abs_level_greater1_flag和coeff_abs_level_greater2_flag。所述修改缩减多达56个上下文,其中译码效率改变可忽略。本发明为了说明而描述视频译码。然而,本发明中描述的技术也可适用于对其它类型数据进行译码。
[0025] 图1是图解说明根据本发明的实例可经配置以利用用于上下文自适应二进制算术译码(CABAC)的技术的实例性视频编码和解码系统10的框图。如图1所示,系统10包含源装置12,所述源装置12经由通信信道16将经编码视频发射到目的地装置14。经编码视频数据也可存储在存储媒体34或文件服务器36上,且可按需要由目的地装置14存取。当存储到存储媒体或文件服务器时,视频编码器20可将经译码视频数据提供到另一装置,例如网络接口、压缩光盘(CD)、蓝光或数字视频光盘(DVD)烧录器或冲压设施装置,或其它装置,用于将经译码视频数据存储到存储媒体。同样,与视频解码器30分离的装置,例如网络接口、CD或DVD读取器或类似物,可从存储媒体检索经译码视频数据且将所检索数据提供到视频解码器30。
[0026] 源装置12和目的地装置14可包括广泛多种装置中的任一者,包含桌上型计算机、笔记型(即,膝上型)计算机、平板计算机、机顶盒、例如所谓的智能电话等电话手持机、电视机、相机、显示装置、数字媒体播放器、视频游戏控制台或类似装置。在许多情况下,此些装置可经装备以用于无线通信。因此,通信信道16可包括适合于发射经编码视频数据的无线信道、有线信道或无线与有线信道的组合。类似地,文件服务器36可由目的地装置14通过任何标准数据连接(包含因特网连接)存取。这可包含适于存取存储在文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器等等)或两者的组合。
[0027] 根据本发明的实例的用于CABAC的技术可应用于视频译码以支持多种多媒体应用中的任一种,例如空中电视广播、闭路电视发射、卫星电视发射、流式视频发射(例如,经由因特网)、为存储在数据存储媒体上对数字视频的编码、对存储在数据存储媒体上的数字视频的解码,或其它应用。在一些实例中,系统10可经配置以支持单向或双向视频发射以支持例如视频流式传输、视频重放、视频广播和/或视频电话等应用。
[0028] 在图1的实例中,源装置12包含视频源18、视频编码器20、调制器/解调器22和发射器24。在源装置12中,视频源18可包含例如以下各项的源:例如摄像机等视频俘获装置、含有先前俘获视频的视频档案、用以从视频内容提供者接收视频的视频馈送接口,和/或用于产生计算机图形作为源视频的计算机图形系统,或此些源的组合。作为一个实例,如果视频源18是摄像机,则源装置12和目的地装置14可形成所谓的相机电话或视频电话。然而,本发明中描述的技术可大体上适用于视频译码,且可适用于无线和/或有线应用,或其中经编码视频数据存储在本地磁盘上的应用。
[0029] 所俘获、预俘获或计算机产生的视频可由视频编码器20编码。经编码视频信息可由调制解调器22根据例如无线通信协议等通信标准而调制,且经由发射器24发射到目的地装置14。调制解调器22可包含为了信号调制而设计的各种混频器滤波器放大器或其它组件。发射器24可包含为了发射数据而设计的电路,包含放大器、滤波器和一个或一个以上天线。
[0030] 由视频编码器20编码的所俘获、预俘获或计算机产生的视频也可存储到存储媒体34或文件服务器36上以供日后使用。存储媒体34可包含蓝光光盘、DVD、CD-ROM、快闪存储器或任何其它合适的用于存储经编码视频的数字存储媒体。存储在存储媒体34上的经编码视频可随后由目的地装置14存取以用于解码和重放。虽然图1中未图示,但在一些实例中,存储媒体34和/或文件服务器36可存储发射器24的输出。
[0031] 文件服务器36可为能够存储经编码视频且将所述经编码视频发射到目的地装置14的任一类型的服务器。实例文件服务器包含网络服务器(例如,用于网站)、FTP服务器、网络附接存储(NAS)装置、本地磁盘驱动器,或能够存储经编码视频数据且将其发射到目的地装置的任一其它类型的装置。经编码视频数据从文件服务器36的发射可为流式发射、下载发射或两者的组合。文件服务器36可由目的地装置14通过任何标准数据连接(包含因特网连接)存取。这可包含适于存取存储在文件服务器上的经编码视频数据的无线信道(例如,Wi-Fi连接)、有线连接(例如,DSL、电缆调制解调器、以太网、USB等等)或两者的组合。
[0032] 在图1的实例中,目的地装置14包含接收器26、调制解调器28、视频解码器30和显示装置32。目的地装置14的接收器26经由信道16接收信息,且调制解调器28对所述信息进行解调以产生用于视频解码器30的经解调位流。经由信道16传送的信息可包含由视频编码器20产生以供视频解码器30用于对视频数据进行解码的多种语法信息。此语法也可与存储在存储媒体34或文件服务器36上的经编码视频数据一起包含。视频编码器20和视频解码器30中的每一者可形成能够对视频数据进行编码或解码的相应编码器一解码器(CODEC)的部分。
[0033] 显示装置32可与目的地装置14集成或在目的地装置14的外部。在一些实例中,目的地装置14可包含集成显示装置,且还经配置以与外部显示装置介接。在其它实例中,目的地装置14可为显示装置。大体上,显示装置32向用户显示经解码视频数据,且可包括多种显示装置中的任一者,例如液晶显示器(LCD)、等离子显示器、有机发光二极管(OLED)显示器,或另一类型的显示装置。
[0034] 在图1的实例中,通信信道16可包括任何无线或有线通信媒体,例如射频(RF)频谱或者一种或一种以上物理传输线,或无线与有线媒体的任何组合。通信信道16可形成基于包的网络的部分,所述网络例如为局域网、广域网或例如因特网的全球网。通信信道16大体上表示用于将视频数据从源装置12发射到目的地装置14的任何合适的通信媒体或不同通信媒体的集合,包含有线或无线媒体的任何合适组合。通信信道16可包含路由器、交换机、基站或可用于促进从源装置12到目的地装置14的通信的任何其它设备。
[0035] 视频编码器20和视频解码器30可根据例如由ITU-T视频译码专家组(VCEG)的视频译码联合合作组(JCT-VC)和ISO/IEC动画专家组(MPEG)当前在开发的高效视频译码(HEVC)标准等视频压缩标准来操作。称为“HEVC工作草案6”或“WD6”的HEVC标准的最新草案在布洛斯(Bross)等人的文献JCTVC-H1003“高效视频译码(HEVC)文本规范草案6(High efficiency video coding(HEVC)text specification draft6)”(ITU-T SG16WP3和ISO/IEC JTC1/SC29/WG11的视频译码联合合作组(JCT-VC),第8次会议:美国加利福尼亚圣何塞,2012年2月)中描述,其从2012年6月1日起可从http://phenix.int-evry.fr/jct/doc_end_user/documents/8_San%20Jose/wg11/JCTVC-H1003-v22.zip下载。
[0036] 或者,视频编码器20和视频解码器30可根据例如ITU-T H.264标准(或者称为MPEG4第10部分高级视频译码(AVC))等其它专或行业标准或此些标准的扩展来操作。然而本发明的技术不限于任何特定译码标准。其它实例包含MPEG-2和ITU-T H.263。
[0037] 虽然图1中未图示,但在一些方面中,视频编码器20和视频解码器30可各自与音频编码器和解码器集成,且可包含适当的多路复用器一多路分用器(MUX-DEMUX)单元或其它硬件软件,以处置共同数据流或单独数据流中的音频和视频两者的编码。如果适用,在一些实例中,MUX-DEMUX单元可符合ITU H.223多路复用器协议,或例如用户数据报协议(UDP)等其它协议。
[0038] 视频编码器20和视频解码器30各自可实施为多种合适编码器电路中的任一者,例如一个或一个以上微处理器数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程门阵列(FPGA)、离散逻辑、软件、硬件、固件或其任一组合。当所述技术部分地以软件实施时,装置可将用于所述软件的指令存储在合适的非暂时性计算机可读媒体中,且使用一个或多个处理器执行硬件中的指令以执行本发明的技术。视频编码器20和视频解码器30中的每一者可包含于一个或一个以上编码器或解码器中,其中任一者可集成为相应装置中的组合式编码器/解码器(CODEC)的部分。
[0039] 视频编码器20可实施本发明的技术中的任一者或全部以用于视频译码过程中的CABAC。视频编码器30可实施本发明的技术中的任一者或全部以用于视频译码过程中的CABAC。如本发明中描述的视频译码器可指代视频编码器或视频解码器。类似地,视频译码单元可指代视频编码器或视频解码器。同样,视频译码可指代视频编码或视频解码。
[0040] 在本发明的一个实例中,视频编码器20可经配置以确定P切片中的视频数据块的第一预测类型,将第一预测类型表示为P切片预测类型语法元素,确定B切片中的视频数据块的第二预测类型,将第二预测类型表示为B切片预测类型语法元素,确定P切片预测类型语法元素的P切片二进制化,确定B切片预测类型语法元素的B切片二进制化,其中P切片预测类型语法元素和B切片预测类型语法元素是使用相同二进制化逻辑来确定,且基于P切片预测类型语法元素和B切片预测语法元素的二进制化对所述视频数据进行编码。
[0041] 在本发明的另一实例中,视频解码器30可经配置以使用P切片中的视频数据块的二进制化映射将经二进制化P切片预测类型语法元素映射到预测类型,使用B切片中的视频数据块的相同二进制化映射将经二进制化B切片预测类型语法元素映射到预测类型,且基于经映射预测类型对所述视频数据进行解码。
[0042] 在本发明的另一实例中,视频编码器20可经配置以确定视频数据块的预测模式的分区类型,使用具有单个上下文的CABAC对视频数据块的预测类型语法元素的分区类型二进位进行编码,其中所述单个上下文对于任一分区类型是相同的,且在旁路模式中使用CABAC对视频数据块的预测类型语法元素的分区大小二进位进行编码。
[0043] 在本发明的另一实例中,视频解码器30可经配置以接收已使用CABAC译码的视频数据块的预测类型语法元素,所述预测类型语法元素包含表示分区类型的分区类型二进位和表示分区大小的分区大小二进位,使用具有单个上下文的CABAC对预测类型语法元素的分区类型二进位进行解码,其中所述单个上下文对于任一分区类型是相同的,且在旁路模式中使用CABAC对所述预测类型语法元素的分区大小二进位进行解码。
[0044] 在本发明的另一实例中,视频编码器20和视频解码器30可经配置以使用CABAC对视频数据块的Cb色度经译码块旗标进行译码,其中对Cb色度经译码块旗标进行译码包括使用包含一个或多个上下文的上下文集合作为CABAC的部分,且使用CABAC对Cr色度经译码块旗标进行译码,其中对Cr色度经译码块旗标进行译码包括使用与Cb色度经译码块旗标相同的上下文集合作为CABAC的部分。
[0045] JCT-VC正致力于HEVC标准的开发。HEVC标准化努力是基于称为HEVC测试模型(HM)的视频译码装置的演进模型。HM假设视频译码装置相对于符合例如ITU-TH.264/AVC的现存装置的若干额外能力。举例来说,H.264提供9种帧内预测编码模式,而HM可提供多达33种帧内预测编码模式。以下部分将更详细论述HM的某些方面。
[0046] 大体上,HM的工作模型描述了可将视频帧或图片划分为包含亮度和色度样本两者的树块或最大译码单元(LCU)的序列。树块具有与H.264标准的宏块类似的目的。切片包含若干在译码次序上连续的树块。视频帧或图片可经分割为一个或多个切片。每一树块可根据四叉树而分裂为若干译码单元(CU)。举例来说,作为四叉树的根节点的树块可分裂为四个子节点,且每一子节点又可为母节点且分裂为另外四个子节点。作为四叉树的叶节点,最终未经分裂的子节点包括译码节点,即经译码视频块。与经译码位流相关联的语法数据可界定树块可经分裂的最大次数,且也可界定译码节点的最小大小。
[0047] CU包含译码节点以及与译码节点相关联的预测单元(PU)和变换单元(TU)。CU的大小大体上对应于译码节点的大小且形状通常必须为正方形。CU的大小的范围可为从8x8像素直到具有最大64x64像素或更大的树块的大小。每一CU可含有一个或多个PU和一个或多个TU。与CU相关联的语法数据可描述例如CU分割为一个或多个PU。分割模式在CU经跳过或直接模式编码、经帧内预测模式编码还是经帧间预测模式编码之间可不同。PU可经分割为非正方形的形状。与CU相关联的语法数据还可描述例如CU根据四叉树而分割为一个或多个TU。TU可为正方形或非正方形的形状。
[0048] 新兴的HEVC标准允许根据TU的变换,所述TU对于不同CU可为不同的。TU通常基于为经分割LCU界定的给定CU内的PU的大小来定大小,但情况可能并非总是这样。TU通常与PU大小相同或小于PU。在一些实例中,使用称为“残余四叉树”(RQT)的四叉树结构,对应于CU的残余样本可经再分为较小的单元。RQT的叶节点可称为变换单元(TU)。与TU相关联的像素差值可经变换以产生可经量化的变换系数。
[0049] 大体上,PU指代与预测过程相关的数据。举例来说,当PU经帧内模式编码时,PU可包含描述PU的帧内预测模式的数据。作为另一实例,当PU经帧间模式编码时,PU可包含定义PU的运动向量的数据。界定PU的运动向量的数据可描述例如运动向量的平分量、运动向量的垂直分量、运动向量的分辨率(例如,四分之一像素精度或八分之一像素精度)、运动向量所指向的参考图片,和/或运动向量的参考图片列表(例如,列表0、列表1或列表C)。
[0050] 大体上,TU用于变换和量化过程。具有一个或一个以上PU的给定CU还可包含一个或一个以上变换单元(TU)。在预测之后,视频编码器20可根据PU从由译码节点识别的视频块计算残余值。随后更新译码节点以参考残余值而非原始视频块。残余值包括像素差值,所述像素差值可使用变换和TU中指定的其它变换信息而变换为变换系数、经量化且经扫描以产生用于熵译码的经串行化变换系数。可再次更新译码节点以参考这些经串行化变换系数。本发明通常使用术语“视频块”来指代CU的译码节点。在一些特定情况下,本发明也可使用术语“视频块”来指代树块,即LCU或CU,其包含译码节点以及PU和TU。
[0051] 视频序列通常包含一系列视频帧或图片。图片群组(GOP)通常包括一系列一个或多个视频图片。GOP可在GOP的标头、一个或多个图片的标头或其它地方包含描述所述GOP中包含的图片数目的语法数据。图片的每一切片可包含描述相应切片的编码模式的切片语法数据。视频编码器20通常对个别视频切片内的视频块进行操作以便对视频数据进行编码。视频块可对应于CU内的译码节点。视频块可具有固定或变化的大小,且可根据指定译码标准而大小不同。
[0052] 作为一实例,HM支持各种PU大小下的预测。假定特定CU的大小为2Nx2N,则HM支持2Nx2N或NxN的PU大小的帧内预测以及2Nx2N、2NxN、Nx2N或NxN的对称PU大小的帧间预测。HM还支持2NxnU、2NxnD、nLx2N和nRx2N的PU大小的帧间预测的不对称分割。在不对称分割中,CU的一个方向未分割,而另一方向分割为25%和75%。CU的对应于25%分割的部分由“n”指示,随后是“上”、“下”、“左”或“右”的指示。因此,举例来说,“2NxnU”指代经水平分割的
2Nx2N CU,其中顶部为2Nx0.5NPU且底部为2Nx1.5N PU。
[0053] 图4是展示用于帧内预测和帧间预测的正方形和非正方形分区类型的概念图。分区102是2Nx2N分区,且可用于帧内预测和帧间预测两者。分区104是NxN分区,且可用于帧内预测和帧间预测两者。分区106是2NxN分区,且当前在HEVC中用于帧间预测。分区108是Nx2N分区,且当前在HEVC中用于帧间预测。
[0054] 图5是展示不对称分区类型的概念图。分区110是2NxnU分区,且当前在HEVC中用于帧间预测。分区112是2NxnD分区,且当前在HEVC中用于帧间预测。分区114是nLx2N分区,且当前在HEVC中用于帧间预测。分区116是nRx2N分区,且当前在HEVC中用于帧间预测。
[0055] 在本发明中,“NxN”和“N乘N”可以互换地使用以在垂直和水平尺寸方面指代视频块的像素尺寸,例如16x16像素或16乘16像素。大体上,16x16块将在垂直方向上具有16个像素(y=16)且在水平方向上具有16个像素(x=16)。同样,NxN块通常在垂直方向上具有N个像素且在水平方向上具有N个像素,其中N表示非负整数值。块中的像素可以若干行和列布置。而且,块无需一定在水平方向上具有与垂直方向上相同数目的像素。举例来说,块可包括NxM个像素,其中M不一定等于N。
[0056] 在使用CU的PU的帧内预测或帧间预测译码之后,视频编码器20可计算由CU的TU指定的变换所应用于的残余数据。残余数据可对应于未经编码图片的像素之间的像素差和对应于CU的预测值。视频编码器20可形成CU的残余数据,且随后变换残余数据以产生变换系数。
[0057] 在任何变换以产生变换系数后,视频编码器20可执行变换系数的量化。量化大体上指代其中变换系数经量化以可能地减少用以表示所述系数的数据量从而提供进一步压缩的过程。量化过程可减小与系数中的一些或全部相关联的位深度。举例来说,在量化期间可将n位值下舍入到m位值,其中n大于m。
[0058] 在一些实例中,视频编码器20可利用预定义扫描次序来扫描经量化变换系数以产生可经熵编码的经串行化向量。在其它实例中,视频编码器20可执行自适应扫描。在扫描经量化变换系数以形成一维向量之后,视频编码器20可例如根据上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法对所述一维向量进行熵编码。视频编码器20还可对与经编码视频数据相关联的语法元素进行熵编码以供视频解码器30用于对视频数据进行解码。
[0059] 为了执行CABAC,视频编码器20可将上下文模型内的上下文指派于待发射的符号。所述上下文可例如涉及符号的相邻值是否为非零。为了执行CAVLC,视频编码器20可针对待发射符号选择可变长度译码。VLC中的码字可经构造以使得相对较短的码对应于较可能的符号,而较长的码对应于较不可能的符号。以此方式,VLC的使用可例如针对待发射的每一符号使用相等长度码字来实现位节省。概率确定可基于对符号指派的上下文。
[0060] 本发明是用于上下文自适应二进制算术译码(CABAC)熵译码器或例如概率区间分割熵译码(PIPE)或相关译码器等其它熵译码器的相关技术。算术译码是在具有高译码效率的许多压缩算法中使用的一种形式的熵译码,因为其能够将符号映射到非整数长度码字。算术译码算法的实例是在H.264/AVC中使用的基于上下文的二进制算术译码(CABAC)。
[0061] 大体上,使用CABAC对数据符号进行译码涉及以下步骤中的一者或多者:
[0062] (1)二进制化:如果待译码符号是非二进制值的,那么将其映射到所谓的“二进位”的序列。每一二进位可具有“0”或“1”的值。
[0063] (2)上下文指派:(在常规模式中)将每一二进位指派于一上下文。上下文模型确定如何基于可用于给定二进位的信息来计算用于所述二进位的上下文,所述信息例如先前经编码符号或二进位数的值。
[0064] (3)二进位编码:以算术编码器对二进位进行编码。为了对二进位进行编码,算术编码器需要二进位的值的概率作为输入,所述概率即二进位的值等于“0”的概率以及二进位的值等于“1”的概率。每一上下文的(估计)概率由称为“上下文状态”的整数值表示。每一上下文具有一状态,且因此所述状态(即,估计概率)对于指派于一个上下文的二进位是相同的,且在上下文之间不同。
[0065] (4)状态更新:用于选定上下文的概率(状态)是基于二进位的实际经译码值(例如,如果二进位值为“1”,那么“1”的概率增加)来更新。
[0066] 应注意,概率区间分割熵译码(PIPE)使用类似于算术译码原理的原理,且可因此还利用本发明的技术。
[0067] H.264/AVC和HEVC中的CABAC使用若干状态,且每一状态隐含地涉及概率。存在CABAC的变体,其中直接使用符号的概率(“0”或“1”),即概率(或其整数版本)是状态。举例来说,CABAC的此些变体在“法国电信、NTT、NTT DOCOMO、松下和特艺公司(Technicolor)的视频译码技术提案的说明(Description ofvideo coding technology proposal by France Telecom,NTT,NTT DOCOMO,Panasonic and Technicolor)”(2010年4月德国德累斯顿,JCTVC-A114,第1次JCT-VC会议,下文称为“JCTVC-A114”)以及A.阿尔新(A.Alshin)和E.阿尔新那(E.Alshina)的“用于CABAC的多参数概率更新(Multi-parameter probability update for CABAC)”(2011年7月意大利托里诺,JCTVC-F254,第6次JCT-VC会议,下文称为“JCTVC-F254”)中描述。
[0068] 在本发明中,提出缩减在CABAC中使用的二进制化和/或上下文的数目。特定来说,本发明提出可使CABAC中使用的上下文数目降低多达56的技术。通过减少56个上下文,实验结果展示分别在高效率仅帧内、随机存取和低延迟测试条件中有0.00%、0.01%和一0.13%位失真(BD)速率改变。由此,所需上下文数目的缩减减少了编码器和解码器两者处的存储需要,而不实质上影响译码效率。
[0069] 在本发明中,提出缩减用于语法元素的CABAC上下文的数目,所述语法元素为pred_type、merge_idx、inter_pred_flag、ref_idx_lx、cbf_cb、cbf_cr、coeff_abs_level_greater1_flag和coeff_abs_level_greater2_flag。所述修改缩减多达56个上下文,其中译码效率改变可忽略。以上提出的语法元素的上下文缩减可单独使用或以任一组合使用。
[0070] 语法元素pred_type包含每一译码单元的预测模式(pred_mode_flag)和分区类型(part_mode)。等于0的语法元素pred_mode_flag指定当前译码单元是在帧间预测模式中译码。等于1的语法元素pred_mode_flag指定当前译码单元是在帧内预测模式中译码。语法元素part_mode指定当前译码单元的分割模式。
[0071] 语法元素merge_idx[x0][y0]指定合并候选列表的合并候选索引,其中x0、y0指定所考虑预测块的左上方亮度样本相对于图片的左上方亮度样本的位置(x0,y0)。当merge_idx[x0][y0]不存在时,推断其等于0。合并候选列表是与运动信息可从其复制到当前单元邻近的译码单元的列表。
[0072] 语法元素inter_pred_flag[x0][y0]指定是否单向预测或双向预测用于当前预测单元。阵列索引x0、y0指定所考虑预测块的左上方亮度样本相对于图片的左上方亮度样本的位置(x0,y0)。
[0073] 语法元素ref_idx_lx指代参考图片列表内的特定参考图片。
[0074] 语法元素cbf_cb、cbf_cr指示色度(分别为Cb和Cr)变换块是否含有非零变换系数。等于1的语法元素cbf_cb[x0][y0][trafoDepth]指定Cb变换块含有不等于0的一个或多个变换系数层级。阵列索引x0、y0指定所考虑变换块的左上方亮度样本相对于图片的左上方亮度样本的位置(x0,y0)。阵列索引trafoDepth指定为了变换译码将译码单元变为块的当前细分层级。对于对应于译码单元的块,阵列索引trafoDepth等于0。当cbf_cb[x0][y0][trafoDepth]不存在且预测模式不是帧内预测时,推断cbf_cb[x0][y0][trafoDepth]的值等于0。
[0075] 等于1的语法元素cbf_cr[x0][y0][trafoDepth]指定Cr变换块含有不等于0的一个或多个变换系数层级。阵列索引x0、y0指定所考虑变换块的左上方亮度样本相对于图片的左上方亮度样本的位置(x0,y0)。阵列索引trafoDepth指定为了变换译码将译码单元变为块的当前细分层级。对于对应于译码单元的块,阵列索引trafoDepth等于0。当cbf_cr[x0][y0][trafoDepth]不存在且预测模式不是帧内预测时,推断cbf_cr[x0][y0][trafoDepth]的值等于0。
[0076] 语法元素coeff_abs_level_greater11flag[n]对于扫描位置n指定是否存在大于1的变换系数层级。当coeff_abs_level_greater1_flag[n]不存在时,推断其等于0。
[0077] 语法元素coeff_abs_level_greater2_flag[n]对于扫描位置n指定是否存在大于2的变换系数层级。当coeff_abs_level_greater2_flag[n]不存在时,推断其等于0。
[0078] 在针对HEVC的一个提议中,在P和B切片中使用对语法元素pred_type的不同二进制化,如表1所示。本发明提出针对P和B切片使用相同的二进制化。表2到4中展示实例。表5展示在共同测试条件(例如,参见F.博森,“共同测试条件和软件参考配置(Common test conditions and software reference configurations)”,JCTVC-F900)下对P切片的译码性能影响。
[0079]
[0080] 表1。针对HEVC的一个提议中pred_type的二进制化
[0081] 如表1中可见,I切片(例如,仅包含帧内预测块的切片)包含两个不同预测类型(pred_type)。一个二进位串(二进制化)用于具有2Nx2N分区类型的帧内预测块,且另一二进位串用于具有NxN分区类型的帧内预测块。如表1中所示,用于I切片的二进位串不取决于CU大小。
[0082] 对于P和B切片,在表1中,对于pred_type的每一值使用不同的二进位串。又,pred_type的值取决于所使用的预测模式(帧间预测或帧内预测)和分区类型。对于P和B切片,所使用的实际二进位串进一步取决于正译码的CU的大小以及对于4x4块大小是否启用帧间预测。
[0083] 二进位串下的第一列适用于其中正译码的CU的CU大小的对数函数大于最小可允许CU大小的对数函数的情形。根据HEVC中的一个实例,如果cLog2CUSize>Log2MinCUsize,那么使用二进位串的第一列。使用对数函数来产生较小的数,使得可使用较小的连续索引。
[0084] 如果正译码的CU的CU大小的对数函数等于最小可允许CU大小的对数函数(即,cLog2CUSize==Log2MinCUSize),那么在表1中二进位串下的列2和3中的一者用以选择二进制化。当正译码的CU的CU大小的对数函数等于3且未启用4x4CU的帧间预测(即,cLog2CUSize==3&&!inter_4x4_enabled_flag)时,使用列2。当正译码的CU的CU大小的对数函数大于3或启用4x4CU的帧间预测(即,cLog2CUSize>3llinter_4x4_enabled_flag)时,使用列3。
[0085] 根据本发明中描述的一个或多个实例,以下表2展示实例二进制化,其中P和B切片使用相同的二进位串。如表2中所示,P切片使用表1中用于B切片的相同二进制化。以此方式,不必对于P和B切片两者存储和使用单独的上下文集合。由此,对pred_type语法元素进行译码所需的上下文的总数目减少。此外,仅需要存储二进位串逻辑(列(1)到(3)中所示)与实际二进位串之间的一个映射(而非两个)。
[0086]
[0087] 表2。本发明的一个实例中pred_type的二进制化
[0088] 以下表3展示用于pred_type的二进制化的另一实例。在此实例中,B切片使用来自表1的与P切片相同的二进制化。以下表4展示其中P切片和B切片使用相同二进制化的额外实例。表2到4仅有意展示P与B切片之间的共享二进制化的实例。可使用任何二进制化或二进制化规则,使得用于P和B切片两者的pred_type语法元素共享相同二进制化。
[0089] 视频编码器20和视频解码器30可存储用于与P和B切片两者一起使用的相同的映射规则和映射表(例如,如表2到4中所示)。CABAC编码和解码可使用这些映射应用于pred_type语法元素。
[0090] 以此方式,视频编码器20可经配置以确定P切片中的视频数据块的第一预测类型,将第一预测类型表示为P切片预测类型语法元素,确定B切片中的视频数据块的第二预测类型,将第二预测类型表示为B切片预测类型语法元素,确定P切片预测类型语法元素的P切片二进制化,确定B切片预测类型语法元素的B切片二进制化,其中P切片预测类型语法元素和B切片预测类型语法元素是使用相同二进制化逻辑来确定,且基于P切片预测类型语法元素和B切片预测语法元素的二进制化对所述视频数据进行编码。
[0091] 视频编码器20可进一步经配置以用所确定P切片二进制化对P切片预测类型语法元素进行二进制化,用所确定B切片二进制化对B切片预测类型语法元素进行二进制化,将上下文自适应二进制算术译码(CABAC)应用于经二进制化P切片预测类型语法元素,且将上下文自适应二进制算术译码(CABAC)应用于经二进制化B切片预测类型语法元素。
[0092] 类似地,视频解码器30可经配置以使用P切片中的视频数据块的二进制化映射将经二进制化P切片预测类型语法元素映射到预测类型,使用B切片中的视频数据块的相同二进制化映射将经二进制化B切片预测类型语法元素映射到预测类型,且基于经映射预测类型对所述视频数据进行解码。
[0093] 视频解码器30可进一步经配置以接收指示P切片中的视频数据块的预测类型的经上下文自适应二进制算术译码P切片预测类型语法元素,接收指示B切片中的视频数据块的预测类型的经上下文自适应二进制算术译码B切片预测类型语法元素,对P切片预测类型语法元素进行解码以产生经二进制化P切片预测类型语法元素,且对B切片预测类型语法元素进行解码以产生经二进制化B切片预测类型语法元素。
[0094]
[0095]
[0096] 表3。本发明的另一实例中pred_type的二进制化
[0097]
[0098] 表4。本发明的另一实例中pred_type的二进制化
[0099] 以下表5展示使用表2中所示的用于P和B切片的共享二进制化的译码性能。如表5中可见,使用共享二进制化损失极少译码效率到不损失译码效率。低延迟P HE(高效率)是单向预测(P)切片二进制化的共同测试条件。类A到E表示不同的帧分辨率。类A是2k x4k分辨率。类B是1920x1080分辨率。类C是WVGA分辨率。类D是WQVGA分辨率。类E是720P分辨率。低延迟P HE测试条件中的0.1到0.2百分比的改变通常视为无关紧要的。
[0100]
[0101]
[0102] 表5。对pred_type的统一二进制化的译码性能
[0103] 任选地,用于预测类型(包含预测大小和/或预测模式)的相同二进制化(不限于表2到4)可在两个和多个不同类型的帧间预测切片中共享。帧间预测切片可包含(但不限于):
[0104] a.P切片:切片仅支持单向运动预测
[0105] b.B切片:切片支持单向和双向运动预测
[0106] c.在可缩放视频译码中:增强层可与基本层共享相同的二进制化。
[0107] d.在多视图译码中:不同视图可共享相同的二进制化。
[0108] 当启用不对称分割时,相等地划分为两个上下文集合的四个上下文用于CABAC的最后两个二进位,用于用信号发送用于不对称分割的pred_type语法元素(即,PART_2NxnU、PART_2NxnD、PART_nLx2N、PART_nRx2N)。取决于是否沿着水平方向或垂直方向划分分区,应用一个上下文集合。第二到最后二进位(即,分区类型二进位;part_mode)指定当前CU是否具有对称分区或不对称分区。最后二进位(即,分区大小二进位;part_mode)指定第一分区的大小是否为CU大小的四分之一或四分之三。表6展示pred_type语法元素的第二到最后(分区类型)和最后(分区大小)的上下文的实例。
[0109]
[0110] 表6。Pred_Type语法元素的最后两个二进位的上下文
[0111] 本发明提出对第二到最后二进位(即,分区类型二进位)使用一个上下文且对最后二进位(即,分区大小二进位)使用旁路模式。因此,上下文的数目从4缩减到1。表7展示根据本发明的此实例使用的上下文的实例。表8展示与所提出修改相关联的译码性能。随机存取高效率(HE)是关于随机存取帧的测试条件。低延迟B HE是允许双向预测的测试条件。
[0112]二进位 上下文
分区类型(对称或不对称) 上下文集合1(1个上下文)
分区大小(第一分区为1/4CU或3/4CU) 旁路模式(无上下文)
[0113] 表7。根据本发明实例的Pred_Type语法元素的最后两个二进位的上下文
[0114]
[0115] 表8。pred_type的所提出方法的译码性能
[0116] 以此方式,根据此实例,视频编码器20可经配置以确定视频数据块的预测模式的分区类型,使用具有单个上下文的上下文自适应二进制算术译码对视频数据块的预测类型语法元素的分区类型二进位进行编码,其中所述单个上下文对于任一分区类型是相同的,且在旁路模式中使用上下文自适应二进制算术译码对视频数据块的预测类型语法的分区大小二进位进行编码。
[0117] 类似地,根据此实例,视频解码器30可经配置以接收已使用上下文自适应二进制算术译码(CABAC)译码的视频数据块的预测类型语法元素,所述预测类型语法元素包含表示分区类型的分区类型二进位和表示分区大小的分区大小二进位,使用具有单个上下文的上下文自适应二进制算术译码对预测类型语法元素的分区类型二进位进行解码,其中所述单个上下文对于任一分区类型是相同的,且在旁路模式中使用上下文自适应二进制算术译码对视频数据块的预测类型语法的分区大小二进位进行解码。
[0118] 在另一实例中,当对矩形分区类型进行译码时,对于指示分区模式是否为PART_nLx2N或PART_nRx2N或者模式是否为PART_2NxnU、PART_2NxnD的二进位可使用旁路模式或单个上下文。使用旁路模式或单个上下文是适用的,因为任一分区模式被使用的机会接近于50%。还任选地,对于指示模式是否为对称分区或不对称分区的二进位可使用旁路模式或单个上下文。
[0119] 本发明的下一实例涉及帧间预测的“合并”模式中的信令。在合并模式中,编码器通过预测语法的位流信令指示解码器从将译码的图片的当前部分的选定候选运动向量复制运动向量、参考索引(识别给定参考图片列表中运动向量指向的参考图片)和运动预测方向(识别参考图片列表(列表0或列表1),即鉴于参考帧是否在时间上在当前帧之前或跟随当前帧)。这是通过在位流中用信号发送进入候选运动向量列表的索引来实现,所述索引识别选定候选运动向量(即,特定空间运动向量预测符(MVP)候选或时间MVP候选)。
[0120] 因此,对于合并模式,预测语法可包含识别模式(在此情况下“合并”模式)的旗标和识别选定候选运动向量的索引(merge_idx)。在一些实例中,候选运动向量将在参考当前部分的因果部分中。也就是说,候选运动向量将已经由解码器解码。因此,解码器已经接收和/或确定针对因果部分的运动向量、参考索引和运动预测方向。由此,解码器可简单地从存储器检索与因果部分相关联的运动向量、参考索引和运动预测方向,且复制这些值作为当前部分的运动信息。为了在合并模式中重构块,解码器使用导出的当前部分的运动信息来获得预测块,且将残余数据添加到预测块以重构经译码块。
[0121] 在HM4.0中,在当前PU处于合并模式中时用信号发送五个合并候选中的一者。利用截断一元码来表示语法元素merge_idx。在针对HEVC的一个提议中,对于CABAC,每一二进位使用一个上下文。本发明提出在全部四个二进位中重复地使用一个上下文,如表9中所示。
[0122]
[0123] 表9。Pred_Type语法元素的最后两个二进位的上下文
[0124] 表10展示与此实例相关联的译码性能。
[0125]
[0126] 表10。merge_idx的所提出方法的译码性能
[0127] 任选地,在合并索引译码中可使用多于一个上下文,其中一些二进位共享同一上下文且一些二进位使用其它上下文。作为一个实例,仅连续二进位共享同一上下文。举例来说,二进位2和二进位3可共享一个上下文;二进位2和二进位4无法共享同一上下文,除非二进位3也共享所述上下文。
[0128] 作为另一实例,假定合并索引的二进位的总数目是N(第一二进位是二进位0,最后二进位是二进位N-1)。在合并索引译码中使用Y个阈值thresi,i=l,...,y来确定上下文共享。在此实例中,以下规则指示在二进位之间如何共享上下文:
[0129] 1.0<Y<N(存在比二进位少的阈值)
[0130] 2.thresi<thresi+1
[0131] 3.0<thres1
[0132] 4.thresY=N
[0133] 5.binj将共享一个上下文,其中i={thresY,...,thresi+1-l/
[0134] 基于这些规则,其中在全部四个二进位中重复使用一个上下文的先前方法可视为N=4、Y=1、thres1=4的一种情况。因此,二进位0到二进位3共享同一上下文。
[0135] 另一实例包含设定N=4、Y=2、thres1=2、thres2=4。在此实例中,二进位0和二进位1共享相同上下文,且二进位2和二进位3共享相同上下文。
[0136] 帧间预测旗标(inter_pred_flag)指定是否单向预测或双向预测用于当前PU。在一些实例中,用于帧间预测旗标的上下文索引等于当前CU深度。由于存在四个可能CU深度(0到3),因此存在用于对inter_pred_flag进行译码的四个可能上下文。
[0137] 本发明提出用以选择用于对inter_pred_flag进行译码的上下文的上下文索引等于当前CU深度(例如,CU的层级四叉树分解),但是以所选的阈值为上限(即,是当前CU深度或阈值中的较小者)。在一个实例中所述阈值可选择为2。或者,上下文索引可等于最大CU深度减去当前CU深度且以所选阈值为上限。或者,可设计预定义映射表以通过给定CU深度选择上下文索引。所述映射表可实施为逻辑集合。因此,使用3个上下文对语法元素inter_pred_flag进行译码。
[0138] 表11展示当初始化表改变但上下文数目不改变时的译码性能。表12展示将上下文数目从4缩减到3的提出技术的译码性能。
[0139]
[0140]
[0141] 表11。具有对inter_pred_flag的经修改CABAC初始化的HM4.0的译码性能。
[0142]
[0143] 表12。inter_pred_flag的所提出上下文缩减技术的译码性能。
[0144] 通过相对于相关联列表(例如,列表0或列表1)中的作用参考帧使用截断一元码来用信号发送参考帧索引(ref_idx_lx)。使用三个上下文来对参考帧索引进行译码。一个上下文用于二进位0,一个上下文用于二进位1,且一个上下文用于其余二进位。表13展示用于ref_idx_lx的一元码的二进位的上下文指派的实例。
[0145]ref_idx_lx一元码的二进位 上下文
二进位0 上下文1
二进位1 上下文2
二进位2-N(N是二进位的总数目) 上下文3
[0146] 表13。ref_idx_lx的二进位的上下文指派
[0147] 本发明提出使用两个上下文来对用于ref_idx_lx的一元码进行译码:一个上下文用于二进位0且另一上下文用于其余二进位。表14展示根据本发明的此实例用于ref_idx_lx的一元码的二进位的上下文指派的实例。表15展示与所提出修改相关联的译码性能。
[0148]ref_idx_Ix一元码的二进位 上下文
二进位0 上下文1
二进位1-N(N是二进位的总数目) 上下文2
[0149] 表14。ref_idx_lx的二进位的上下文指派
[0150]
[0151] 表15。ref_idx_lx的所提出方法的译码性能。
[0152] 对于色度经译码块旗标语法元素(cbf_cb和cbf_cr),对于CABAC使用两个不同上下文集合(在每一上下文集合中5个上下文)。在每一集合中使用的实际上下文的索引等于与正译码的色度经译码块旗标相关联的当前变换深度。表16展示用于cbf_cb和cbf_cr色度经译码块旗标的上下文集合。
[0153]色度经译码块旗标 上下文集合
Cbf_cb 上下文集合1(5个上下文)
Cbf_cr 上下文集合2(5个上下文)
[0154] 表16。用于cbf_cb和cbf_cr的上下文集合
[0155] 本发明提出cbf_cb和cbf_cr共享一个上下文集合。在每一集合中使用的实际上下文的索引仍可等于与正译码的色度经译码块旗标相关联的当前变换深度。表17展示根据本发明实例的用于cbf_cb和cbf_cr色度经译码块旗标的上下文集合。表18展示与所提出修改相关联的译码性能。
[0156]色度经译码块旗标 上下文集合
Cbf_cb 上下文集合1(5个上下文)
Cbf_cr 上下文集合1(5个上下文)
[0157] 表17。根据本发明实例的用于cbf_cb和cbf_cr的上下文集合
[0158]
[0159] 表18。cbf_cb和cbf_cr的所提出方法的译码性能。
[0160] 以此方式,根据此实例,视频编码器20和视频解码器30两者可经配置以使用上下文自适应二进制算术译码(CABAC)对视频数据块的Cb色度经译码块旗标进行译码,其中CABAC使用包含一个或多个上下文的上下文集合,且使用CABAC对Cr色度经译码块旗标进行译码,其中CABAC使用与Cb色度经译码块旗标相同的上下文集合。视频编码器20和视频解码器30可进一步经配置以基于与视频数据块相关联的变换单元的变换深度从所述一个或多个上下文选择上下文。
[0161] 在用于HEVC的一个提议中,对于coeff_abs_level_greater1_flag和coeff_abs_level_greater2_flag存在十二个上下文集合。coeff_abs_level_greater1_flag指示变换系数是否具有大于1的绝对值。coeff_abs_level_greater2_flag指示变换系数是否具有大于2的绝对值。为亮度和色度分量相等地指派上下文集合,即6个上下文集合用于亮度且6个上下文用于色度。每一上下文集合由5个上下文组成。上下文集合的索引ctxSet是基于先前的coeff_abs_level_greater1_flag而选择。对于coeff_abs_level_greater1_flag,上下文集合内的上下文的索引greater1Ctx是基于拖尾的一到最大值4来确定。所述上下文索引可表示为:
[0162] ctxIdx_level_greater1=(ctxSet*5)+Min(4,greater1Ctx)   (1)
[0163] 对于coeff_abs_level_greater2_flag,上下文集合内的上下文的索引greater2Ctx是基于为1到最大值4的coeff_abs_level_greater1_flag的数目。所述上下文索引可表示为:
[0164] ctxIdx_level_greater2=(ctxSet*5)+Min(4,greater2Ctx)   (2)
[0165] greater1Ctx基于重要系数的数目以及大于1的系数的数目。另一方面,greater2Ctx基于大于1的系数的数目。
[0166] 在一些实例中,可在不同上下文集合中使用不同的上下文数目,包含例如:
[0167] 1.用于大于1的层级或用于大于2的层级的上下文集合可具有不同的上下文数目。举例来说,上下文集合0和3可具有5个上下文,且其余上下文集合可具有2个上下文。
[0168] 2.用于亮度系数的上下文集合与用于色度分量的上下文集合相比可具有不同数目的上下文。举例来说,用于亮度的上下文集合0可具有5个上下文,且用于色度的上下文集合0可具有4个上下文。
[0169] 3.用于大于1的层级的上下文集合可具有与用于大于2的层级的上下文集合不同的上下文数目。举例来说,用于大于1的层级的上下文集合0可具有5个上下文,且用于大于2的层级的上下文集合0可仅具有3个上下文。
[0170] 在其它实例中,可使用上下文集合的不同数目用于大于1或大于2的译码,包含例如:
[0171] 1.用于亮度系数的上下文集合可具有与用于色度分量的上下文集合不同数目的上下文集合。举例来说,亮度可使用6个上下文,且色度可使用4个上下文。
[0172] 2.用于大于1的上下文集合可具有与用于大于2的上下文集合不同数目的上下文集合。举例来说,大于1可使用6个上下文,且大于2可使用4个上下文。
[0173] 任选地,使用度量来确定上下文集合中正使用哪一上下文且所述度量的值范围大于上下文集合中的上下文的数目。在一个此方面中,一个上下文可与所述度量的一个或多个值相关联。上下文共享优选地限于连续的值。举例来说,使所述度量的值为y。y=2关联于上下文3,且y=1和y=4也可关联于上下文3。然而,如果y=3关联于上下文4,那么y=4无法关联于上下文3。
[0174] 举例来说,对于coeff_abs_level_greater1_flag,上下文集合0和3具有5个上下文,且上下文集合1、2、4和5具有2个上下文。对于coeff_abs_level_greater2_flag,上下文集合0、1和2具有5个上下文,且上下文集合3、4和5具有2个上下文。其可表示为:
[0175] ctxIdx_level_greater1=(ctxSet*5)+Min(Thres_greater1,greater1Ctx)   (3)[0176] 如果ctxSet=0或ctxSet=3,Thres_greater1=4;
[0177] 否则,Thres_greater1=1.
[0178] ctxIdx_level_greater2=(ctxSet*5)+Min(Thres_greater2,greater2Ctx)   (4)[0179] 如果ctxSet<3,Thres_greater2=4;
[0180] 否则,Thres_greater2=1
[0181] Thres_greater1和Thres_greater2可基于以下情形不同地选择:
[0182] 1.亮度或色度分量
[0183] 2.上下文集合
[0184] 作为另一实例,对于coefl_abs_level_greater1_flag,上下文集合0和3具有5个上下文,且上下文集合1、2、4和5具有3个上下文。对于coefl_abs_level_greater2_flag,上下文集合0、1和2具有5个上下文,且上下文集合3、4和5具有2个上下文。其可表示为:
[0185] ctxIdx_level_greater1=(ctxSet*5)+greater1Ctx_mapped   (3)
[0186] ctxIdx_level_greater2=(ctxSet*5)+greater2Ctx_mapped   (4)
[0187] 在此些实例中,映射可如表19和20中所示:
[0188]greater1Ctx 0 1 2 3 >3
ctxSet0 0 1 2 3 4
ctxSet1 0 1 1 2 2
ctxSet2 0 1 1 1 2
ctxSet3 0 1 2 3 4
ctxSet4 0 1 2 2 2
ctxSet5 0 1 1 2 2
[0189] 表19
[0190]greater2Ctx 0 1 2 3 >3
ctxSet0 0 1 2 3 4
ctxSet1 0 1 1 1 1
ctxSet2 0 1 1 1 1
ctxSet3 0 1 2 3 4
ctxSet4 0 1 1 1 1
ctxSet5 0 1 1 1 1
[0191] 表20
[0192] coefl_abs_level_greater1_flag和coefl_abs_level_greater2_flag的CABAC初始化表也针对用于等于l的Thres_greater1或Thres_greater2的上下文集合而修改。所述修改将第五上下文的初始化向前移动为第二上下文的初始化。此提出的方法将上下文的数目从120缩减到78。
[0193]
[0194] 表21。coeff_abs_level_greater1_flag和coeff_abs_level_greater2_flag的所提出方法的译码性能。
[0195] 表21列出在先前部分中提到的所有语法元素的上下文的数目。总缩减为56个上下文。
[0196]上下文的数目 HM4.0 所提出方法
pred_type 10 6
merge_idx 4 1
inter_pred_flag 4 3
ref_idx_lc,ref_idx_10,ref_idx_ll 3 2
cbf_cb,cbf_cr 10 5
coeff_abs_level_greater1_flag 60 36
coeff_abs_level_greater2_flag 60 42
总计 151 95
[0197] 表22。所提出方法和HM4.0中上下文数目的比较
[0198] 图2是图解说明可实施本发明中描述的技术的实例性视频编码器20的框图。视频编码器20可执行视频切片内的视频块的帧内和帧间译码。帧内译码依赖于空间预测来减少或移除给定视频帧或图片内的视频中的空间冗余。帧间译码依赖于时间预测来减少或移除视频序列的邻近帧或图片内的视频中的时间冗余。帧内模式(I模式)可指代若干基于空间的压缩模式中的任一者。例如单向预测(P模式)或双向预测(B模式)等帧间模式可指代若干基于时间的压缩模式中的任一者。
[0199] 在图2的实例中,视频编码器20包含分割单元35、预测单元41、参考图片存储器64、求和器50、变换单元52、量化单元54以及熵编码单元56。预测单元41包含运动估计单元42、运动补偿单元44和帧内预测单元46。对于视频块重构,视频编码器20还包含逆量化单元58、逆变换单元60和求和器62。还可包含解块滤波器(图2中未图示)以对块边界进行滤波以从经重构视频移除成块假象。如果需要,则解块滤波器将通常对求和器62的输出进行滤波。除了解块滤波器之外也可使用额外的环路滤波器(环路内或环路后)。
[0200] 如图2所示,视频编码器20接收视频数据,且分割单元35将数据分割为视频块。此分割也可包含分割为切片、瓦片或其它较大单元,以及视频块分割,例如根据LCU和CU的四叉树结构。视频编码器20通常说明对待编码视频切片内的视频块进行编码的组件。切片可被划分为多个视频块(且可能划分为若干组称为瓦片的视频块)。预测单元41可基于误差结果(例如,译码速率和失真水平)为当前视频块选择多个可能译码模式中的一者,例如多个帧内译码模式中的一者或多个帧间译码模式中的一者。预测单元41可将所得经帧内或帧间译码块提供到求和器50以产生残余块数据且提供到求和器62以重构经编码块以用作参考图片。
[0201] 预测单元41内的帧内预测单元46可相对于与待译码当前块相同的帧或切片中的一个或一个以上相邻块执行当前视频块的帧内预测译码以提供空间压缩。预测单元41内的运动估计单元42和运动补偿单元44相对于一个或一个以上参考图片中的一个或一个以上预测块执行当前视频块的帧间预测译码以提供时间压缩。
[0202] 运动估计单元42可经配置以根据视频序列的预定模式来确定视频切片的帧间预测模式。预定模式可将序列中的视频切片指定为P切片、B切片或GPB(一股化P/B)切片。运动估计单元42和运动补偿单元44可高度集成,但为了概念目的而分开来说明。由运动估计单元42执行的运动估计是产生估计视频块的运动的运动向量的过程。举例来说,运动向量可指示当前视频帧或图片内的视频块的PU相对于参考图片内的预测块的位移。
[0203] 预测块为被发现在像素差方面紧密匹配于待译码视频块的PU的块,所述像素差可通过绝对差和(SAD)、平方差和(SSD)或其它差量度来确定。在一些实例中,视频编码器20可计算存储在参考图片存储器64中的参考图片的子整数像素位置的值。举例来说,视频编码器20可内插参考图片的四分之一像素位置、八分之一像素位置或其它分数像素位置的值。因此,运动估计单元42可执行相对于全像素位置和分数像素位置的运动搜索,且输出具有分数像素精度的运动向量。
[0204] 运动估计单元42通过将PU的位置与参考图片的预测块的位置进行比较来计算经帧间译码切片中的视频块的PU的运动向量。参考图片可选自第一参考图片列表(列表0)或第二参考图片列表(列表1),其中每一者识别存储在参考图片存储器64中的一个或多个参考图片。运动估计单元42将所计算的运动向量发送到熵编码单元56和运动补偿单元44。
[0205] 由运动补偿单元44执行的运动补偿可涉及基于由运动估计确定的运动向量来获取或产生预测块,可能执行达到子像素精度的内插。在接收到当前视频块的PU的运动向量后,运动补偿单元44可即刻在参考图片列表中的一者中定位运动向量指向的预测块。视频编码器20通过从正译码的当前视频块的像素值减去预测块的像素值而形成像素差值,来形成残余视频块。像素差值形成块的残余数据,且可包含亮度和色度差分量两者。求和器50表示执行此减法运算的组件。运动补偿单元44还可产生与视频块和视频切片相关联的语法元素,供视频解码器30用于对视频切片的视频块进行解码。
[0206] 帧内预测单元46可对当前块进行帧内预测,作为对如上所述由运动估计单元42和运动补偿单元44执行的帧间预测的替代。具体来说,帧内预测单元46可确定将用以对当前块进行编码的帧内预测模式。在一些实例中,帧内预测单元46可例如在单独的编码遍次期间使用各种帧内预测模式对当前块进行编码,且帧内预测单元46(或在一些实例中,模式选择单元40)可从测试模式中选择将使用的适当帧内预测模式。举例来说,帧内预测单元46可使用用于各种经测试帧内预测模式的速率一失真分析来计算速率一失真值,且在经测试模式中选择具有最佳速率一失真特性的帧内预测模式。速率一失真分析通常确定经编码块与曾经编码以产生经编码块的原始未经编码块之间的失真(或误差)的量,以及用以产生经编码块的位速率(即,位数目)。帧内预测单元46可根据各种经编码块的失真和速率来计算比率,以确定哪一帧内预测模式展现块的最佳速率一失真值。
[0207] 在任一情况下,在选择块的帧内预测模式之后,帧内预测单元46可将指示块的选定帧内预测模式的信息提供到熵译码单元56。熵译码单元56可根据本发明的技术对指示选定帧内预测模式的信息进行编码。视频编码器20可在所发射位流中包含配置数据,其可包含多个帧内预测模式索引表和多个经修改帧内预测模式索引表(也称为码字映射表)、用于各种块的编码上下文的定义,以及针对上下文中的每一者将使用的最可能帧内预测模式、帧内预测模式索引表和经修改帧内预测模式索引表的指示。
[0208] 在预测单元41经由帧间预测或帧内预测产生当前视频块的预测块之后,视频编码器20通过从当前视频块减去预测块而形成残余视频块。残余块中的残余视频数据可包含在一个或一个以上TU中且应用于变换单元52。变换单元52使用例如离散余弦变换(DCT)或概念上类似的变换等变换将残余视频数据变换为残余变换系数。变换单元52可将残余视频数据从像素域转换到变换域,例如频域。
[0209] 变换单元52可将所得变换系数发送到量化单元54。量化单元54量化变换系数以进一步减小位速率。量化过程可减小与系数中的一些或全部相关联的位深度。可通过调整量化参数来修改量化程度。在一些实例中,量化单元54可随后执行对包含经量化变换系数的矩阵的扫描。或者,熵编码单元56可执行扫描。作为一个实例,本发明中描述的译码技术可完全地或部分地由熵编码单元56执行。然而,本发明的方面不限于此。举例来说,本发明中描述的译码技术可由图2中未图示的视频编码器20的组件(例如处理器或任何其它组件)执行。在一些实例中,本发明的译码技术可由图2中图解说明的其它单元或模块中的一者执行。在又一些其它实例中,本发明的译码技术可由视频编码器20的单元和模块的组合执行。以此方式,视频编码器20可经配置以执行本发明中描述的实例技术。
[0210] 在量化后,熵编码单元56对经量化变换系数进行熵编码。举例来说,熵编码单元56可执行上下文自适应可变长度译码(CAVLC)、上下文自适应二进制算术译码(CABAC)、基于语法的上下文自适应二进制算术译码(SBAC)、概率区间分割熵(PIPE)译码或另一熵编码方法或技术。在熵编码单元56的熵编码之后,经编码位流可发射到视频解码器30,或经归档以用于视频解码器30的稍后发射或检索。熵编码单元56还可对正译码的当前视频切片的运动向量和其它语法元素进行熵编码。
[0211] 在本发明的一个实例中,熵编码单元56可经配置以确定P切片中的视频数据块的第一预测类型,将第一预测类型表示为P切片预测类型语法元素,确定B切片中的视频数据块的第二预测类型,将第二预测类型表示为B切片预测类型语法元素,确定P切片预测类型语法元素的P切片二进制化,确定B切片预测类型语法元素的B切片二进制化,其中P切片预测类型语法元素和B切片预测类型语法元素是使用相同二进制化逻辑来确定,且基于P切片预测类型语法元素和B切片预测语法元素的二进制化对所述视频数据进行编码。
[0212] 在本发明的另一实例中,熵编码单元56可经配置以确定视频数据块的预测模式的分区类型,使用具有单个上下文的上下文自适应二进制算术译码对视频数据块的预测类型语法元素的分区类型二进位进行编码,其中所述单个上下文对于任一分区类型是相同的,且在旁路模式中使用上下文自适应二进制算术译码对视频数据块的预测类型语法的分区大小二进位进行编码。
[0213] 在本发明的另一实例中,熵编码单元56可经配置以使用上下文自适应二进制算术译码(CABAC)对视频数据块的Cb色度经译码块旗标进行译码,其中CABAC使用包含一个或多个上下文的上下文集合,且使用CABAC对Cr色度经译码块旗标进行译码,其中CABAC使用与Cb色度经译码块旗标相同的上下文集合。视频编码器20和视频解码器30可进一步经配置以基于与视频数据块相关联的变换单元的变换深度从所述一个或多个上下文选择上下文。
[0214] 逆量化单元58和逆变换单元60分别应用逆量化和逆变换以重构像素域中的残余块,用于稍后用作参考图片的参考块。运动补偿单元44可通过将残余块加到参考图片列表中的一者内的参考图片中的一者的预测块来计算参考块。运动补偿单元44还可将一个或多个内插滤波器应用于经重构残余块以计算子整数像素值以用于运动估计。求和器62将经重构残余块加到由运动补偿单元44产生的经运动补偿预测块以产生参考块以存储在参考图片存储器64中。参考块可由运动估计单元42和运动补偿单元44用作参考块以对后续视频帧或图片中的块进行帧间预测。
[0215] 图3是图解说明可实施本发明中描述的技术的实例性视频解码器30的框图。在图3的实例中,视频解码器30包含熵解码单元80、预测单元81、逆量化单元86、逆变换单元88、求和器90以及参考图片存储器92。预测单元81包含运动补偿单元82和帧内预测单元84。在一些实例中,视频解码器30可执行与关于图2的视频编码器20描述的编码遍次大体上互逆的解码遍次。
[0216] 在解码过程期间,视频解码器30从视频编码器20接收表示经编码视频切片的视频块的经编码视频位流和相关联语法元素。视频解码器30的熵解码单元80对位流进行熵解码以产生经量化系数、运动向量和其它语法元素。熵解码单元80将运动向量和其它语法元素转发到预测单元81。视频解码器30可在视频切片级和/或视频块级接收语法元素。
[0217] 作为一个实例,本发明中描述的译码技术可完全地或部分地由熵解码单元80执行。然而,本发明的方面不限于此。举例来说,本发明中描述的译码技术可由图3中未图示的视频解码器30的组件(例如处理器或任何其它组件)执行。在一些实例中,本发明的译码技术可由图3中图解说明的其它单元或模块中的一者执行。在又一些其它实例中,本发明的译码技术可由视频解码器30的单元和模块的组合执行。以此方式,视频解码器30可经配置以执行本发明中描述的实例技术。
[0218] 在本发明的一个实例中,熵解码单元80可经配置以使用P切片中的视频数据块的二进制化映射将经二进制化P切片预测类型语法元素映射到预测类型,使用B切片中的视频数据块的相同二进制化映射将经二进制化B切片预测类型语法元素映射到预测类型,且基于经映射预测类型对所述视频数据进行解码。
[0219] 在本发明的一个实例中,熵解码单元80可经配置以接收已使用上下文自适应二进制算术译码(CABAC)译码的视频数据块的预测类型语法元素,所述预测类型语法元素包含表示分区类型的分区类型二进位和表示分区大小的分区大小二进位,使用具有单个上下文的上下文自适应二进制算术译码对预测类型语法元素的分区类型二进位进行解码,其中所述单个上下文对于任一分区类型是相同的,且在旁路模式中使用上下文自适应二进制算术译码对视频数据块的预测类型语法的分区大小二进位进行解码。
[0220] 在本发明的另一实例中,熵解码单元80可经配置以使用上下文自适应二进制算术译码(CABAC)对视频数据块的Cb色度经译码块旗标进行译码,其中CABAC使用包含一个或多个上下文的上下文集合,且使用CABAC对Cr色度经译码块旗标进行译码,其中CABAC使用与Cb色度经译码块旗标相同的上下文集合。视频编码器20和视频解码器30可进一步经配置以基于与视频数据块相关联的变换单元的变换深度从所述一个或多个上下文选择上下文。
[0221] 当视频切片经译码为经帧内译码(I)切片时,预测单元81的帧内预测单元84可基于用信号发送的帧内预测模式和来自当前帧或图片的先前经解码块的数据来产生当前视频切片的视频块的预测数据。当视频帧经译码为经帧间译码(即,B、P或GPB)切片时,预测单元81的运动补偿单元82基于从熵解码单元80接收的运动向量和其它语法元素来产生当前视频切片的视频块的预测块。预测块可从参考图片列表中的一者内的参考图片中的一者产生。视频解码器30可基于存储在参考图片存储器92中的参考图片,使用默认构造技术来构造参考帧列表,列表0和列表1。
[0222] 运动补偿单元82通过剖析运动向量和其它语法元素来确定当前视频切片的视频块的预测信息,且使用预测信息来产生正解码的当前视频块的预测块。举例来说,运动补偿单元82使用所接收语法元素中的一些来确定用以对视频切片的视频块进行译码的预测模式(例如,帧内或帧间预测)、帧间预测切片类型(例如,B切片、P切片或GPB切片)、切片的一个或多个参考图片列表的构造信息、切片的每一经帧间编码视频块的运动向量、切片的每一经帧间译码视频块的帧间预测状态,以及用以对当前视频切片中的视频块进行解码的其它信息。
[0223] 运动补偿单元82还可基于内插滤波器执行内插。运动补偿单元82可使用由视频编码器20在视频块编码期间使用的内插滤波器来计算参考块的子整数像素的经内插值。在此情况下,运动补偿单元82可根据所接收语法元素来确定由视频编码器20使用的内插滤波器且使用所述内插滤波器来产生预测块。
[0224] 逆量化单元86逆量化(即,解量化)在位流中提供且由熵解码单元80解码的经量化变换系数。逆量化过程可包含使用由视频编码器20针对视频切片中的每一视频块计算的量化参数来确定量化程度,且同样确定应当应用的逆量化程度。逆变换单元88对变换系数应用逆变换,例如逆DCT、逆整数变换或概念上类似的逆变换过程,以便产生像素域中的残余块。
[0225] 在运动补偿单元82基于运动向量和其它语法元素产生当前视频块的预测块之后,视频解码器30通过将来自逆变换单元88的残余块与由运动补偿单元82产生的对应预测块进行求和来形成经解码视频块。求和器90表示执行此求和运算的组件。如果需要,则还可应用解块滤波器以对经解码块进行滤波以便移除成块假象。也可使用其它环路滤波器(在译码环路中或在译码环路之后)来平滑像素转变,或另外改善视频质量。随后将给定帧或图片中的经解码视频块存储在参考图片存储器92中,所述参考图片存储器存储用于后续运动补偿的参考图片。参考图片存储器92还存储经解码视频用于稍后在例如图1的显示装置32等显示装置上呈现。
[0226] 图6是图解说明本发明的实例性视频编码方法的流程图。图6的方法可由视频编码器20实施。视频编码器20可经配置以确定P切片中的视频数据块的第一预测类型(602),且将第一预测类型表示为P切片预测类型语法元素(604)。视频编码器20可进一步经配置以确定B切片中的视频数据块的第二预测类型(606),且将第二预测类型表示为B切片预测类型语法元素(608)。P切片预测类型语法元素和B切片预测类型语法元素指定预测模式和分区类型。预测模式可包含帧间预测和帧内预测中的一者。分区类型可包含对称分区和不对称分区中的一者。
[0227] 视频编码器20可进一步经配置以确定用于P切片预测类型语法元素的P切片二进制化(610),且确定用于B切片预测类型语法元素的B切片二进制化,其中P切片预测类型语法元素和B切片预测类型语法元素是使用相同的二进制化逻辑确定(612)。视频编码器20可随后基于P切片预测类型语法元素和B切片预测类型语法元素的二进制化对视频数据进行编码(614)。
[0228] 对视频数据进行编码可包括用所确定P切片二进制化对P切片预测类型语法元素进行二进制化,用所确定B切片二进制化对B切片预测类型语法元素进行二进制化,将上下文自适应二进制算术译码(CABAC)应用于经二进制化P切片预测类型语法元素,且将上下文自适应二进制算术译码(CABAC)应用于经二进制化B切片预测类型语法元素。
[0229] 图7是图解说明本发明的实例性视频解码方法的流程图。图7的方法可由视频解码器30实施。视频解码器30可经配置以接收指示P切片中的视频数据块的预测类型的经上下文自适应二进制算术译码P切片预测类型语法元素(702),且接收指示B切片中的视频数据块的预测类型的经上下文自适应二进制算术译码B切片预测类型语法元素(704)。P切片预测类型语法元素和B切片预测类型语法元素指定预测模式和分区类型。预测模式可包含帧间预测和帧内预测中的一者。分区类型可包含对称分区和不对称分区中的一者。
[0230] 视频解码器30可进一步经配置以对P切片预测类型语法元素进行解码以产生经二进制化P切片预测类型语法元素(706),且对B切片预测类型语法元素进行解码以产生经二进制化B切片预测类型语法元素(708)。视频解码器30可进一步经配置以使用P切片中的视频数据块的二进制化映射将经二进制化P切片预测类型语法元素映射到预测类型(710),且使用B切片中的视频数据块的相同二进制化映射将经二进制化B切片预测类型语法元素映射到预测类型(712)。视频解码器30可随后基于经映射预测类型对视频数据进行解码(714)。
[0231] 图8是图解说明本发明的实例性视频编码方法的流程图。图8的方法可由视频编码器20实施。视频编码器20可经配置以确定视频数据块的预测模式的分区类型(802),且使用具有单个上下文的上下文自适应二进制算术译码(CABAC)对视频数据块的预测类型语法元素的分区类型二进位进行编码(804)。所述单个上下文对于任一分区类型是相同的。在一个实例中,分区类型是不对称分区,且分区类型二进位指示不对称分区是否为垂直分割或水平分割。举例来说,分区大小二进位指示第一分区是否为视频数据块的大小的四分之一或第一分区是否为视频数据块的大小的四分之三。
[0232] 视频编码器20可进一步经配置以在旁路模式中使用CABAC对视频数据块的预测类型语法元素的分区大小二进位进行编码(806)。
[0233] 图9是图解说明本发明的实例性视频解码方法的流程图。图9的方法可由视频解码器30实施。视频解码器30可经配置以接收已使用上下文自适应二进制算术译码(CABAC)译码的视频数据块的预测类型语法元素,所述预测类型语法元素包含表示分区类型的分区类型二进位和表示分区大小的分区大小二进位(902)。在一个实例中,分区类型是不对称分区,且分区类型二进位指示不对称分区是否为垂直分割或水平分割。举例来说,分区大小二进位指示第一分区是否为视频数据块的大小的四分之一或第一分区是否为视频数据块的大小的四分之三。
[0234] 视频解码器30可进一步经配置以使用具有单个上下文的CABAC对预测类型语法元素的分区类型二进位进行解码,其中所述单个上下文对于任一分区类型是相同的(904),且在旁路模式中使用CABAC对预测类型语法元素的分区大小二进位进行解码(906)。
[0235] 图10是图解说明本发明的实例性视频译码方法的流程图。图10的方法可由视频编码器20或视频解码器实施。为了图10的目的,视频编码器20和视频解码器30将大体上统称为视频译码器。根据图10的技术,视频译码器可经配置以使用上下文自适应二进制算术译码(CABAC)对视频数据块的Cb色度经译码块旗标进行译码,其中对Cb色度经译码块旗标进行译码包括使用包含一个或多个上下文的上下文集合作为CABAC的部分(1002),且使用CABAC对Cr色度经译码块旗标进行译码,其中对Cr色度经译码块旗标进行译码包括使用与Cb色度经译码块旗标相同的上下文集合作为CABAC的部分(1004)。在一个实例中,上下文集合包含5个上下文。
[0236] 在本发明的一个任选实例中,视频译码器可进一步经配置以基于与视频数据块相关联的变换单元的变换深度从所述一个或多个上下文选择上下文(1006)。
[0237] 当作为视频编码器操作时,视频译码器可进一步经配置以在经编码视频位流中用信号发送经译码Cb色度经译码块旗标,且在经编码视频位流中用信号发送经译码Cr色度经译码块旗标。当作为视频解码器操作时,视频译码器可进一步经配置以接收经编码视频位流中的经译码Cb色度经译码块旗标,且接收经编码视频位流中的经译码Cr色度经译码块旗标。
[0238] 在一个或一个以上实例中,所描述的功能可以硬件、软件、固件或其任一组合来实施。如果以软件实施,那么功能可作为一个或多个指令或代码存储在计算机可读媒体上或经由计算机可读媒体传输,且由基于硬件的处理单元执行。计算机可读媒体可包含对应于例如数据存储媒体等有形媒体的计算机可读存储媒体,或包含促进计算机程序例如根据通信协议从一处传送到另一处的任何媒体的通信媒体。以此方式,计算机可读媒体通常可对应于(1)非暂时性的有形计算机可读存储媒体,或(2)例如信号或载波等通信媒体。数据存储媒体可为可由一个或一个以上计算机或者一个或一个以上处理器存取以检索用于实施本发明中描述的技术的指令、代码和/或数据结构的任何可用媒体。计算机程序产品可包含计算机可读媒体。
[0239] 举例来说且并非限制,此类计算机可读存储媒体可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置、快闪存储器或可用来以指令或数据结构的形式存储所要程序代码且可由计算机存取的任何其它媒体。而且,恰当地将任何连接称作计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)或例如红外线、无线电及微波等无线技术从网站、服务器或其它远程源传输指令,则同轴电缆、光纤电缆、双绞线、DSL或例如红外线、无线电及微波等无线技术包含于媒体的定义中。然而应了解,计算机可读存储媒体和数据存储媒体不包含连接、载波、信号或其它瞬时媒体,而是针对非瞬时有形存储媒体。如本文中所使用,磁盘及光盘包含压缩光盘(CD)、激光光盘、光学光盘、数字多功能光盘(DVD)、软磁盘及蓝光光盘,其中磁盘通常以磁性方式再生数据,而光盘使用激光以光学方式再生数据。上文的组合也应包含在计算机可读媒体的范围内。
[0240] 可由例如一个或一个以上数字信号处理器(DSP)、通用微处理器、专用集成电路(ASIC)、现场可编程逻辑阵列(FPGA)或其它等效集成或离散逻辑电路等一个或一个以上处理器来执行指令。因此,如本文中所使用的术语“处理器”可指上述结构或适合于实施本文中所描述的技术的任一其它结构中的任一者。另外,在一些方面中,本文描述的功能性可提供于经配置以用于编码和解码的专用硬件和/或软件模块内,或并入在组合式编解码器中。并且,可将所述技术完全实施于一个或多个电路或逻辑元件中。
[0241] 本发明的技术可在广泛多种装置或设备中实施,包含无线手持机、集成电路(IC)或一组IC(例如,芯片组)。本发明中描述各种组件、模块或单元以强调经配置以执行所揭示技术的装置的功能方面,但不一定需要通过不同硬件单元来实现。而是,如上所述,各种单元可在编解码器硬件单元中组合或由互操作硬件单元(包含如上所述的一个或多个处理器)的集合结合合适软件和/或固件来提供。
[0242] 已描述了各种实例。这些和其它实例属于所附权利要求书的范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈