首页 / 专利库 / 视听技术与设备 / 视频编码层 / 一种HEVC编码中使用预测模式进行复杂度控制的方法

一种HEVC编码中使用预测模式进行复杂度控制的方法

阅读:717发布:2020-07-09

专利汇可以提供一种HEVC编码中使用预测模式进行复杂度控制的方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种HEVC编码中使用预测模式进行复杂度控制的方法,包括以下步骤:统计第一个GOP中的各个编码单元预测模式的复杂度,计算出各个预测模式的复杂度的比值,并通过不同的编码单元预测模式组合得到不同的 门 限值。把目标复杂度平均分配到待编码GOP内的每一 帧 ;把复杂度平均分配给剩下的编码树单元,每个编码树单元根据分配到的复杂度选择编码单元预测模式的组合,编码完成后更新剩余的复杂度。本发明整个方法避免引入额外的复杂度,且无需专门的训练视频序列,对于任何视频可以直接编码,复杂度控制的动态范围很高,而且 波动 较小。本发明能够在GOP级别在一定范围内实现复杂度的控制。,下面是一种HEVC编码中使用预测模式进行复杂度控制的方法专利的具体信息内容。

1.一种HEVC编码中使用预测模式进行复杂度控制的方法,其特征在于,包括如下步骤:
第一步,用户设定视频编码目标复杂度系数,正常编码并统计第一个GOP中的各个编码单元预测模式的复杂度和总的复杂度;
第二步,根据第一步中各个编码单元预测模式的复杂度,计算各个编码单元预测模式的复杂度的比值;
第三步,根据不同的视频分辨率,由第二步中编码单元预测模式的复杂度的比值计算不同编码单元预测模式组合的限值;
第四步,由第一步中得到的总复杂度,乘以目标复杂度系数,得到目标复杂度;平均分配目标复杂度到GOP里面每一
第五步,在每帧开始时,通过第四步中分配的每帧复杂度与前一帧剩余复杂度,计算当前帧的实际复杂度;
第六步,在每个编码树单元开始时,把当前帧剩余的复杂度平均分配到每个编码树单元CTU,作为编码树单元的目标复杂度;
第七步,针对第六步分配到的目标复杂度结合第三步不同编码单元预测模式组合的门限值选择编码单元预测模式的组合;
第八步,完成当前CTU的编码,更新当前帧剩余复杂度,并判断过程是否结束。
2.根据权利要求1所述的HEVC编码中使用预测模式进行复杂度控制的方法,其特征在于:第一步中:对第一个I帧后面的接下来的图像组大小Gop_size的P帧,分别统计各个编码单元预测模式的复杂度和这个GOP总的复杂度。
3.根据权利要求1所述的HEVC编码中使用预测模式进行复杂度控制的方法,其特征在于:第二步中:在第一步的基础上,通过统计的编码单元预测模式的复杂度计算各个编码单元预测模式的复杂度的比值,各个编码单元预测模式的复杂度的比值在不同帧之间保持恒定。
4.根据权利要求1-3任一项所述的HEVC编码中使用预测模式进行复杂度控制的方法,其特征在于:第三步中:计算不同编码单元预测模式组合的门限值,不同编码单元预测模式组合的门限值用来选择编码单元层次组合。

说明书全文

一种HEVC编码中使用预测模式进行复杂度控制的方法

技术领域

[0001] 本发明属于视频信息压缩领域,具体而言,涉及一种HEVC编码中使用预测模式进行复杂度控制的方法。

背景技术

[0002] 如今,智能移动设备,比如智能手机、智能平板变得越来越普及。随着这类设备的大量普及,智能手机、平板上的摄像头使得视频拍摄变得越来越容易。海量的视频内容被人们生成,而这种流量对于移动网络造成了沉重的负担,而且这种流量还在快速膨胀。在这种现状下,用于高效视频压缩的HEVC视频编码标准被提出,相比上一代视频编码标准AVC/H.264,HEVC可以节省接近50%的码流,可以极大的减轻视频对于网络带宽的压,可以预见,HEVC将成为未来十年最主要的视频编码标准。
[0003] 在另一方面,由于采用了一系列新的技术,比如更多的预测单元模式划分类型等,在大大提高编码效率的同时,也使得符合HEVC编码标准的编码器复杂度过高,限制了符合这种标准的编码器尤其是性能相对有限的移动智能设备中的应用。
[0004] 经检索,公开号为105120295A、申请号为201510490394.8的中国发明专利申请,该发明公开一种基于四叉树编码分割的HEVC复杂度控制方法,具体步骤如下:一、用户设定视频编码的初始目标复杂度;步骤二、利用区域显著性检测算法生成视频中每一的编码权重图谱;步骤三、编码器设计每一帧的块级别复杂度-失真优化控制模型;步骤四、针对视频中的所有帧,循环更新当前帧的目标复杂度替换前一帧的目标复杂度,应用于当前帧的块级别复杂度-失真优化控制模型;步骤五、编码结束。
[0005] 但是上述专利:1.由于引入了区域显著性检测算法,带来了编码复杂度的上升;2.该专利需要至少3个视频序列作为训练,必须先训练后使用,应用受限。
[0006] 在运用了大量新技术的同时,HEVC能够取得很好的压缩性能,但同时运算复杂度很高。尤其是对于HEVC编码标准中规定33中预测模式类型,编码器需要将这些类型的预测模式全部进行计算比较,耗费大量计算。

发明内容

[0007] 针对现有技术中的缺陷和HEVC中所有预测模式,本发明的目的是提供一种HEVC编码中使用预测模式进行复杂度控制的方法,既达到复杂度控制的目的,同时还能取得较好的编码性能。
[0008] 为实现上述目的,本发明采用以下技术方案:
[0009] 一种HEVC编码中使用预测模式进行复杂度控制的方法,其特征在于,包括如下步骤:
[0010] 第一步,用户设定视频编码目标复杂度系数,正常编码并统计第一个GOP中的各个编码单元预测模式的复杂度和总的复杂度;
[0011] 第二步,根据第一步中各个编码单元预测模式的复杂度,计算各个编码单元预测模式的复杂度的比值;
[0012] 第三步,根据不同的视频分辨率,由第二步中编码单元预测模式的复杂度的比值计算不同编码单元预测模式组合的限值;
[0013] 第四步,由第一步中得到的总复杂度,乘以目标复杂度系数,得到目标复杂度;平均分配目标复杂度到GOP里面每一帧;
[0014] 第五步,在每帧开始时,通过第四步中分配的每帧复杂度与前一帧剩余复杂度,计算当前帧的实际复杂度;
[0015] 第六步,在每个编码树单元开始时,把当前帧剩余的复杂度平均分配到每个编码树单元CTU,作为编码树单元的目标复杂度;
[0016] 第七步,针对第六步分配到的目标复杂度结合第三步不同编码单元预测模式组合的门限值选择编码单元预测模式的组合;
[0017] 第八步,完成当前CTU的编码,更新当前帧剩余复杂度,并判断过程是否结束。
[0018] 优选地,第一步中:对第一个I帧后面的接下来的图像组大小Gop_size的P帧,分别统计各个编码单元预测模式的复杂度和这个GOP总的复杂度。
[0019] 优选地,第二步中:在第一步的基础上,通过统计的编码单元预测模式的复杂度计算各个编码单元预测模式的复杂度的比值,各个编码单元预测模式的复杂度的比值在不同帧之间保持恒定。
[0020] 优选地,第三步中:计算不同编码单元预测模式组合的门限值,不同编码单元预测模式组合的门限值用来选择编码单元层次组合。
[0021] 与现有技术相比,本发明具有如下的有益效果:
[0022] 本发明提供的方法能够使得编码单元根据目前的复杂度的情况动态的选择需要的预测模式,从而在一定范围内达到复杂度的控制。与现有方法相比,本发明整个方法避免引入额外的复杂度,且无需专门的训练视频序列,对于任何视频可以直接编码,复杂度控制的动态范围很高,而且波动较小。本发明能够在GOP级别在一定范围内实现复杂度的控制。附图说明
[0023] 通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0024] 图1是本发明的HEVC编码中使用预测模式进行复杂度控制的方法流程图

具体实施方式

[0025] 下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
[0026] 以下首先对本发明的技术用语进行解释和说明。
[0027] 编码单元:Coding Unit,简称CU,视频编码的最基本单元,每个编码单元的大小可以是64x64、32x32、16x16、8x8。其中最大编码单元叫做编码树单元CTU(Coding Tree Unit),可以通过四叉树分割技术递归划分成大小不一的小编码单元。
[0028] 预测模式:Prediction Mode,HEVC支持的预测模式有Inter2Nx2N,Inter2NxN,InterNx2N,InterNxN,Inter2NxN/2,Inter2Nx3N/2,InterN/2x2N,Inter3N/2x2N,Intra2Nx2N,IntraNxN,SKIP/Merge2Nx2N,N对应的值有32,16,8,4。为了后文简单描述,现将预测模式使用索引表述如表1:
[0029] 表1预测模式索引值
[0030]
[0031]
[0032] 如图1所示,一种HEVC编码中使用预测模式进行复杂度控制的方法,具体实施步骤如下:
[0033] 步骤1:用户设定视频编码目标复杂度系数α,α∈[0,1],正常编码并统计第一个GOP中的各个预测模式的复杂度和GOP总的复杂度:
[0034] 在第一个I帧后面接下来的Gop_size的P帧,分别统计各个编码单元预测模式的复杂度和总的复杂度,记为 下标是预测模式的索引值。
[0035] 步骤2:计算各个编码单元预测模式的比值:
[0036] 分别把各个预测模式的复杂度的比值记为R0,R1,R2,R3,…,R43。把预测模式22即Inter16x16模式的复杂度作为分母,则计算公式如下:
[0037]
[0038] 上述参数的下标表示预测模式的索引;
[0039] 步骤3:计算不同编码单元预测模式组合的门限值:
[0040] 在完成复杂度的分配之后,需要把复杂度映射到具体的编码操作当中。为了使得取得的编码率失真性能较优,针对编码单元预测模式的组合,通过离线学习的方法先确定了在给定复杂度的情况下如何去选择编码单元预测模式组合。在离线学习中发现预测模式的组合与编码图像的分辨率有很高的相关性,所以先定义:
[0041]
[0042] RC=RW+RH
[0043] 其中RW表示输入视频序列像素宽度,RH表示输入视频序列像素高度,RC表示判决门限;
[0044] 在给定一个编码单元预测模式复杂度的情况下,如下表1选择编码单元预测模式;
[0045] 表1给定复杂度下的最佳的编码层次组合
[0046]
[0047] 在给定复杂度的情况下,需要确定选择的编码单元预测模式的个数。在本发明方法中需要四个门限值去区分,记这四个门限值为 这些门限将在步骤7中使用,具体计算过程是:
[0048] 当RC<2其计算公式为:
[0049]
[0050] 当RC≥2其计算公式为:
[0051]
[0052] 步骤4:把目标复杂度平均分配到GOP里面每一帧:
[0053] 第一个GOP中的总的复杂度是 目标复杂度系数为α∈[0,1]。因此,分配到每帧的复杂度为:
[0054]
[0055] 步骤5:计算每帧的实际复杂度:
[0056] 每帧的复杂度 由两部分组成,一部分是分配到每帧的复杂度 另一部分是前一帧剩余的复杂度 即
[0057] 步骤6:把每帧剩余的复杂度 平均分配到每个编码树单元CTU:
[0058] 记每帧有NCTU个CTU,当前处理的CTU是第j个,则当前CTU分配到的复杂度为:
[0059]
[0060] 步骤7:针对分配到的复杂度选择编码单元预测模式的组合:
[0061] 当前编码单元CTU分配到的复杂度确定之后,就是针对分配到的复杂度选择编码单元预测模式的组合。这里要解决的问题就是如何选定编码单元预测模式组合。具体公式如下:
[0062]
[0063] 按预测模式索引值从小到大顺序选择,直到所有复杂度用尽;
[0064] 步骤8:完成当前CTU的编码,更新当前帧剩余复杂度,并判断过程是否结束。:
[0065] 在每个编码树单元CTU完成编码之后,更新帧内剩余的复杂度,计算公式如下:
[0066]
[0067]
[0068] 如果是帧内的最后一个编码单元,则进入下一帧编码,否则进入下一个编码单元。当GOP内所有帧都完成编码时,进入下一个GOP。如果所有GOP都完成编码,则过程结束。
[0069] 为了验证本发明的可行性和有效性,在真实环境下验证本发明方法。实验室测试条件为Windows7操作系统,3.1GHz主频的CPU,8G内存。测试代码为HEVC参考代码HM,测试QP为22、27、32、37。RD性能的参考是原始HM代码在复杂度不受限情况下的性能。测试序列特征如下表2:
[0070] 表2测试序列特征
[0071]序列 编码帧数 帧率 尺寸
BQTerrace 150 60 1920x1080
RaceHorses 150 30 832x480
BlowingBubbles 150 50 416x240
FourPeople 150 60 1280x720
SlideEditing 150 30 1280x720
[0072] 表3基于编码单元层次的HEVC复杂度控制方法的BD-BR值
[0073]目标复杂度 10% 20% 30% 40% 50% 60% 70% 80% 90%
BQTerrace 9.02 4.87 3.12 2.02 1.71 1.21 0.98 0.35 0.22
RaceHorses 15.88 9.50 4.28 3.47 2.09 1.08 0.50 0.22 0.04
BlowingBubbles 13.27 7.12 4.62 3.46 2.64 1.44 0.89 0.38 0.23
FourPeople 24.62 13.32 7.13 3.59 2.16 1.85 1.49 1.09 0.98
SlideEditing 25.64 9.39 3.61 2.85 2.27 2.23 1.56 0.97 1.02
[0074] 由实验结果可知,本发明可以在较大范围内(5%-100%)对复杂度进行有效的控制,并且取得较好的率失真性能。
[0075] 以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈