首页 / 专利库 / 视听技术与设备 / 视频编码层 / 一种适用于HEVC视频编码的帧级量化参数计算方法

一种适用于HEVC视频编码级量化参数计算方法

阅读:460发布:2020-05-28

专利汇可以提供一种适用于HEVC视频编码级量化参数计算方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种考虑 帧 间依赖的帧级量化参数计算方法。首先建立基于帧间依赖的失真 预测模型 (ΔD-ΔQp模型),然后将该模型运用到率失真优化中,求得率失真代价最小时的拉格朗日乘子λ,最后由λ-Qp关系,求出最优帧级量化参数。其中的ΔD-ΔQp模型不仅体现了帧间依赖,并在建模过程中将视频内容考虑了进来,所以该模型可以根据视频内容自适应调整。本方法具有实施复杂度低的特点,方法中使用的参量均是从 视频编码 过程中获得,不需要复杂的计算,基本不会增加视频编码复杂度,所以不会造成系统延时。,下面是一种适用于HEVC视频编码级量化参数计算方法专利的具体信息内容。

1.一种适用于HEVC视频编码级量化参数计算方法,通过离线数据统计分析,当前帧的帧级量化参数Qps的改变量ΔQp,与GOP内所有帧的平均失真ΔD之间呈现线性关系ΔD=K·ΔQp                                     (7)
其中K为斜率,ΔD=avg(MSE),MSE为每帧的编码失真;
将公式(7)变换为ΔD=f(Qps,ε)·ΔQp                             (8)采取对ΔD/ΔR的值取极限的方式,即
R是码率,D是失真;
该方法包括如下步骤:
(1)建立K与Qps、ε之间模型;
(2)数据统计分析;
(3)帧级量化参数计算。
2.如权利要求1所述的适用于HEVC视频编码的帧级量化参数计算方法,其特征在于:所述步骤(1)具体包括如下流程:
外层循环由Qps控制,其初值等于18,每循环一次Qps加1,一直到Qps等于48结束循环;内层循环由ΔQp控制,每循环一次,ΔQp加0.1,其变化区间为[-5,5],每个Qps的变化范围为[-
5+Qps,5+Qps)];当内外层循环都结束后,用每次内层循环编码获取的数据以启发式离线建模的方式建立K与Qps、ε之间模型。
3.如权利要求2所述的适用于HEVC视频编码的帧级量化参数计算方法,其特征在于:所述步骤(2)具体如下:
a)提出基于依赖的帧间失真波动程度K
ΔQp=ΔQp+0.1                                 (10)
其中MSE为每帧的编码失真,N=30为编码帧数;ΔD与ΔQp之间的斜率为K,b)建立帧间失真波动程度预测模型
参数ε定义如下所示:
其中N是编码帧数,N∈[10,30];
建立帧间失真依赖模型以如下函数关系呈现:
其中a1,a2,b1,b2,c1,c2为自适应参数,随着视频内容不同而更新。
4.如权利要求3所述的适用于HEVC视频编码的帧级量化参数计算方法,其特征在于:所述步骤(3)具体如下:
由于当ΔQp趋于零时,ΔR也趋于零,将公式(9)转化为:
由公式(7),(8),(14)可得:
采用二次模型可以对码率R进行有效估计:
其中SATDi为当前帧的SATD,qi为当前帧的量化步长,qi与 之间的关系为:
α1,α2为模型参量,由公式(17),(18)可得ΔR为:
令 则公式(19)转化为:
ΔRi=H(i)·ΔQp                                     (20)
令ΔD=f(ΔQp),ΔR=g(ΔQp),则公式(15)转化为:
将公式(16),(20)带入(21)可得:
将公式(22)带入 可得当前帧的帧级量化参数为:

说明书全文

一种适用于HEVC视频编码级量化参数计算方法

技术领域

[0001] 本发明涉及一种适用于HEVC视频编码的帧级量化参数计算方法,适用于改进HEVC码率控制中帧级量化参数计算方法和改进HEVC的RDO(率失真优化)中D-q模型。

背景技术

[0002] 在符合HEVC标准的视频编码中存在复杂的多层次空时域依赖,如:帧内和帧间预测导致的失真会发生空时域传递;上下文自适应熵编码会导致邻近编码单元之间码率消耗相互依赖,这些都使得帧级量化参数(Qp)的计算,不再满足传统编码单元之间相互独立的假设。由于在图像组(GOP)内除I帧外,其他所有帧均采用帧间预测编码,使得帧间依赖成为影响失真传递的最大因素,所以在计算帧级量化参数时需要考虑帧间依赖。帧间依赖关系非常复杂,可以在码率控制算法中直接使用多遍编码,来分析视频帧之间的依赖关系,但是非常耗时且计算复杂度比较高,由于实际使用的编码器通常对编码实时性要求很高,所以这种方法不适合在实际中应用。
[0003] 现在大多数做法是在率失真优化(RDO)中体现帧间依赖,首先通过离线统计分析建立符合帧间依赖关系的R-q,D-q模型,其中R是码率,D是失真,q是量化步长,然后根据率失真优化理论:
[0004]
[0005]
[0006] 得出在码率约束RT下,编码失真最小的量化参数集合 其中N为总编码帧数。但是公式(1)仅仅是对问题的描述,并不能根据该公式求解,所以在实际操作中使用拉格朗日优化方法,把公式(1)中的问题转化为可以求解的数学问题:
[0007]
[0008]
[0009] 其中J是率失真代价,λ是拉格朗日乘子,通过公式(2)就把码率约束下的最小化失真问题,转化为求最小率失真代价J的数学问题,J取得最小时的量化参数即为最优帧级量化参数。
[0010] 以前的研究已经证明,当:
[0011]
[0012] 即:
[0013]
[0014] 时取得的量化参数为最优量化参数。在符合HEVC标准的编码器中,拉格朗日乘子λ根据下式计算:
[0015] λ=qfactor·2(Qp-12)/3  (5)
[0016] 其中qfactor是编码器中的参数。由公式(4),(5)得出帧级量化参数为:
[0017]
[0018] 由公式(6)可以看出,每帧的帧级量化参数与失真对码率的偏导直接相关,所以该偏导值的计算非常重要。
[0019] 基于以上分析,本方法首先提出了一种考虑帧间依赖的失真预测模型(ΔD-ΔQp模型),目的是求出整个GOP失真的改变量ΔD,然后将求出的ΔD运用到公式(6)中求出帧级量化参数。由于在计算时考虑了帧间依赖,所以由本方法计算出来的帧级量化参数更加合理精确,同时由于ΔD-ΔQp模型能够根据视频内容自适应地调整,所以本方法具有广泛的适用性。
[0020] 最接近的已有技术1:
[0021] Adaptive Quantization Parameter Selection For H.265/HEVC by Employing Inter-Frame Dependency。
[0022] 该技术针对HEVC编码器中Random Access编码结构,提出了一种编码层级(coding level)量化参数自适应选择算法。首先在图像组(GOP)内,将图像组分为5个编码层级,依次为level0~level4,处于level0的图像进行帧内编码,level1~level4的图像参考比其低的相邻层进行帧间预测编码。然后依据反向传递理论,推导并计算出每层基于帧间依赖的失真D。最后依据率失真优化理论和λ-Qp关系模型,计算出相邻编码层之间量化参数的偏移量,并由这个偏移量结合初始量化参数得出各层的量化参数,对于处于同一层的各帧,其帧级量化参数与该层量化参数相同。
[0023] 该已有技术的缺陷
[0024] 该技术提出的仅是针对Random Access编码结构的量化参数选择算法,计算出的量化参数为编码层级,所以该算法存在颗粒度较大,应用场景局限的缺点。并且由于本论文中提出的帧间依赖是基于不同编码层的,其中的level4完全没有被参考,帧间失真传递在该层终止,没有形成一个完整、连续的失真传递链,所以对于帧间依赖的分析并不全面。
[0025] 最接近的已有技术2:
[0026] Adaptive Quantization Parameter Cascading in HEVC Hierarchical Coding[0027] 该技术针对HEVC编码器中Random Access编码结构,提出了一种编码层级量化参数自适应选择算法。首先该算法将同一图像组(GOP)内的图像分成若干不同的编码层,然后提出基于帧间依赖的失真传递和码率依赖模型,这两个模型分别说明了当前层的失真和码率改变量,与整个GOP失真和码率改变量之间的关系。接着根据一次D-q和二次R-q模型,得出了各层失真和码率改变量与量化步长改变量之间的模型。最后利用率失真优化理论,求出各层的最佳量化步长偏移量Δq,然后将这个最佳偏移量与GOP量化参数均值相加并结合q-Qp关系得出每层的量化参数。
[0028] 该已有技术缺陷:
[0029] 该技术对于所有测试序列都使用固定的参数δ来体现帧间依赖,使得该算法不能根据视频内容进行自适应调整,在普适性方面有所欠缺。同样该算法是编码层级的量化参数选择算法,所以该算法也存在颗粒度过大和帧间参考链条不完整的缺陷。

发明内容

[0030] 本发明需解决的技术问题:
[0031] (1)传统的帧级量化参数计算方法为了降低编码复杂度,假设编码帧之间相互独立,使得帧级量化参数计算的不够精确,所以在考虑帧间依赖的量化参数计算方法中,需要找到合适的量来表征帧间依赖关系;
[0032] (2)传统的失真预测方法基本都是寻求建立失真与量化步长之间的模型(D-q模型),忽略了视频内容对帧间失真传递的影响,所以基于帧间依赖的失真预测模型需要考虑视频内容,使失真预测模型能够根据视频内容自适应调整;
[0033] (3)传统的率失真优化算法都是直接运用D-q、R-q和λ-Qp模型求出最佳量化参数,如何将ΔD-ΔQp模型、ΔR-ΔQp模型和率失真算法结合,也是一个需要考虑的问题。
[0034] 本发明提出了一种考虑帧间依赖的帧级量化参数计算方法。首先建立基于帧间依赖的失真预测模型(ΔD-ΔQp模型),然后将该模型运用到率失真优化中,求得率失真代价最小时的拉格朗日乘子λ,最后由λ-Qp关系,求出最优帧级量化参数。其中的ΔD-ΔQp模型不仅体现了帧间依赖,并在建模过程中将视频内容考虑了进来,所以该模型可以根据视频内容自适应调整。本方法具有实施复杂度低的特点,方法中使用的参量均是从视频编码过程中获得,不需要复杂的计算,基本不会增加视频编码复杂度,所以不会造成系统延时。
[0035] 有益技术效果
[0036] (1)通过数据分析发现帧间失真波动程度K可以体现帧间依赖,并且K与Qps之间存在一一映射关系,所以可以通过建立K与Qps之间的模型对帧间失真波动程度进行预测。同时由于Qps是由码率控制算法提前得出,所以依据Qps与K之间的模型,仅需要很少的计算量就可以得出预测结果。
[0037] (2)由于视频内容也影响帧间失真传递,所以在建立Qps与K的模型时需要同时考虑视频内容,因此可以建立K=f(Qps,ε)的模型,更加全面地描述帧间失真依赖关系。由于该函数可以根据视频内容进行自适应调整,这样就保证了模型的普适性和准确性。同时在视频编码预处理阶段就已经得出了各帧的SATD,所以ε不需要复杂的计算就可以得出,基本不会引起编码时延。
[0038] (3)使用以上K=f(Qps,ε)模型建立ΔD-ΔQp之间的模型,然后将该模型ΔD-ΔQp融合进公式(6)中,使得依据该方法求出的帧级量化参数能有效地体现帧间依赖。并且由于K可以根据视频内容自适应调整,保证了本方法的普适性。附图说明
[0039] 图1是离线启发式建模流程图
[0040] 图2是ΔQp与ΔD之间关系图;
[0041] 图3是视频内容自适应的帧间失真估计模型图;

具体实施方式

[0042] 下面结合附图对本发明作进一步说明。
[0043] 本发明首先采用离线启发式建模的方式建立K与Qps、ε之间的模型,接着将建立的模型运用到ΔD-ΔQp关系中,建立ΔD-ΔQp模型,最后将ΔD、ΔR融合进λ-Qp关系中,得到帧级量化参数。
[0044] 通过离线数据统计分析发现,当前帧的帧级量化参数Qps的改变量ΔQp,与GOP内所有帧的平均失真ΔD之间呈现线性关系,
[0045] ΔD=K·ΔQp  (7)
[0046] 其中K为斜率,ΔD=avg(MSE),MSE为每帧的编码失真。由于avg(MSE)是整个GOP内所有Qp变化影响帧的平均失真,所以在ΔD中充分考虑了帧间依赖。经分析发现,这种线性关系的斜率值K能够体现基于依赖的失真传递特性,K越大,随着ΔQp的变化,失真ΔD的变化越剧烈,即帧间失真的波动越大,从而当前帧对整个GOP的影响越大,反之随着ΔQp的变化,ΔD的变化相对平缓,帧间失真波动较小,则当前帧对整个GOP的影响相较弱,由以上分析可以看出K实际上体现出了基于依赖的帧间失真波动的大小。并且K和Qps之间存在一一映射关系,K的值会随着参考帧Qps的变化而改变,所以可以通过建立K与Qps之间的关系对K进行预测。
[0047] 视频内容也会影响帧间失真传递。随着视频序列长度增加,视频内容会发生变化,所以当前参考帧的失真传递过程也会有所不同。基于这样的事实,本发明使用ε来体现一定长度视频的内容,ε=avg(SATD),其中SATD为帧级预测失真经哈达玛变换后的值。根据以上分析可得,为了更加准确地预测帧间依赖关系,可以建立K与Qps和ε三者间的模型,这样就可以做到根据视频内容自适应地预测基于帧间依赖的编码失真失真。
[0048] 由以上分析可以将公式(7)变换为:
[0049] ΔD=f(Qps,ε)·ΔQp  (8)
[0050] 在公式(6)中已经证明,当前帧最优帧级量化参数与失真对码率的偏导直接相关,本方法采取对ΔD/ΔR的值取极限的方式,即
[0051]
[0052] 将公式(8)中求得的失真融合进公式(6)中,使通过该方法求出的帧级量化参数既能体现帧间依赖,又能根据视频内容进行自适应调整,其中ΔR为由当前帧Qps变化引起GOP内所有帧编码比特变化的量。
[0053] 本发明具体包括如下内容:
[0054] (1)建立K与Qps、ε之间模型的流程
[0055] 图1中的BaseQp即表示Qps,从图1可以看出,该流程主要两个循环组成。外层循环由Qps控制,其初值等于18,每循环一次Qps加1,一直到Qps等于48结束循环,之所以将Qps设置在18到48的区间,是因为在正常编码情况下,帧级Qp一般都在这个范围内。内层循环由ΔQp控制,每循环一次,ΔQp加0.1,其变化区间为[-5,5],这样每个Qps的变化范围为[-5+Qps,5+Qps)],从而使得对应每个Qps都能有足够的数据点。当内外层循环都结束后,用每次内层循环编码获取的数据以启发式离线建模的方式建立模型。
[0056] (2)数据统计分析
[0057] a)提出基于依赖的帧间失真波动程度K
[0058] 如图2所示,图中X轴deltaqp即为ΔQp,ΔQp初值为-5,之后有
[0059] ΔQp=ΔQp+0.1  (10)
[0060] 直到ΔQp等于5。Y轴Meandeltamse即为δ,
[0061]
[0062] 其中MSE为每帧的编码失真,N=30为编码帧数。ΔD与ΔQp之间的斜率为K,[0063]
[0064] 由图2可以看出,K与Qps的值有关,当Qps变化时,K也会产生相应变化。
[0065] 由图2经过进一步观察可以得出,在不同Qps下ΔQp与ΔD呈现出线性关系,且当Qps不同时,直线的斜率K也不同,当K比较大时,随着ΔQp的变化,ΔD变化的快,当K比较小时,随着ΔQps的变化,ΔD变化的慢,所以K的大小直接体现了基于依赖的帧间失真ΔD变化的趋势,所以这里将K定义为:帧间失真波动程度。
[0066] b)建立帧间失真波动程度预测模型
[0067] 在编码过程中,设置不同编码帧数N,并对N的每一个值进行离线启发式建模,所得的结果如图3所示。图中的X轴为体现不同视频内容的量ε,Y轴为第一个参考帧的Qps,Z轴为在一定视频内容下的帧间失真波动程度K。参数ε定义如下所示:
[0068]
[0069] 其中N是编码帧数,N∈[10,30]。使用不同N的目的是使编码视频的内容发生变化,以便观察在不同视频内容下的特征。
[0070] 由图3观察可得,在不同ε情况下,Qps与K之间的曲线变化趋势基本相同,不同的仅仅是K的幅度,所以可以建立这三者之间的函数关系,用来对不同视频内容下的帧间失真依赖进行预测。最后通过启发式建模,本发明建立帧间失真依赖模型以如下函数关系呈现:
[0071]
[0072] 其中a1,a2,b1,b2,c1,c2为自适应参数,会随着视频内容不同而更新。
[0073] (3)提出帧级量化参数计算方法
[0074] 由公式(6)可以得出当前帧的帧级量化参数与失真对码率的偏导直接相关,使用公式(9)的方法可以准确求出该偏导值,所以这里采用如下的方法进一步推导得出精确计算帧级量化参数的方法。由于当ΔQp趋于零时,ΔR也趋于零,可以将公式(9)转化为:
[0075]
[0076] 由公式(7),(8),(14)可得:
[0077]
[0078] 以前的研究已经证明采用二次模型可以对码率R进行有效估计:
[0079]
[0080] 其中SATDi为当前帧的SATD,qi为当前帧的量化步长,qi与 之间的关系为:
[0081]
[0082] α1,α2为模型参量,由公式(17),(18)可得ΔR为:
[0083]
[0084] 令- 则公式(19)转化为:
[0085] ΔRi=H(i)·ΔQp  (20)
[0086] 令ΔD=f(ΔQp),ΔR=g(ΔQp)则公式(15)转化为:
[0087]
[0088] 将公式(16),(20)带入(21)可得:
[0089]
[0090] 将公式(22)带入公式(6)可得当前帧的帧级量化参数为:
[0091]
[0092] 从公式(23)中可以看出,经本方法计算出的当前帧的帧级量化参数与K和H的比值相关,而K的值一方面体现帧间失真依赖,另一方面能随着视频内容的变化而更新,所以最终由本方法求出的帧级量化参数也具有这两方面特性。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈