首页 / 专利库 / 广播 / 帧内预测 / 一种增强型帧内预测模式编码方法

一种增强型内预测模式编码方法

阅读:312发布:2023-12-24

专利汇可以提供一种增强型内预测模式编码方法专利检索,专利查询,专利分析的服务。并且本 发明 属于 信号 处理中的视频编解码领域,涉及一种增强型 帧 内预测 模式编码方法。其特点在于:利用相邻图像 块 的纹理的空间相关性,根据相邻块之间最佳预测模式的关系,统计确定视频的最有可能预测模式表,从而提高帧内编码时预测 精度 。本发明方法包括:统计相邻块之间最佳预测模式的关系,建立最有可能预测模式查找表;在编码端,根据左邻块和上邻块的预测模式查表得出当前块的最有可能预测模式,然后进行相应的帧内预测编码操作;在解码端,根据左邻块和上邻块的预测模式查表得出当前块的最有可能预测模式,然后进行相应的帧内预测解码操作。本发明所提出的方法简单易行,能有效增加帧内编码时预测精度,从而提高视频的编码效率。,下面是一种增强型内预测模式编码方法专利的具体信息内容。

1、一种增强型内预测模式编码方法,首先建立最有可能预测模式查找表; 在编码端根据该查找表对帧内预测的每个进行编码;在解码端根据该查找表 对帧内预测的每个块进行解码;
建立最有可能预测模式查找表的步骤为:
(A1)将测试序列对应的预测模式统计表stat[9][9][9]中设置初始值为0;
(A2)对每个图像块进行帧内预测编码处理:首先在AVS或H.264标准规定 的每一种预测模式下,设置率失真代价变量的初始值为零,如果当前块是图像 的上边缘块或左边缘块,选择均值DC预测模式作为其最有可能预测模式,写入 最有可能预测模式查找表;否则进行下述处理:
(A3)在AVS或H.264标准规定的每一种预测模式下计算其率失真代价值, 选定率失真代价最小的模式C为当前块的预测模式;在当前块的左邻块的预测 模式为L,其上邻块的预测模式为U时,将stat[L][U][C]中的数加1;
对所有帧内预测的块重复步骤(A2)至(A3)操作,即得到该序列的预测模式 统计表stat[9][9][9];
(A4):重复上述步骤(A1)至(A3)对典型测试序列进行统计,每个测试序列 到一张预测模式统计表,将各统计表的对应项相加得预测模式统计总表 stat_all[9][9][9];
(A5):分别令左邻块预测模式L和上邻块预测模式U为0至8的所有整数, 在每种L和U的组合下,按以下方法确定当前块最有可能预测模式:对每个给 定的L和U,找出stat_all[L][U][i],i=0、1、......、8中的最大值为stat_all[L][U][C], 其中C就是该组合下当前块的最有可能预测模式,将C写入最有可能预测模式 查找表的mpm[L][U];
对帧内预测的每个块进行编码的步骤为:
(B1)根据上邻块和左邻块的预测模式,查上述最有可能预测模式查找表 得出当前块的最有可能预测模式:设当前块的左邻块的预测模式为L、上邻 块的预测模式U,如果当前图像块为上边缘块或左边缘块,则Cp=DC;否则 当前块的最有可能预测模式Cp=mpm[L][U];
(B2)计算当前块在每一种预测模式下的代价,选择最佳的预测模式:
分别在AVS标准或H.264标准规定的9种可能的预测模式下,设置率失真代 价值的初始值,然后计算当前块的率失真代价值;选定率失真代价最小的模式 为当前块的预测模式C;
(B3)以选定的预测模式C对当前块编码:
首先计算当前块的原始象素值和该预测模式C下的预测值之间的差值,得 到当前块的残差图像;再对残差图像块进行整数变换和量化;对计算量化后的 变换系数进行熵编码
(B4)将预测模式信息写入码流:
为每个4×4块设定标志位f,如果Cp=C,则令f=1,否则f=0,将标志位f 用1比特写入码流;用变量R表示当前要写入的模式信息:如果当前块的预测 模式C小于最有可能预测模式Cp,则R=C,否则R=C-1,将R对应的三位二 进制数写入码流;
(B5)将熵编码后的信息写入码流;
对帧内预测的每个4×4块进行解码的步骤为:
(C1)从码流中读取图像块的帧内编码信息,包括标志位f和模式信息R;
(C2)确定当前块的最有可能预测模式Cp:如果当前块为当前帧图像的左 边缘块或上边缘块,则Cp为DC模式;否则设当前块的左邻块的预测模式为L、 上邻块的预测模式U,则Cp为预测模式查找表中表项mpm[L][U]的值。
(C3)确定当前图像块的帧内预测模式C:如果标志位f=1,则C=Cp;否 则进行如下处理:如果模式信息R小于Cp,则C=R;否则C=R+1;
(C4)重建当前图像块:根据预测模式C进行图像块象素的预测;对图像块 数据进行熵解码得到变换系数,然后对变换系数进行反量化、反变换;最后得 到重建的图像块。
2、根据权利要求1所述的方法,其特征在于:在AVS-M标准中,所建立的最 有可能预测模式查找表为:     U     L   0     1     2     3     4     5     6     7     8     0   0     0     0     0     0     0     0     0     0     1   1     1     1     1     1     1     1     1     1     2   0     1     0     0     4     5     1     0     1     3   0     1     1     0     4     5     1     0     1     4   0     1     4     4     4     4     4     4     8     5   0     0     0     0     4     5     0     0     0     6   0     1     1     1     4     4     6     3     1     7   0     0     0     0     0     0     0     7     0     8   1     1     1     1     1     1     1     3     8

说明书全文

技术领域

发明属于信号处理中的视频编解码领域,涉及一种增强型内预测模式 编码方法。

背景技术

随着通信技术与计算机技术的飞速发展,数字音视频信息的需求量与日俱 增。由于原始视频数据量极大,为了节省信道传输带宽和存储空间,需要对其 进行压缩编码。在视频编码技术的发展过程中,产生了一系列国际标准,如 ITU-T制定的H.261、H.263系列,ISO制定的MPEG-1、MPEG-2、MPEG-4系 列。目前,ISO和ITU建立的联合视频工作组(JVT)共同制定了最新的视频编 码标准H.264/MPEG-4 Part 10。在国内,中国数字音视频编码技术标准工作组 (AVS)正在制定面向存储应用的AVS1.0标准和面向移动多媒体应用的 AVS-M标准。
由于视频数据在空间域上有较强的相关性,待处理象素的值可由其邻近 象素的值来预测。将实际值与预测值的残差进行编码可获得较大的压缩率。 H.264中采用基于块的空间预测方法对帧内图像编码。对于亮度分量,可采用4 ×4与16×16两种分块方式。在帧内预测的4×4模式下,每个4×4块中的象素 通过邻块中已经解码的17个象素进行预测。预测模式分为9种,在编码时应该 为每个4×4块选择一种残差最小的最佳预测模式。在编码端需要把最终采用的 帧内预测模式的信息写进码流中,以便正确解码。为了最大程度地压缩码字, H.264在编码端采用一个简单有效的策略:首先根据当前块的左邻块和上邻块 的状态确定当前块最有可能预测模式(mostProbableMode),如果上邻块A和左 邻块B都在当前帧内,则最有可能预测模式为A和B中较小的模式,否则最有可 能预测模式为均值(DC)预测模式;然后对每一种有效的模式计算代价,用 代价最小的模式作为当前块的预测模式;最后把当前块的预测模式信息写进码 流,为了节省码字,如果最终预测模式等于最有可能预测模式,则简单地设置 信息标志为1,否则把当前模式信息完整地写入码流中。由此可见,最有可能 预测模式的预测越准确,码流的节省就越大。
但实验表明,在很多情况下预测模式的取小原则与实际存在一定的误差, 由于最有可能预测模式值在最后模式比较时占有优势,使得最后的模式并非最 佳模式,这样就不能最大程度地节省码流和提高预测精度

发明内容

本发明的目的在于克服上述帧内预测模式编码方法的不足之处,提供一种 增强型帧内预测模式编码方法。该方法简单易行,能更好地提高压缩率和增加 预测精度。
本发明提供的一种增强型帧内预测模式编码方法,首先建立最有可能预测 模式查找表;在编码端根据该查找表对帧内预测的每个块进行编码;在解码端 根据该查找表对帧内预测的每个块进行解码;
建立最有可能预测模式查找表的步骤为:
(A1)将测试序列对应的预测模式统计表stat[9][9][9]中设置初始值为0;
(A2)对每个图像块进行帧内预测编码处理:首先在AVS或H.264标准规定 的每一种预测模式下,设置率失真代价变量的初始值为零,如果当前块是图像 的上边缘块或左边缘块,选择均值DC预测模式作为其最有可能预测模式,写入 最有可能预测模式查找表;否则进行下述处理:
(A3)在AVS或H.264标准规定的每一种预测模式下计算其率失真代价值, 选定率失真代价最小的模式C为当前块的预测模式;在当前块的左邻块的预测 模式为L,其上邻块的预测模式为U时,将stat[L][U][C]中的数加1;
对所有帧内预测的块重复步骤(A2)至(A3)操作,即得到该序列的预测模式 统计表stat[9][9][9];
(A4):重复上述步骤(A1)至(A3)对典型测试序列进行统计,每个测试序列 到一张预测模式统计表,将各统计表的对应项相加得预测模式统计总表 stat_all[9][9][9];
(A5):分别令左邻块预测模式L和上邻块预测模式U为0至8的所有整数, 在每种L和U的组合下,按以下方法确定当前块最有可能预测模式:对每个给 定的L和U,找出stat_all[L][U][i],i=0、1、......、8中的最大值为stat_all[L][U][C], 其中C就是该组合下当前块的最有可能预测模式,将C写入最有可能预测模式 查找表的mpm[L][U];
对帧内预测的每个块进行编码的步骤为:
(B1)根据上邻块和左邻块的预测模式,查上述最有可能预测模式查找表 得出当前块的最有可能预测模式:设当前块的左邻块的预测模式为L、上邻 块的预测模式U,如果当前图像块为上边缘块或左边缘块,则Cp=DC;否则 当前块的最有可能预测模式Cp=mpm[L][U];
(B2)计算当前块在每一种预测模式下的代价,选择最佳的预测模式:
分别在AVS标准或H.264标准规定的9种可能的预测模式下,设置率失真代 价值的初始值,然后计算当前块的率失真代价值;选定率失真代价最小的模式 为当前块的预测模式C;
(B3)以选定的预测模式C对当前块编码:
首先计算当前块的原始象素值和该预测模式C下的预测值之间的差值,得 到当前块的残差图像;再对残差图像块进行整数变换和量化;对计算量化后的 变换系数进行熵编码
(B4)将预测模式信息写入码流:
为每个4×4块设定标志位f,如果Cp=C,则令f=1,否则f=0,将标志位f 用1比特写入码流;用变量R表示当前要写入的模式信息:如果当前块的预测 模式C小于最有可能预测模式Cp,则R=C,否则R=C-1,将R对应的三位二 进制数写入码流;
(B5)将熵编码后的信息写入码流;
对帧内预测的每个4×4块进行解码的步骤为:
(C1)从码流中读取图像块的帧内编码信息,包括标志位f和模式信息R;
(C2)确定当前块的最有可能预测模式Cp:如果当前块为当前帧图像的左 边缘块或上边缘块,则Cp为DC模式;否则设当前块的左邻块的预测模式为L、 上邻块的预测模式U,则Cp为预测模式查找表中表项mpm[L][U]的值。
(C3)确定当前图像块的帧内预测模式C:如果标志位f=1,则C=Cp;否 则进行如下处理:如果模式信息R小于Cp,则C=R;否则C=R+1;
(C4)重建当前图像块:根据预测模式C进行图像块象素的预测;对图像块 数据进行熵解码得到变换系数,然后对变换系数进行反量化、反变换;最后得 到重建的图像块。
本发明根据相邻块之间最佳预测模式的统计关系来估计最有可能预测模 式。其主要理论基础是相邻图像块的纹理具有空间相关性。帧内预测所确定的 最佳预测模式,其预测方向就是纹理信息最强的方向。所以,可以推论在H.264 或AVS等编码系统中,相邻图像块的最佳预测模式也是相关的。具体而言,本 发明的主要优点是:
其一、所提出的方法简单易行,不增加额外的计算复杂度。
其二、所提出的方法能很好地增加预测精度、提高压缩率。
附图说明
图1为H.264和AVS中定义的一种8个方向预测模式及其标号示意图。

具体实施方式

本发明通过对大量测试序列的预测模式进行统计,得出在左邻块预测模式 (leftmode)和上邻块预测模式(upmode)的各种组合下,当前块最佳预测模 式的取值规律;将各种左邻块预测模式和上邻块预测模式组合下最有可能的最 佳模式作为最有可能预测模式(mostProbableMode)写入一张固定的查找表中。
下面以AVS中4×4模式亮度分量的帧内预测为例,对本发明作进一步详细 的说明。AVS中定义的预测模式方向如图1所示。
具体的编码过程如下:
首先定义如下变量以便于算法描述:
左邻块预测模式L(leftmode):记录当前块的左邻块选用的预测模式, 其值为0到8的整数。
上邻块预测模式U(upmode):记录当前块的上邻块选用的预测模式,其 值为0到8的整数。
当前块预测模式C(currentmode):记录当前块选用的预测模式,其值为 0到8的整数。
预测模式统计表stat[9][9][9]:每个测试序列对应一张预测模式统计表,用 来记录该序列帧内预测模式的统计信息。stat[L][U][C]表示,在该序列采用帧 内预测的4×4图像块中,左邻块预测模式为L、上邻块预测模式为U、且当前 预测模式为C的4×4块的个数。
预测模式统计总表stat_all[9][9][9]:由所有测试序列的预测模式统计表对 应项相加得到。
最有可能预测模式查找表mpm[9][9]:记录最有可能的预测模式,其值为0 到8的整数;当左邻块预测模式为L、上邻块预测模式为U时,当前块最有可能 的预测模式为mpm[L][U]。
标志位f:标志图像块最有可能预测模式的选择是否准确,其值为二进制 数0或1,在码流中占用1bit。
预测模式选择变量R(remaining_mode_selector):当最有可能预测模式 的选择不准确时,用此变量表示当前块的预测模式信息,其值为0到7的整数, 在码流中写入该变量的二进制数(对应000到111),占用3bit。
一.编码前的准备工作:
对大量已编码的典型序列预测模式的取值规律作统计实验,建立一般情况 下的最有可能预测模式查找表:
步骤(A):统计每个测试序列的帧内预测模式取值规律:
先将该序列对应的预测模式统计表stat[9][9][9]中所有项置初始值0,再逐 个扫描采用帧内预测编码的4×4块(不包括图像帧的上边缘块和左边缘块), 首先在AVS或H.264标准规定的每一种预测模式下,设置率失真代价变量的初 始值为零,在当前块的预测模式为C,其左邻块的预测模式为L,其上邻块的 预测模式为U时,将stat[L][U][C]中的数加1;对所有帧内预测的4×4块重复此 操作,即可得到该序列的预测模式统计表。
步骤(B):根据预测模式统计表建立最有可能预测模式查找表:
用步骤(A)对各测试序列(如AVS标准中规定了112种测试序列)进行统计, 每个测试序列得到一张预测模式统计表,将这些表的对应项相加得预测模式统 计总表stat_all[9][9][9];
分别令左邻块预测模式L和上邻块预测模式U为0至8的所有整数,在每种L 和U的组合下,按以下方法确定当前块最有可能预测模式:
对每个给定的L和U,找出stat_all[L][U][i],i=0、1、……8中的最大值为 stat_all[L][U][C],其中C就是该组合下当前块的最有可能预测模式,将C写入 最有可能预测模式查找表的mpm[L][U];
如果当前块是图像的上边缘块或左边缘块,在这两种情况下,选择均值 (DC)预测模式作为其最有可能预测模式,写入最有可能预测模式查找表。
根据上述方法就可以获得最有可能预测模式查找表。
表一为根据AVS测试序列得出的最有可能预测模式查找表。
二.采用下述步骤,在编码端对帧内预测的每个4×4块进行编码。
(1):根据上邻块和左邻块的预测模式,查最有可能预测模式查找表得出 当前块的最有可能预测模式:
如果当前块的左邻块的预测模式为L、上邻块的预测模式U,则当前块 的最有可能预测模式Cp=mpm[L][U]。
(2):计算当前块在每一种预测模式下的代价,选择最佳的预测模式:
分别在AVS或H.264标准规定的9种可能的预测模式下,设置率失真代价值 的初始值,再计算当前块中各象素的原始值和预测值的差值,这些差值的绝对 值的和就是该预测模式的代价;选定代价最小的模式为当前块的预测模式C。
(3):以选定的预测模式对当前块编码:
按照AVS标准规定的步骤,首先计算当前块的原始象素值和该预测模式下 的预测值之间的差值,得到当前块的残差图像;再对残差图像块进行整数变换 和量化;对计算量化后的变换系数进行熵编码;
(4):将预测模式信息写入码流:
为每个4×4块设定标志位f,如果Cp=C,则令f=1;否则f=0,用预测模 式选择变量R表示当前模式信息:如果当前块的预测模式C小于最有可能预测 模式Cp,则R=C,否则R=C-1,将R对应的三位二进制数写入码流;
(5):将熵编码后的信息写入码流;
三.再根据下述步骤,在解码端对编码后的图像块进行解码。
(1)从码流中读取图像块的帧内编码信息,包括标志位f和模式信息R;
(2)确定当前块的最有可能预测模式Cp:如果当前块为当前帧图像的左边 缘块或上边缘块,则Cp为DC模式;否则设当前块的左邻块的预测模式为L、 上邻块的预测模式U,则Cp为预测模式查找表中表项mpm[L][U]的值。
(3)确定当前图像块的帧内预测模式C:如果标志位f=1,则C=Cp;否则 进行如下处理:如果模式信息R小于Cp,则C=R;否则C=R+1;
(4)重建当前图像块:根据预测模式C进行图像块象素的预测;对图像块 数据进行熵解码得到变换系数,然后对变换系数进行反量化、反变换;最后得 到重建的图像块。
以中国音视频编码标准化工作组(AVS)制定的面向移动多媒体应用的编 码系统AVS-M为例,说明这种基于统计的帧内预测模式编码方法的效果。在 AVS-M编码系统中,采用本发明提出的方法替代原来的方法,对典型序列进 行对比实验。表二所示为对比实验的结果。实验选取了CIF 15fs、QCIF 5fs、 CIF 30fs、QCIF 15fs四种格式的测试序列。表中的Y(dB)项表示采用本方法后 信噪比改变的分贝数,Bitrate项表示采用本方法后比特率的相对变化量。由表 中数据可知,每个序列的信噪比都有提高,比特率都有降低。这说明本发明提 出的基于统计的帧内预测编码方法可在实际应用中更好地提高压缩率和增加 预测精度。
           表一  最有可能预测模式查找表     U  L     0     1     2     3     4     5     6     7     8     0     0     0     0     0     0     0     0     0     0     1     1     1     1     1     1     1     1     1     1     2     0     1     0     0     4     5     1     0     1     3     0     1     1     0     4     5     1     0     1     4     0     1     4     4     4     4     4     4     8     5     0     0     0     0     4     5     0     0     0     6     0     1     1     1     4     4     6     3     1     7     0     0     0     0     0     0     0     7     0     8     1     1     1     1     1     1     1     3     8
表二  对典型序列使用本方法编码后信噪比和比特率的变化 全I帧测试   CIF 15fs   Y(dB)   Bitrate     QCIF 5fs   Y(dB) Bitrate   football   +0.2160   -2.59%     Foreman   +0.0343 -0.43%   Bus   +0.0925   -1.45%     football   +0.0583 -0.92%   Foreman   +0.0609   -1.12%     Bus   +0.0450 -0.69%   Paris   +0.0700   -0.86%     paris   +0.0214 -0.22%   News   +0.0746   -0.87%     Mobile   +0.0120 -0.15%   Tempete   +0.0476   -0.77%     News   +0.0148 -0.14%   Mobile   +0.0374   -0.57%     Tempete   +0.0125 -0.14%   Average   +0.0856   -1.18%     Average   +0.0283 -0.38%   CIF 30fs   Y(dB)   Bitrate     QCIF 15fs   Y(dB) Bitrate   football   +0.1064   -1.87%     Foreman   +0.0248 -0.32%   News   +0.0661   -0.77%     football   +0.0369 -0.68%   Foreman   +0.0498   -0.77%     News   +0.0232 -0.23%   Paris   +0.0591   -0.63%     Mobile   +0.0106 -0.13%   Tempete   +0.0461   -0.68%     Bus   +0.0269 -0.42%   Bus   +0.0531   -0.82%     paris   +0.0151 -0.15%   Mobile   +0.0306   -0.39%     Tempete   +0.0162 -0.21%   Average   +0.0587   -0.85%     Average   +0.0220 -0.31% IPP帧测试   CIF 30fs   Y(dB)   Bitrate     QCIF 15fs   Y(dB) Bitrate   football   +0.01dB   -0.23%     football   +0.016dB -0.30%   CIF 15fs   Y(dB)   Bitrate     QCIF 5fs   Y(dB) Bitrate   football   +0.059dB   -1.32%     football   +0.017dB -0.40%
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈