一种增强型帧内预测模式编码方法专利检索-帧内预测广播专利检索查询-专利查询网

一种增强型 帧内预测模式编码方法

阅读：312发布：2023-12-24

专利汇可以提供一种增强型帧内预测模式编码方法专利检索，专利查询，专利分析的服务。并且本发明属于信号处理中的视频编解码领域，涉及一种增强型帧内预测模式编码方法。其特点在于：利用相邻图像块的纹理的空间相关性，根据相邻块之间最佳预测模式的关系，统计确定视频的最有可能预测模式表，从而提高帧内编码时预测精度。本发明方法包括：统计相邻块之间最佳预测模式的关系，建立最有可能预测模式查找表；在编码端，根据左邻块和上邻块的预测模式查表得出当前块的最有可能预测模式，然后进行相应的帧内预测编码操作；在解码端，根据左邻块和上邻块的预测模式查表得出当前块的最有可能预测模式，然后进行相应的帧内预测解码操作。本发明所提出的方法简单易行，能有效增加帧内编码时预测精度，从而提高视频的编码效率。，下面是一种增强型帧内预测模式编码方法专利的具体信息内容。

权利要求

1、一种增强型帧内预测模式编码方法，首先建立最有可能预测模式查找表；在编码端根据该查找表对帧内预测的每个块进行编码；在解码端根据该查找表对帧内预测的每个块进行解码；
建立最有可能预测模式查找表的步骤为：
(A1)将测试序列对应的预测模式统计表stat[9][9][9]中设置初始值为0；
(A2)对每个图像块进行帧内预测编码处理：首先在AVS或H.264标准规定的每一种预测模式下，设置率失真代价变量的初始值为零，如果当前块是图像的上边缘块或左边缘块，选择均值DC预测模式作为其最有可能预测模式，写入最有可能预测模式查找表；否则进行下述处理：
(A3)在AVS或H.264标准规定的每一种预测模式下计算其率失真代价值，选定率失真代价最小的模式C为当前块的预测模式；在当前块的左邻块的预测模式为L，其上邻块的预测模式为U时，将stat[L][U][C]中的数加1；
对所有帧内预测的块重复步骤(A2)至(A3)操作，即得到该序列的预测模式统计表stat[9][9][9]；
(A4)：重复上述步骤(A1)至(A3)对典型测试序列进行统计，每个测试序列到一张预测模式统计表，将各统计表的对应项相加得预测模式统计总表 stat_all[9][9][9]；
(A5)：分别令左邻块预测模式L和上邻块预测模式U为0至8的所有整数，在每种L和U的组合下，按以下方法确定当前块最有可能预测模式：对每个给定的L和U，找出stat_all[L][U][i]，i＝0、1、......、8中的最大值为stat_all[L][U][C]，其中C就是该组合下当前块的最有可能预测模式，将C写入最有可能预测模式查找表的mpm[L][U]；
对帧内预测的每个块进行编码的步骤为：
(B1)根据上邻块和左邻块的预测模式，查上述最有可能预测模式查找表得出当前块的最有可能预测模式：设当前块的左邻块的预测模式为L、上邻块的预测模式U，如果当前图像块为上边缘块或左边缘块，则Cp＝DC；否则当前块的最有可能预测模式Cp＝mpm[L][U]；
(B2)计算当前块在每一种预测模式下的代价，选择最佳的预测模式：
分别在AVS标准或H.264标准规定的9种可能的预测模式下，设置率失真代价值的初始值，然后计算当前块的率失真代价值；选定率失真代价最小的模式为当前块的预测模式C；
(B3)以选定的预测模式C对当前块编码：
首先计算当前块的原始象素值和该预测模式C下的预测值之间的差值，得到当前块的残差图像；再对残差图像块进行整数变换和量化；对计算量化后的变换系数进行熵编码；
(B4)将预测模式信息写入码流：
为每个4×4块设定标志位f，如果Cp＝C，则令f＝1，否则f＝0，将标志位f 用1比特写入码流；用变量R表示当前要写入的模式信息：如果当前块的预测模式C小于最有可能预测模式Cp，则R＝C，否则R＝C-1，将R对应的三位二进制数写入码流；
(B5)将熵编码后的信息写入码流；
对帧内预测的每个4×4块进行解码的步骤为：
(C1)从码流中读取图像块的帧内编码信息，包括标志位f和模式信息R；
(C2)确定当前块的最有可能预测模式Cp：如果当前块为当前帧图像的左边缘块或上边缘块，则Cp为DC模式；否则设当前块的左邻块的预测模式为L、上邻块的预测模式U，则Cp为预测模式查找表中表项mpm[L][U]的值。
(C3)确定当前图像块的帧内预测模式C：如果标志位f＝1，则C＝Cp；否则进行如下处理：如果模式信息R小于Cp，则C＝R；否则C＝R+1；
(C4)重建当前图像块：根据预测模式C进行图像块象素的预测；对图像块数据进行熵解码得到变换系数，然后对变换系数进行反量化、反变换；最后得到重建的图像块。
2、根据权利要求1所述的方法，其特征在于：在AVS-M标准中，所建立的最有可能预测模式查找表为： U L 0 1 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 0 1 0 0 4 5 1 0 1 3 0 1 1 0 4 5 1 0 1 4 0 1 4 4 4 4 4 4 8 5 0 0 0 0 4 5 0 0 0 6 0 1 1 1 4 4 6 3 1 7 0 0 0 0 0 0 0 7 0 8 1 1 1 1 1 1 1 3 8

说明书全文

技术领域

本发明属于信号处理中的视频编解码领域，涉及一种增强型帧内预测模式编码方法。

背景技术

随着通信技术与计算机技术的飞速发展，数字音视频信息的需求量与日俱增。由于原始视频数据量极大，为了节省信道传输带宽和存储空间，需要对其进行压缩编码。在视频编码技术的发展过程中，产生了一系列国际标准，如 ITU-T制定的H.261、H.263系列，ISO制定的MPEG-1、MPEG-2、MPEG-4系列。目前，ISO和ITU建立的联合视频工作组(JVT)共同制定了最新的视频编码标准H.264/MPEG-4 Part 10。在国内，中国数字音视频编码技术标准工作组 (AVS)正在制定面向存储应用的AVS1.0标准和面向移动多媒体应用的 AVS-M标准。
由于视频数据在空间域上有较强的相关性，待处理象素块的值可由其邻近象素的值来预测。将实际值与预测值的残差进行编码可获得较大的压缩率。 H.264中采用基于块的空间预测方法对帧内图像编码。对于亮度分量，可采用4 ×4与16×16两种分块方式。在帧内预测的4×4模式下，每个4×4块中的象素通过邻块中已经解码的17个象素进行预测。预测模式分为9种，在编码时应该为每个4×4块选择一种残差最小的最佳预测模式。在编码端需要把最终采用的帧内预测模式的信息写进码流中，以便正确解码。为了最大程度地压缩码字， H.264在编码端采用一个简单有效的策略：首先根据当前块的左邻块和上邻块的状态确定当前块最有可能预测模式(mostProbableMode)，如果上邻块A和左邻块B都在当前帧内，则最有可能预测模式为A和B中较小的模式，否则最有可能预测模式为均值(DC)预测模式；然后对每一种有效的模式计算代价，用代价最小的模式作为当前块的预测模式；最后把当前块的预测模式信息写进码流，为了节省码字，如果最终预测模式等于最有可能预测模式，则简单地设置信息标志为1，否则把当前模式信息完整地写入码流中。由此可见，最有可能预测模式的预测越准确，码流的节省就越大。
但实验表明，在很多情况下预测模式的取小原则与实际存在一定的误差，由于最有可能预测模式值在最后模式比较时占有优势，使得最后的模式并非最佳模式，这样就不能最大程度地节省码流和提高预测精度。

发明内容

本发明的目的在于克服上述帧内预测模式编码方法的不足之处，提供一种增强型帧内预测模式编码方法。该方法简单易行，能更好地提高压缩率和增加预测精度。
本发明提供的一种增强型帧内预测模式编码方法，首先建立最有可能预测模式查找表；在编码端根据该查找表对帧内预测的每个块进行编码；在解码端根据该查找表对帧内预测的每个块进行解码；
建立最有可能预测模式查找表的步骤为：
(A1)将测试序列对应的预测模式统计表stat[9][9][9]中设置初始值为0；
(A2)对每个图像块进行帧内预测编码处理：首先在AVS或H.264标准规定的每一种预测模式下，设置率失真代价变量的初始值为零，如果当前块是图像的上边缘块或左边缘块，选择均值DC预测模式作为其最有可能预测模式，写入最有可能预测模式查找表；否则进行下述处理：
(A3)在AVS或H.264标准规定的每一种预测模式下计算其率失真代价值，选定率失真代价最小的模式C为当前块的预测模式；在当前块的左邻块的预测模式为L，其上邻块的预测模式为U时，将stat[L][U][C]中的数加1；
对所有帧内预测的块重复步骤(A2)至(A3)操作，即得到该序列的预测模式统计表stat[9][9][9]；
(A4)：重复上述步骤(A1)至(A3)对典型测试序列进行统计，每个测试序列到一张预测模式统计表，将各统计表的对应项相加得预测模式统计总表 stat_all[9][9][9]；
(A5)：分别令左邻块预测模式L和上邻块预测模式U为0至8的所有整数，在每种L和U的组合下，按以下方法确定当前块最有可能预测模式：对每个给定的L和U，找出stat_all[L][U][i]，i＝0、1、......、8中的最大值为stat_all[L][U][C]，其中C就是该组合下当前块的最有可能预测模式，将C写入最有可能预测模式查找表的mpm[L][U]；
对帧内预测的每个块进行编码的步骤为：
(B1)根据上邻块和左邻块的预测模式，查上述最有可能预测模式查找表得出当前块的最有可能预测模式：设当前块的左邻块的预测模式为L、上邻块的预测模式U，如果当前图像块为上边缘块或左边缘块，则Cp＝DC；否则当前块的最有可能预测模式Cp＝mpm[L][U]；
(B2)计算当前块在每一种预测模式下的代价，选择最佳的预测模式：
分别在AVS标准或H.264标准规定的9种可能的预测模式下，设置率失真代价值的初始值，然后计算当前块的率失真代价值；选定率失真代价最小的模式为当前块的预测模式C；
(B3)以选定的预测模式C对当前块编码：
首先计算当前块的原始象素值和该预测模式C下的预测值之间的差值，得到当前块的残差图像；再对残差图像块进行整数变换和量化；对计算量化后的变换系数进行熵编码；
(B4)将预测模式信息写入码流：
为每个4×4块设定标志位f，如果Cp＝C，则令f＝1，否则f＝0，将标志位f 用1比特写入码流；用变量R表示当前要写入的模式信息：如果当前块的预测模式C小于最有可能预测模式Cp，则R＝C，否则R＝C-1，将R对应的三位二进制数写入码流；
(B5)将熵编码后的信息写入码流；
对帧内预测的每个4×4块进行解码的步骤为：
(C1)从码流中读取图像块的帧内编码信息，包括标志位f和模式信息R；
(C2)确定当前块的最有可能预测模式Cp：如果当前块为当前帧图像的左边缘块或上边缘块，则Cp为DC模式；否则设当前块的左邻块的预测模式为L、上邻块的预测模式U，则Cp为预测模式查找表中表项mpm[L][U]的值。
(C3)确定当前图像块的帧内预测模式C：如果标志位f＝1，则C＝Cp；否则进行如下处理：如果模式信息R小于Cp，则C＝R；否则C＝R+1；
(C4)重建当前图像块：根据预测模式C进行图像块象素的预测；对图像块数据进行熵解码得到变换系数，然后对变换系数进行反量化、反变换；最后得到重建的图像块。
本发明根据相邻块之间最佳预测模式的统计关系来估计最有可能预测模式。其主要理论基础是相邻图像块的纹理具有空间相关性。帧内预测所确定的最佳预测模式，其预测方向就是纹理信息最强的方向。所以，可以推论在H.264 或AVS等编码系统中，相邻图像块的最佳预测模式也是相关的。具体而言，本发明的主要优点是：
其一、所提出的方法简单易行，不增加额外的计算复杂度。
其二、所提出的方法能很好地增加预测精度、提高压缩率。
附图说明
图1为H.264和AVS中定义的一种8个方向预测模式及其标号示意图。

具体实施方式

本发明通过对大量测试序列的预测模式进行统计，得出在左邻块预测模式 (leftmode)和上邻块预测模式(upmode)的各种组合下，当前块最佳预测模式的取值规律；将各种左邻块预测模式和上邻块预测模式组合下最有可能的最佳模式作为最有可能预测模式(mostProbableMode)写入一张固定的查找表中。
下面以AVS中4×4模式亮度分量的帧内预测为例，对本发明作进一步详细的说明。AVS中定义的预测模式方向如图1所示。
具体的编码过程如下：
首先定义如下变量以便于算法描述：
左邻块预测模式L(leftmode)：记录当前块的左邻块选用的预测模式，其值为0到8的整数。
上邻块预测模式U(upmode)：记录当前块的上邻块选用的预测模式，其值为0到8的整数。
当前块预测模式C(currentmode)：记录当前块选用的预测模式，其值为 0到8的整数。
预测模式统计表stat[9][9][9]：每个测试序列对应一张预测模式统计表，用来记录该序列帧内预测模式的统计信息。stat[L][U][C]表示，在该序列采用帧内预测的4×4图像块中，左邻块预测模式为L、上邻块预测模式为U、且当前预测模式为C的4×4块的个数。
预测模式统计总表stat_all[9][9][9]：由所有测试序列的预测模式统计表对应项相加得到。
最有可能预测模式查找表mpm[9][9]：记录最有可能的预测模式，其值为0 到8的整数；当左邻块预测模式为L、上邻块预测模式为U时，当前块最有可能的预测模式为mpm[L][U]。
标志位f：标志图像块最有可能预测模式的选择是否准确，其值为二进制数0或1，在码流中占用1bit。
预测模式选择变量R(remaining_mode_selector)：当最有可能预测模式的选择不准确时，用此变量表示当前块的预测模式信息，其值为0到7的整数，在码流中写入该变量的二进制数(对应000到111)，占用3bit。
一.编码前的准备工作：
对大量已编码的典型序列预测模式的取值规律作统计实验，建立一般情况下的最有可能预测模式查找表：
步骤(A)：统计每个测试序列的帧内预测模式取值规律：
先将该序列对应的预测模式统计表stat[9][9][9]中所有项置初始值0，再逐个扫描采用帧内预测编码的4×4块(不包括图像帧的上边缘块和左边缘块)，首先在AVS或H.264标准规定的每一种预测模式下，设置率失真代价变量的初始值为零，在当前块的预测模式为C，其左邻块的预测模式为L，其上邻块的预测模式为U时，将stat[L][U][C]中的数加1；对所有帧内预测的4×4块重复此操作，即可得到该序列的预测模式统计表。
步骤(B)：根据预测模式统计表建立最有可能预测模式查找表：
用步骤(A)对各测试序列(如AVS标准中规定了112种测试序列)进行统计，每个测试序列得到一张预测模式统计表，将这些表的对应项相加得预测模式统计总表stat_all[9][9][9]；
分别令左邻块预测模式L和上邻块预测模式U为0至8的所有整数，在每种L 和U的组合下，按以下方法确定当前块最有可能预测模式：
对每个给定的L和U，找出stat_all[L][U][i]，i＝0、1、……8中的最大值为 stat_all[L][U][C]，其中C就是该组合下当前块的最有可能预测模式，将C写入最有可能预测模式查找表的mpm[L][U]；
如果当前块是图像的上边缘块或左边缘块，在这两种情况下，选择均值 (DC)预测模式作为其最有可能预测模式，写入最有可能预测模式查找表。
根据上述方法就可以获得最有可能预测模式查找表。
表一为根据AVS测试序列得出的最有可能预测模式查找表。
二.采用下述步骤，在编码端对帧内预测的每个4×4块进行编码。
(1)：根据上邻块和左邻块的预测模式，查最有可能预测模式查找表得出当前块的最有可能预测模式：
如果当前块的左邻块的预测模式为L、上邻块的预测模式U，则当前块的最有可能预测模式Cp＝mpm[L][U]。
(2)：计算当前块在每一种预测模式下的代价，选择最佳的预测模式：
分别在AVS或H.264标准规定的9种可能的预测模式下，设置率失真代价值的初始值，再计算当前块中各象素的原始值和预测值的差值，这些差值的绝对值的和就是该预测模式的代价；选定代价最小的模式为当前块的预测模式C。
(3)：以选定的预测模式对当前块编码：
按照AVS标准规定的步骤，首先计算当前块的原始象素值和该预测模式下的预测值之间的差值，得到当前块的残差图像；再对残差图像块进行整数变换和量化；对计算量化后的变换系数进行熵编码；
(4)：将预测模式信息写入码流：
为每个4×4块设定标志位f，如果Cp＝C，则令f＝1；否则f＝0，用预测模式选择变量R表示当前模式信息：如果当前块的预测模式C小于最有可能预测模式Cp，则R＝C，否则R＝C-1，将R对应的三位二进制数写入码流；
(5)：将熵编码后的信息写入码流；
三.再根据下述步骤，在解码端对编码后的图像块进行解码。
(1)从码流中读取图像块的帧内编码信息，包括标志位f和模式信息R；
(2)确定当前块的最有可能预测模式Cp：如果当前块为当前帧图像的左边缘块或上边缘块，则Cp为DC模式；否则设当前块的左邻块的预测模式为L、上邻块的预测模式U，则Cp为预测模式查找表中表项mpm[L][U]的值。
(3)确定当前图像块的帧内预测模式C：如果标志位f＝1，则C＝Cp；否则进行如下处理：如果模式信息R小于Cp，则C＝R；否则C＝R+1；
(4)重建当前图像块：根据预测模式C进行图像块象素的预测；对图像块数据进行熵解码得到变换系数，然后对变换系数进行反量化、反变换；最后得到重建的图像块。
以中国音视频编码标准化工作组(AVS)制定的面向移动多媒体应用的编码系统AVS-M为例，说明这种基于统计的帧内预测模式编码方法的效果。在 AVS-M编码系统中，采用本发明提出的方法替代原来的方法，对典型序列进行对比实验。表二所示为对比实验的结果。实验选取了CIF 15fs、QCIF 5fs、 CIF 30fs、QCIF 15fs四种格式的测试序列。表中的Y(dB)项表示采用本方法后信噪比改变的分贝数，Bitrate项表示采用本方法后比特率的相对变化量。由表中数据可知，每个序列的信噪比都有提高，比特率都有降低。这说明本发明提出的基于统计的帧内预测编码方法可在实际应用中更好地提高压缩率和增加预测精度。
表一最有可能预测模式查找表 U L 0 1 2 3 4 5 6 7 8 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 2 0 1 0 0 4 5 1 0 1 3 0 1 1 0 4 5 1 0 1 4 0 1 4 4 4 4 4 4 8 5 0 0 0 0 4 5 0 0 0 6 0 1 1 1 4 4 6 3 1 7 0 0 0 0 0 0 0 7 0 8 1 1 1 1 1 1 1 3 8
表二对典型序列使用本方法编码后信噪比和比特率的变化全I帧测试 CIF 15fs Y(dB) Bitrate QCIF 5fs Y(dB) Bitrate football +0.2160 -2.59％ Foreman +0.0343 -0.43％ Bus +0.0925 -1.45％ football +0.0583 -0.92％ Foreman +0.0609 -1.12％ Bus +0.0450 -0.69％ Paris +0.0700 -0.86％ paris +0.0214 -0.22％ News +0.0746 -0.87％ Mobile +0.0120 -0.15％ Tempete +0.0476 -0.77％ News +0.0148 -0.14％ Mobile +0.0374 -0.57％ Tempete +0.0125 -0.14％ Average +0.0856 -1.18％ Average +0.0283 -0.38％ CIF 30fs Y(dB) Bitrate QCIF 15fs Y(dB) Bitrate football +0.1064 -1.87％ Foreman +0.0248 -0.32％ News +0.0661 -0.77％ football +0.0369 -0.68％ Foreman +0.0498 -0.77％ News +0.0232 -0.23％ Paris +0.0591 -0.63％ Mobile +0.0106 -0.13％ Tempete +0.0461 -0.68％ Bus +0.0269 -0.42％ Bus +0.0531 -0.82％ paris +0.0151 -0.15％ Mobile +0.0306 -0.39％ Tempete +0.0162 -0.21％ Average +0.0587 -0.85％ Average +0.0220 -0.31％ IPP帧测试 CIF 30fs Y(dB) Bitrate QCIF 15fs Y(dB) Bitrate football +0.01dB -0.23％ football +0.016dB -0.30％ CIF 15fs Y(dB) Bitrate QCIF 5fs Y(dB) Bitrate football +0.059dB -1.32％ football +0.017dB -0.40％

标题	发布/更新时间	阅读量
基于视觉显著性的HEVC优化算法	2020-05-08	55
一种基于机器学习的内容自适应视频编码方法	2020-05-08	125
一种使用纹理平滑信息的3D视频残差编码模式选择方法	2020-05-08	302
一种基于块编码特性的3D视频错误隐藏方法	2020-05-08	55
一种基于文本自编码器的视频内容描述方法	2020-05-08	53
一种早教机器人的控制方法	2020-05-08	259
一种基于融合神经网络的视频中人体行为识别方法	2020-05-08	306
视频解码方法	2020-05-08	251
双向光流中的梯度计算	2020-05-08	626
一种移动机器人单目视觉跟随系统及跟随方法	2020-05-11	640

一种增强型帧内预测模式编码方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：