首页 / 专利库 / 视听技术与设备 / 块匹配运动估计 / 视频编码的全局判决方法

视频编码的全局判决方法

阅读:639发布:2021-03-30

专利汇可以提供视频编码的全局判决方法专利检索,专利查询,专利分析的服务。并且本 发明 属运动图象编码技术领域。本发明包括 运动估计 、 帧 预测与预测误差生成,变换与量化,图象重建、 熵编码 四部分;其特征在于:在运动估计部分,设置对分级搜索 块 匹配过程中每级结果进行判决的全局判决器,判断当前帧图象重建误差是否超过上一帧图象的重建误差;所说的全局判决器采用重建误差判决准则。采用本发明可大大提高了编码的速度。,下面是视频编码的全局判决方法专利的具体信息内容。

1.一种视频编码的全局判决方法,包括运动估计预测与预测误 差生成,变换与量化,图象重建、熵编码四部分;其特征在于:在运动 估计部分,设置对分级搜索匹配过程中每级结果进行判决的全局判决 器,判断当前帧图象重建误差是否超过上一帧图象的重建误差;这一判 决器能对编码过程的各部分进行控制,即控制(ⅰ)搜索是否停止;(ⅱ)帧 差信号是否送入DCT进行变换与处理;本发明所说的全局判决器采用重 建误差判决准则。
2.如权利要求1所述的视频编码的全局判决方法,其特征在于,所 说的重建误差判决准则为:对当前帧(第k帧)宏块1,若在运动估计中满 足SADl(k)(i,j)≤Eeconl(k),(i,j)∈S, 则当前运动估计可以结束,(i,j)即为要找的宏块l的运动向量,而且宏块 l的其它编码运算,预测误差计算及DCT、Q、IQ、IDCT都可省去。

说明书全文

发明属运动图象编码技术领域。

在当今信息化时代,图象的存储和传输变得愈来愈重要。由于图象 原始数据信息量十分巨大,要在有限容量的存储介质进行存储和有限容 量的信息通道传输图象,图象数据的压缩,也就是对运动图象进行编码 是必不可少的。运动图象编码是通过综合利用图象信号在时间、空间、 统计三方面的冗余度,以及场景的知识、人的视觉特性来实现的。目前 较为成熟的编码方法是综合了预测编码、变换编码、熵编码几种编码方 法以及运动补偿技术的混合编码方法,方框图如图1所示。其编码实现 实现方法如下步骤: (1)对输入的当前图象和上一重建图象作运动估计ME,运动估计得到运 动向量MV; (2)根据运动向量对上一重建作预测P,获得对当前图象的预测图象; (3)将当前图象减去当前图象的预测图象得到预测误差PE; (4)对预测误差作离散余弦变换DCT和量化Q; (5)对(4)的结果作变长编码VLC得到当前编码图象;和 (6)对(4)的结果作逆量化IQ、逆离散余弦变换IDCT得到重建的预测误 差,再与当前预测图象相加得到当前重建图象,经存储器FM变成上 一重建图象。

图1中各步骤的功能如下: ·运动估计、预测及预测误差的计算(减法器)构成预测编码,是为了消除 图象信号在时间上的相关性。图象在时间上的相关性表现为当前帧图象 的某一部分是由上一帧图象的某一部分经过运动而得到的。而运动是通 过运动向量来描述的,运动估计就是要求得运动向量,而预测则是根据 运动向量来补偿、抵消当前帧图象与上一帧图象部分之间因运动而产生 的信号的变化。 ·离散余弦变换DCT构成变换编码,目的是为了消除图象信号在空间上 的相关性。量化Q既是后面熵编码的需要,又是利用了人的视觉特性来 提高编码的质量。 ·变长编码VLC构成熵编码,进一步消除了图象信号的统计的相关性。 ·逆量化IQ、逆离散余弦变换IDCT、加法器实现图象重建,为预测提 供参照物。

现有实现上述混合编码方法的编码器如图2所示。图中DCT、块 Q、块IQ、块IDCT、块VLC是指一帧(一幅)图象中一块(按国际标准为 8×8象素)为单位进离散余弦变换DCT、量化Q、逆量化IQ、逆离散余弦 变换IDCT、变长编码VLC。宏块P是指以一帧图象中一个宏块(按国际 标准为6个块)为单位进行预测P。宏块MV指宏块的运动向量。0块是 指块中8×8个元素都为0。

该编码器实现的工作过程为: 首先,一帧(一幅)图象是以一块(8×8象素)或一宏块(6个块)为单位进行编 码的。其次,整个编码过程分为两部分:运动估计和编码核心如图2虚 框所示。当前帧宏块首先进入运动估计部分作运动估计,运动估计得到 运动向量MV,输入到编码核心对当前帧宏块进行编码,具体分为如下 步骤:

首先,对当前帧宏块和上一重建帧宏块作运动估计。运动估计分为 整象素搜索和半象素搜索两步。整象素搜索采用分级运动搜索方法,即 将搜索域分级:静止点、小搜索域、大搜索域。这是典型的3级,具体 实现可以有变化,如2级:静止点、小搜索域,即将小搜索域与大搜索 域合并;或4级:静止点、小搜索域、大搜索域、更大搜索域,即将大 搜索域再细分两级。在前两级搜索域搜索结束后要进行判断,判断是否 满足判据而可以停止整象素搜索进入到半象素搜索和后面的编码核心, 具体的判决准则可能是多种多样的。

其次,进到编码核心以后,根据运动估计得到宏块的运动向量对 上一重建帧宏块进行预测得到当前预测帧宏块,然后用减法器将当前帧 宏块减去当前预测帧宏块计算预测误差,接着做DCT、Q、熵编码(VLC) 和图象重建。

这种编码器的实现方法的不足在于编码速度不够高。对QCIF格式 简单运动图象序列(如Claire序列),利用Pentium-133 PC仍无法做到软 件实时编码(25帧/秒)。

本发明的目的在于克服已有技术的不足之处,在原有编码方法的基础 上增设对图象中大量不必要运算的判断,提高编码器速度。

本发明提出一种视频编码的全局判决方法,包括运动估计、帧预测与 预测误差生成,变换与量化,图象重建、熵编码四部分;其特征在于: 在运动估计部分,设置对分级搜索块匹配过程中每级结果进行判决的全 局判决器,判断当前帧图象的重建误差是否超过上一帧图象的重建误差; 这一判决器能对编码过程的各部分进行控制,即控制(ⅰ)搜索是否停止; (ⅱ)帧差信号是否送入DCT进行变换与处理;本发明所说的全局判决器 采用重建误差判决准则。

本发明所说的重建误差判决准则为:对当前帧(第k帧)宏块l,若在运 动估计中满足

SADl(k)(i,j)≤Ereconl(k),(i,j)∈S, 则当前运动估计可以结束,(i,j)即为要找的宏块l的运动向量,而且宏块 l的其它编码运算,预测误差计算及DCT、Q、IQ、IDCT都可省去;若 不满足上面不等式,则继续进行运动估计。

本发明采用的重建误差判决准则的原理简述如下: 在运动估计,通常采用块匹配法,要计算宏块的SAD(Sum of Absolute Difference)值, SAD l ( k ) ( i , j ) = Σ m = 1 N Σ n = 1 N | I o ( k ) ( m , n ) - I o ( k - l ) ( m + i , n + j ) | , ( i , j ) S - - ( 1 ) 其中SADl(k)为第k帧宏块l的SAD值,(i,j)为候选的运动向量,S为搜 索域,Io(k)为第k原始帧灰度值,Io(k-l)为第k-1原始帧灰度值,宏块的大 小为N×N。 前一帧(第k-l帧)宏块l的重建误差Ereconl(k-l)可由下式计算得到, E reconl ( k - l ) = Σ m = 1 N Σ n = 1 N | I o ( k - l ) ( m , n ) - I r ( k - l ) ( m , n ) | - - - - - ( 2 )

其中Ir(k-l)为第k-l帧重建帧。 则重建误差判决准则为:对当前帧(第k帧)宏块l,若在运动估计中满足

SADl(k)(i,j)≤Ereconl(k),(i,j)∈S,                  (3) 则当前运动估计可以结束,(i,j)即为要找的宏块l的运动向量,而且宏块 l的其它编码运算,预测误差计算及DCT、Q、IQ、IDCT都可省去;若 不满足不等式(3),则继续进行运动估计。

本发明所述的新型视频编码器的实现框图如图3所示,其工作过程 为: 首先,对当前帧宏块和上一重建帧宏块作运动估计。运动估计包括整象 素搜索和半象素搜索。整象素搜索采用分级运动搜索方法,将搜索域分 级:静止点、小搜索域、大搜索域。(这是典型的3级,具体实现可以有 变化,同前)。在每一级搜索域搜索结束后,都进入全局判决器G,判断 在当前这一级搜索下当前输入宏块是否满足重建误差判据,若满足则不 但当前宏块的搜索过程结束,而且该宏块的整个编码过程也已结束,编 码转到下一宏块;若不满足则继续下一级的搜索。半象素搜索结束后得 到运动向量,进入编码核心。

其次,进到编码核心以后,根据运动估计得到宏块的运动向量对上 一重建帧宏块进行预测得到当前预测帧宏块,然后用当前帧宏块减去当 前预测帧宏块计算预测误差,接着做DCT、Q、熵编码(VLC)和图象重建。

结合图3与图2,可以看出本发明与现有技术相比有如下特点: 第一,在本发明的运动估计中整象素部分,在整象素搜索的每一级搜索 结束后设置全局判决器G,判决器G中判据是一旦满足,则对该宏块的 整个编码过程就结束了,也就是不但结束整象素搜索过程,而且连半象 素搜索、整个编码核心都不必做了,从而大大提高了编码的速度。 第二,对判决器G,我们采用了高效的重建误差判据。该判据不但可以 控制搜索是否停止,而且还可以控制帧差信号是否送入DCT进行变换与 处理。

附图的简要说明 图1为已有的混合编码方法框图 图2为已有的视频编码器结构框图 图3为本发明的视频编码器结构框图

采用本发明编码方法实现视频编码器的一种实施例结构如图3所 示。其工作过程同前所述。本实施例给出在Pentium-200 PC机上对QCIF 格式的简单序列Claire序列和复杂序列Foreman序列的编码参数及编码 速度如下: Claire序列:I帧量化参数为10,P帧量化参数为10。运动估计             中的整象素搜索采用两级搜索:静止点、小搜索域,             区域长度为5,每一级搜索算法采样法三步法,块             匹配运算采用亚采样方法。             结果:编码帧率(速率)达到平均70帧/秒。 Foreman序列:I帧量化参数为20,P帧量化参数为20。运动估              计中的整象素搜索采用三级搜索:静止点、小运              动区域(区域长度为4),大搜索域(区域长度为10)              每一级搜索算法为三步法,块匹配运算采用亚              采样方法。              结果:编码帧率(速率)达到平均30帧/秒。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈