首页 / 专利库 / 视听技术与设备 / 帧间位移误差 / 用于编码目标轮廓的装置

用于编码目标轮廓的装置

阅读:156发布:2020-12-03

专利汇可以提供用于编码目标轮廓的装置专利检索,专利查询,专利分析的服务。并且一轮廓编码装置基于多边形近似,确定先前 帧 的先前轮廓上的 顶点 。对两顶点间各第一直线段上的预定数目的抽样点计算一组第一近似误差,并得到其第一组离散正弦变换系数。基于顶点信息及当前帧的当前轮廓检测预定的顶点。对两顶点间各第二直线段上的预定数目的抽样点计算一组第二近似误差,并得到其第二组离散正弦变换系数,在通过从相应的第一组离散正弦变换系数中减去第二组离散正弦系数确定一组差值后被编码发送,减少了传输数据量。,下面是用于编码目标轮廓的装置专利的具体信息内容。

1、一种用于对以数字视频信号表达的目标的轮廓 进行编码的装置,该数字视频信号具有包括一当前及 一先前帧的多个帧,该编码装置包括有:
第一轮廓检测装置,用于检测先前帧内目标边界以 生成一先前轮廓,其中该先前轮廓提供了用于描绘先前 帧中目标轮廓的先前边界信息;
用于确定先前轮廓上多个顶点的装置;
用于通过由多个第一直线段适配该先前轮廓以提供 该先前轮廓的多边形近似,从而生成表示该先前轮廓上 顶点位置的顶点信息的装置,各第一直线段连接两相邻 的顶点;
第一装置,用于为各第一直线段提供N个抽样点并 为各第一直线段上N个抽样点的每点计算误差以为各第 一直线段产生第一组误差,其中所述N个抽样点等分各 第一直线段且该第一组误差中的各误差表示所述N个抽 样点的各点与该先前轮廓间的距离;
第一变换装置,用于将各第一直线段的该第一组误 差变换成第一组离散正弦变换系数;
第二轮廓检测装置,用于检测当前帧内目标的边界 以生成一当前轮廓,其中该当前轮廓提供了用于描绘当 前帧中目标轮廓的当前边界信息;
用于基于通过使用顶点信息及来自当前轮廓的当前 边界信息的当前及先前帧之间的运动的估算,检测预测 的顶点从而提供预测的顶点及运动矢量的装置,该预测 的顶点信息表示预测的顶点的位置且各运动矢量表示一 顶点与其相对应的预测的顶点间的位移;
第二装置,用于为连接两预测顶点的各第二直线段 提供N个抽样点并为各第二直线段上N个抽样点的每点 计算一误差以为各第二直线段产生一第二组误差,其中 所述N个抽样点等分各第二直线段且该第二组误差中的 各误差表示所述N个抽样点的每点与该当前轮廓间的距 离;
第二变换装置,用于将各第二直线段的该第二组误 差变换成一第二组离散正弦变换系数;
用于通过从相应的第一组离散正弦变换系数中减去 第二组离散正弦变换系数生成一组差值的装置;
用于将该组差值转换成一组量化的差值的装置,及
用于对该组量化的差值及该运动矢量进行编码的装 置。
2、根据权利要求1所述的编码装置,其中所述检 测预测的顶点从而提供预测的顶点及运动矢量的装置包 括:
用于基于顶点信息生成自先前帧的顶点的装置, 各顶点块在中心有一顶点;
用于确定当前帧的一搜索区并自该搜索区生成多个 大小相同的候选块的装置,各候选块被选取以使其中心 象素为形成当前轮廓一部分的象素;及
用于通过在顶点块与多个候选块的各块之间执行一 块匹配算法,检测预测的顶点以生成表示预测的顶点位 置的预测的顶点信息和表示顶点与预测的顶点之间位移 的运动矢量的装置。

说明书全文

发明涉及一种对目标轮廓进行编码的装置;特别 地,涉及一种可通过使用顶点运动估算而减少被发送的 数据量的轮廓编码装置。

在诸如电视电话、电视会议及高清晰度电视系统的 数字视频系统中,为了确定每个视频信号需要大量的 数字数据,因为在视频帧信号中的视频行信号内包括一 序列被称为象素值的数字数据。但是,由于在传统的传 输信道中可获得的频带宽度是有限的,为了通过这种传 输信道传输大量的数字数据,不可避免地要通过使用各 种数据压缩技术来压缩或减少数据量,尤其是在如电视 电话及电视会议系统这样的低比特率视频信号编码器的 情况下。

这些用于低比特率编码系统对视频信号进行编码的 方法中的一种是所谓的面向目标的分析一合成编码技术 (见Michael Hotter写的“基于运动 两维目标的面向目标的分析-合成编码”,Signa l Processing:Image Comm unication 2,第409-428页(1 990年12月)。

根据该面向目标的分析-合成编码技术,输入视频 图象被分成目标,且用于确定每个目标的运动轮廓及象 素数据的三组参数通过不同的编码信道被处理。

具体地,在处理目标轮廓时,轮廓信息对于物体形 状的分析及合成是很重要的。用于表示轮廓信息的传统 编码方法是一种链式编码技术。虽然没有轮廓信息的丢 失,但是,链式编码方法需要大量的比特。

为此,对目标的轮廓近似的多种方法已被建议出来, 例如多边形近似及B-样条函数近似方法。在多边形近 似方法中其缺点之一是轮廓图象表示粗糙。B-样条函 数近似法正相反,能更精确地表示轮廓图象,但它需要 高阶多项式来减少近似误差,由此增加了视频编码器的 整体计算复杂性。

为了改善多边形及B-样条函数近似方法的目标轮 廓表示粗糙及整体计算复杂性问题而引入的一种技术是 采用离散正弦变换(DST)的轮廓近似的方法。

在同一持有人的待审美国专利申请:08/423, 604号(名为“用来表示目标轮廓的轮廓近似装置”) 中公开的一种采用基于多边形近似及DST的轮廓近似 技术的装置中,确定一些顶点并通过使用以直线段适配 轮廓的多边形近似来近似目标轮廓。且,对各直线段选 取N个抽样点并且顺序计算出位于各直线段上N个抽样 点的每一个的近似误差以对各直线段得到一组近似误差。 该N个抽样点等分各直线段并且各近似误差表示N个抽 样点的各个点与轮廓间的距离。之后,通过在各组近似 误差上执行一维DST操作生成各组DST系数。

尽管通过使用基于上述DST的轮廓近似可能修正 了粗糙的表示及整体计算的复杂性,但由于每帧的DS T系数都必须被发送,从而导致了传输数据量的增加。

因此,本发明的主要目的是提供一种改进的用于编 码目标的轮廓的装置,其通过使用顶点运动估算技术可 减少传输的数据量。

根据本发明,提供了一种用于对以数字视频信号表 达的目标的轮廓进行编码的装置,该数字视频信号具有 多个包括一当前帧及一先前帧的帧,该装置包括有:一 第一轮廓检测器,用于检测先前帧内目标的边界以生成 一先前轮廓,其中该先前轮廓提供了用于描绘先前帧中 目标的轮廓的先前边界信息;一多边形近似部分,用于 确定先前轮廓上的一些顶点,并用于通过由多条第一直 线段适配该先前轮廓来提供该先前轮廓的多边形近似, 从而生成表示该先前轮廓上顶点位置的顶点信息,各第 一直线段连接两相邻的顶点;一第一抽样及误差检测器, 用于为各第一直线段提供N个抽样点并为各第一直线段 上N个抽样点的每点计算误差以为各第一直线段产生第 一组误差,其中所述N个抽样点等分各第一直线段且该 第一组误差中的每个误差表示所述N个抽样点的每点与 该先前轮廓之间的距离;一第一变换电路,用于将各第 一直线段的该第一组误差变换成第一组离散正弦变换系 数;一第二轮廓检测器,用于检测当前帧内目标的边界 以生成一当前轮廓,其中该当前轮廓提供了用于描绘当 前帧中目标轮廓的当前边界信息;一顶点预测单元,用 于基于通过使用顶点信息及来自当前轮廓的当前边界信 息的当前及先前帧之间的运动的估算,检测预测的顶点 从而提供预测的顶点信息及运动矢量,该预测的顶点信 息表示预测的顶点的位置且该运动矢量表示一顶点与其 相对应的预测的顶点间的位移;一第二抽样及误差检测 器,用于为连接两预测顶点的各第二直线段提供N个抽 样点并为各第二直线段上N个抽样点的每点计算一误差 以为各第二直线段产生一第二组误差,其中所述N个抽 样点等分各第二直线段且各第二组误差中的各误差表示 所述N个抽样点的每点与该当前轮廓间的距离;一第二 变换电路,用于将各第二直线段的该第二组误差变换成 一第二组离散正弦变换系数;一减法器,用于通过从第 一组离散正弦变换系数中减去第二组离散正弦变换系数 生成一组差值;一量化器,用于将该组差值转换成一组 量化的差值;及一轮廓编码器,用于对该组量化的差值 及该运动矢量进行编码。

从以下结合附图对优选实施例的描述中,本发明的 上述及其它目的和特证将变得明显,附图中:

图1给出了根据本发明的用于编码目标轮廓的一装 置的方框图

图2给出了图1中所示的顶点预测单元的详细方框 图;

图3A至3C说明了目标轮廓的示例性多边形近似 处理;及

图4A及4B示出了示例性图,各图表示连接两顶 点的一直线段与其相应的轮廓线之间的误差。

参照图1,示出了用于对一视频信号中表达的目标 的轮廓进行编码的本发明装置的方框图。一作为当前帧 信号的输入数字视频信号通过线L10被馈送给第二轮 廓检测器113及顶点预测单元115;并作为先前帧 信号被存储在存储器100中,该帧存储器100通 过线L20与第一轮廓检测器103及顶点预测单元1 15连接。

第一轮廓检测器103检测自帧存储器100取出 的先前帧中一目标的边界或轮廓并生成一先前轮廓,其 中该先前轮廓提供了用于描绘先前帧中目标轮廓的先前 边界信息,所述先前边界信息包括沿着先前帧中的目标 边界的象素的位置数据。表示该目标的轮廓的该轮廓数 据被从第一轮廓检测器103提供至多边形近似部分1 05和第一抽样及误差检测器107。

在多边形近似部分105,该先前轮廓通过一多边 形近似技术被近似。该目标形状的多边形近似通过使用 由多条直线段适配该轮廓的传统的近似算法来获得。

参照图3A至3C,其示出了根据多边形近似技术 对一示例性先前轮廓10的线段处理过程。

首先,选取两个起始顶点,如果先前轮廓是开环形 的,则选取两个端点,例如图2A中所示的A及B作为 起始顶点,另一方面,如果先前轮廓是闭环形式的,则 选取轮廓上两个最远的点作为起始顶点。然后,确定出 轮廓上的距一线段AB的最远点,如果线段AB与该最 远点,例如C点之间的距离Dmax大于一预定阈值时, 该点C就成为一个顶点。这个过程重复进行直至对于每 个线段的所述Dmax小于预定的阈值为止。

顶点的数目取决于预定的阈值。如图3A至3C所 看到的,利用较小的预定的阈值,由线段来表示轮廓可 变得更精确,其代价是降低了编码效率。

再返回参照图1,表示先前轮廓10的确定出的顶 点如A、B、C、D及E的位置的顶点信息由多边形近 似部分105通过线L40提供给第一抽样及误差检测 器107及顶点预测单元115。该第一抽样及误差检 测器107为各直线段选取N个抽样点并基于该顶点信 息及先前轮廓数据计算各直线段上N个抽样点的各点上 的一近似误差;提供该近似误差至第一离散正弦变换( DST)电路109,其中该N个抽样点等分两顶点之 间的各直线段,N为一整数,该近似误差表示连接两顶 点的直线段与该两顶点间轮廓线之间的距离。

图4A及4B说明了表示直线段与对应轮廓线之间 近似误差的示例性图形,其中图4A描绘了直线段AD 与其相应轮廓线之间的近似误差及图4B示出了直线段 DC与其相应轮廓线之间的近似误差。各误差d1至d 4或d1’至d4’表示直线段AD上的各抽样点S1 至S4或直线段DC上的各抽样点S1’至S4’到相 应轮廓线的距离。如图4A及4B中所看到的,顶点的 误差都为“零”,因为所有的顶点都位于轮廓上。

通过第一抽样及误差检测器107计算出的近似误 差被提供给第一DST电路109。该第一DST电路 109在各组近似误差上执行一维DST操作并生成一 第一组DST系数给减法器123,所述各组近似误差 包括各直线段的N个抽样点及两顶点的误差。

同时,第二轮廓检测器113执行与第一轮廓检测 器103相同的功能,从而生成一当前轮廓并经线L3 0送至顶点预测单元115和第二抽样及误差检测器1 17。即,该第二轮廓检测器113检测作为当前帧信 号提供给其的输入数字视频信号中的一目标边界并生成 或确定当前轮廓,其中该当前轮廓提供了用于描绘当前 帧中目标边界的当前边界信息,所述当前边界信息包括 沿着当前帧中目标边界的象素的位置数据。

在顶点预测单元115,线L10上的该输入数字 视频信号,即当前帧信号、自帧存储器100取出在线 L20上的先前帧信号、来自第二轮廓检测器113在 线L30上的当前轮廓数据及来自多边形近似部分10 5在线L40上由顶点信息表示的顶点被处理以生成预 测的顶点信息到线L50上及该顶点的运动矢量到线L 60上,其中该预测的顶点信息表示预测的顶点的位置 且该运动矢量表示该顶点与预测的顶点之间的位移,顶 点预测单元115的细节将参照图2予以描述。

在检测完所有顶点的运动矢量后,该预测的顶点及 运动矢量通过线L50和L60分别被提供给轮廓编码 器129和第二抽样及误差检测器117,第二抽样及 误差检测器117基于表示预测的顶点位置的预测的顶 点信息及来自第二轮廓检测器113在线L30上的当 前轮廓数据执行与第一抽样及误差检测器107相同的 功能,从而提供各组预测的近似误差给第二DST电路 119。即,该第二抽样及误差检测器117在连接两 预测的顶点的各直线段上选取N个抽样点并基于预测的 顶点信息及当前轮廓数据计算各直线段上N个抽样点的 各点的预测的近似误差;提供该预测的近似误差给第二 DST电路119,其中该N个抽样点等分两预测的顶 点间的各直线段。该预测的近似误差表示连接两预测的 顶点之间的一直线段与该两预测的顶点间的当前轮廓之 间的距离。第二DST电路119执行与第一DST电 路109相同的功能,从而生成一第二组DST系数给 减法器123。

减法器123从相应的第一组DST系数中减去第 二组DST系数并提供其间的一组差值给量化器125。 量化器125量化该组差值以提供一组量化的差值给轮 廓编码器129作进一步处理。

在轮廓编码器129,例如通过使用JPEG(联 合照相专家组)的二进制算术码,该组量化的差值与来 自顶点预测单元115在线L60上的运动矢量一起被 编码。该包括编码的量化的差值及运动矢量的编码数字 信号被传送给一发送机(未示出)被发送。

现在参照图2,给出了图1中所示的顶点预测单元 115的详细方框图,用于说明顶点预测处理。

在本发明的优选实施例中,顶点的运动矢量被检测, 其中各运动矢量表示先前帧中一顶点与当前帧中称作预 测的顶点的一与其最相似的象素之间的基间位移。为检 测顶点与预测的顶点之间的运动矢量,采用了匹配算 法。

如图2中所示,顶点信息自多边形近似部分105 经线L40提供给顶点块形成部分210。在顶点块形 成部分210,先前帧的在其中心具有各顶点的一顶点 块,便如5×5象素的块被从帧存储器100经线L2 0取出并提供给顶点运动矢量检测器230。

同时,线L10上的作为当前帧信号的输入数字视 频信号被馈送给候选块生成部分220且线L30上的 当前轮廓也被馈送给候选块生成部分220。该候选块 生成部分220确定当前帧的一通常较大的搜索区并生 成一多个大小相同的候选块送给顶点运动矢量检测器2 30。

在本发明的优选实施例中,在当前帧中被确定的搜 索区包括当前轮廓的邻域中预定数目的象素,且这些候 选块被选择使其中心象素为形成当前轮廓的一部分的象 索,从而将预测的顶点置于当前轮廓上。

在顶点运动矢量检测器230,在完成顶点块与来 自候选块生成部分220的搜索区中所包括的多个候选 块的各块之间的相似计算后,来自顶点块形成部分21 0的各顶点块的运动矢量被确定。该确定的顶点块的运 动矢量被指定为顶点块中包含的顶点的运动矢量。之后, 该顶点的运动矢量及预测的顶点信息被分别生成至线L 60和L50上。

因此,如上所述,本发明通过传送第一与第二组D ST系数间的差值能实质地减少表示视频信号中表达的 目标轮廓的传输数据的量。

虽然本发明是对特定的实施例作出描述的,但显然 对于熟愁本领域的技术人员而言,在不偏离以下权利要 求书中所限定的本发明精神和范围的情况下,可以作出 各种变化及改型。

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈