首页 / 专利库 / 视听技术与设备 / 帧间位移误差 / 一种基于对象和分形的双目立体视频压缩编解码方法

一种基于对象和分形的双目立体视频压缩编解码方法

阅读:1031发布:2020-10-04

专利汇可以提供一种基于对象和分形的双目立体视频压缩编解码方法专利检索,专利查询,专利分析的服务。并且本 发明 提出了一种基于对象和分形的双目立体视频压缩与解压缩方法,在双目立体 视频编码 中以左通道为基本层,右通道为增强层,左通道采用单独的 运动补偿 预测 方式(MCP)进行编码。首先利用视频分割方法获得视频对象分割平面即Alpha平面,对左目的起始 帧 采用 块 DCT变换编码,对左目的非I帧进行块 运动估计 /补偿编码。然后利用Alpha平面判别该图像块的区域属性,如果该块不在当前编码的视频对象区域内,则对该外部块不做处理;如果该块全部都在当前编码的视频对象区域内,在内部块的前一帧即左目视频的参考帧搜索窗中利用全搜索方法寻找最相似的匹配块,最后利用Huffman编码方法压缩 迭代 函数系统系数;如果该块的部分 像素 在当前编码的视频对象区域内,部分像素不在当前编码的视频对象区域内,则对该边界块需要单独处理。右通道采用MCP加 视差 补偿预测方式(DCP)进行编码,MCP是与左目类似的处理,选择误差最小的作为预测结果。在进行DCP编码方式时,又充分利用立体平行摄像结构中的偏振性和方向性。,下面是一种基于对象和分形的双目立体视频压缩编解码方法专利的具体信息内容。

1.一种基于对象和分形的双目立体视频压缩编码方法,其特征在于具体步骤如下:
步骤一:利用自动视频对象分割方法对视频序列进行自动分割,获取每一的视频对象分割平面即Alpha平面,根据得到的视频对象分割平面确定要编码的视频对象区域;把正在进行压缩的帧称为当前帧,把当前帧的已经编码并重建的前一帧称为参考帧;
步骤二:对于左目,首先判断是否为I帧,若是I帧,则对该帧进行互不重叠的固定大小的划分,对每一个图像块分别采用基于块DCT变换的帧内图像压缩方法,对该帧图像进行单独编码和解码,解码之后的像素若属于Alpha平面中待编码的视频对象则保留该像素值,否则将像素值置零后转到步骤十四;所述I帧为视频序列起始帧或者视频序列中只进行帧内编码的图像帧;将当前帧划分为固定大小的互不重叠的图像块称为宏块;将当前宏块进行树状划分得到的块称为小块;所述当前帧所有块的集合称为子块域;所述前一帧的所有块的集合称为父块域;所述块DCT变换中的块采用固定大小模式;对于右目,转到步骤六;
步骤三:若左目为非I帧,用常规单目的运动补偿预测(MCP)编码,对当前帧进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及左目前一帧重建图像即参考帧中,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
步骤四:对当前正在处理的图像块即当前块,利用Alpha平面判别该图像块的区域属性;如果该块不在当前编码的视频对象区域内,对该块不做处理;如果该块全部都在当前编码的视频对象区域内,转入步骤五;如果该块的部分像素在当前编码的视频对象区域内,部分像素不在当前编码的视频对象区域内,需要单独处理,转入步骤十三;如果所有的宏块都已处理完毕,则转到步骤十四;所述不在当前编码的视频对象区域内的块称为外部块,所述全部都在当前编码的视频对象区域内的块称为内部块,所述部分像素不在当前编码的视频对象区域内的块为边界块;
步骤五:依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同;如果匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤五编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤五编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,记录IFS系数;转入步骤五编码下一宏块;所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块位置(x,y)和比例因子s、偏移因子o;如果当前帧所有的宏块都已编码完毕,且是左目,则转到步骤十四,若是右目,则继续执行步骤七;
步骤六:对右目图像,首先进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及右目前一帧重建图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤五;
步骤七:计算左目中对应帧图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,转到步骤八;
步骤八:对当前正在处理的图像块即当前块,利用Alpha平面判别该图像块的区域属性;如果该块不在当前编码的视频对象区域内,对该块不做处理;如果该块全部都在当前编码的视频对象区域内,转入步骤九;如果该块的部分像素在当前编码的视频对象区域内,部分像素不在当前编码的视频对象区域内,需要单独处理,转入步骤十三;如果所有的宏块都已处理完毕,则转到步骤十四;
步骤九:首先对与当前子块位置相同的父块进行块匹配,得到RMS,并保存迭代函数系统系数,该系数包括父块与子块的相对位移矢量(x,y),比例因子s和偏移因子o;依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同并转入步骤十;如果所得的匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤九编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别转入步骤十计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤九编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,转入步骤十计算RMS,记录IFS系数,转入步骤九编码下一宏块;最后与步骤五所得结果比较,选择误差最小的作为预测结果;如果当前帧所有的宏块都已编码完毕,则转到步骤十四;
步骤十:在垂直方向上先上下隔行搜索两个点;如果这两个点的RMS均大于偏振线上点的RMS转到步骤十一,否则转到步骤十二;
步骤十一:只沿初始点的右侧进行搜索,在搜索过程中进行跳跃式搜索;向右间隔两个点进行搜索,计算RMS,转入步骤十进行垂直方向搜索;如果当前点的RMS小于前一点的RMS,将当前点作为新的起始搜索点,转回到步骤十一开始位置,继续平搜索下一点;否则说明当前点的RMS大于前一点的RMS,即最佳匹配点位于这两点之间,选择合适的小区域进行全搜索,至此选择RMS最小的点作为最终匹配结果,结束DCP搜索过程,继续执行步骤九;
步骤十二:选择两点中RMS最小的点,在垂直方向上再搜索相邻两点之间的点,计算其RMS,选择误差最小的点作为此垂直方向上的最佳匹配点,转入步骤十一继续沿偏振线方向进行搜索;
步骤十三:该步骤单独处理边界块,当前帧的边界块只在父块中的属于边界块和内部块中搜索匹配,当前块和父块的像素选取准则是:在当前块中只计算位于当前编码的视频对象区域内的像素值,只在参考帧的相同视频对象区域内进行块匹配;对于父块中,如果与当前块的相对应位置的父块中的某一像素也属于该视频对象区域,则采用原像素值,否则,用其它属于该视频对象区域像素的平均值代替;转到步骤五;
步骤十四:对所有IFS系数进行Huffman编码,降低IFS系数数据的统计冗余;判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回步骤二继续处理下一帧图像。
2.根据权利要求1所述一种基于对象和分形的双目立体视频压缩编码方法,其特征在于:处理的视频序列为YUV格式,分别对3个分量中的每个采用上述十四个步骤进行处理。
3.根据权利要求1所述一种基于对象和分形的双目立体视频压缩编码方法,其特征在于:所述步骤五中对宏块采用树状划分,块匹配采用匹配误差准则;子块与父块的匹配误差RMS为:
其中参数s和o分别为:
其中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值;
计算当前宏块在参考帧中的块匹配误差RMS,其中ri是子块的像素值,di是父块的像素值;如果RMS小于预先设定的阈值γ,记录IFS系数,IFS系数包括匹配块的位移矢量(x,y)和公式2,3中的s和o,处理下一宏块;否则,对当前宏块进行树状划分,计算划分后小块的RMS,如果小于阈值γ,则停止划分,否则继续划分,直到子块达到预先设定的最小块为止。
4.根据权利要求1所述一种基于对象和分形的双目立体视频压缩编码方法,其特征在于:所述步骤十中垂直方向的搜索方法运用了双目立体视频的偏振性,最佳匹配点位于偏振线上即水平线上:在立体平行摄像系统中,沿水平方向进行DCP搜索;
两摄像机在同一时刻观看空间同一特征点P(xc,yc,zc),在左图像和右图像的坐标分别为pleft=(Xlet,Yleft),pright=(Xright,Yright);其中点P(xc,yc,zc)与两个光心所确定的平面称为偏振平面,偏振平面与左右图像的交线称为偏振线;由几何关系得到:
其中f为左右摄像机的焦距,B为左右摄像机之间的基线距离。
5.根据权利要求1所述一种基于对象和分形的双目立体视频压缩编码方法,其特征在于:所述步骤十一中水平方向的搜索方法运用了双目立体视频的方向性:同一空间点在两图像平面中的投影位置差矢量即视差 其中f为左右摄像机的焦距,B
为左右摄像机之间的基线距离;视差D是深度z的函数,表示相对深度;对于同一特征点,其透视投影左图像是右图像沿水平负向的局部平移,同一空间点在右图像上的图像坐标比在左图像上的图像坐标偏右,在搜索时沿一个方向进行。

说明书全文

一种基于对象和分形的双目立体视频压缩编解码方法

技术领域:

[0001] 本发明属于视频压缩编码领域,涉及双目立体视频的压缩编码,特别涉及一种基于对象和分形的视频压缩编码方法。在保证图像质量的前提下,一定程度上增大了压缩比,而且大大加快了分形双目立体视频编码的速度,缩短了编码时间。背景技术:
[0002] 基于对象(Object-Based,简称OB)编码的概念最早由MPEG-4标准提出,使用基于对象的视频压缩编码方法使得每一视频的前景对象和背景对象得以独立的进行编码,可以进一步提高压缩比,同时在解码端可以实现一些新的功能,比如针对每一个视频对象的独立的传输和解码、对象和背景的替换、基于对象的视频检索、特别是相对于标准的编码方法,在对象的边界上可以获得更好的图像质量,因为物体的边界通常和图像中的边缘相重合,它是编码困难的部分。MPEG-4提出了基于对象的视频编码技术标准,在视频分析中,以视频对象为基本单位,每一个视频事件和场景都可以视为由视频中所有语义对象的静态属性(如形状、色彩、纹理)及其动态属性(运动强度、方向、节奏)组合而成的。在以对象为基本分析单位的视频分析方法,符合人类的思维方式和视觉特点,排除了视频中不重要的部分对视频分析的干扰(参见Liang Zhang.Object-basedMethod of important video clips Extraction[J].Journal of Beijing Information Science andTechnology University,2009,24(4):83-86),( 参 见 Bo Huang,Yujian Huang.A ScalableObject-based Wavelet Coder[J].Radio Communications Technology,2009,35(1):35-38),(参见Kassim Ashraf a,Zhao L F.Rate-scalable object-based wavelet codec with implicitshape coding[J].IEEE Transactions on Circuits and Systems for Video Technology,2000,10(7):1068-1079)。基于对象的视频编码方法可以提高视频压缩编码的性能并使其具有更多的灵活性。
[0003] 分形理论最初由Mandelbrot于上世纪70年代提出(参见 B.Mandelbrot.TheFractal Geometry ofNature[M].New York:W.H.Freeman and Company,1982.)。分形编码的数学基础迭代函数系统(IFS)理论。Barnsley首先将分形编码用于交互式图像压缩(参见Michael F.Barnsley,Alan D.Sloan.A better way to compress image[J].ByteMagazine,1988,13(1):215-233.)。Jacqain提出了全自动的分形图像压缩方法(参见Arnaud E.Jacquin.A novel fractal blocking-coding technique for digital image[C].IEEEInternational Conference on Acoustics,Speech and Signal Processing,1990,4:2225-2228.),( 参 见 Arnaud E.Jacquin.Fractal image coding:
a review[J].Proceeding of the IEEE,1993,81(10):1451-1465.),该方法采用基于图像分的方式以局部的仿射变换代替全局的仿射变换。之后,Fisher利用四叉树改进了这一方法(参见Y.Fisher.Fractal ImageCompression[J].Fractals,1994,2(3):
347-361.),( 参 见 Y.Fisher,E.W.Jacobs.Imagecompression:A study the iterated transform method[J].Signal Processing,1992,29(3),251-263.),( 参 见 Y.Fisher.Fractal Image Compression:Theory and application to digitalimages[M].New York:
Spring-Verlag,1995,55-77.),大大提高了编码效率,并成为目前分形图像编码中的主流方法。
[0004] 在此基础之上,一些学者和研究人员把分形图像压缩的方法应用到视频序列的压缩上。Meiqing Wang等提出了综合基于数据立方体和基于帧的分形视频压缩方法(参见Meiqing Wang,Choi-Hong Lai.A hybrid fractal video compression method[J].Computers &Mathematics with Applications,2005,50(3-4):611-621.),(参见Meiqing Wang,ZhehuangHuang,Choi-Hong Lai.Matching search in fractal video compression and its parallelimplementation in distributed computing environments[J].Applied Mathematical Modeling,2006,30(8):677-687.),( 参 见 Meiqing Wang,Rong Liu,Choi-Hong Lai.Adaptive partitionand hybrid method in fractal video compression[J].Computers & Mathematics withApplications,2006,51(11):1715-1726.)。其中最为经典和影响较大的参见(C.S.Kim,R.C.Kim,S.U.Lee.Fractal coding of video sequence using circular prediction mapping andnoncontractive interframe mapping[J].IEEE Transactions on Image Processing,1998,7(4):
601-605.)。该方法采用类似于标准视频编码方法所采用的运动估计/补偿技术,该方法利用了相邻帧之间的时间强相关性,对视频序列压缩取得了较好的效果。在CPM和NCIM中,子块域中的每个图像块都由来自相邻帧相同大小的父块域通过运动补偿得到。CPM和NCIM两者间最大的不同在于CPM在解码的过程中需要具备收敛性,而NCIM不需要。但是在循环预测编码(CPM)方法中,为了保证起始帧经过自身的循环解码能够近似收敛到原来的图像,压缩过程需要经过复杂变换、搜索和迭代等,压缩时间和图像质量难以达到要求。目前典型的分形图像和视频压缩方法的运算量很大,编码速度较慢,并且解码的质量有待提高,使得分形图像和视频压缩方法还需要进一步的改进和提高。
[0005] 随着多媒体技术的不断发展,多视点视频因其具有单目视频无法比拟的优越性渐渐成为研究的热点。而双目立体视频是多视点视频中应用最为广泛的一种形式,它增加了场景的深度信息,使欣赏到的图像有强烈的现实感和逼真感,可以应用于立体电视,远程教育,远程工业控制,远程医学诊断和虚拟现实等众多领域(参见A Schertz.Sourcecoding of stereoscopic television pictures[C].Proceedings of the IEEE InternationalConference on Image Processing and its Applications.Maastricht,The Netherlands,1992,462-464.)。双目立体视频是利用人眼睛的双目视差原理,双目各自独立地接收来自同一场景的特定摄像点的左右图像,左眼看偏左的图像,右眼看偏右的图像,形成双目视差,大脑能得到图像的深度信息,使欣赏到的图像有强烈深度感、逼真感,观众能欣赏到超强的立体视觉效果。但是相对于单目视频,双目立体视频系统必须传输和存储翻番的数据量,所以必须对其进行有效地压缩。(参见Shigang Wang,Xuejun Wang,HexinChen.Stereoscopic video compression coding based on H.264[J].Chinese Journal ofStereology and Image Analysis,2008,13(1):11-16)
[0006] 在双目立体视频编码过程中,不但要考虑各通道内前后帧图像之间的时域相关性和帧内图像的空域相关性,还要充分利用通道之间的空域相关性进行编码。前者可以利用运动补偿预测(MCP)去除冗余,后者可以采用视差补偿预测(DCP)去除通道间冗余。DCP与MCP相比要复杂的多,其中的关键技术是视差匹配。Michael E.Lukaces是双目立体视频编码的早期研究者,他探索了将视差补偿(DC-based)(指使用双目视差关系在两幅图像之间建立对应)用于从双目立体视频序列中的一个视频序列预测另一个视频序列,并提出了多种基于视差补偿的方法(参见Lukacs M E,Predictive coding ofmulti-viewpoint image sets[C].IEEE International Conference on Acoustics,Speech andSignal Processing,1986,521-524)。Perkins将基于视差补偿的方法归纳为一种条件编码方法,对于无损编码来说是最优的,对于有损编码则是次优的(参见Perkins M G.Datacompression of stereo pairs[J].IEEE Transactions on Communications,1992,40(4):684-696)。Tzovaras等人提出了视差估计的分层块匹配以及运动视差双向补偿方法,称之为聚合估计(参见Tzovaras D,Grammalidis N,Strintzis M G.Object-based codingof stereoscopic image sequences using joint 3D motion/disparity segmentation[C].Proceedings of SPIE:Visual Communication and Image Processing,1995,1678-1689)。另外Franich还提出了基于通用块匹配算法的视差估计方法,并引入一种平滑检测手段来评价视差匹配好坏(参见Franch R E H,Lagendijk R L,Biemond J.Stereo-enhanceddisplacement estimation by genetic block matching[C].Proceedings of SPIE:Volume2094-Visual Communications and Image Processing.Cambridge,MA,USA,1993,362-371)。Siram Sethuramn以及M.Siegel等人提出了基于视差和运动的可变块四叉树多分辨率分割方法,针对基于MPEG视频编码标准的双目立体视频流的编码,按在解码端是否有合成中间视图的需要,提出了两个双目立体视频流的混合分辨率编码方法(参见Sethuraman S,SiegelM W,Jordan A G.Segmentation based coding of stereoscopicimage sequences[C].Proceedings of SPIE:Volume 2668-Digital Video Compression:Algorithms and Technologies.San Jose,CA,USA,1996,420-429)。常用的双目立体视频编码方案有:
独 立 MCP(Motion Compensated Prediction) 编 码,层 间 DCP(DisparityCompensated Prediction)编码和MCP与DCP相结合编码。其中在MCP与DCP相结合编码中,基本层采用独立MCP编码,增强层采用MCP与DCP两种方式进行预测,从中选择误差较小的一种作为预测结果。
发明内容:
[0007] 本发明提出了一种基于对象和分形的双目立体视频压缩与解压缩方法,在双目立体视频编码中以左通道为基本层,右通道为增强层,左通道采用单独的运动补偿预测方式(MCP)进行编码。首先利用视频分割方法获得视频对象分割平面即Alpha平面,对左目的起始帧采用块DCT变换编码,对左目的非I帧进行块运动估计/补偿编码。然后利用Alpha平面判别该图像块的区域属性,如果该块不在当前编码的视频对象区域内,则对该外部块不做处理;如果该块全部都在当前编码的视频对象区域内,在内部块的前一帧即左目视频的参考帧搜索窗中利用全搜索方法寻找最相似的匹配块,最后利用Huffman编码方法压缩迭代函数系统系数;如果该块的部分像素在当前编码的视频对象区域内,部分像素不在当前编码的视频对象区域内,则对该边界块需要单独处理。右通道采用MCP加视差补偿预测方式(DCP)进行编码,MCP是与左目类似的处理,选择误差最小的作为预测结果。在进行DCP编码方式时,又充分利用立体平行摄像结构中的偏振性和方向性。
[0008] 一种基于对象和分形的双目立体视频压缩编码方法,包括以下步骤:
[0009] 步骤一:利用自动视频对象分割方法对视频序列进行自动分割,获取每一帧的视频对象分割平面即Alpha平面,根据得到的视频对象分割平面确定要编码的视频对象区域;把正在进行压缩的帧称为当前帧,把当前帧的已经编码并重建的前一帧称为参考帧;
[0010] 步骤二:对于左目,首先判断是否为I帧,若是I帧,则对该帧进行互不重叠的固定大小的块划分,对每一个图像块分别采用基于块DCT变换的帧内图像压缩方法,对该帧图像进行单独编码和解码,解码之后的像素若属于Alpha平面中待编码的视频对象则保留该像素值,否则将像素值置零后转到步骤十四;所述I帧为视频序列起始帧或者视频序列中只进行帧内编码的图像帧;所述将当前帧划分为固定大小的互不重叠的图像块称为宏块;所述将当前宏块进行树状划分得到的块称为小块;所述当前帧所有块的集合称为子块域;
所述前一帧的所有块的集合称为父块域;所述块DCT变换中的块采用固定大小模式;对于右目,转到步骤六;
[0011] 步骤三:若左目为非I帧,用常规单目的运动补偿预测(MCP)编码,对当前帧进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及左目前一帧重建图像即参考帧中,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
[0012] 步骤四:对当前正在处理的图像块即当前块,利用Alpha平面判别该图像块的区域属性;如果该块不在当前编码的视频对象区域内,对该块不做处理;如果该块全部都在当前编码的视频对象区域内,转入步骤五;如果该块的部分像素在当前编码的视频对象区域内,部分像素不在当前编码的视频对象区域内,需要单独处理,转入步骤十三;如果所有的宏块都已处理完毕,则转到步骤十四;所述不在当前编码的视频对象区域内的块称为外部块,所述全部都在当前编码的视频对象区域内的块称为内部块,所述部分像素不在当前编码的视频对象区域内的块为边界块;
[0013] 步骤五:依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同;如果匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤五编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤五编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,记录IFS系数;转入步骤五编码下一宏块;所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块位置(x,y)和比例因子s、偏移因子o;如果当前帧所有的宏块都已编码完毕,且是左目,则转到步骤十四,若是右目,则继续执行步骤七;
[0014] 步骤六:对右目图像,首先进行互不重叠的宏块划分,然后计算这些宏块以及经树状划分得到的小块的像素和、像素平方和,以及右目前一帧重建图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,以减少块匹配过程中的重复计算,转到步骤五;
[0015] 步骤七:计算左目中对应帧图像参考帧,按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,转到步骤八;
[0016] 步骤八:对当前正在处理的图像块即当前块,利用Alpha平面判别该图像块的区域属性;如果该块不在当前编码的视频对象区域内,对该块不做处理;如果该块全部都在当前编码的视频对象区域内,转入步骤九;如果该块的部分像素在当前编码的视频对象区域内,部分像素不在当前编码的视频对象区域内,需要单独处理,转入步骤十三;如果所有的宏块都已处理完毕,则转到步骤十四;
[0017] 步骤九:首先对与当前子块位置相同的父块进行块匹配,得到RMS,并保存迭代函数系统系数,该系数包括父块与子块的相对位移矢量(x,y),比例因子s和偏移因子o;依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同并转入步骤十;如果所得的匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤九编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别转入步骤十计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤九编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,转入步骤十计算RMS,记录IFS系数,转入步骤九编码下一宏块;最后与步骤五所得结果比较,选择误差最小的作为预测结果;如果当前帧所有的宏块都已编码完毕,则转到步骤十四;
[0018] 步骤十:在垂直方向上先上下隔行搜索两个点;如果这两个点的RMS均大于偏振线上点的RMS转到步骤十一,否则转到步骤十二;
[0019] 步骤十一:只沿初始点的右侧进行搜索,在搜索过程中进行跳跃式搜索;向右间隔两个点进行搜索,计算RMS,转入步骤十进行垂直方向搜索;如果当前点的RMS小于前一点的RMS,将当前点作为新的起始搜索点,转回到步骤十一开始位置,继续平搜索下一点;否则说明当前点的RMS大于前一点的RMS,即最佳匹配点位于这两点之间,选择合适的小区域进行全搜索,至此选择RMS最小的点作为最终匹配结果,结束DCP搜索过程,继续执行步骤九;
[0020] 步骤十二:选择两点中RMS最小的点,在垂直方向上再搜索相邻两点之间的点,计算其RMS,选择误差最小的点作为此垂直方向上的最佳匹配点,转入步骤十一继续沿偏振线方向进行搜索;
[0021] 步骤十三:该步骤单独处理边界块,当前帧的边界块只在父块中的属于边界块和内部块中搜索匹配,当前块和父块的像素选取准则是:在当前块中只计算位于当前编码的视频对象区域内的像素值,只在参考帧的相同视频对象区域内进行块匹配;对于父块中,如果与当前块的相对应位置的父块中的某一像素也属于该视频对象区域,则采用原像素值,否则,用其它属于该视频对象区域像素的平均值代替;转到步骤五;
[0022] 步骤十四:对所有IFS系数进行Huffman编码,降低IFS系数数据的统计冗余;判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回步骤二继续处理下一帧图像。
[0023] 所述一种基于对象和分形的双目立体视频压缩编码方法,处理的视频序列为YUV格式,分别对3个分量中的每个采用上述十四个步骤进行处理。
[0024] 所述步骤五中对宏块采用树状划分,块匹配采用匹配误差准则;子块与父块的匹配误差RMS为:
[0025]
[0026] 其中参数s和o分别为:
[0027]
[0028]
[0029] 其中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值;
[0030] 计算当前宏块在参考帧中的块匹配误差RMS,其中ri是子块的像素值,di是父块的像素值;如果RMS小于预先设定的阈值γ,记录IFS系数,IFS系数包括匹配块的位移矢量(x,y)和公式2,3中的s和o,处理下一宏块;否则,对当前宏块进行树状划分,计算划分后小块的RMS,如果小于阈值γ,则停止划分,否则继续划分,直到子块达到预先设定的最小块为止。
[0031] 所述步骤十中垂直方向的搜索方法运用了双目立体视频的偏振性,最佳匹配点位于偏振线上即水平线上:在立体平行摄像系统中,沿水平方向进行DCP搜索;
[0032] 两摄像机在同一时刻观看空间同一特征点P(xc,yc,zc),在左图像和右图像的坐标分别为Pleft=(Xleft,Yleft),pright=(Xright,Yright);其中点P(xc,yc,zc)与两个光心所确定的平面称为偏振平面,偏振平面与左右图像的交线称为偏振线;由几何关系得到:
[0033]
[0034] 所述步骤十一中水平方向的搜索方法运用了双目立体视频的方向性;同一空间点在两图像平面中的投影位置差矢量即视差 由此可知视差D是深度z的函数,表示相对深度;对于同一特征点,其透视投影左图像是右图像沿水平负向的局部平移,说同一空间点在右图像上的图像坐标比在左图像上的图像坐标偏右,在搜索时只需沿一个方向进行。
[0035] 一种基于对象和分形的双目立体视频解压缩方法,其特征在于包含以下步骤:
[0036] 步骤I:首先读入左目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;
[0037] 步骤II:判断解码帧是否为I帧,若是I帧转入步骤III,否则转入步骤IV;
[0038] 步骤III:对于I帧,从压缩文件中读入码流,并读入该帧的Alpha平面,进行类似于JPEG的解压缩方式进行解码,解码之后的文件包括基于不同对象的视频文件和完整的视频文件,在基于对象的视频文件中,根据Alpha平面,判断对应的对象属性,属于该对象的像素保留,不属于该对象的像素置零,帧数加一转入步骤VII;
[0039] 步骤IV:对于非I帧,计算左目前一帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
[0040] 步骤V:读入右目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;计算右目前一帧和左目对应帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,转入步骤VI;
[0041] 步骤VI:从对应的压缩文件中读入块的划分信息和Huffman码流以及该帧的Alpha平面,并根据以上的信息得到该帧所有宏块的划分方式和每一个小块的迭代函数系统系数,利用Alpha平面判别该图像块的区域属性,将当前块分成内部块、外部块和边界块;对于内部块,按照每一宏块进行分形解码;对于内部块,按照每一宏块进行分形解码;外部块不用处理;边界块用均值代替,进行分形解码;
[0042] 步骤VII:判断此时所有帧是否都已解码,若都解码完毕,结束解码过程,否则转入步骤II。
[0043] 对于每一个宏块进行解压缩时,首先判断该宏块在编码时的划分方式,对于每一个子块,首先在父块域找到与该子块相对应的区域,然后利用下面的公式获得该子块的像素值:
[0044] ri=s·di+o (5)
[0045] 其中ri为待解码子块的像素值,di为父块域中的像素值,s为比例因子,o为偏移因子。
[0046] 在基于对象的解码过程中,利用Alpha平面判别该图像块的区域属性,将当前块分成内部块、外部块和边界块;当前块中只有属于该对象区域的像素,即内部块才进行解码;在父块域中只利用属于同一对象区域的像素进行解码,假如父块域中的某个子块中部分像素不属于该视频对象即边界块,这部分像素的值用该子块中属于该对象区域的像素的平均值代替。
[0047] 在基于对象和分形的双目立体视频解码过程中,左目用常规单目的运动补偿预测(MCP)编码,右目的每个图像块通过运动补偿预测(MCP)和视差补偿预测(DCP)两种方式进行预测,从中选择误差较小的一种作为预测结果。
[0048] 处理的视频序列为YUV格式,分别对3个分量中的每个采用上述七个步骤进行处理。
[0049] 本发明所提出的一种基于对象和分形的双目立体视频压缩方法的优点在于:
[0050] (1)本方法中对起始帧采用帧内块DCT变换编码,相对于CPM/NCIM编码方案,不但大幅度减少了压缩时间和块效应,而且提高了峰值信噪比
[0051] (2)本方法先将一帧图像划分为互不重叠的、由若干固定大小尺寸的宏块组成的棋盘格式,然后根据匹配准则与设定阈值的关系,对宏块进行树状结构划分,相对于四叉树划分准则,大大降低了计算复杂度,提高了编码速度。
[0052] (3)本方法在进行子块的块匹配之前,计算当前帧互不重叠的宏块及其经树状划分之后得到的小块的像素和与像素平方和;在参考帧中,按照匹配步长分别计算各宏块以及经树状划分以后得到的小块的像素和与像素平方和;避免了在块匹配过程中出现重复计算的弊端,大大节约了子块的匹配时间。
[0053] (4)本方法中,左目的编码方式与单目分形编码相同;右目中,除了采用前一帧作为参考帧外,加入了左目对应的帧作为参考帧,选取误差最小的块作为父块,使得面向的范围更广,实现更好的效果。
[0054] (5)本方法引入了基于对象的视频编码方法,利用Alpha平面判别该图像块的区域属性,将当前块分成内部块、外部块和边界块;基于对象的编码方法在非基于对象方法的基础之上又进一步提高了分形压缩的性能,不但增加了压缩比和峰值信噪比,而且使得压缩具有更大的灵活性。
[0055] (6)本方法中,在进行DCP编码方式时,充分利用立体平行摄像结构中的偏振性和方向性,对DCP搜索方式进行了简化运算,提出了一种新型快速搜索算法。附图说明:
[0056] 图1a为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法的左目MCP压缩流程图
[0057] 图1b为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法的右目DCP压缩流程图;
[0058] 图1c为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法的左目MCP解压缩流程图;
[0059] 图1d为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法的右目DCP解压缩流程图;
[0060] 图1e为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法的DCP快速算法流程图;
[0061] 图2a为标准测试视频序列“ion.cif”的第2帧的左目图像;
[0062] 图2b为标准测试视频序列“ion.cif”的第2帧的右目图像;
[0063] 图2c为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法得到的标准测试视频序列“ion.cif”的第2帧左目的Alpha分割平面;
[0064] 图2d为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法得到的标准测试视频序列“ion.cif”的第2帧右目的Alpha分割平面;
[0065] 图2e为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法单独解码经本发明方法压缩编码以后的标准测试视频序列“ion.cif”的第2帧左目的前景视频对象的结果图像;
[0066] 图2f为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法单独解码经本发明方法压缩编码以后的标准测试视频序列“ion.ciff”的第2帧的右目的前景视频对象的结果图像;
[0067] 图3为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法的MCP和DCP结构示意图;
[0068] 图4a为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法对宏块的四种划分模式图;
[0069] 图4b为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法对宏块的划分模式四进一步进行划分的四种划分模式图;
[0070] 图5为双目立体平行摄像系统成像原理图;
[0071] 图6为本发明一种基于对象和分形的双目立体视频视频压缩与解压缩方法的DCP快速搜索模式图;
[0072] 图7a为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法对基于对象的三种图像块的标记图;
[0073] 图7b为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法对边界块属于不同视频对象区域的像素的标记图;
[0074] 图8a为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法与传统的CPM/NCIM方法对标准测试视频序列“ion.cif”右目的前5帧进行压缩的峰值信噪比的对比图;
[0075] 图8b为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法与传统的CPM/NCIM方法对标准测试视频序列“ion.cif”右目的前5帧进行压缩的压缩比的对比图;
[0076] 图8c为本发明一种基于对象和分形的双目立体视频压缩与解压缩方法与传统的CPM/NCIM方法对标准测试视频序列“ion.cif”右目的前5帧进行压缩的时间对比图。具体实施方式:
[0077] 下面将结合附图对本发明方法作进一步的详细说明,仅以亮度分量Y为例,色差分量U和V的压缩步骤与亮度分量相同。
[0078] 本发明提出了一种基于对象和分形的双目立体视频压缩与解压缩方法,在双目立体视频编码中以左通道为基本层,右通道为增强层,左通道采用单独的运动补偿预测方式(MCP)进行编码。首先利用视频分割方法获得视频对象分割平面即Alpha平面,对左目的起始帧采用块DCT变换编码,对左目的非I帧进行块运动估计/补偿编码。然后利用Alpha平面判别该图像块的区域属性,如果该块不在当前编码的视频对象区域内,则对该外部块不做处理;如果该块全部都在当前编码的视频对象区域内,在内部块的前一帧即左目视频的参考帧搜索窗中利用全搜索方法寻找最相似的匹配块,最后利用Huffman编码方法压缩迭代函数系统系数;如果该块的部分像素在当前编码的视频对象区域内,部分像素不在当前编码的视频对象区域内,则对该边界块需要单独处理。右通道采用MCP加视差补偿预测方式(DCP)进行编码,MCP是与左目类似的处理,选择误差最小的作为预测结果。在进行DCP编码方式时,又充分利用立体平行摄像结构中的偏振性和方向性。
[0079] 如附图1a和图1b所示,一种基于对象和分形的双目立体视频压缩编码方法,包括以下步骤:
[0080] 步骤一:以标准测试视频序列“ion.cif”的前5帧为例。利用自动视频对象分割方法对视频序列进行自动分割,获取Alpha平面。视频中的对象可以通过Alpha平面进行定义,并且可以独立进行压缩编码。附图2b是标准测试视频序列“ion.cif”右目的第2帧,附图2d为该帧的Alpha平面,前景用黑色表示,背景用白色表示。如附图2b所示,图像中有两个视频对象,那么Alpha平面就可以是一个二值图像,用黑色代表前景,白色代表背景。每个对象都可以独立地进行压缩,使得每个对象组成一个码流。所以在解压缩时,不需要得到整幅图像,而是可以单独恢复和控制每个对象。单独解压缩前景视频对象的结果为附图2f。引入基于对象的编码不但提高了压缩性能,而且增加了视频编码方法的灵活性。
[0081] 步骤二:对于左目,首先判断是否为I帧,若是I帧,则对该帧进行互不重叠的固定大小的块划分,对每一个图像块分别采用基于块DCT变换的I帧帧内图像压缩方法,对该帧图像进行单独编码和解码,解码之后的像素若属于Alpha平面中待编码的视频对象则保留该像素值,否则将像素值置零后转到步骤十四;所述I帧为视频序列起始帧或者视频序列中只进行帧内编码的图像帧;所述将当前帧划分为固定大小的互不重叠的图像块称为宏块;所述将当前宏块进行树状划分得到的块称为小块;所述当前帧为正在进行压缩的帧,所述参考帧为当前帧的已经编码并重建的前一帧;所述当前帧所有块的集合称为子块域;所述前一帧的所有块的集合称为父块域;所述块DCT变换中的块采用固定大小模式。对于右目,转到步骤六;
[0082] 对视频序列“ion.cif”起始帧,对每一个图像块分别采用基于块DCT变换的I帧帧内图像压缩方法,将起始帧划分为8×8的互不重叠的子块,对每一子块分别进行DCT变换。离散余弦变换将8×8的图像样本X,变换成8×8的系数矩阵Y。变换过程(包括反变换)可以用变换矩阵A来表示。
[0083] 8×8样本块的正向DCT(FDCT)变换如下:
[0084] Y=AXAT (6)
[0085] 反向DCT(IDCT)如下:
[0086] X=ATYA (7)
[0087] 其中A是8×8的变换矩阵。A中的各个元素如下:
[0088]
[0089] 其中
[0090] (i=0) (i>0) (9)
[0091] i,j分别为矩阵A的行和列。
[0092] 对变换系数进行量化和编码,转入步骤十四。附图3为双目立体视频编码的MCP和DCP结构示意图。
[0093] 步骤三:若左目为非I帧,用常规单目的运动补偿预测(MCP)编码,对当前非I帧图像进行互不重叠的16×16宏块划分,分别计算当前帧互不重叠的16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和。然后分别计算参考帧也就是前一帧的解压缩图像中以1为步长的大小分别为16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和,以减少块匹配过程中的重复计算。从第一个宏块开始处理,依次对当前帧的所有16×16宏块进行编码,转入步骤四;
[0094] 步骤四:在当前帧中按照互不重叠的16×16的宏块进行块匹配,利用Alpha平面判别该图像块的区域属性;根据该宏块的类型,做出如下的选择,如果该宏块不在Alpha平面内,对该块不做处理,继续处理下一宏块;如果该宏块全部位于Alpha平面内,转入步骤五;如果该宏块部分位于Alpha平面内,转入步骤十三。如果当前帧宏块全部匹配完毕后,转入步骤十四。所述不在当前编码的视频对象区域内的块称为外部块,所述全部都在当前编码的视频对象区域内的块称为内部块,所述部分像素不在当前编码的视频对象区域内的块为边界块。
[0095] 步骤五:依次对当前帧的所有16×16宏块进行编码,在父块域中的搜索窗内对整个宏块进行块运动估计/补偿。匹配的依据是分形迭代函数系统原理,简要介绍一下分形图像压缩的数学基础-迭代函数系统(IFS:Iterative Function System)理论。设D是n nR 欧氏空间的子集,ω为D→D的映射,如果存在一个实数C,0≤C<1,使得对于R 上的度量d,满足对任意x,y∈D,有d(ω(x),ω(y))≤C(d(x,y)),则称ω为压缩映射,实数C称为ω的压缩因子。完备的度量空间(X,d)以及n个压缩映射ωi:X→X(其压缩因子分别为C1,C2,...Cn)一起,就组成一个迭代函数系统(Iterated Function System),简称
2
IFS,记作{X:ω1,ω2,...,ωn}。C=max(C1,C2,...,Cn)称为IFS的压缩因子。因此{R :
ω1,ω2,ω3}就是一个IFS。
[0096] 分形图像压缩中,一般的匹配准则是RMS,即:
[0097]
[0098] 其中s,o分别为:
[0099]
[0100]
[0101] 其中,N为子块和父块像素的个数,ri为子块的像素值,di为父块的像素值。
[0102] 首先设定子块的匹配误差阈值γ=tol×tol×no,其中tol根据不同的子块大小而改变,大的子块tol就越大,小的子块tol就小。在本例中,我们取16×16宏块的tol为10.0,8×8子块的tol为8.0,4×4子块的tol为6.0,no为当前子块属于该视频对象区域的像素个数。
[0103] 首先设定16×16宏块的匹配误差阈值γ16=10.0×10.0×no,在参考帧的父块域中以当前子块的位置开始在15×15的搜索窗内对整个宏块进行块匹配,如果匹配误差RMS小于开始设定的阈值γ16,保存当前的IFS系数包括比例因子s,偏移o,父块相对于当前子块的坐标偏移x,y,返回步骤五,继续下一宏块的匹配。
[0104] 否则,按照树状结构对该宏块进行划分,对宏块的划分有四种模式,如附图4a,模式一为一个16×16小块,模式二为两个8×16的小块,模式三为两个16×8的小块,模式四为四个8×8的小块。
[0105] 1、首先按模式二的划分计算,若模式二中两个小块都满足RMS<γ16,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分,转到5;
[0106] 2、否则按模式三划分,若模式三中两个小块都满足RMS<γ16,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分,转到5;
[0107] 3、否则按照模式四对当前宏块进行划分,此时匹配误差阈值设置为γ8=8.0×8.0×no,如果模式四中的4个小块都满足RMS<γ8,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分,转到5;
[0108] 4、否则对模式四中的每一个小块按照附图4b中的模式划分顺序进行划分,可依次划分为1个8×8的小块,2个4×8的小块,2个8×4的小块,4个4×4的小块。这里只对第一个8×8小块的匹配过程进行阐述,其它3个8×8小块的匹配过程与第一个相同,不再赘述。首先按照2个4×8的小块划分,进行块匹配,如果两个子块的匹配误差RMS全部小于γ8时,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分。否则,按照2个8×4的划分方式进行块的划分,对这两个子块进行块匹配,如果两个子块的匹配误差RMS全部小于γ8时,保存当前的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分。否则,对该子块划分为4个4×4的小块,同时匹配误差阈值设为γ4=6.0×6.0×no,对四个小块分别进行块匹配,并分别记录每个子块的IFS系数包括比例因子s,偏移o,以及父块相对于当前子块的坐标偏移x,y,并停止块的划分,转到5;
[0109] 5、返回步骤五,继续下一宏块的编码。
[0110] 如果当前帧所有的宏块都已编码完毕,且是左目,则转到步骤十四,若是右目,则继续执行步骤七;
[0111] 步骤六:对右目图像,首先进行互不重叠的16×16宏块划分,分别计算当前帧互不重叠的16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和。然后分别计算参考帧也就是右目前一帧的解压缩图像和左目中对应帧的解压缩图像中以1为步长的大小分别为16×16,16×8,8×16,8×8,8×4,4×8,4×4的小块的像素和与像素的平方和,以减少块匹配过程中的重复计算。编码器首先在右目的前一帧中搜索,选择最匹配的D块。从第一个宏块开始处理,依次对当前帧的所有16×16宏块进行编码,转入步骤五;
[0112] 步骤七:编码器在左目对应帧搜索,选择最匹配的D块。从第一个宏块开始处理,依次对当前帧的所有16×16宏块进行编码,转入步骤八;
[0113] 步骤八:在当前帧中按照互不重叠的16×16的宏块进行块匹配,根据该宏块的类型,做出如下的选择,如果该宏块不在Alpha平面内,对该块不做处理,继续处理下一宏块;如果该宏块全部位于Alpha平面内,转入步骤九;如果该宏块部分位于Alpha平面内,转入步骤十三。如果当前帧宏块全部匹配完毕后,转入步骤十四。
[0114] 步骤九:首先对与当前子块位置相同的父块进行块匹配,得到RMS,并保存迭代函数系统系数,该系数包括父块与子块的相对位移矢量(x,y),比例因子s和偏移因子o;依次对当前帧的所有宏块进行编码,在父块域中的搜索窗内首先对该宏块进行块匹配;在进行子块与父块的匹配过程中,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同并转入步骤十;如果所得的匹配误差RMS小于开始设定的阈值γ,保存当前的迭代函数系统系数即IFS系数,转入步骤九编码下一宏块;否则,依次按照树状结构对该块进行划分,并对各个划分得到的小块分别转入步骤十计算匹配误差RMS,如果RMS小于设定阈值γ,停止划分并记录该小块IFS系数,转入步骤九编码下一宏块;否则继续划分,直到将当前块划分为预先设定的最小块,转入步骤十计算RMS,记录IFS系数,转入步骤九编码下一宏块;最后与步骤五所得结果比较,选择误差最小的作为预测结果;如果当前帧所有的宏块都已编码完毕,则转到步骤十四;
[0115] 步骤十:图1e为DCP快速算法流程图,具体实现如下:根据立体几何极线约束,图5中点P(xc,yc,zc)在左右图像上的点必定位于对应的偏振线上;由偏振性可知,最佳匹配点位于偏振线上即水平线上,但在实际中可能存在一定的误差,因此采用在垂直方向上先上下隔行搜索两个点,例如图6中的点2和点3;如果这两个点的RMS均大于偏振线上点的RMS转到步骤十一,否则转到步骤十二;
[0116] 两摄像机在同一时刻观看空间同一特征点P(xc,yc,zc),它在左图像和右图像的坐标分别为pleft=(Xleft,Yleft),pright=(Xright,Yright)。其中点P(xc,yc,zc)与两个光心所确定的平面称为偏振平面,偏振平面与左右图像的交线称为偏振线。由几何关系得到:
[0117]
[0118] 步骤十一:由视差矢量 可知,对于同一特征点,其透视投影左图像可认为是右图像沿水平负向的局部平移。也就是说同一空间点在右图像上的图像坐标比在左图像上的图像坐标偏右,因此在搜索时只需沿一个方向进行。在立体平行摄像系统中,进行DCP搜索时只需沿水平方向进行搜索即可。最佳匹配点位于初始点的右侧,只沿初始点的右侧进行搜索,在搜索过程中进行跳跃式搜索;如图6所示,例如点1匹配完之后,向右间隔两个点进行搜索,即搜索点4,计算RMS,并转入步骤十进行垂直方向搜索;如果点
4的RMS小于点1的RMS值,将点4作为起始搜索点,转回到步骤十一开始位置,继续水平搜索下一点;
[0119] 否则说明当前点的RMS大于前一点的RMS,例如点13的RMS大于点7的RMS,那么说明最佳匹配点位于这两点之间,如果点8的RMS小于点9,那么此最佳匹配点位于虚线框内,此时搜索点范围已大大缩小,并且为了最大化匹配精度,本文对此虚线框内未搜索的点进行全搜索,反之如果点8的RMS大于点9的RMS,那么最佳匹配点位于实线框内,对实线框进行全搜索,至此选择RMS最小的点作为最终匹配结果,结束DCP搜索过程,继续执行步骤九;
[0120] 步骤十二:选择两点中RMS最小的点,例如此时点2的RMS最小,那么在垂直方向上再搜索点1和点2之间的点,计算其RMS,选择这三个点中误差最小的点作为此垂直方向上的最佳匹配点,转入步骤十一继续沿偏振线方向进行搜索;
[0121] 步骤十三:为了在匹配子块与父块时,避免将属于不同对象的像素相混淆,对每一个像素在Alpha平面中做一个标记,标明被标记的像素是属于哪一对象的,如附图7b所示,此边界块的像素被标记为S1和S2两个部分。
[0122] 边界块的具体压缩方法:假设当前压缩的是对象1(压缩对象2时,方法相同),即S1所在的对象。对于与子块相关的量,只计算在S1区域内的像素值,而S2区域内的像素不予以考虑;对于与父块有关的量,若与子块相对应的位置的父块中的某一像素di也属于S1区域,则使用di的原像素值,否则,按照特定的计算值来代替di,本发明中使用的是父块中属于S1区域的像素均值来代替di。需要说明的是,匹配映射只在同类块之间进行,即子块和父块必须同时是边界块或者同时是内部块(外部块)。按照所述当前块和父块的像素选取准则确定当前块和父块的像素值后,计算匹配误差RMS,如果RMS小于阈值γ,则保存当前所得系数,否则将当前的边界块划分为小块,对每个小块分别返回步骤五进行处理;
[0123] 步骤十四:对所有IFS系数进行huffman编码,huffman编码是根据出现的概率将每个符号映射到一个变长码字的集合(VLC)上,降低IFS系数数据的统计冗余。判断当前帧是否为最后一帧,如果是最后一帧结束编码,否则,转入步骤二继续处理下一帧图像。
[0124] 如附图1c和图1d所示,一种基于对象和分形的双目立体视频解压缩方法,包括以下步骤:
[0125] 步骤I:首先读入左目压缩信息,包括压缩帧数,每帧的宽和高,I帧重建质量,插入I帧的间隔;
[0126] 步骤II:判断解码帧是否为I帧,若是I帧转入步骤III,否则转入步骤IV;
[0127] 步骤III:对于I帧,从压缩文件中读入码流,并读入该帧的Alpha平面,进行类似于JPEG的解压缩方式进行解码,进行反DCT变换,得到每一个8×8的块的像素值;解码之后的文件包括基于不同对象的视频文件和完整的视频文件,在基于对象的视频文件中,根据Alpha平面,判断对应的对象属性,属于该对象的像素保留,不属于该对象的像素置零,帧数加一转入步骤VII;
[0128] 步骤IV:对于非I帧,首先计算左目前一帧即参考帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和;
[0129] 步骤V:读入右目压缩信息,包括压缩帧数,每帧图像的宽和高,I帧压缩质量和插入I帧的间隔;计算右目前一帧和左目对应帧即参考帧中按照设定步长划分的所有宏块以及经树状划分得到的小块的像素和、像素平方和,转入步骤VI;
[0130] 步骤VI:从压缩文件中读入块的划分信息和Huffman码流及该帧的Alpha平面,并根据以上的信息得到该帧所有宏块的划分方式和每一个小块的迭代函数系统系数,按照每一宏块进行解码,对于每一个宏块进行解压缩时;首先判断该宏块在编码时的划分方式,对于每一个子块,在父块域找到与该子块相对应的区域,然后利用下面的公式获得该子块的像素值,
[0131] ri=s·di+o
[0132] 其中ri为待解码子块的像素值,di为父块域中的像素值,s为比例因子,o为偏移因子。
[0133] 在基于对象的解码过程中,利用Alpha平面判别该图像块的区域属性,将当前块分成内部块、外部块和边界块;当前块中只有属于该对象区域的像素才进行解码,在父块域中只利用属于同一对象区域的像素进行解码,假如父块域中的某个子块中部分像素不属于该视频对象,这部分像素的值用该子块中属于该对象区域的像素的平均值代替,进行分形解码。
[0134] 步骤VII:判断此时所有帧是否都已解码,若都解码完毕,结束解码过程,否则转入步骤II。
[0135] 处理的双目立体视频序列为YUV格式,分别对3个分量中的每个采用上述七个步骤进行处理。
[0136] 本方法选择Visual C++6.0作为所述方法的实现语言,CPU为 CoreTM2DuoT8300,2.4GHz主频,内存大小为2G,对标准测试视频序列“ion.cif”进行了基于分形的双目立体视频编码实验。
[0137] 表1、表2和表3分别为基于对象1和对象2的前5帧压缩的平均峰值信噪比、平均压缩比、平均压缩时间的比较。表3中第一帧时间是处理完三目的总时间,其它帧类似。可以看出,本方法在压缩比上有一定的提高。同时复原图像质量没有明显降低,能保证人眼的观看。但是在压缩时间上,本方法有了很大的提高,大约降低了20倍,使得编解码速度有了明显提高,改善了分形双目立体视频编解码的性能。利用本方法对“ion.cif”的前5帧分别基于对象1和基于对象2的压缩比的对比如附图8a所示;利用本方法对“ion.cif”的前5帧基于对象1的峰值信噪比的对比如附图8b所示;利用本方法对“ion.cif”的前5帧的压缩时间的对比如附图8c所示。
[0138]
[0139] 表1CPM/NCIM方法和本发明方法的压缩性能均值对比
[0140]
[0141] 表2CPM/NCIM方法和本发明方法的峰值信噪比均值对比
[0142]
[0143] 表3CPM/NCIM方法和本发明方法的前5帧时间对比
[0144] 分形编码中,编码速度和压缩时间一直都是最为关心的问题,也是很难解决的环节。本方法可以根据立体平行摄像结构中的偏振性和方向性,对DCP搜索方式进行了简化运算,极大的增强了双目立体视频编码的实用性。从结果数据中,可以看到本方法在保证一定的图像复原质量前提了,一定程度上提高了压缩比,而且编码速度和压缩时间有了很大比例的改进,提高了分形双目立体视频编码的实用性。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈