专利汇可以提供基于学习的视频编解码系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于学习的视频编解码 框架 ,包括:空时域重构内存,用于存储经编码与解码之后的重构视频内容;空时域预测网络,用于利用重构视频内容的空时域相关性,通过 卷积神经网络 以及循环神经网络对其建模,输出当前编码 块 的预测值;预测值与原始值相减形成残差; 迭代 分析器与迭代合成器,逐级对输入残差编解码;二值化器,将迭代分析器的输出量化为二值表示;熵 编码器 ,对量化后的编码输出进行 熵编码 ,后获得输出码流;熵 解码器 ,对输出码流进行熵解码,后输出给迭代合成器。该编码框架,通过基于学习的VoxelCNN(空时域预测网络)实现了空时域的预测,并用残差迭代编码的方法实现 视频编码 率失真优化的控制。,下面是基于学习的视频编解码系统专利的具体信息内容。
1.一种基于学习的视频编解码系统,其特征在于,包括:编码端与解码端;其中编码端包括:空时域重构内存、空时域预测网络、迭代分析器、迭代合成器、二值化器、熵编码器以及熵解码器;
所述空时域重构内存,用于存储经编码与解码之后的重构视频内容;
所述空时域预测网络,用于利用重构视频内容的空时域相关性,通过卷积神经网络以及循环神经网络对其建模,输出当前编码块的预测值;
所述迭代分析器,包含卷积神经网络与循环神经网络结构,将所述空时域预测网络输出的预测值与原始值相减形成的残差作为输入,输出为该残差的压缩表达;
所述迭代合成器,包含卷积神经网络与循环神经网络结构,接收熵解码器解码产生的上述残差的压缩表达,并叠加所述空时域预测网络输出的预测值,形成重构视频内容;
所述熵编码器与所述熵解码器,逐级对输入残差编解码,所述迭代分析器与迭代合成器,通过增加码流为代价逐步减少残差的失真程度,实现高低码流情况下不同失真程度的编码;
所述二值化器,将迭代分析器的输出量化为二值表示;
所述熵编码器,对量化后的编码输出进行熵编码,后获得输出码流;
所述熵解码器,对输出码流进行熵解码,后输出给迭代合成器;
所述空时域预测网络计算编码块的预测值包含运动合成与混合预测两个过程,其中:
运动合成为运动插补或者运动延伸操作,运动插补为通过重构视频内容相邻两帧获得物体运动轨迹并插补至相邻两帧之间,作为插补帧;运动延伸为通过重构视频内容的前两帧获得物体运动轨迹并向后延伸,从而获得一延伸帧;
混合预测包含卷积及卷积LSTM结构,将插补帧或者延伸帧、插补帧的前后各一帧或者延伸帧的前两帧,以及位于当前帧中当前编码块上方与左方已经解码的块作为输入,通过学习对视频空时域信息的建模,生成当前帧中当前编码块的预测值;通过迭代计算,最终获得每一编码块的预测值。
2.根据权利要求1所述的一种基于学习的视频编解码系统,其特征在于,所述空时域重构内存、空时域预测网络、迭代合成器与熵解码器构成编码端中的解码器。
3.根据权利要求1所述的一种基于学习的视频编解码系统,其特征在于,运动插补过程如下:将插补帧记为 重构视频内容中相邻两帧分别记为 与 通过编码块尺寸为m的运动补偿操作确定一个以坐标(x,y)为中心的编码块的运动矢量(vx,vy),插补帧 中以(x,y)为中心的编码块 的值由 中以 为中心的编码块 复制得到,按照
此种方法,得到一个完整的插补帧
4.根据权利要求1所述的一种基于学习的视频编解码系统,其特征在于,运动延伸过程如下:在重构视频内容前两帧 与 中,通过编码块尺寸为m的运动补偿操作确定一个以坐标(x,y)为中心的编码块的运动矢量(vx,vy),延伸帧 中以(x,y)为中心的编码块的值由 中以(x-vx,y-vy)为中心的编码块 复制得到,按照此种方法,获得一个完整的延伸帧
5.根据权利要求1所述的一种基于学习的视频编解码系统,其特征在于,空时域预测网络输出的预测值与原始值相减形成残差,并通过迭代分析器与迭代合成器配合熵编码器与熵解码器进行迭代编码,空时域预测网络的优化目标为:
其中,B为优化所涉及的总帧数,J是重构视频内容中每一帧总的编码块数量, 分别对应为第i帧中的第j个编码块的原始值、预测值。
6.根据权利要求5所述的一种基于学习的视频编解码系统,其特征在于,迭代分析器与迭代合成器均包含S个基于卷积的自编码器组成的S个编码阶段,重构值和目标值不断地迭代分析与合成以实现可变的压缩率,重构值也即重构视频内容,每一阶段迭代分析器产生一个对于输入残差的压缩表达,压缩表达经过量化后形成输出码流,迭代分析器与迭代合成器的优化目标表示为:
其中, 为初始阶段输入的残差, 表示第n个阶段时输入的残差, 表示第n个阶段迭代分析器的输出。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种视频编码方法、装置及终端设备 | 2020-05-08 | 90 |
利用连续坐标系的运动补偿和运动估计 | 2020-05-11 | 161 |
帧间预测的方法及其装置和运动补偿的方法及其装置 | 2020-05-13 | 391 |
基于仿射运动信息的尺寸限制 | 2020-05-08 | 773 |
从仿射运动预测的非仿射块 | 2020-05-12 | 176 |
视频解码的方法和装置、计算机设备及存储介质 | 2020-05-12 | 431 |
扩展Merge预测 | 2020-05-12 | 689 |
多次迭代运动矢量细化 | 2020-05-08 | 825 |
BIO中的时间梯度计算的改善 | 2020-05-08 | 622 |
仿射的运动矢量访问范围 | 2020-05-11 | 218 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。