首页 / 专利库 / 显示技术 / 立体像对 / 一种基于机器学习的立体视频客观质量评价方法

一种基于机器学习的立体视频客观质量评价方法

阅读:813发布:2024-02-12

专利汇可以提供一种基于机器学习的立体视频客观质量评价方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 机器学习 的立体视频客观 质量 评价方法,其在评价单 帧 图像的 亮度 分量图的 空域 质量时,采用原始和失真的立体视频中的每帧图像的亮度分量图中的每个图像 块 经奇异值分解后的奇异向量的点积来衡量失真立体视频中的每帧图像的失真程度,由于奇异向量可以很好的反映图像的结构信息,以奇异向量的点积来衡量图像的质量因考虑到了结构信息的变化,因此评价结果能更客观地反映立体视频受到各种失真影响下的视觉质量的变化情况;其采用机器学习的方法来处理立体视频的左视点视频的质量和右视点视频的质量、左视点视频和右视点视频在视点间的差异程度与客观质量评价预测值之间的关系,可以有效地取得与人眼 感知 更一致的评价结果。,下面是一种基于机器学习的立体视频客观质量评价方法专利的具体信息内容。

1.一种基于机器学习的立体视频客观质量评价方法,其特征在于它的处理过程为:
通过对参考立体视频的左视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像,及失真的立体视频的左视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块实施奇异值分解,获取失真的立体视频的左视点视频的质量;
通过对参考立体视频的右视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块,及失真的立体视频的右视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块实施奇异值分解,获取失真的立体视频的右视点视频的质量;
通过计算参考立体视频的左视点视频与右视点视频中相对应的两图像的亮度分量图的绝对差值图中的每个尺寸大小为8×8的子块,与失真的立体视频的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对差值图中的每个尺寸大小为8×8的子块的结构相似度,获取失真的立体视频的左视点视频与右视点视频在视点间的差异程度;
采用多个原始的无失真的立体视频,建立其在不同失真类型不同失真程度下的失真立体视频集合,该失真立体视频集合包括多个失真立体视频,然后利用主观质量评价方法分别评价出该失真立体视频集合中的每个失真立体视频的平均主观意见分,接着按照上述三个过程获取该失真立体视频集合中的每个失真立体视频的左视点视频的质量、右视点视频的质量、左视点视频与右视点视频在视点间的差异程度,再将每个失真立体视频的左视点视频的质量、右视点视频的质量、左视点视频与右视点视频在视点间的差异程度构成特征矢量;
将该失真立体视频集合中的所有失真立体视频分成训练集和测试集,然后采用支持向量回归作为机器学习的方法,对该训练集中的所有失真立体视频的特征矢量进行训练,并结合该训练集中的所有失真立体视频的平均主观意见分,得到支持向量回归训练模型,接着根据支持向量回归训练模型,对该测试集中的每个失真立体视频的特征矢量进行测试,预测得到该测试集中的每个失真立体视频的客观质量评价预测值;
该立体视频客观质量评价方法具体包括以下步骤:
(o) (o) (d) (o)
①令R 表示原始的无失真的立体视频,将R 作为参考立体视频,令R 表示与R相对应的失真立体视频,将R(o)的左视点视频中的第k帧图像的亮度分量图记为 将R(o)(d)
的右视点视频中的第k帧图像的亮度分量图记为 将R 的左视点视频中的第k帧图像(d)
的亮度分量图记为 将R 的右视点视频中的第k帧图像的亮度分量图记为 其中,k为正整数,1≤k≤Nf,Nf表示左视点视频和右视点视频中包含的图像的帧数;
(d) (d)
②计算R 的左视点视频中的每帧图像的亮度分量图的空域质量,将R 的左视点视频中的第k帧图像的亮度分量图 的空域质量记为QL,k,其中,获取QL,k的主要过程为:首先,分别将 和 分割成多个互不重叠的尺寸大小一致的第一图像块;然后对 和中的每个第一图像块实施奇异值分解,得到 和 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵、奇异值的对矩阵;接着,根据 和 中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵,获取 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度;最后,根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,获得 的空域质量QL,k;
(d) (d)
③根据R 的左视点视频中的每帧图像的亮度分量图的空域质量,计算R 的左视点视频的质量,记为QL, 其中,wL,k表示QL,k相对于时域上
(d)
位于R 的左视点视频中的第k帧图像之前的F帧图像各自的空域质量和时域上位(d)
于R 的左视点视频中的第k帧图像之后的F帧图像各自的空域质量的波动因子,F的值为
(d)
1或2或3或4,QL,k-T表示R 的左视点视频中的第k-T帧图像的亮度分量图 的空域(d)
质量,QL,k+T表示R 的左视点视频中的第k+T帧图像的亮度分量图 的空域质量,符号“||”为取绝对值符号;
(d) (d)
④计算R 的右视点视频中的每帧图像的亮度分量图的空域质量,将R 的右视点视频中的第k帧图像的亮度分量图 的空域质量记为QR,k,其中,获取QR,k的主要过程为:首先,分别将 和 分割成多个互不重叠的尺寸大小一致的第二图像块;然后对 和中的每个第二图像块实施奇异值分解,得到 和 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵、奇异值的对角矩阵;接着,根据 和 中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵,获取 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度;最后,根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,获得 的空域质量QR,k;
⑤根据R(d)的右视点视频中的每帧图像的亮度分量图的空域质量,计算R(d)的右视点视频的质量,记为QR, 其中,wR,k表示QR,k相对于时域上
(d)
位于R 的右视点视频中的第k帧图像之前的F帧图像各自的空域质量和时域上位(d)
于R 的右视点视频中的第k帧图像之后的F帧图像各自的空域质量的波动因子,F的值为1
(d)
或2或3或4,QR,k-T表示R 的右视点视频中的第k-T帧图像的亮度分量图 的空域质(d)
量,QR,k+T表示R 的右视点视频中的第k+T帧图像的亮度分量图 的空域质量;
(o)
⑥计算R 的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对差值(d)
图,并计算R 的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对差值(o) (d)
图,然后计算R 对应的绝对差值图中的每个尺寸大小为8×8的子块与R 对应的绝对差(o)
值图中对应的尺寸大小为8×8的子块的结构相似度,再根据R 对应的绝对差值图中的每(d)
个尺寸大小为8×8的子块与R 对应的绝对差值图中对应的尺寸大小为8×8的子块的结(d)
构相似度,计算R 的左视点视频与右视点视频中相对应的两帧图像的亮度分量图在视点(d) (d)
间差异的变化程度,将R 的左视点视频中的第k帧图像的亮度分量图 与R 的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度记为QD,k;
⑦根据R(d)的左视点视频与右视点视频中相对应的两帧图像的亮度分量图在视点间差异的变化程度,计算R(d)的左视点视频与右视点视频在视点间的差异程度,记为QD,(d)
其中,wD,k表示QD,k相对于时域上位于R 的左视点视频中的第k帧图
(d)
像之前的F帧图像与R 的右视点视频中的第k帧图像之前的F帧图像各自的亮度分量图(d)
在视点间差异的变化程度,及时域上位于R 的左视点视频中的第k帧图像之后的F帧图(d)
像与R 的右视点视频中的第k帧图像之后的F帧图像各自的亮度分量图在视点间差异的变化程度的波动因子,
F的
值为1或2或3或4,QD,k-T表示R(d)的左视点视频中的第k-T帧图像的亮度分量图 与(d)
R 的右视点视频中的第k-T帧图像的亮度分量图 在视点间差异的变化程度,QD,k+T分(d) (d)
别R 的左视点视频中的第k+T帧图像的亮度分量图 与R 的右视点视频中的第k+T帧图像的亮度分量图 在视点间差异的变化程度;
⑧采用n'个原始的无失真的立体视频,建立其在不同失真类型不同失真程度下的失真立体视频集合,该失真立体视频集合包括多个失真立体视频,利用主观质量评价方法分别评价出该失真立体视频集合中的每个失真立体视频的平均主观意见分,将该失真立体视频集合中的第j个失真立体视频的平均主观意见分记为MOSj,MOSj∈[0,5];然后按照步(d) (d) (d)
骤①至步骤⑦计算R 的左视点视频的质量QL、R 的右视点视频的质量QR及R 的左视点视频与右视点视频在视点间的差异程度QD的操作,以相同的方式计算该失真立体视频集合中的每个失真立体视频的左视点视频的质量、该失真立体视频集合中的每个失真立体视频的右视点视频的质量、该失真立体视频集合中的每个失真立体视频的左视点视频与右视点视频在视点间的差异程度,将该失真立体视频集合中的第j个失真立体视频的左视点视频的质量记为QL(j),将该失真立体视频集合中的第j个失真立体视频的右视点视频的质量记为QR(j),将该失真立体视频集合中的第j个失真立体视频的左视点视频与右视点视频在视点间的差异程度记为QD(j);再由该失真立体视频集合中的每个失真立体视频的左视点视频的质量和右视点视频的质量、该失真立体视频集合中的每个失真立体视频的左视点视频与右视点视频在视点间的差异程度构成该失真立体视频集合中的每个失真立体视频的特征矢量,将该失真立体视频集合中的第j个失真立体视频的特征矢量记为xj,xj=(QL(j),QR(j),QD(j));其中,n'>1,1≤j≤N',N'表示该失真立体视频集合中包含的失真立体视频的个数;
⑨将该失真立体视频集合中的所有失真立体视频分成训练集和测试集,然后采用支持向量回归作为机器学习的方法,对该训练集中的所有失真立体视频的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观意见分之间的误差最小,拟合得到最优的权值opt opt opt opt
矢量W 和最优的偏置项b ,接着利用W 和b 构造得到支持向量回归训练模型,再根据支持向量回归训练模型,对该测试集中的每个失真立体视频的特征矢量进行测试,预测得到该测试集中的每个失真立体视频的客观质量评价预测值,将该测试集中的第k'个失真立体视频的客观质量评价预测值记为Qk',Qk'=f(xk'), 其中,
1≤k'≤t',t'表示该测试集中包含的失真立体视频的个数,f()为函数表示形式,xk'表示测试集中的第k'个失真立体视频的特征矢量,Qk'=f(xk')表示该测试集中的第k'个失真立体视频的客观质量评价预测值Qk'是该测试集中的第k'个失真立体视频的特征矢量opt T opt
xk'的函数,(W )为W 的转置矢量, 表示该测试集中的第k'个失真立体视频的线性函数。
2.根据权利要求1所述的一种基于机器学习的立体视频客观质量评价方法,其特征在(d)
于所述的步骤②中R 的左视点视频中的第k帧图像的亮度分量图 的空域质量QL,k的具体获取过程为:
②-1、分别将 和 分割成 个互不重叠的尺寸大小为c×r的第一图
像块,其中,W表示左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,c的取值为能被W整除,r的取值为能被H整除;
②-2、对 中的每个第一图像块实施奇异值分解,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;并对 中的每个第一图像块实施奇异值分解,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;
②-3、根据 中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵、 中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵,计算 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似度矢量,将 中的第i个第一图像块与 中的第i个第一图像块的奇异向量的相似度矢量记为ΓL,i,ΓL,i=[γ1…γq…γτ],其中,i为正整数,1≤i≤Nblock,γ1=|α1+β1|, γq=|αq+βq|,
γτ=|ατ+βτ|,
分别表示 中的第i个第一图像块的左奇异向量矩阵中的第1个、第q个、第τ个左奇异向量, 分别表示 中的第i个第一图像块的右奇异向量矩阵中的第1个、
第q个、第τ个右奇异向量, 分别表示 中的第i个第一图像块的左奇
异向量矩阵中的第1个、第q个、第τ个左奇异向量, 分别表示 中的第
i个第一图像块的右奇异向量矩阵中的第1个、第q个、第τ个右奇异向量,q为正整数,
1≤q≤τ,在此τ为第一图像块的奇异值的对角矩阵中的奇异值的个数,符号“||”为取绝对值符号;
②-4、根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似度矢量,计算 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,将 中的第i个第一图像块与 中的第i个第一图像块的奇异向量的相似程度记为其中,ln()为以自然基数e为底的对数函数;
②-5、根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,计算 的空域质量,记为QL,k,
3.根据权利要求2所述的一种基于机器学习的立体视频客观质量评价方法,其特征在于所述的步骤②-2的具体过程为:
②-2a、将 中当前待处理的第i个第一图像块定义为当前第一图像块,其中,i为正整数,1≤i≤Nblock;
②-2b、将当前第一图像块以矩阵形式表示为 对 实施奇异值分解,

中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵,为 的奇异值的对角矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、第2个、…、第m
个、…、第r个左奇异向量,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号, 分别表示 中的第1个、第2个、…、第q个、…、
第τ个奇异值,1≤n≤c, 分别表示 中的第1个、第2个、…、第
n个、…、第c个右奇异向量;
②-2c、令i=i+1,将 中下一个待处理的第一图像块作为当前第一图像块,然后返回步骤②-2b继续执行,直至 中的所有第一图像块处理完毕,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号;
②-2d、将 中当前待处理的第i个第一图像块定义为当前第一图像块,其中,i为正整数,1≤i≤Nblock;
②-2e、将当前第一图像块以矩阵形式表示为 对 实施奇异值分解,
其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量
矩阵, 为 的奇异值的对角矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、第2个、…、第
m个、…、第r个左奇异向量,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号, 分别表示 中的第1个、第2个、…、第q个、…、
第τ个奇异值,1≤n≤c, 分别表示 中的第1个、第2个、…、第
n个、…、第c个右奇异向量;
②-2f、令i=i+1,将 中下一个待处理的第一图像块作为当前第一图像块,然后返回步骤②-2e继续执行,直至 中的所有第一图像块处理完毕,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号。
4.根据权利要求1所述的一种基于机器学习的立体视频客观质量评价方法,其特征在(d)
于所述的步骤④中R 的右视点视频中的第k帧图像的亮度分量图 的空域质量的空域质量QR,k的具体获取过程为:
④-1、分别将 和 分割成 个互不重叠的尺寸大小为c×r的第二图
像块,其中,W表示左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,c的取值为能被W整除,r的取值为能被H整除;
④-2、对 中的每个第二图像块实施奇异值分解,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;并对 中的每个第二图像块实施奇异值分解,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;
④-3、根据 中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵、 中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵,计算 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似度矢量,将 中的第i个第二图像块与 中的第i个第二图像块的奇异向量的相似度矢量记为ΓR,i,ΓR,i=[γ1'…γq'…γτ'],其中,i为正整数,1≤i≤Nblock,γ1'=|α1'+β1'|, γq'
=|αq'+βq'|, γτ'=|ατ'+βτ'|,
分别表示 中的第i个第二图像块的左奇异向量矩阵中
的第1个、第q个、第τ个左奇异向量, 分别表示 中的第i个第二图
像块的右奇异向量矩阵中的第1个、第q个、第τ个右奇异向量, 分别表示 中的第i个第二图像块的左奇异向量矩阵中的第1个、第q个、第τ个左奇异向量,分别表示 中的第i个第二图像块的右奇异向量矩阵中的第1个、第q
个、第τ个右奇异向量,q为正整数,1≤q≤τ,在此τ为第二图像块的奇异值的对角矩阵中的奇异值的个数,符号“||”为取绝对值符号;
④-4、根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似度矢量,计算 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,将 中的第i个第二图像块与 中的第i个第二图像块的奇异向量的相似程度记为SR,i, 其中,ln()为以自然基数e为底的对数函数;
④-5、根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,计算 的空域质量,记为QR,k,
5.根据权利要求4所述的一种基于机器学习的立体视频客观质量评价方法,其特征在于所述的步骤④-2的具体过程为:
④-2a、将 中当前待处理的第i个第二图像块定义为当前第二图像块,其中,i为正整数,1≤i≤Nblock;
④-2b、将当前第二图像块以矩阵形式表示为 对 实施奇异值分解,
,其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向
量矩阵, 为 的奇异值的对角矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、第2
个、…、第m个、…、第r个左奇异向量,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号, 分别表示 中的第1个、第2
个、…、第q个、…、第τ个奇异值,1≤n≤c, 分别表示 中的
第1个、第2个、…、第n个、…、第c个右奇异向量;
④-2c、令i=i+1,将 中下一个待处理的第二图像块作为当前第二图像块,然后返回步骤④-2b继续执行,直至 中的所有第二图像块处理完毕,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号;
④-2d、将 中当前待处理的第i个第二图像块定义为当前第二图像块,其中,i为正整数,1≤i≤Nblock;
④-2e、将当前第二图像块以矩阵形式表示为 对 实施奇异值分解,
,其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异
向量矩阵, 为 的奇异值的对角矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、第2
个、…、第m个、…、第r个左奇异向量,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号, 分别表示 中的第1个、第2
个、…、第q个、…、第τ个奇异值,1≤n≤c, 分别表示 中的
第1个、第2个、…、第n个、…、第c个右奇异向量;
④-2f、令i=i+1,将 中下一个待处理的第二图像块作为当前第二图像块,然后返回步骤④-2e继续执行,直至 中的所有第二图像块处理完毕,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号。
6.根据权利要求1至5中任一项所述的一种基于机器学习的立体视频客观质量评价方(d) (d)
法,其特征在于所述的步骤⑥中R 的左视点视频中的第k帧图像的亮度分量图 与R的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度QD,k的具体获取过程为:
(o) (o)
⑥-1、计算R 的左视点视频中的第k帧图像的亮度分量图 与R 的右视点视频中的第k帧图像的亮度分量图 的绝对差值图,记为 其中,符号“||”
为取绝对值符号;
(d) (d)
⑥-2、计算R 的左视点视频中的第k帧图像的亮度分量图 与R 的右视点视频中的第k帧图像的亮度分量图 的绝对差值图记为
⑥-3、采用尺寸大小为8×8的滑动窗口在 中逐像素点滑动,将 分割成
(W-7)×(H-7)个相重叠的尺寸大小为8×8的子块,同样采用尺寸大小为8×8的滑动窗口在 中逐像素点滑动,将 分割成(W-7)×(H-7)个相重叠的尺寸大小为8×8的子块,然后计算 和 中所有的坐标位置相同的两个子块的结构相似度,将 中左上角像素点的坐标位置为(x,y)的子块和 中左上角像素点的坐标位置为(x,y)的子块的结构相似度记为SSIM(x,y), 其中,W表示
左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,1≤x≤W-7,1≤y≤H-7, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的均值, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的均值, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的方差, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的方差, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值与 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的协方差,C1和C2均为常数,C1≠0,C2≠0;
⑥-4、根据 和 中所有的坐标位置相同的两个子块的结构相似度,计算R(d)的左(d)
视点视频中的第k帧图像的亮度分量图 与R 的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度,记为QD,k,
7.根据权利要求6所述的一种基于机器学习的立体视频客观质量评价方法,其特征在于所述的步骤⑥-3中取C1=6.5025,C2=58.5225。
8.根据权利要求7所述的一种基于机器学习的立体视频客观质量评价方法,其特征在于所述的步骤⑨的具体过程为:
⑨-1、将该失真立体视频集合中的所有失真立体视频按来源分为n'组,然后从n'组中选出 组,再将选出的 组中的所有失真立体视频构成训练集,将未被选出的组中的所有失真立体视频构成测试集,或将选出的 组中的所有失真立体视频构成测试集,将未被选出的 组中的所有失真立体视频构成训练集,其中,符号为向下取整符号;
⑨-2、将训练集中的所有失真立体视频的特征矢量和平均主观意见分构成训练样本数据集,记为Ωt,{xk,MOSk}∈Ωt,其中,xk表示Ωt中的第k个失真立体视频的特征矢量,MOSk表示Ωt中的第k个失真立体视频的平均主观意见分,1≤k≤t,t表示训练集中包含的失真立体视频的个数;
⑨-3、构造Ωt中的每个失真立体视频的特征矢量的回归函数,将Ωt中的第k个失真立体视频的特征矢量xk的回归函数记为f(xk), 其中,f()为函数表示
T
形式,W为权值矢量W的转置矢量,b为偏置项, 表示Ωt中的第k个失真立体视频的特征矢量xk的线性函数, K(xk,xl)为支持向量回归中的核函数,
为xl的转置矢量,xl表示Ωt中的第l个失真立体视频的特征矢
量;
⑨-4、采用支持向量回归作为机器学习的方法,对Ωt中的所有失真立体视频的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观意见分之间的误差最小,拟opt opt opt
合得到最优的权值矢量W 和最优的偏置项b ,然后将最优的权值矢量W 和最优的偏opt opt opt
置项b 的组合记为(W ,b ), 再利用得到
的最优的权值矢量Wopt和最优的偏置项bopt构造支持向量回归训练模型,记为f(xinput),其中,ψ表示对Ωt中的所有失真立体视频的特征矢量进
行训练时的权重矢量和偏置项的所有可能的组合的集合, 表示最小化概率密opt T opt
度函数,xinput表示支持向量回归训练模型的输入矢量,(W )为W 的转置矢量,表示支持向量回归训练模型的输入矢量xinput的线性函数;
⑨-5、根据支持向量回归训练模型,对测试集中的每个失真立体视频的特征矢量进行测试,预测得到测试集中的每个失真立体视频的客观质量评价预测值,将测试集中的第k'个失真立体视频的客观质量评价预测值记为Qk',Qk'=f(xk'),
其中,1≤k'≤t',t'表示测试集中包含的失真立体视频的个数,xk'表示测试集中的第k'个失真立体视频的特征矢量, 表示测试集中的第k'个失真立体视频的线性函数。

说明书全文

一种基于机器学习的立体视频客观质量评价方法

技术领域

[0001] 本发明涉及一种视频质量评价技术,尤其是涉及一种基于机器学习的立体视频客观质量评价方法。

背景技术

[0002] 随着视频编码技术和3D显示技术的快速发展,3D视频成功地吸引了公众的眼球;由两个视点构成的立体视频是最简单的3D视频格式,3D视频的研究始于立体视频。立体视频在经过采集、处理等一系列的环节后,不可避免的会产生失真。立体视频质量评价就是对失真后的视频进行质量评估的技术,这对于立体视频技术的发展具有重要意义。
[0003] 立体视频质量评价方法可以分为主观评价和客观评价两类方法,主观评价方法虽然可以得到更为准确的结果,但是其评价过程费时费难以在实际应用中得到推广;客观评价方法具有操作简单、成本低和易于实现等特点,已成为立体视频质量评价的研究热点。
[0004] 立体视频客观质量评价是一个新兴的研究领域,相应的研究工作极少。目前已有的客观质量评价方法大部分的思路是,直接采用2D图像/视频质量评价的方法对立体视频的每一个视频/每一视点进行评价,然后采用加性加权的方式组合得出立体视频的客观评价值。这种简单的以2D图像/视频质量评价的方法扩展而来的立体视频客观质量评价方法得出的客观结果与主观感知之间的一致性并不理想。

发明内容

[0005] 本发明所要解决的技术问题是提供一种基于机器学习的立体视频客观质量评价方法,其能够客观地反映立体视频受到各种压缩和图像处理影响下视觉质量的变化情况,能够较好地与人类视觉系统感知相一致。
[0006] 本发明解决上述技术问题所采用的技术方案为:一种基于机器学习的立体视频客观质量评价方法,其特征在于它的处理过程为:
[0007] 通过对参考立体视频的左视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像,及失真的立体视频的左视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块实施奇异值分解,获取失真的立体视频的左视点视频的质量;
[0008] 通过对参考立体视频的右视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块,及失真的立体视频的右视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块实施奇异值分解,获取失真的立体视频的右视点视频的质量;
[0009] 通过计算参考立体视频的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对差值图中的每个尺寸大小为8×8的子块,与失真的立体视频的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对差值图中的每个尺寸大小为8×8的子块的结构相似度,获取失真的立体 视频的左视点视频与右视点视频在视点间的差异程度;
[0010] 采用多个原始的无失真的立体视频,建立其在不同失真类型不同失真程度下的失真立体视频集合,该失真立体视频集合包括多个失真立体视频,然后利用主观质量评价方法分别评价出该失真立体视频集合中的每个失真立体视频的平均主观意见分,接着按照上述三个过程获取该失真立体视频集合中的每个失真立体视频的左视点视频的质量、右视点视频的质量、左视点视频与右视点视频在视点间的差异程度,再将每个失真立体视频的左视点视频的质量、右视点视频的质量、左视点视频与右视点视频在视点间的差异程度构成特征矢量;
[0011] 将该失真立体视频集合中的所有失真立体视频分成训练集和测试集,然后采用支持向量回归作为机器学习的方法,对该训练集中的所有失真立体视频的特征矢量进行训练,并结合该训练集中的所有失真立体视频的平均主观意见分,得到支持向量回归训练模型,接着根据支持向量回归训练模型,对该测试集中的每个失真立体视频的特征矢量进行测试,预测得到该测试集中的每个失真立体视频的客观质量评价预测值。
[0012] 本发明的基于机器学习的立体视频客观质量评价方法,它具体包括以下步骤:
[0013] ①令R(o)表示原始的无失真的立体视频,将R(o)作为参考立体视频,令R(d)表示与(o) (o)R 相对应的失真立体视频,将R 的左视点视频中的第k帧图像的亮度分量图记为 将(o) (d)
R 的右视点视频中的第k帧图像的亮度分量图记为 将R 的左视点视频中的第k帧(d)
图像的亮度分量图记为 将R 的右视点视频中的第k帧图像的亮度分量图记为其中,k为正整数,1≤k≤Nf,Nf表示左视点视频和右视点视频中包含的图像的帧数;
[0014] ②计算R(d)的左视点视频中的每帧图像的亮度分量图的空域质量,将R(d)的左视点视频中的第k帧图像的亮度分量图 的空域质量记为QL,k,其中,获取QL,k的主要过程为:首先,分别将 和 分割成多个互不重叠的尺寸大小一致的第一图像块;然后对和 中的每个第一图像块实施奇异值分解,得到 和 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵、奇异值的对矩阵;接着,根据 和 中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵,获取 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度;最后,根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,获得 的空域质量QL,k;
[0015] ③根据R(d)的左视点视频中的每帧图像的亮度分量图的空域质量,计算R(d)的左视点视频的质量,记为QL, 其中,wL,k表示QL,k相对于时域上(d)
位于R 的左视点视频中的第k帧图像之前的F帧图像各自的空域质量和时域上位(d)
于R 的左视点视频中的第k帧图像之后 的F帧图像各自的空域质量的波动因子, F的值为
(d)
1或2或3或4,QL,k-T表示R 的左视点视频中的第k-T帧图像的亮度分量图 的空域(d)
质量,QL,k+T表示R 的左视点视频中的第k+T帧图像的亮度分量图 的空域质量,符号“||”为取绝对值符号;
[0016] ④计算R(d)的右视点视频中的每帧图像的亮度分量图的空域质量,将R(d)的右视点视频中的第k帧图像的亮度分量图 的空域质量记为QR,k,其中,获取QR,k的主要过程为:首先,分别将 和 分割成多个互不重叠的尺寸大小一致的第二图像块;然后对和 中的每个第二图像块实施奇异值分解,得到 和 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵、奇异值的对角矩阵;接着,根据 和 中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵,获取 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度;最后,根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,获得 的空域质量QR,k;
[0017] ⑤根据R(d)的右视点视频中的每帧图像的亮度分量图的空域质量,计算R(d)的右(d)视点视频的质量,记为QR, 其中,wR,k表示QR,k相对于时域上位于R 的
(d)
右视点视频中的第k帧图像之前的F帧图像各自的空域质量和时域上位于R 的右视点视频中的第k帧图像之后的F帧图像各自的空域质量的波动因子,
[0018](d)
F的值为1或2或3或4,QR,k-T表示R 的右视点视频中的第k-T帧图像的亮度分量图(d)
的空域质量,QR,k+T表示R 的右视点视频中的第k+T帧图像的亮度分量图 的空域质量;
[0019] ⑥计算R(o)的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对(d)差值图,并计算R 的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对(o) (d)
差值图,然后计算R 对应的绝对差值图中的每个尺寸大小为8×8的子块与R 对应的绝(o)
对差值图中对应的尺寸大小为8×8的子块的结构相似度,再根据R 对应的绝对差值图中(d)
的每个尺寸大小为8×8的子块与R 对应的绝对差值图中对应的尺寸大小为8×8的子块(d)
的结构相似度,计算R 的左视点视频与右视点视频中相对应的两帧图像的亮度分量图在视点间差异的变化程度,将R(d)的左视点视频中的第k帧图像的亮度分量图 与R(d)的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度记为QD,k;
[0020] ⑦根据R(d)的左视点视频与右视点视频中相对应的两帧图像的亮度分量图在视(d)点间差异的变化程度,计算R 的左视点视频与右视点视频在视点间的差异程度,记为QD,(d)
其中,wD,k表示QD,k相对于时域上位于R 的左视点视频中的第k帧
图像之前的F帧图像与R(d)的右视点视频中的第k帧图像之前的F帧图像各自的亮度分量图在视点间差异的变化程度,及时域上位于R(d)的左视点视频中的第k帧图像之后的F帧图像与R(d)的右视点视频中的第k帧图像之后的F帧图像各自的亮度分量图在视点间差异的变化程度的波动因子,
[0021]F的 值
(d) (d)
为1或2或3或4,QD,k-T表示R 的左视点视频中的第k-T帧图像的亮度分量图 与R的右视点视频中的第k-T帧图像的亮度分量图 在视点间差异的变化程度,QD,k+T分别R(d)的左视点视频中的第k+T帧图像的亮度分量图 与R(d)的右视点视频中的第k+T帧图像的亮度分量图 在视点间差异的变化程度;
[0022] ⑧采用n'个原始的无失真的立体视频,建立其在不同失真类型不同失真程度下的失真立体视频集合,该失真立体视频集合包括多个失真立体视频,利用主观质量评价方法分别评价出该失真立体视频集合中的每个失真立体视频的平均主观意见分,将该失真立体视频集合中的第j个失真立体视频的平均主观意见分记为MOSj,MOSj∈[0,5];然后按(d) (d) (d)照步骤①至步骤⑦计算R 的左视点视频的质量QL、R 的右视点视频的质量QR及R 的左视点视频与右视点视频在视点间的差异程度QD的操作,以相同的方式计算该失真立体视频集合中的每个失真立体视频的左视点视频的质量、该失真立体视频集合中的每个失真立体视频的右视点视频的质量、该失真立体视频集合中的每个失真 立体视频的左视点视频与右视点视频在视点间的差异程度,将该失真立体视频集合中的第j个失真立体视频的左视点视频的质量记为QL(j),将该失真立体视频集合中的第j个失真立体视频的右视点视频的质量记为QR(j),将该失真立体视频集合中的第j个失真立体视频的左视点视频与右视点视频在视点间的差异程度记为QD(j);再由该失真立体视频集合中的每个失真立体视频的左视点视频的质量和右视点视频的质量、该失真立体视频集合中的每个失真立体视频的左视点视频与右视点视频在视点间的差异程度构成该失真立体视频集合中的每个失真立体视频的特征矢量,将该失真立体视频集合中的第j个失真立体视频的特征矢量记为xj,xj=(QL(j),QR(j),QD(j));其中,n'>1,1≤j≤N',N'表示该失真立体视频集合中包含的失真立体视频的个数;
[0023] ⑨将该失真立体视频集合中的所有失真立体视频分成训练集和测试集,然后采用支持向量回归作为机器学习的方法,对该训练集中的所有失真立体视频的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观意见分之间的误差最小,拟合得到最优的opt opt opt opt权值矢量W 和最优的偏置项b ,接着利用W 和b 构造得到支持向量回归训练模型,再根据支持向量回归训练模型,对该测试集中的每个失真立体视频的特征矢量进行测试,预测得到该测试集中的每个失真立体视频的客观质量评价预测值,将该测试集中的第k'个失真立体视频的客观质量评价预测值记为Qk',Qk'=f(xk'), 其
中,1≤k'≤t',t'表示该测试集中包含的失真立体视频的个数,f()为函数表示形式,xk'表示测试集中的第k'个失真立体视频的特征矢量,Qk'=f(xk')表示该测试集中的第k'个失真立体视频的客观质量评价预测值Qk'是该测试集中的第k'个失真立体视频的特征矢量opt T opt
xk'的函数,(W )为W 的转置矢量, 表示该测试集中的第k'个失真立体视频的线性函数。
[0024] 所述的步骤②中R(d)的左视点视频中的第k帧图像的亮度分量图 的空域质量QL,k的具体获取过程为:
[0025] ②-1、分别将 和 分割成 个互不重叠的尺寸大小为c×r的第一图像块,其中,W表示左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,c的取值为能被W整除,r的取值为能被H整除;
[0026] ②-2、对 中的每个第一图像块实施奇异值分解,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;并对 中的每个第一图像块实施奇异值分解,得 到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;
[0027] ②-3、根据 中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵、中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵,计算 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似度矢量,将 中的第i个第一图像块与中的第i个第一图像块的奇异向量的相似度矢量记为ΓL,i,ΓL,i=[γ1…γq…γτ],其中,i为正整数,1≤i≤Nblock,γ1=|α1+β1|, γq=|αq+βq|,γτ=|ατ+βτ|,
分别表示 中的第i个第一图像块的左奇异向量矩阵中的第1个、第q个、第τ个左奇异向量, 分别表示 中的第i个第一图像块的右奇异向量矩阵中的第1个、第
q个、第τ个右奇异向量, 分别表示 中的第i个第一图像块的左奇异向量
矩阵中的第1个、第q个、第τ个左奇异向量, 分别表示 中的第i个第一
图像块的右奇异向量矩阵中的第1个、第q个、第τ个右奇异向量,q为正整数,1≤q≤τ,在此τ为第一图像块的奇异值的对角矩阵中的奇异值的个数,符号“||”为取绝对值符号;
[0028] ②-4、根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似度矢量,计算 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,将 中的第i个第一图像块与 中的第i个第一图像块的奇异向量的相似程度记为SL,i, 其中,ln()为以自然基数e为底的对数函数;
[0029] ②-5、根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,计算 的空域质量,记为QL,k,
[0030] 所述的步骤②-2的具体过程为:
[0031] ②-2a、将 中当前待处理的第i个第一图像块定义为当前第一图像块,其中,i为正整数, 1≤i≤Nblock;
[0032] ②-2b、将当前第一图像块以矩阵形式表示为 对 实施奇异值分解, 其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵,
为 的奇异值的对角矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、第2个、…、第m
个、…、第r个左奇异向量,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号, 分别表示 中的第1个、第2个、…、第q个、…、
第τ个奇异值,1≤n≤c, 分别表示 中的第1个、第2个、…、第
n个、…、第c个右奇异向量;
[0033] ②-2c、令i=i+1,将 中下一个待处理的第一图像块作为当前第一图像块,然后返回步骤②-2b继续执行,直至 中的所有第一图像块处理完毕,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号;
[0034] ②-2d、将 中当前待处理的第i个第一图像块定义为当前第一图像块,其中,i为正整数,1≤i≤Nblock;
[0035] ②-2e、将当前第一图像块以矩阵形式表示为 对 实施奇异值分解, 其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵, 为 的奇异值的对角矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、第2个、…、第
m个、…、第r个左奇异向量,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号, 分别表示 中的第1个、第2个、…、第q个、…、
第τ个奇异值,1≤n≤c, 分别表示 中的第1个、第2个、…、第
n个、…、第c 个右奇异向量;
[0036] ②-2f、令i=i+1,将 中下一个待处理的第一图像块作为当前第一图像块,然后返回步骤②-2e继续执行,直至 中的所有第一图像块处理完毕,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号。
[0037] 所述的步骤④中R(d)的右视点视频中的第k帧图像的亮度分量图 的空域质量的空域质量QR,k的具体获取过程为:
[0038] ④-1、分别将 和 分割成 个互不重叠的尺寸大小为c×r的第二图像块,其中,W表示左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,c的取值为能被W整除,r的取值为能被H整除;
[0039] ④-2、对 中的每个第二图像块实施奇异值分解,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;并对 中的每个第二图像块实施奇异值分解,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;
[0040] ④-3、根据 中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵、 中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵,计算 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似度矢量,将 中的第i个第二图像块与中的第i个第二图像块的奇异向量的相似度矢量记为ΓR,i,ΓR,i=[γ1'…γq'…γτ'],其中,i为正整数,1≤i≤Nblock,γ1'=|α1'+β1'|,γq'=|αq'+βq'|, γτ'=|ατ'+βτ'|,
分别表示 中的第i个第二图像块的左奇异向量矩阵中
的第1个、第q个、第τ个左奇异向量, 分别表示 中的第i个第二图像
块的右奇异向量矩阵中的第1个、第q个、第τ个右奇异向量, 分别表
示 中的第i个第二图像块的左奇异向量矩阵中的第1个、第q个、第τ个左奇异向量,分别表示 中的第i个第二图像块的右奇异向量矩阵中的第1个、第q
个、第τ个右奇异向量,q为正整数,1≤q≤τ,在此τ为第二图像块的奇 异值的对角矩阵中的奇异值的个数,符号“||”为取绝对值符号;
[0041] ④-4、根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似度矢量,计算 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,将 中的第i个第二图像块与 中的第i个第二图像块的奇异向量的相似程度记为SR,i, 其中,ln()为以自然基数e为底的对数函数;
[0042] ④-5、根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,计算 的空域质量,记为QR,k,
[0043] 所述的步骤④-2的具体过程为:
[0044] ④-2a、将 中当前待处理的第i个第二图像块定义为当前第二图像块,其中,i为正整数,1≤i≤Nblock;
[0045] ④-2b、将当前第二图像块以矩阵形式表示为 对 实施奇异值分解, ,其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵, 为 的奇异值的对角矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、第2个、…、
第m个、…、第r个左奇异向量,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号, 分别表示 中的第1个、第2个、…、第q
个、…、第τ个奇异值,1≤n≤c, 分别表示 中的第1个、第2
个、…、第n个、…、第c个右奇异向量;
[0046] ④-2c、令i=i+1,将 中下一个待处理的第二图像块作为当前第二图像块,然后返回步骤④-2b继续执行,直至 中的所有第二图像块处理完毕,得到 中的每个第二图像块的左奇异向 量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号;
[0047] ④-2d、将 中当前待处理的第i个第二图像块定义为当前第二图像块,其中,i为正整数,1≤i≤Nblock;
[0048] ④-2e、将当前第二图像块以矩阵形式表示为 对 实施奇异值分解, ,其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵, 为 的奇异值的对角矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、第2个、…、
第m个、…、第r个左奇异向量,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号, 分别表示 中的第1个、第2个、…、第q
个、…、第τ个奇异值,1≤n≤c, 分别表示 中的第1个、第2
个、…、第n个、…、第c个右奇异向量;
[0049] ④-2f、令i=i+1,将 中下一个待处理的第二图像块作为当前第二图像块,然后返回步骤④-2e继续执行,直至 中的所有第二图像块处理完毕,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号。
[0050] 所述的步骤⑥中R(d)的左视点视频中的第k帧图像的亮度分量图 与R(d)的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度QD,k的具体获取过程为:
[0051] ⑥-1、计算R(o)的左视点视频中的第k帧图像的亮度分量图 与R(o)的右视点视频中的第k帧图像的亮度分量图 的绝对差值图,记为 其中,符号“||”为取绝对值符号;
(d) (d)
[0052] ⑥-2、计算R 的左视点视频中的第k帧图像的亮度分量图 与R 的右视点视频中的第k帧图像的亮度分量图 的绝对差值图记为
[0053] ⑥-3、采用尺寸大小为8×8的滑动窗口在 中逐像素点滑动,将 分割成 (W-7)×(H-7)个相重叠的尺寸大小为8×8的子块,同样采用尺寸大小为8×8的滑动窗口在 中逐像素点滑动,将 分割成(W-7)×(H-7)个相重叠的尺寸大小为8×8的子块,然后计算 和 中所有的坐标位置相同的两个子块的结构相似度,将 中左上角像素点的坐标位置为(x,y)的子块和 中左上角像素点的坐标位置为(x,y)的子块的结构相似度记为SSIM(x,y), 其中,W表示左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,1≤x≤W-7,1≤y≤H-7, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的均值, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的均值, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的方差, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的方差, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值与 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的协方差,C1和C2均为常数,C1≠0,C2≠0;
(d)
[0054] ⑥-4、根据 和 中所有的坐标位置相同的两个子块的结构相似度,计算R(d)的左视点视频中的第k帧图像的亮度分量图 与R 的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度,记为QD,k,
[0055] 所述的步骤⑥-3中取C1=6.5025,C2=58.5225。
[0056] 所述的步骤⑨的具体过程为:
[0057] ⑨-1、将该失真立体视频集合中的所有失真立体视频按来源分为n'组,然后从n'组中选出 组,再将选出的 组中的所有失真立体视频构成训练集,将未被选出的组中的所有失真 立体视频构成测试集,或将选出的 组中的所有失真立体视频构成测试集,将未被选出的 组中的所有失真立体视频构成训练集,其中,符号为向下取整符号;
[0058] ⑨-2、将训练集中的所有失真立体视频的特征矢量和平均主观意见分构成训练样本数据集,记为Ωt,{xk,MOSk}∈Ωt,其中,xk表示Ωt中的第k个失真立体视频的特征矢量,MOSk表示Ωt中的第k个失真立体视频的平均主观意见分,1≤k≤t,t表示训练集中包含的失真立体视频的个数;
[0059] ⑨-3、构造Ωt中的每个失真立体视频的特征矢量的回归函数,将Ωt中的第k个失真立体视频的特征矢量xk的回归函数记为f(xk), 其中,f()为函数T
表示形式,W为权值矢量W的转置矢量,b为偏置项, 表示Ωt中的第k个失真立体视频的特征矢量xk的线性函数, K(xk,xl)为支持向量回归中的核函
T 2 T
数,K(xk,xl)=(xkxl+1),xl为xl的转置矢量,xl表示Ωt中的第l个失真立体视频的特征矢量;
[0060] ⑨-4、采用支持向量回归作为机器学习的方法,对Ωt中的所有失真立体视频的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观意见分之间的误差最小,拟opt opt opt合得到最优的权值矢量W 和最优的偏置项b ,然后将最优的权值矢量W 和最优的偏置项bopt的组合记为(Wopt,bopt), 再利用得到的最
opt opt
优的权值矢量W 和最优的偏置项b 构造支持向量回归训练模型,记为f(xinput),[0061] 其中,ψ表示对Ωt中的所有失真立体视频的特
征矢量进行训练时的权重矢量和偏置项的所有可能的组合的集合, 表示最小化概率密度函数,xinput表示支持向量回归训练模型的输入矢量,(Wopt)T为Wopt的转置矢量,表示支持向量回归训练模型的输入矢量xinput的线性函数;
[0062] ⑨-5、根据支持向量回归训练模型,对测试集中的每个失真立体视频的特征矢量进行测试,预测得到测试集中的每个失真立体视频的客观质量评价预测值,将测试集中的第k'个失真立体视频的客观质量评价预测值记为Qk',Qk'=f(xk'),其中,1≤k'≤t', t'表示测试集中包含的失真立体视频的个数,xk'表示测试集中的第k'个失真立体视频的特征矢量, 表示测试集中的第k'个失真立体视频的线性函数。
[0063] 与现有技术相比,本发明的优点在于:
[0064] 1)本发明方法在评价单帧图像的亮度分量图的空域质量时,采用原始和相应失真立体视频中的每帧图像的亮度分量图中的每个图像块经奇异值分解后的奇异向量的点积来衡量失真立体视频中的每帧图像的失真程度,由于奇异向量可以很好的反映图像的结构信息,以奇异向量的点积来衡量图像的质量因考虑到了结构信息的变化,因此评价结果能更客观地反映立体视频受到各种失真影响下的视觉质量的变化情况。
[0065] 2)本发明方法采用机器学习的方法来处理立体视频的左视点视频的质量、立体视频的右视点视频的质量、立体视频的左视点视频和右视点视频在视点间的差异程度与立体视频的客观质量评价预测值之间的关系,可以有效地取得与人眼感知更一致的评价结果。
[0066] 3)本发明方法在奇异值分解的过程中,采用了分块分解的方法,这样对于不同的应用选用不同大小的分块可以在评价性能和效率上进行权衡,可以得到更适合某种应用的评价方法。附图说明
[0067] 图1为本发明方法的总体实现框图
[0068] 图2a为两个失真的立体视频的左视点视频中的每帧图像的亮度分量图的空域质量在时域上的波动示意图;
[0069] 图2b为两个失真的立体视频的右视点视频中的每帧图像的亮度分量图的空域质量在时域上的波动示意图;
[0070] 图2c为两个失真的立体视频的左视点视频与右视点视频中的每帧图像的亮度分量图在视点间差异的变化程度在时域上的波动示意图;
[0071] 图3a为Barrier gate(1920×1080)立体视频序列;
[0072] 图3b为Basket(1920×1080)立体视频序列;
[0073] 图3c为Boxers(1920×1080)立体视频序列;
[0074] 图3d为Hall(1920×1080)立体视频序列;
[0075] 图3e为Lab(1920×1080)立体视频序列;
[0076] 图3f为News report(1920×1080)立体视频序列;
[0077] 图3g为Phone call(1920×1080)立体视频序列;
[0078] 图3h为Soccer(1920×1080)立体视频序列;
[0079] 图3i为Tree branches(1920×1080)立体视频序列;
[0080] 图3j为Umbrella(1920×1080)立体视频序列。

具体实施方式

[0081] 以下结合附图实施例对本发明作进一步详细描述。
[0082] 在观看立体视频的时候,人的两只眼睛是分别接受左视点视频和右视点视频的,左眼看到左视点视频,右眼看到右视点视频。由于两个视点之间存在着差异,进而在大脑中形成立体感。另有研 究表明,这三者之间是一种极为复杂的关系,简单的线性加权方式无法准确的衡量立体视频的质量。本发明根据人类视觉系统中存在的上述特点,提出了一种基于机器学习的立体视频客观质量评价方法,首先将影响立体视频质量的因素分为三个方面:左视点视频的质量、右视点视频的质量以及视点间的差异程度;然后利用支持向量回归作为机器学习的方法,通过对样本的训练得出三者之间的关系模型,最后采用该关系模型来预测得到立体视频的客观质量评价预测值。
[0083] 本发明的基于机器学习的立体视频客观质量评价方法,其总体实现框图如图1所示,其处理过程为:
[0084] 通过对参考立体视频的左视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块,及失真的立体视频的左视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块实施奇异值分解,获取失真的立体视频的左视点视频的质量;
[0085] 通过对参考立体视频的右视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块,及失真的立体视频的右视点视频中的图像的亮度分量图中的所有尺寸大小一致的第一图像块实施奇异值分解,获取失真的立体视频的右视点视频的质量;
[0086] 通过计算参考立体视频的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对差值图中的每个尺寸大小为8×8的子块,与失真的立体视频的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对差值图中的每个尺寸大小为8×8的子块的结构相似度,获取失真的立体视频的左视点视频与右视点视频在视点间的差异程度;
[0087] 采用多个原始的无失真的立体视频,建立其在不同失真类型不同失真程度下的失真立体视频集合,该失真立体视频集合包括多个失真立体视频,然后利用主观质量评价方法分别评价出该失真立体视频集合中的每个失真立体视频的平均主观意见分,接着按照上述三个过程获取该失真立体视频集合中的每个失真立体视频的左视点视频的质量、右视点视频的质量、左视点视频与右视点视频在视点间的差异程度,再将每个失真立体视频的左视点视频的质量、右视点视频的质量、左视点视频与右视点视频在视点间的差异程度构成特征矢量;
[0088] 将该失真立体视频集合中的所有失真立体视频分成训练集和测试集,然后采用支持向量回归作为机器学习的方法,对该训练集中的所有失真立体视频的特征矢量进行训练,并结合该训练集中的所有失真立体视频的平均主观意见分,得到支持向量回归训练模型,接着根据支持向量回归训练模型,对该测试集中的每个失真立体视频的特征矢量进行测试,预测得到该测试集中的每个失真立体视频的客观质量评价预测值。
[0089] 本发明的立体视频客观质量评价方法具体包括以下步骤:
[0090] ①令R(o)表示原始的无失真的立体视频,将R(o)作为参考立体视频,令R(d)表示与(o) (o)R 相对应的失真立体视频,将R 的左视点视频中的第k帧图像的亮度分量图记为 将(o) (d)
R 的右视点视频中的第k帧图像的亮度分量图记为 将R 的左视点视频中的第k帧(d)
图像的亮度分量图记为 将R 的右视点视频中的第k帧图像的亮度分量图记为 ,其中,k为正整数,1≤k≤Nf,Nf表示左视点视频和右视点视频中包含的图像的帧数。
[0091] ②计算R(d)的左视点视频中的每帧图像的亮度分量图的空域质量,将R(d)的左视点视频中的第k帧图像的亮度分量图 的空域质量记为QL,k,其中,获取QL,k的主要过程为:首先,分别将 和 分割成多个互不重叠的尺寸大小一致的第一图像块;然后对和 中的每个第一图像块实施奇异值分解,得到 和 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵、奇异值的对角矩阵;接着,根据 和 中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵,获取 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度;最后,根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,获得 的空域质量QL,k。
[0092] 在此具体实施例中,步骤②中R(d)的左视点视频中的第k帧图像的亮度分量图的空域质量QL,k的具体获取过程为:
[0093] ②-1、分别将 和 分割成 个互不重叠的尺寸大小为c×r的第一图像块,其中,W表示左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,c的取值为能被W整除,r的取值为能被H整除;在此,要求c的取值能够被W整除,同时r的取值能够被H整除,当图像的尺寸较小时,则c×r可取值为8×8或16×16或32×32,当图像的尺寸较大时,则c×r的取值应适当取大一点,如取c×r=120×120,一般情况下第一图像块的尺寸较大时虽然能够提高计算精度,但同时也会增加计算复杂度。
[0094] ②-2、对 中的每个第一图像块实施奇异值分解,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;并对 中的每个第一图像块实施奇异值分解,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵。
[0095] 在此,步骤②-2的具体过程为:
[0096] ②-2a、将 中当前待处理的第i个第一图像块定义为当前第一图像块,其中,i为正整数,1≤i≤Nblock。
[0097] ②-2b、将当前第一图像块以矩阵形式表示为 对 实施奇异值分解, 其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵,
为 的奇异值的对角矩阵, 和 为酉矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示 中的第1个、
第2个、…、 第m个、…、第r个左奇异向量,且每个左奇异向量的模均为1,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号,
分别表示 中的第1个、第2个、…、第q个、…、第τ个奇异值,1≤n≤c,分别表示 中的第1个、第2个、…、第n个、…、第c个右奇异向量,
且每个右奇异向量的模均为1。
[0098] ②-2c、令i=i+1,将 中下一个待处理的第一图像块作为当前第一图像块,然后返回步骤②-2b继续执行,直至 中的所有第一图像块处理完毕,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号。
[0099] ②-2d、将 )中当前待处理的第i个第一图像块定义为当前第一图像块,其中,i为正整数,1≤i≤Nblock。
[0100] ②-2e、将当前第一图像块以矩阵形式表示为 对 实施奇异值分解, 其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵, 为 的奇异值的对角矩阵, 和 为酉矩阵, 对角线上的元素为奇
异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示
中的第1个、第2个、…、第m个、…、第r个左奇异向量,且每个左奇异向量的模均为1,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号,分别表示 中的第1个、第2个、…、第q个、…、第τ个奇异值,
1≤n≤c, 分别表示 中的第1个、第2个、…、第n个、…、第c
个右奇异向量,且每个右奇异向量的模均为1。
[0101] ②-2f、令i=i+1,将 中下一个待处理的第一图像块作为当前第一图像块,然后返回步骤②-2e继续执行,直至 中的所有第一图像块处理完毕,得到 中的每个第一图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号。
[0102] ②-3、根据 中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵、中的每个第一图像块的左奇异向量矩阵和右奇异向量矩阵,计算 与 中所有的坐标位置相同的两个第一图 像块的奇异向量的相似度矢量,将 中的第i个第一图像块与中的第i个第一图像块的奇异向量的相似度矢量记为ΓL,i,ΓL,i=[γ1…γq…γτ],其中,i为正整数,1≤i≤Nblock,γ1=|α1+β1|, γq|αq+βq|,γτ=|ατ+βτ|,
分别表示 中的第i个第一图像块的左奇异向量矩阵中的第1个、第q个、第τ个左奇异向量, 分别表示 中的第i个第一图像块的右奇异向量矩阵中的第1个、
第q个、第τ个右奇异向量, 分别表示 中的第i个第一图像块的左奇
异向量矩阵中的第1个、第q个、第τ个左奇异向量, 分别表示 中的第
i个第一图像块的右奇异向量矩阵中的第1个、第q个、第τ个右奇异向量,q为正整数,
1≤q≤τ,在此τ为第一图像块的奇异值的对角矩阵中的奇异值的个数,符号“||”为取绝对值符号。
[0103] ②-4、利用2-泛数和对数标度由相似度矢量求出 与 中的所有坐标位置相同的两个第一图像块的奇异向量的相似程度,即根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似度矢量,计算 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,将 中的第i个第一图像块与 中的第i个第一图像块的奇异向量的相似程度记为SL,i, 其中,ln()为以自然基数e为底的对数函数。
[0104] ②-5、根据 与 中所有的坐标位置相同的两个第一图像块的奇异向量的相似程度,计算 的空域质量,记为QL,k,
[0105] ③根据R(d)的左视点视频中的每帧图像的亮度分量图的空域质量,计算R(d)的左视点视频的质量,记为QL, 其中,wL,k表示QL,k相对于时域上(d)
位于R 的左视点视频中的第k帧图像之前的F帧图像各自的空域质量和时域上位(d)
于R 的左视点视频中的第k帧图像之后 的F帧图像各自的空域质量的波动因子, F的值为
1或2或3或4,一般情况下F的取值越大,则对客观评价的准确度越高,但通过大量实验发现当F的取值大于4时,随着值的增大,计算复杂度也同时增加,但对客观评价的准确度没(d)
有明显提高,因此在此取F的值为1或2或3或4,QL,k-T表示R 的左视点视频中的第k-T(d)
帧图像的亮度分量图 的空域质量,QL,k+T表示R 的左视点视频中的第k+T帧图像的亮度分量图 的空域质量,符号“||”为取绝对值符号。在此,wL,k越大说明其对应的空域质量的波动越剧烈,也就是说该空域质量对于总的视频质量的影响也就越大。图2a给出了两个失真的立体视频(MOS值为4.3571的失真立体视频和MOS值为3.75的失真立体视频)的左视点视频中的每帧图像的亮度分量图的空域质量在时域上的波动示意图,图2a中位于下方的曲线为主观感知质量较好的一个立体视频(MOS值为4.3571)的左视点视频中的每帧图像的亮度分量图的空域质量在时域上的波动情况,位于上方的曲线为主观感知质量相对差一些的立体视频(MOS值为3.75)的左视点视频中的每帧图像的亮度分量图的空域质量在时域上的波动情况,图2a中的每一个点表示根据步骤②计算得到的失真的立体视频的左视点视频中的每帧图像的亮度分量图的空域质量。从图2a中可以看出由于上方曲线中的每个点的波动情况比下方曲线中的每个点的波动情况更为剧烈,导致出现以下现象:虽然上方曲线中的每个点表示的图像的亮度分量图的空域质量都比下方曲线中的每个点表示的图像的亮度分量图的空域质量高,而MOS值为3.75的失真立体视频最后视频总的感知质量却比MOS值为4.3571的失真立体视频的低。从而可知单帧图像的亮度分量图的空域质量的波动情况会影响总的视频的质量,因此本发明在时域加权计算左视点视频的质量的过程中考虑了单帧图像的亮度分量图的空域质量的波动性。
[0106] ④计算R(d)的右视点视频中的每帧图像的亮度分量图的空域质量,将R(d)的右视点视频中的第k帧图像的亮度分量图 的空域质量记为QR,k,其中,获取QR,k的主要过程为:首先,分别将 和 分割成多个互不重叠的尺寸大小一致的第二图像块;然后对和 中的每个第二图像块实施奇异值分解,得到 和 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵、奇异值的对角矩阵;接着,根据 和 中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵,获取 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度;最后,根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,获得 的空域质量QR,k。
[0107] 在此具体实施例中,步骤④中R(d)的右视点视频中的第k帧图像的亮度分量图的空域质量 的空域质量QR,k的具体获取过程为:
[0108] ④-1、分别将 和 分割成 个互不重叠的尺寸大小为c×r的第二图像块,其中,W表示左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,c的取值为能被W整除,r的取值为能被H整除。
[0109] ④-2、对 中的每个第二图像块实施奇异值分解,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵;并对 中的每个第二图像块实施奇异值分解,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵。
[0110] 在此,步骤④-2的具体过程为:
[0111] ④-2a、将 中当前待处理的第i个第二图像块定义为当前第二图像块,其中,i为正整数,1≤i≤Nblock。
[0112] ④-2b、将当前第二图像块以矩阵形式表示为 对 实施奇异值分解, ,其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵, 为 的奇异值的对角矩阵, 和 为酉矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示
中的第1个、第2个、…、第m个、…、第r个左奇异向量,且每个左奇异向量的模均为1,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号,分别表示 中的第1个、第2个、…、第q个、…、第τ个奇异值,
1≤n≤c, 分别表示 中的第1个、第2个、…、第n个、…、第c
个右奇异向量,且每个右奇异向量的模均为1。
[0113] ④-2c、令i=i+1,将 中下一个待处理的第二图像块作为当前第二图像块,然后返回步骤④-2b继续执行,直至 中的所有第二图像块处理完毕,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号。
[0114] ④-2d、将 中当前待处理的第i个第二图像块定义为当前第二图像块,其中,i为正整数, 1≤i≤Nblock。
[0115] ④-2e、将当前第二图像块以矩阵形式表示为 对 实施奇异值分解, ,其中, 为 的左奇异向量矩阵, 为 的转置矩阵, 为 的右奇异向量矩阵, 为 的奇异值的对角矩阵, 和 为酉矩阵, 对角线上的元素为奇异值,且其值按照从大到小的顺序进行排列,1≤m≤r, 分别表示
中的第1个、第2个、…、第m个、…、第r个左奇异向量,且每个左奇异向量的模均为1,1≤q≤τ,τ=min(r,c),min()为最小值函数,diag()为对角矩阵表示符号,分别表示 中的第1个、第2个、…、第q个、…、第τ个奇异
值,1≤n≤c, 分别表示 中的第1个、第2个、…、第n个、…、
第c个右奇异向量,且每个右奇异向量的模均为1。
[0116] ④-2f、令i=i+1,将 中下一个待处理的第二图像块作为当前第二图像块,然后返回步骤④-2e继续执行,直至 中的所有第二图像块处理完毕,得到 中的每个第二图像块的左奇异向量矩阵、右奇异向量矩阵和奇异值的对角矩阵,其中,i=i+1中的“=”为赋值符号。
[0117] ④-3、根据 中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵、中的每个第二图像块的左奇异向量矩阵和右奇异向量矩阵,计算 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似度矢量,将 中的第i个第二图像块与中的第i个第二图像块的奇异向量的相似度矢量记为ΓR,i,ΓR,i=[γ1'…γq'…γτ'],其中,i为正整数,1≤i≤Nblock,γ1'=|α1'+β1'|,γq'=|αq'+βq'|, γτ'=|ατ'+βτ'|,
分别表示 中的第i个第二图像块的左奇异向量矩阵中
的第1个、第q个、第τ个左奇异向量, 分别表示 中的第i个第二图像
块的右奇异向量矩阵中的第1个、第q个、第τ个右奇异向量, 分别表示
中的第i个第二图像块的左奇异向量矩阵中的第1个、 第q个、第τ个左奇异向量,分别表示 中的第i个第二图像块的右奇异向量矩阵中的第1个、第q
个、第τ个右奇异向量,q为正整数,1≤q≤τ,在此τ为第二图像块的奇异值的对角矩阵中的奇异值的个数,符号“||”为取绝对值符号。
[0118] ④-4、利用2-泛数和对数标度由相似度矢量求出 与 中的所有坐标位置相同的两个第二图像块的奇异向量的相似程度,即根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似度矢量,计算 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,将 中的第i个第二图像块与 中的第i个第二图像块的奇异向量的相似程度记为SR,i, 其中,ln()为以自然基数e为底的对数函数。
[0119] ④-5、根据 与 中所有的坐标位置相同的两个第二图像块的奇异向量的相似程度,计算 的空域质量,记为QR,k,
[0120] ⑤根据R(d)的右视点视频中的每帧图像的亮度分量图的空域质量,计算R(d)的右(d)视点视频的质量,记为QR, 其中,wR,k表示QR,k相对于时域上位于R 的
(d)
右视点视频中的第k帧图像之前的F帧图像各自的空域质量和时域上位于R 的右视点视频中的第k帧图像之后的F帧图像各自的空域质量的波动因子,
[0121]F的值为1或2或3或4,QR,k-T表示R(d)的右视点视频中的第k-T帧图像的亮度分量图(d)
的空域质量,QR,k+T表示R 的右视点视频中的第k+T帧图像的亮度分量图 的空域质量。图2b给出了两个失真的立体视频(MOS值为4.3571的失真立体视频和MOS值为3.75的失真立体视频)的右视点视频中的每帧图像的亮度分量图的空域质量在时域上的波动示意图。
[0122] ⑥计算R(o)的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对(d)差值图,并计 算R 的左视点视频与右视点视频中相对应的两帧图像的亮度分量图的绝对(o) (d)
差值图,然后计算R 对应的绝对差值图中的每个尺寸大小为8×8的子块与R 对应的绝(o)
对差值图中对应的尺寸大小为8×8的子块的结构相似度,再根据R 对应的绝对差值图中(d)
的每个尺寸大小为8×8的子块与R 对应的绝对差值图中对应的尺寸大小为8×8的子块(d)
的结构相似度,计算R 的左视点视频与右视点视频中相对应的两帧图像的亮度分量图在(d) (d)
视点间差异的变化程度,将R 的左视点视频中的第k帧图像的亮度分量图 与R 的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度记为QD,k。
[0123] 在此具体实施例中,步骤⑥中R(d)的左视点视频中的第k帧图像的亮度分量图(d)与R 的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度QD,k的具体获取过程为:
[0124] ⑥-1、计算R(o)的左视点视频中的第k帧图像的亮度分量图 与R(o)的右视点视频中的第k帧图像的亮度分量图 的绝对差值图,记为 其中,符号“||”为取绝对值符号。
[0125] ⑥-2、计算R(d)的左视点视频中的第k帧图像的亮度分量图 与R(d)的右视点视频中的第k帧图像的亮度分量图 的绝对差值图记为
[0126] ⑥-3、采用尺寸大小为8×8的滑动窗口在 中逐像素点滑动,将 分割成(W-7)×(H-7)个相重叠的尺寸大小为8×8的子块,同样采用尺寸大小为8×8的滑动窗口在 中逐像素点滑动,将 分割成(W-7)×(H-7)个相重叠的尺寸大小为8×8的子块,然后计算 和 中所有的坐标位置相同的两个子块的结构相似度,将 中左上角像素点的坐标位置为(x,y)的子块和 中左上角像素点的坐标位置为(x,y)的子块的结构相似度记为SSIM(x,y),
[0127] 其中,W表示左视点视频中的图像和右视点视频中的图像的宽度,H表示左视点视频中的图像和右视点视频中的图像的高度,1≤x≤W-7,1≤y≤H-7, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的均值, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的均值, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度 值的方差, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的方差, 表示 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值与 中左上角像素点的坐标位置为(x,y)的子块中的所有像素点的亮度值的协方差,C1和C2均为常数,C1≠0,C2≠0,在本实施例中取C1=6.5025,C2=58.5225。。
(d)
[0128] ⑥-4、根据 和 中所有的坐标位置相同的两个子块的结构相似度,计算R(d)的左视点视频中的第k帧图像的亮度分量图 与R 的右视点视频中的第k帧图像的亮度分量图 在视点间差异的变化程度,记为QD,k,
(d)
[0129] ⑦根据R 的左视点视频与右视点视频中相对应的两帧图像的亮度分量图在视(d)点间差异的变化程度,计算R 的左视点视频与右视点视频在视点间的差异程度,记为QD,(d)
其中,wD,k表示QD,k相对于时域上位于R 的左视点视频中的第k帧图
(d)
像之前的F帧图像与R 的右视点视频中的第k帧图像之前的F帧图像各自的亮度分量图(d)
在视点间差异的变化程度,及时域上位于R 的左视点视频中的第k帧图像之后的F帧图(d)
像与R 的右视点视频中的第k帧图像之后的F帧图像各自的亮度分量图在视点间差异的变化程度的波动因子,
[0130](d)
F的值为1或2或3或4,QD,k-T表示R 的左视点视频中的第k-T帧图像的亮度分量图与R(d)的右视点视频中的第k-T帧图像的亮度分量图 在视点间差异的变化程度,QD,k+T(d) (d)
分别R 的左视点视频中的第k+T帧图像的亮度分量图 与R 的右视点视频中的第k+T帧图像的亮度分量图 在视点间差异的变化程度。图2c给出了两个失真的立体视频(MOS值为4.3571的失真立体视频和MOS值为3.75的失真立体视频)的左视点视频与右视点视频中的每帧图像的亮度分量图在视点间差异的变化程度在时域上的波动示意图。
[0131] ⑧采用n'个原始的无失真的立体视频,建立其在不同失真类型不同失真程度下的失真立体视频集合,该失真立体视频集合包括多个失真立体视频,利用主观质量评价方法分别评价出该失真立体 视频集合中的每个失真立体视频的平均主观意见分,将该失真立体视频集合中的第j个失真立体视频的平均主观意见分记为MOSj,MOSj∈[0,5];然后按(d) (d) (d)照步骤①至步骤⑦计算R 的左视点视频的质量QL、R 的右视点视频的质量QR及R 的左视点视频与右视点视频在视点间的差异程度QD的操作,以相同的方式计算该失真立体视频集合中的每个失真立体视频的左视点视频的质量、该失真立体视频集合中的每个失真立体视频的右视点视频的质量、该失真立体视频集合中的每个失真立体视频的左视点视频与右视点视频在视点间的差异程度,将该失真立体视频集合中的第j个失真立体视频的左视点视频的质量记为QL(j),将该失真立体视频集合中的第j个失真立体视频的右视点视频的质量记为QR(j),将该失真立体视频集合中的第j个失真立体视频的左视点视频与右视点视频在视点间的差异程度记为QD(j);再由该失真立体视频集合中的每个失真立体视频的左视点视频的质量和右视点视频的质量、该失真立体视频集合中的每个失真立体视频的左视点视频与右视点视频在视点间的差异程度构成该失真立体视频集合中的每个失真立体视频的特征矢量,将该失真立体视频集合中的第j个失真立体视频的特征矢量记为xj,xj=(QL(j),QR(j),QD(j));其中,n'>1,1≤j≤N',N'表示该失真立体视频集合中包含的失真立体视频的个数。
[0132] 在本实施例中,直接采用法国IRCCyN研究机构提供的立体视频数据库。该立体视频数据库包括10(即n'=10)对超高清(分辨率为1920×1080)无失真的参考立体视频序列(图3a、图3b、图3c、图3d、图3e、图3f、图3g、图3h、图3i、图3j分别给出了Barrier gate(1920×1080)立体视频序列、Basket(1920×1080)立体视频序列、Boxers(1920×1080)立体视频序列、Hall(1920×1080)立体视频序列、Lab(1920×1080)立体视频序列、News report(1920×1080)立体视频序列、Phone call(1920×1080)立体视频序列、Soccer(1920×1080)立体视频序列、Tree branches(1920×1080)立体视频序列、Umbrella(1920×1080)立体视频序列),以及由这10对参考立体视频序列在H.264编码下3个失真等级、JPEG2000压缩下(JP2K)4个失真等级、下采样下(DS)一个等级、图像边缘增强下(EE)一个等级和下采样加图像增强下(DS+EE)一个等级的共100对失真立体视频构成。该立体视频数据库同时给出了所有失真立体视频的平均主观意见分MOS值。在计算该
100对失真立体视频的特征矢量的过程中,相应的参数设置为:H=1080,W=1920,r=c=120,F=2,C1=6.5025,C2=58.5225。
[0133] ⑨因为失真的立体视频的特征矢量与失真的立体视频的客观质量之间的关系是非线性的,因此简单的对特征矢量各分量采用线性加权的方式得到的结果不能很好的反映出立体视频的客观质量,而支持向量回归的方法可以通过使用核函数来高效的解决非线性问题,因此本发明将该失真立体视频集合中的所有失真立体视频分成训练集和测试集,然后采用支持向量回归作为机器学习的方法,对该训练集中的所有失真立体视频的特征opt opt opt opt矢量进行训练,得到最优的权值矢量W 和最优的偏置项 b ,接着利用W 和b 构造得到支持向量回归训练模型,再根据支持向量回归训练模型,对该测试集中的每个失真立体视频的特征矢量进行测试,预测得到该测试集中的每个失真立体视频的客观质量评价预测值,将该测试集中的第k'个失真立体视频的客观质量评价预测值记为Qk',Qk'=f(xk'),,其中,1≤k'≤t',t'表示该测试集中包含的失真立体视
频的个数,f()为函数表示形式,xk'表示测试集中的第k'个失真立体视频的特征矢量,Qk'=f(xk')表示该测试集中的第k'个失真立体视频的客观质量评价预测值Qk'是该测试集中的第k'个失真立体视频的特征矢量xk'的函数,(Wopt)T为Wopt的转置矢量, 表示该测试集中的第k'个失真立体视频的线性函数。
[0134] 在此具体实施例中,步骤⑨的具体过程为:
[0135] ⑨-1、因为失真立体视频集合是由n'个内容不同的原始的无失真的立体视频经过不同失真类型不同失真程度发展而来的,因此首先将该失真立体视频集合中的所有失真立体视频按来源分为n'组,这样每组的失真立体视频都不会出现在其他组中,满足分组原则,然后从n'组中选出 组,再将选出的 组中的所有失真立体视频构成训练集,将未被选出的 组中的所有失真立体视频构成测试集,在实际处理过程中,也可将选出的 组中的所有失真立体视频构成测试集,将未被选出的 组中的所有失真立体视频构成训练集,其中,符号 为向下取整符号。
[0136] 即对于上述给出的100对失真立体视频,将这些失真立体视频分为10组,然后从10组中任意选出5组,由这5组中的所有失真立体视频构成训练集,再由剩下的5组中的所有失真立体视频构成测试集。
[0137] ⑨-2、将训练集中的所有失真立体视频的特征矢量和平均主观意见分构成训练样本数据集,记为Ωt,{xk,MOSk}∈Ωt,其中,xk表示Ωt中的第k个失真立体视频的特征矢量,MOSk表示Ωt中的第k个失真立体视频的平均主观意见分,1≤k≤t,t表示训练集中包含的失真立体视频的个数。
[0138] ⑨-3、构造Ωt中的每个失真立体视频的特征矢量的回归函数,将Ωt中的第k个失真立体视频的特征矢量xk的回归函数记为f(xk), ,其中,f()为函数T
表示形式,W为权值矢量W的转置矢量,b为偏置项, 表示Ωt中的第k个失真立体视频的特征矢量xk的 线性函数, K(xk,xl)为支持向量回归中的核函
数,K(xk,xl)=(xkxlT+1)2,xlT为xl的转置矢量,xl表示Ωt中的第l个失真立体视频的特征矢量。
[0139] ⑨-4、采用支持向量回归作为机器学习的方法,对Ωt中的所有失真立体视频的特征矢量进行训练,使得经过训练得到的回归函数值与平均主观意见分之间的误差最小,拟合得到最优的权值矢量Wopt和最优的偏置项bopt,然后将最优的权值矢量Wopt和最优的opt opt opt偏置项b 的组合记为(W ,b ), 再利用得到
opt opt
的最优的权值矢量W 和最优的偏置项b 构造支持向量回归训练模型,记为f(xinput), ,其中,ψ表示对Ωt中的所有失真立体视频的特征矢量进行
训练时的权重矢量和偏置项的所有可能的组合的集合, 表示最小化概率密度函数,xinput表示支持向量回归训练模型的输入矢量,(Wopt)T为Wopt的转置矢量, 表示支持向量回归训练模型的输入矢量xinput的线性函数。
[0140] ⑨-5、根据支持向量回归训练模型,对测试集中的每个失真立体视频的特征矢量进行测试,预测得到测试集中的每个失真立体视频的客观质量评价预测值,将测试集中的第k'个失真立体视频的客观质量评价预测值记为Qk',Qk'=f(xk'),,其中,1≤k'≤t',t'表示测试集中包含的失真立体视频的个数,xk'表示测试集中的第k'个失真立体视频的特征矢量, 表示测试集中的第k'个失真立体视频的线性函数。
[0141] 为了说明本发明方法的评价性能,在此利用以下三个常用的性能指标来衡量本发明方法在法国IRCCyN机构提供的立体视频数据库上的评价性能:
[0142] (1)线性相关系数(CC):Pearson线性相关系数,用来反映客观评价方法预测的准确性,取值范围在0到1之间,且越接近1说明客观评价方法的准确性越高。
[0143] (2)Spearman等级相关系数(SROCC):Spearman等级相关系数,用来反映客观评价方法预测的单调性,取值范围在0到1之间,且越接近1说明客观评价方法的单调性越好。
[0144] (3)均方根误差(RMSE):均方根误差,用来表示客观评价方法的准确性,其值越小表示客观评价方法越准确。
[0145] 表1列出了本发明方法在IRCCyN库上进行验证得到的三个性能指标的评价结果。因为本发明方法涉及到训练的问题,不管是所有的失真类型(ALL),还是H.264失真、JP2K失真、DS失真、EE失真以及DS+EE失真,训练样本都是从10组数据里任意选取5组构成的,那么可能的选取情况 就有 种。为了更为客观地说明本发明方法的性能,表1中所有的性能指标都是对训练样本的所有可能的选取情况下得到的预测结果的性能的平均值,即每一失真类型下的性能值是由该失真类型下的252种可能的训练情况下得到的结果的平均值,以此可以避免随机情况的发生。从表1中所列的数据可知,本发明方法的评价结果的准确性、单调性都不错,且对于不同失真表现的性能都比较稳定,能较好的预测人眼对立体视频的主观感知。
[0146] 表1本发明方法的性能指标的评价结果
[0147]。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈