技术领域
[0001] 本
发明涉及视频编码技术领域,尤其涉及一种视频编码性能主观评价方法及系统。
背景技术
[0002] 一种视频编码技术的优劣主要取决于视频压缩性能和对网络传输的适应性。编码技术的视频压缩性能决定了,经过其压缩处理以后的视频图像的
质量,而对网络传输的适应性则决定了,经过其压缩后的视频码流能否在网络中稳定传输,码流接收端是否会经常性的陷入缓冲。
[0003] 对视频质量的评估,大体上,可分为主观质量评定和客观质量评定两种方法。目前的主流的客观质量评价方法,就是利用率失真性能来衡量
编码器的压缩性能,虽然率失真数据能够客观地衡量编码后的图像相对于原始图像的失真度,
缺陷是无法判别这些失真对重建图像效果的价值。相同的率失真性能下,有些编码器的失真度体现在丢弃高频信息,而有些编码器会主动丢弃对人眼不敏感的区域信息。而主观测试则是建立在人员视觉效果评价的
基础上,以此分析编码器对细节的保存能
力,是衡量视频质量的重要手段。主观测试通常会采集大量样本,通过统计方法去除测试人员的主观误差。
[0004] 码率
波动特性衡量视频编码器对网络传输的适应性,这对移动信道尤其重要。移动信道具有资源受限,易错(error-prone)的特性。编码器输出的码流,如果波动特征明显,会导致终端播放器频繁陷入缓冲。
[0005] 常规的主观评价方法,仅提供对编码技术视频主观质量的性能评价,没有同时考察编码技术的网络传输性能。当需要综合评价编码技术在上述两个性能的综合
水平上,就会陷入困难的境地,不利于对视频编码技术进行综合评价。
发明内容
[0006] 本发明
实施例的目的在于提出一种视频编码性能主观评价方法方法,旨在解决
现有技术主观评价方法中,仅提供对编码技术视频主观质量的性能评价,没有同时考察编码技术的网络传输性能的问题。
[0007] 本发明实施例方法是这样实现的,一种视频编码性能主观评价方法,所述方法包括以下步骤:
[0008] 求取最大窗口比特率;
[0009] 获取主观评分;
[0010] 根据最大窗口比特率与主观评分值,构建条件率失真曲线图,考察性能,获取比较结果。
[0011] 本发明实施例的另一目的在于提出一种视频编码性能主观评价系统,所述系统包括:
[0012] 最大窗口获取模
块,用于求取
时间窗口内最大平均比特率(即最大窗口比特率MWBR);
[0013] 评分模块,用于获取测试对象的主观评分;
[0014] 评测模块,用于通过以最大窗口比特率、主观评分值为横坐标和纵坐标构建的主观条件率失真曲线图来获取不同编码技术在视频压缩性能和对网络传输的适应性能上的综合评价,并用于通过在相同条件下,比较主观评分值,获取编码器在图像主观质量上的压缩性能优劣,并用于通过在相同条件下,比较最大窗口比特率,获取编码器网络传输性能优劣。
[0015] 本发明的有益效果:
[0016] 本发明提出的主观条件率失真性能,一方面用主观评分衡量编码器在视频主观质量上的压缩性能,另一方面将常规的平均比特率替换为最大窗口比特率,表示编码器的传输性能。通过根据最大窗口比特率、主观评分值为横坐标和纵坐标所构建的主观条件率失真曲线图,可获取不同编码技术在视频压缩性能和对网络传输的适应性能上的综合评价,也可通过在相同测试片源、相同编码参数的条件下,比较编码器最大窗口比特率,获取编码器的网络传输性能优劣,比较主观评分,获取编码器在图像主观质量上的压缩性能。
附图说明
[0017] 图1是本发明实施例一种视频编码性能主观评价方法
流程图;
[0018] 图2是本发明实施例测试界面及测试对象说明图表;
[0019] 图3是本发明实施例对同一测试视频源,经过不同编码器编码获取不同码流的最大窗口比特率与主观评分所构建条件率失真曲线图的性能解读图;
[0020] 图4是本发明实施例对同一测试视频源,经过不同编码器编码获取不同码流的最大窗口比特率与主观评分所构建条件率失真曲线图的另一性能解读图;
[0021] 图5是本发明实施例一种视频编码性能主观评价系统示意图,
[0022] 图6是图5一种视频编码性能主观评价系统中最大窗口获取模块详细示意图。
[0023] 图7是图5一种视频编码性能主观评价系统中数据筛选模块详细示意图。
具体实施方式
[0024] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图和实施例,对本发明进行进一步详细说明,为了便于说明,仅示出了与本发明实施例相关的部分。应当理解,此处所描写的具体实施例,仅仅用于解释本发明,并不用以限制本发明。
[0025] 本发明实施例提出了一种视频编码性能主观评价方法-主观条件率失真性能,来综合评价编码技术在视频主观质量上的压缩性能和网络传输性能。本发明实施例首先通过建立以最大窗口比特率为横坐标,以主观评分值为纵坐标的主观条件率失真曲线图,然后根据曲线图,一方面可以获取不同编码技术在视频压缩性能和对网络传输的适应性能上的综合评价,即曲线越高对应的编码技术性能越好;另一方面亦可以获取单项性能的比较:通过在相同测试片源相同编码参数下,比较编码器最大窗口比特率,获取编码器的网络传输性能优劣;比较主观评分的值,获取编码器在图像主观质量上的压缩性能。
[0026] 实施例一
[0027] 图1是本发明实施例一种视频编码性能主观评价方法流程图。所述方法包括以下步骤:
[0028] S101、获取待评测编码器对同一测试片源进行编码后的码流和解码序列;
[0029] S102,根据所述码流和解码序列判定所述待评测编码器的实际输出比特率与目标比特率的相对误差是否在特定范围内,是则进入步骤S104,否则则进入步骤S103;
[0030] 本发明实施例提出的主观条件率失真性能,一方面用主观评分衡量编码器在视频主观质量上的压缩性能,另一方面将常规的平均比特率替换为最大窗口比特率,表示编码器的传输性能。考虑到编码的目标比特率与编码器的实际输出比特率存在不一致的可能,为了进行平等的性能测试,要求所有的编码器实际输出比特率与目标比特率的相对误差在特定范围之内,即:
[0031] abs(bitrate t arg et-bitrateactual)/bitrate t arg et*100%≤Thres[0032] 其中,Thres为判定
阈值,bitratet arg et为目标比特率,bitrateactual为实际输出比特率,Thres为判定阈值,其由所需达到的试验
精度确定,abs(bitratet arg et-bitrateactual)为取bitratet arg et-bitrateactual的绝对值。
[0033] 满足此条件的才可以进入视频条件率失真性能的实质评价阶段。
[0034] S103,
修改目标比特率,进入步骤S101;
[0035] S104:获取最大窗口比特率;
[0036] 由于在实际的流媒体传输中,客户端具有一定的缓冲时长(时间窗),即客户端是否陷入缓冲,取决于该时间窗口内最大比特率是否超过实际传输带宽。本发明实施例提出基于实际传输中的时间窗,进行码率波动性能的衡量,并把时间窗口内最大平均比特率,称为最大窗口比特率MWBR。
[0037] 最大窗口比特率计算方法如下:
[0038] A:根据实际传输中的客户端缓冲时长,确定时间窗;
[0039] B:计算每个时间窗内的输出平均比特率作为一个数据点(即一个窗口比特率值);
[0040] C:删除窗口比特率最大值,消除偶然因数;
[0041] D:将剩余窗口比特率序列降序排列,取前若干个窗口比特率的平均值作为最大窗口比特率;
[0042] S105:获取主观评分;
[0043] 获取主观评分可用如下方法,但不仅限于此,所述方法包括以下步骤:
[0044] S1051,进行模拟主观评价测试;
[0045] 第一步:介绍测试目的、要求、如何评价即如何利用测试对象作为隐性参考;
[0046] 第二步:利用测试片源进行模拟测试,评价各类所损图像,熟悉评分流程,稳定评分;
[0047] 测试条件主要包括显示设备与设置、测试序列、观测人员的选择等,下面将针对PC、手机上测试编码器在低码率下的压缩性能的要求介绍相应的条件。
[0048]PC测试环境参数 说明(参考设置值)
观看距离 建议1米,实际测试时观测者可按
[0049]其习惯自行调整
显示器类型 LCD
显示器尺寸 统一尺寸(如17寸)
显示器
分辨率 1024x768
显卡 统一显卡类别
显示器
亮度 90
显示器
对比度 50
手机测试环境 说明(参考设置值)
参数
手机型号 LG GW880
操作系统 OMS 1.5
芯片组 Marrell PxA930
CPU 624MHz
分辨率 800x480
[0050] 其他测试条件如下:
[0052] 测试片源选择考虑:
[0053] ①复杂度由测试片源Y分量确定空间复杂度、时间复杂度
[0054] ②场景:由时间、空间复杂度信息分布
选定典型场景(至少涵盖以下四种情况)[0055] A、简单场景运动少即SI小TI小
[0056] B、简单场景运动多即SI小TI大
[0057] C、复杂场景运动少即SI大TI小
[0058] D、复杂场景运动多即SI大TI大
[0059] 具体测试时,可根据需要选择测试片源的数量,一般要求A、B、C、D各有一个。
[0060] 而场景的复杂度与运动量分别由测试序列参量SI与TI给出。
[0061] Sobel滤波
[0062] 首先对原始图像进行垂直及水平滤波
[0063]
[0064]
[0065] 然后,计算Sobel滤波的最终输出值
[0066]
[0067] 计算空间信息度SI
[0068] SI=Maxtime{stdspace[sobel[Fn]}
[0070] 计算时间信息度TI
[0071] TI=Maxtime{stdspace[Fn(i,j)-Fn-1(i,j)]}
[0072] (2)选择测试人员
[0073] 至少15人;视力、色彩信息观察力正常;选择非专业人士,即工作不能直接与图像质量有关;按一定的条件(如职业、年龄、性别等)涵盖一定的范围。
[0074] (3)测试人员对测试对象进行主观测试评分,
[0075] 评分档次设置:
[0076]取值 主观评价说明
3 非常好
2 很好
1 好
0 可以接受
-1 比较差
-2 差
-3 非常差
[0077] ①鉴于本方案测试主体为编码器低码率下压缩性能,采用
有损压缩评分档次。若为高清测试则需修改相应的评分档设置
[0078] ②主观测试评分x∈[-3,3],考虑数据的分布性,评分x可以是半分档,即允许最小区分度为0.5;
[0079] ①PC测试时参与同时主观测试评分的测试对象(即经过不同编
解码器输出的解码序列),可依据所需比较的目的自行增加,即不局限于上述的一次两个评分对象;手机测试时,受限于手机显示屏大小,采用单激励源;
[0080] ②由于人的主观评分具有很强的随机性,在进行比较测试时,若单独评分会失去评分的比较意义,即无法横向比较;所以在进行比较测试时,建议在客观条件允许的情况下将所需参与测试的测试对象同时显示并评分;如测试对象太多无法一次显示或是考虑到测试视频源所处的
位置对测试的影响,可将测试对象交叠显示,即通过显示已评分对象和其评分作为下轮测试的参考对象;
[0081] ③参与主观评分测试对象为编解码后解码序列
[0082] 主观测试视频源排列要求(当同时显示比较对象时)
[0083] 随机性:同一编码器处理的图像测试时出现的位置不固定,即位置1出现的测试对象可来自于不同的编码器。
[0084] 重复性:在整个测试过程中,同一测试对象将在位置1、位置2都出现1次。消除视觉上位置影响。
[0085] 对等性:测试对象(不同编码器)的测试结果数量一致
[0086] 主观测试评分过程为:播放测试对象,播放完后,开始打分;评分后可以进行回放修改原始的打分,但仅限于此测试片源;片断间不能回放。
[0087] S1052:进行正式主观评价测试,获取主观评分;
[0088] 测试人员进行测试,其中正式主观评价中的测试片源和模拟评价测试时不相同;
[0089] 在进行正式主观评价测试时,必须注意以下问题:
[0090] 同时评分性:由于测试人员的主观评分具有很强的随机性,在对待评测编码器的编码性能进行比较测试时,若单独评分会失去评分的比较意义(即无法横向比较),所以在客观条件允许的情况下将所需参与测试的测试对象同时显示并评分;若所述测试对象太多无法一次显示或是考虑到测试对象所处的位置对测试的影响,可将测试对象交叠显示,即通过显示已评分测试对象和其评分作为下轮测试的参考对象;
[0091] 测试片源息的覆盖度:时间、空间复杂度的覆盖度要高,即选取具有代表意义的测试片源;
[0092] 测试对象的排列满足:随机性(使得测试人员无法获取测试对象排列的规律性,评分更为客观)、对等性(消除视觉上的位置影响)、重复性(测试对象获取相同数量的统计数据);
[0094] 主观测试原始数据由于主观的原因,存在不可用性。须对主观测试原始数据进行相应的统计处理,消除测试人员的主观误差,从而使得主观测试结果更为合理,所述处理方法如下:
[0095] A:测试数据归一化处理
[0096] 将每个测试人员的测试数据作线性归一化处理,将原始范围[-3,3]的主观评分转换成[0,1]的主观评分,消除个体差异,
[0097]
[0098] 其中i=1,2,...,I,j=1,2,...,J;I为每个测试人员所需进行的主观评分次数,J为参加测试的人数;
[0099] B:进行有效数据筛选;
[0100] b1,有效测试数据筛选
[0101] 有模拟测试时,进行有效测试数据筛选,丢弃测试初期的5个测试数据;如果测试组合较多,则丢弃前3个测试数据。
[0102] b2,正式测试中测试人员评分数据有效性判定;
[0103] 计算当前测试人员y的评分与所有测试人员平均评分的相关系数r1y(x,y)、r2y(x,y),其中x为所有测试人员的平均评分变量,y为一个测试人员的评分变量。计算方法如下:
[0104] ①Pearson相关性分析
[0105] 计算相关系数r1y(x,y),
[0106]
[0107] 其中Cov(x,y)为协方差,σx、σy为相应的标准差;xi:第i种测试组合时,所有测试人员评分的均值(即在
算法、比特率、测试序列组合成的第i种测试条件下相应测试评分的平均);yi:第i种测试组合时,当前测试人员y的评分;n:测试算法总数x测试序列总数。
[0108] ②Spearman等级相关性分析
[0109] 计算相关系数r2y(x,y)
[0110]
[0111] ③确定判定阈值
[0112] 如果mean(min(r1y,r2y))-std(min(r1y,r2y))>0.85,则Thres=0.85否则Thres=mean(min(r1y,r2y))-std(min(r1y,r2y))
[0113] ④判定测试人员评分数据的有效性
[0114] 如果min(r1y,r2y)>Thres,则当前测试人员y的评分数据有效否则当前测试人员y的评分数据无效
[0115] C:基于有效评分数据计算统计变量:所有有效测试人员评分均值;所有测试人员评分均值
[0116]
[0117] μijk:测试人员i,在比特率j,测试序列k,算法r时所作的评分
[0118] D:反归一化,将范围[0,1]的平均得分转换成[-3,3]的评分,将得分与评分含义再度对应。
[0119] S106:根据最大窗口比特率与主观评分,构建主观条件率失真曲线图,获取比较结果,考察性能。
[0120] 以最大窗口比特率MWBR为横坐标,以主观评分为纵坐标绘制主观条件率失真曲线图,根据曲线图来比较不同编码技术对应的网路传输性能和视频压缩质量。
[0121] 最大窗口比特率-衡量编码技术的网络传输适应性;主观评分衡量视频的质量[0122] 1)不同编码器的对应不同的性能曲线,曲线位置越高,表示该曲线对应的编码技术在图像主观质量的压缩及网络传输上的综合性能就越好;
[0123] 2)相同条件下,比较主观评分,分数越高,对应编码技术的视频图像主观质量越好;
[0124] 3)相同条件下,比较最大窗口比特率,值越小,对应编码技术的网络传输性能越好;
[0125] 如图3所示是本发明实施例对同一测试片源,经过不同编码器编码获取不同码流的最大窗口比特率与主观评分所构建条件率失真曲线图的性能解读图;
[0126] 其中两条虚线线是两个编码器的主观条件率失真曲线,实线是单项性能对比辅助线。图中每个点为不同测试片源不同编码参数对应的数据点。
[0127] 以编码器1为例说明,其共测试了四个测试片源,从左到右依次为纹理简单运动剧烈、纹理复杂运动剧烈、纹理复杂运动缓慢、纹理简单运动缓慢场景;
[0128] 综合性能评价:
[0129] 编码器1对应的曲线高于编码器2对应的曲线,即在图像主观质量与网络传输性的综合性能上,编码器1优于编码器2;
[0130] 单项性能比较:相同测试片源相同编码参数下,网络传输性能比较:以在纹理简单运动缓慢的场景下,编码器网络传输性能比较为例,说明如下:编码器1最大窗口比特率小于编码器2最大窗口比特率,即在此场景和编码参数下,编码器1比编码器2具有更好的网络传输性能;
[0131] 如图4所示是本发明实施例对同一测试片源,经过不同编码器编码获取不同码流的最大窗口比特率与主观评分所构建条件率失真曲线图的另一性能解读图;
[0132] 其中两条虚线线是两个编码器的主观条件率失真曲线,实线是单项性能对比辅助线。图中每个点为不同测试场景不同编码参数对应的数据点
[0133] 单项性能比较:相同场景相同编码参数下,图像主观质量性能比较:以在纹理简单运动缓慢的场景下,图像主观质量性能比为例,说明如下:编码器1的主观评分高于编码器2的主观评分,即在此测试场景下编码器1的视频主观质量优于编码器2。
[0134] 本发明实施例提出的主观条件率失真性能,一方面用主观评分衡量编码器在视频主观质量上的压缩性能,另一方面将常规的平均比特率替换为最大窗口比特率,表示编码器的传输性能。通过根据最大窗口比特率、主观评分值为横坐标和纵坐标所构建的主观条件率失真曲线图,可获取不同编码技术在视频压缩性能和对网络传输的适应性能上的综合评价,也可通过在相同测试片源、相同编码参数的条件下,比较编码器最大窗口比特率,获取编码器的网络传输性能优劣,比较主观评分,获取编码器在图像主观质量上的压缩性能。
[0135] 实施例二
[0136] 图5是本发明实施例一种视频编码性能主观评价系统示意图,所述系统包括,编解码模块,平均码率判定模块,最大窗口获取模块、评分模块、评测模块。
[0137] 编解码模块,用于对同一测试视频源进行编解码并获取编码后的码流与解码序列;
[0138] 平均码率判定模块,用于根据所述码流判定待评测编码器的实际输出比特率与目标比特率的相对误差是否在特定范围内,其中所述特定范围为:
[0139] abs(bitrate t arg et-bitrateactual)/bitrate t arg et*100%≤Thres[0140] 其中,Thres为判定阈值,bitratet arg et为目标比特率,bitrateactual为实际输出比特率,Thres为判定阈值,其由所需达到的试验精度确定,abs(bitratet arg et-bitrateactual)为取bitratet arg et-bitrateactual的绝对值。
[0141] 目标比特率修改模块,用于修改所述目标比特率以使重新编解码后的所述实际输出比特率与所述目标比特率的相对误差在所述特定范围内;
[0142] 最大窗口获取模块,用于求取时间窗口内最大平均比特率(即最大窗口比特率MWBR);
[0143] 评分模块,用于获取测试对象的主观评分;其包括模拟主观测试模块、正式主观测试模块、测试评分数据处理模块;
[0144] 所述模拟主观测试模块用于介绍测试目的、要求,如何评分、熟悉评分流程,稳定评分;
[0145] 所述正式主观测试模块用于正式主观测试获取评分;
[0146] 所述测试评分数据处理模块用于处理主观测试的数据处理,其中包括以下模块(如图7所示):
[0147] 归一化模块,用于将每个测试人员的测试数据作线性归一化处理,将原始范围[-3,3]的主观评分转换成[0,1]的主观评分,消除个体差异;
[0148] 数据筛选模块,包括测试数据有效性判定模块,用于对测试过程中有效测试数据的筛选;测试人员数据有效性判定模块,用于对测试人员评分有效性的判定,即用于根据Pearson相关性分析、Spearman等级相关性分析、判定阈值对测试人员的评分进行有效性判定;
[0149] 评分均值计算模块,用于计算有效测试人员评分均值;
[0150] 反归一化模块,用于将范围[0,1]的平均得分转换成[-3,3]的评分,将得分与评分含义再度对应。
[0151] 评测模块,用于通过以最大窗口比特率、主观评分值为横坐标和纵坐标构建的主观条件率失真曲线图来获取不同编码技术在视频压缩性能和对网络传输的适应性能上的综合评价,并用于获取不同编码技术网络传输性能和视频压缩性能单项性能的比较(不同编码器的对应不同的性能曲线,曲线位置越高,表示该曲线对应的编码技术在图像主观质量的压缩及网络传输上的综合性能就越好;在相同条件下,比较主观评分,分数越高,对应编码技术的视频图像主观质量越好;在相同条件下,比较最大窗口比特率,值越小,对应编码技术的网络传输性能越好)。
[0152] 图6是图5一种视频编码性能主观评价系统中最大窗口获取模块详细示意图。
[0153] 其中,最大窗口获取模块包括时间窗确定模块、数据点获取模块、偶然因素消除模块、最大窗口选定模块。所述时间窗确定模块用于根据实际传输中的客户端缓冲时长,确定时间窗;所述数据点获取模块用于计算每个时间窗内的输出平均比特率作为一个数据点(即一个窗口比特率值);所述偶然因素消除模块用于删除窗口比特率最大值,消除偶然因数;最大窗口选定模块用于将剩余窗口比特率序列降序排列,取前若干个窗口比特率的平均值作为最大窗口比特率。
[0154] 本发明实施例提出的主观条件率失真性能,一方面用主观评分衡量编码器在视频主观质量上的压缩性能,另一方面将常规的平均比特率替换为最大窗口比特率,表示编码器的传输性能。通过根据最大窗口比特率、主观评分值为横坐标和纵坐标所构建的主观条件率失真曲线图,可获取不同编码技术在视频压缩性能和对网络传输的适应性能上的综合评价,也可通过在相同测试场景、相同编码参数的条件下,比较编码器最大窗口比特率,获取编码器的网络传输性能优劣,比较主观评分,获取编码器在图像主观质量上的压缩性能。
[0155] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。