首页 / 专利库 / 显示技术 / 立体视觉法 / 一种立体图像视觉显著提取方法

一种立体图像视觉显著提取方法

阅读:1029发布:2020-06-27

专利汇可以提供一种立体图像视觉显著提取方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种立体图像视觉显著提取方法,其首先获取立体图像的左视点图像的L通道图、a通道图和b通道图,并获取立体图像的 深度图 像 变换到区间[0,255]的图像;然后对L通道图、a通道图和b通道图及变换后的深度图像实施log‑Gabor低通滤波,得到各自的低通滤波特征图;接着根据四幅低通滤波特征图获取左视点视觉显著图;再获取立体图像的中心偏好图;最后融合左视点视觉显著图和中心偏好图得到立体图像的视觉显著图;优点是符合显著语义特征,且具有较强的提取 稳定性 和较高的提取准确性。,下面是一种立体图像视觉显著提取方法专利的具体信息内容。

1.一种立体图像视觉显著提取方法,其特征在于包括以下步骤:
①令SRGB表示待提取视觉显著的立体图像,将SRGB的左视点图像记为{LRGB(x,y)},将SRGB的深度图像记为{D(x,y)},其中,1≤x≤W,1≤y≤H,W表示SRGB的宽度,H表示SRGB的高度,LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值,D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值;
②采用颜色空间变换方法,将{LRGB(x,y)}从RGB颜色空间变换到Lab颜色空间,得到{LRGB(x,y)}对应的L通道图、a通道图和b通道图,对应记为{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)},其中,LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值;
③将{D(x,y)}的像素值范围变换到区间[0,255],将变换得到的图像记为{D0,255(x,y)},其中,D0,255(x,y)表示{D0,255(x,y)}中坐标位置为(x,y)的像素点的像素值;
④分别对{LLab,L(x,y)}、{LLab,a(x,y)}、{LLab,b(x,y)}和{D0,255(x,y)}实施log-Gabor低通滤波,对应得到{LLab,L(x,y)}的低通滤波特征图、{LLab,a(x,y)}的低通滤波特征图、{LLab,b(x,y)}的低通滤波特征图和{D0,255(x,y)}的低通滤波特征图,对应记为{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},其中,LLab,L,log(x,y)表示{LLab,L,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a,log(x,y)表示{LLab,a,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b,log(x,y)表示{LLab,b,log(x,y)}中坐标位置为(x,y)的像素点的像素值,D0,255,log(x,y)表示{D0,255,log(x,y)}中坐标位置为(x,y)的像素点的像素值;
⑤根据{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},获取左视点视觉显著图,记为{Lsaliency(x,y)},将{Lsaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Lsaliency(x,y),
⑥获取SRGB的中心偏好图,记为{Csaliency(x,y)},将{Csaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Csaliency(x,y), 其中,e为自然基数,x0和
y0对应表示SRGB中的中心像素点的横坐标和纵坐标,δx表示SRGB中的像素点的横坐标的标准差,δy表示SRGB中的像素点的纵坐标的标准差;
⑦融合{Lsaliency(x,y)}和{Csaliency(x,y)}得到SRGB的视觉显著图,记为{S3D,saliency(x,y)},其中,S3D,saliency(x,y)表示{S3D,saliency(x,y)}中坐标位置为(x,y)的像素点的像素值;
所述的步骤⑦中S3D,saliency(x,y)=Lsaliency(x,y)×Csaliency(x,y)。
2.根据权利要求1所述的一种立体图像视觉显著提取方法,其特征在于所述的步骤③中

其中,min()为取最小值函数,max()为取最大值函数。

说明书全文

一种立体图像视觉显著提取方法

技术领域

[0001] 本发明涉及一种图像信号的处理方法,尤其是涉及一种立体图像视觉显著提取方法。

背景技术

[0002] 在人类视觉接收与信息处理中,由于大脑资源有限以及外界环境信息重要性区别,因此在处理过程中人脑对外界环境信息并不是一视同仁的,而是表现出选择特征。人们在观看图像或者视频片段时注意并非均匀分布到图像的每个区域,而是对某些显著区域关注度更高。如何将视频中视觉注意度高的显著区域检测并提取出来是计算机视觉以及基于内容的视频检索领域的一个重要的研究内容。而随着立体视频显示技术和高质量立体视频内容获取技术的快速发展,针对立体图像/视频的显著区域检测及建模也是一个非常重要的研究内容。
[0003] 然而,立体图像并不是平面图像的简单空间拓展,因此人眼感知立体图像产生立体视觉的过程也不是简单的左视点图像和右视点图像叠加的过程,因此,立体视觉特征(例如:三维视觉注意力)并不是平面视觉特性的简单拓展。然而,现有的立体图像显著图提取方法还停留在平面图像显著提取方法的简单拓展上。因此,如何从立体图像中有效地提取出立体视觉特征、如何使得提取出的立体视觉特征符合人眼三维观看行为都是在对立体图像进行视觉显著图提取过程中需要研究解决的问题。

发明内容

[0004] 本发明所要解决的技术问题是提供一种立体图像视觉显著提取方法,其符合显著语义特征,且具有较强的提取稳定性和较高的提取准确性。
[0005] 本发明解决上述技术问题所采用的技术方案为:一种立体图像视觉显著提取方法,其特征在于包括以下步骤:
[0006] ①令SRGB表示待提取视觉显著的立体图像,将SRGB的左视点图像记为{LRGB(x,y)},将SRGB的深度图像记为{D(x,y)},其中,1≤x≤W,1≤y≤H,W表示SRGB的宽度,H表示SRGB的高度,LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值,D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值;
[0007] ②采用颜色空间变换方法,将{LRGB(x,y)}从RGB颜色空间变换到Lab颜色空间,得到{LRGB(x,y)}对应的L通道图、a通道图和b通道图,对应记为{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)},其中,LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值;
[0008] ③将{D(x,y)}的像素值范围变换到区间[0,255],将变换得到的图像记为{D0,255(x,y)},其中,D0,255(x,y)表示{D0,255(x,y)}中坐标位置为(x,y)的像素点的像素值;
[0009] ④分别对{LLab,L(x,y)}、{LLab,a(x,y)}、{LLab,b(x,y)}和{D0,255(x,y)}实施log-Gabor低通滤波,对应得到{LLab,L(x,y)}的低通滤波特征图、{LLab,a(x,y)}的低通滤波特征图、{LLab,b(x,y)}的低通滤波特征图和{D0,255(x,y)}的低通滤波特征图,对应记为{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},其中,LLab,L,log(x,y)表示{LLab,L,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a,log(x,y)表示{LLab,a,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b,log(x,y)表示{LLab,b,log(x,y)}中坐标位置为(x,y)的像素点的像素值,D0,255,log(x,y)表示{D0,255,log(x,y)}中坐标位置为(x,y)的像素点的像素值;
[0010] ⑤根据{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},获取左视点视觉显著图,记为{Lsaliency(x,y)},将{Lsaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Lsaliency(x,y),
[0011] ⑥获取SRGB的中心偏好图,记为{Csaliency(x,y)},将{Csaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Csaliency(x,y), 其中,e为自然基数,x0和y0对应表示SRGB中的中心像素点的横坐标和纵坐标,δx表示SRGB中的像素点的横坐标的标准差,δy表示SRGB中的像素点的纵坐标的标准差;
[0012] ⑦融合{Lsaliency(x,y)}和{Csaliency(x,y)}得到SRGB的视觉显著图,记为{S3D,saliency(x,y)},其中,S3D,saliency(x,y)表示{S3D,saliency(x,y)}中坐标位置为(x,y)的像素点的像素值。
[0013] 所述的步骤③中,
其中,min()为取最小值函数,max()为取最大值函数。
[0014] 所述的步骤⑦中S3D,saliency(x,y)=Lsaliency(x,y)×Csaliency(x,y)。
[0015] 与现有技术相比,本发明的优点在于:
[0016] 1)本发明方法采用log-Gabor低通滤波器,符合人眼视觉系统对关注物体的检测,使得本发明方法具有较高的提取准确性和较强的稳定性,并能够较好地反映各种因素的显著变化情况,符合显著语义特征。
[0017] 2)本发明方法将深度信息的特征融合到左视点视觉显著图提取之中,提高了立体视觉显著值预测的准确性和稳定性。
[0018] 3)本发明方法同时考虑立体图像的中心偏好图和左视点视觉显著图,并最终融合得到立体图像的视觉显著图,通过这个过程进一步提高了三维视觉显著值的预测准确性和稳定性,从而进一步提高了立体图像的视觉显著图的提取稳定性和提取准确性。附图说明
[0019] 图1为本发明方法的总体实现框图

具体实施方式

[0020] 以下结合附图实施例对本发明作进一步详细描述。
[0021] 本发明提出的一种立体图像视觉显著提取方法,其总体实现框图如图1所示,其包括以下步骤:
[0022] ①令SRGB表示待提取视觉显著的立体图像,将SRGB的左视点图像记为{LRGB(x,y)},将SRGB的右视点图像记为{RRGB(x,y)},将SRGB的深度图像记为{D(x,y)},其中,1≤x≤W,1≤y≤H,W表示SRGB的宽度,H表示SRGB的高度,LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值,RRGB(x,y)表示{RRGB(x,y)}中坐标位置为(x,y)的像素点的像素值,D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值。
[0023] ②采用现有的颜色空间变换方法,将{LRGB(x,y)}从RGB颜色空间变换到Lab颜色空间,得到{LRGB(x,y)}对应的L通道图、a通道图和b通道图,对应记为{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)},其中,LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值。
[0024] ③将{D(x,y)}的像素值范围变换到区间[0,255],将变换得到的图像记为{D0,255(x,y)},其中,D0,255(x,y)表示{D0,255(x,y)}中坐标位置为(x,y)的像素点的像素值,,min()为取最小值函数,max()为取最大值函数。
[0025] ④分别对{LLab,L(x,y)}、{LLab,a(x,y)}、{LLab,b(x,y)}和{D0,255(x,y)}实施现有的log-Gabor低通滤波,对应得到{LLab,L(x,y)}的低通滤波特征图、{LLab,a(x,y)}的低通滤波特征图、{LLab,b(x,y)}的低通滤波特征图和{D0,255(x,y)}的低通滤波特征图,对应记为{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},其中,LLab,L,log(x,y)表示{LLab,L,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,a,log(x,y)表示{LLab,a,log(x,y)}中坐标位置为(x,y)的像素点的像素值,LLab,b,log(x,y)表示{LLab,b,log(x,y)}中坐标位置为(x,y)的像素点的像素值,D0,255,log(x,y)表示{D0,255,log(x,y)}中坐标位置为(x,y)的像素点的像素值。
[0026] ⑤根据{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)},获取左视点视觉显著图,记为{Lsaliency(x,y)},将{Lsaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Lsaliency(x,y),
[0027] ⑥获取SRGB的中心偏好图,记为{Csaliency(x,y)},将{Csaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Csaliency(x,y), 其中,e为自然基数,e=2.7182818284…,x0和y0对应表示SRGB中的中心像素点的横坐标和纵坐标,δx表示SRGB中的像素点的横坐标的标准差,δy表示SRGB中的像素点的纵坐标的标准差。
[0028] 在本实施例中, δx=94和δy=94,其中,符号 为向上取整符号。
[0029] ⑦融合{Lsaliency(x,y)}和{Csaliency(x,y)}得到SRGB的视觉显著图,记为{S3D,saliency(x,y)},其中,S3D,saliency(x,y)表示{S3D,saliency(x,y)}中坐标位置为(x,y)的像素点的像素值,S3D,saliency(x,y)=Lsaliency(x,y)×Csaliency(x,y)。
[0030] 为验证本发明方法的可行性和有效性,进行实验。
[0031] 在此,采用法国南特大学提供的三维人眼跟踪数据库(3D  eye-tracking database)来分析本发明方法的准确性和稳定性。这里,利用评估视觉显著提取方法的3个常用客观参量作为评价指标,即Pearson相关系数(Pearson linear correlation 
coefficient,PLCC)、Kullback-Leibler散度系数(Kullback-Leibler divergence,KLD)、AUC参数(the Area Under the receiver operating characteristics Curve,AUC)。
[0032] 利用本发明方法获取法国南特大学提供的三维人眼跟踪数据库中的每幅立体图像的视觉显著图,并与三维人眼跟踪数据库中的每幅立体图像的主观视觉显著图(三维人眼跟踪数据库中存在)进行比较,PLCC和AUC值越高、KLD值越低说明本发明方法提取的视觉显著图与主观视觉显著图的一致性越好。反映本发明方法的显著提取性能的PLCC、KLD和AUC相关指标如表1所列。从表1所列的数据可知,按本发明方法提取得到的视觉显著图与主观视觉显著图的准确性和稳定性是很好的,表明客观提取结果与人眼主观感知的结果较为一致,足以说明本发明方法的可行性和有效性。
[0033] 表1利用本发明方法提取得到的视觉显著图与主观视觉显著图的准确性和稳定性[0034]性能指标 性能指标值
PLCC 0.5077
KLD 0.3449
AUC 0.7134

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈