一种立体图像视觉显著提取方法专利检索-立体视觉法显示技术专利检索查询-专利查询网

一种立体图像视觉显著提取方法

阅读：1029发布：2020-06-27

专利汇可以提供一种立体图像视觉显著提取方法专利检索，专利查询，专利分析的服务。并且本发明公开了一种立体图像视觉显著提取方法，其首先获取立体图像的左视点图像的L通道图、a通道图和b通道图，并获取立体图像的深度图像变换到区间[0,255]的图像；然后对L通道图、a通道图和b通道图及变换后的深度图像实施log‑Gabor低通滤波，得到各自的低通滤波特征图；接着根据四幅低通滤波特征图获取左视点视觉显著图；再获取立体图像的中心偏好图；最后融合左视点视觉显著图和中心偏好图得到立体图像的视觉显著图；优点是符合显著语义特征，且具有较强的提取稳定性和较高的提取准确性。，下面是一种立体图像视觉显著提取方法专利的具体信息内容。

权利要求

1.一种立体图像视觉显著提取方法，其特征在于包括以下步骤：
①令SRGB表示待提取视觉显著的立体图像，将SRGB的左视点图像记为{LRGB(x,y)}，将SRGB的深度图像记为{D(x,y)}，其中，1≤x≤W,1≤y≤H，W表示SRGB的宽度，H表示SRGB的高度，LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值，D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值；
②采用颜色空间变换方法，将{LRGB(x,y)}从RGB颜色空间变换到Lab颜色空间，得到{LRGB(x,y)}对应的L通道图、a通道图和b通道图，对应记为{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)}，其中，LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值；
③将{D(x,y)}的像素值范围变换到区间[0,255]，将变换得到的图像记为{D0,255(x,y)}，其中，D0,255(x,y)表示{D0,255(x,y)}中坐标位置为(x,y)的像素点的像素值；
④分别对{LLab,L(x,y)}、{LLab,a(x,y)}、{LLab,b(x,y)}和{D0,255(x,y)}实施log-Gabor低通滤波，对应得到{LLab,L(x,y)}的低通滤波特征图、{LLab,a(x,y)}的低通滤波特征图、{LLab,b(x,y)}的低通滤波特征图和{D0,255(x,y)}的低通滤波特征图，对应记为{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)}，其中，LLab,L,log(x,y)表示{LLab,L,log(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,a,log(x,y)表示{LLab,a,log(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,b,log(x,y)表示{LLab,b,log(x,y)}中坐标位置为(x,y)的像素点的像素值，D0,255,log(x,y)表示{D0,255,log(x,y)}中坐标位置为(x,y)的像素点的像素值；
⑤根据{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)}，获取左视点视觉显著图，记为{Lsaliency(x,y)}，将{Lsaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Lsaliency(x,y)，
⑥获取SRGB的中心偏好图，记为{Csaliency(x,y)}，将{Csaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Csaliency(x,y)，其中，e为自然基数，x0和
y0对应表示SRGB中的中心像素点的横坐标和纵坐标，δx表示SRGB中的像素点的横坐标的标准差，δy表示SRGB中的像素点的纵坐标的标准差；
⑦融合{Lsaliency(x,y)}和{Csaliency(x,y)}得到SRGB的视觉显著图，记为{S3D,saliency(x,y)}，其中，S3D,saliency(x,y)表示{S3D,saliency(x,y)}中坐标位置为(x,y)的像素点的像素值；
所述的步骤⑦中S3D,saliency(x,y)＝Lsaliency(x,y)×Csaliency(x,y)。
2.根据权利要求1所述的一种立体图像视觉显著提取方法，其特征在于所述的步骤③中
，
其中，min()为取最小值函数，max()为取最大值函数。

说明书全文

一种立体图像视觉显著提取方法

技术领域

[0001] 本发明涉及一种图像信号的处理方法，尤其是涉及一种立体图像视觉显著提取方法。

背景技术

[0002] 在人类视觉接收与信息处理中，由于大脑资源有限以及外界环境信息重要性区别，因此在处理过程中人脑对外界环境信息并不是一视同仁的，而是表现出选择特征。人们在观看图像或者视频片段时注意力并非均匀分布到图像的每个区域，而是对某些显著区域关注度更高。如何将视频中视觉注意度高的显著区域检测并提取出来是计算机视觉以及基于内容的视频检索领域的一个重要的研究内容。而随着立体视频显示技术和高质量立体视频内容获取技术的快速发展，针对立体图像/视频的显著区域检测及建模也是一个非常重要的研究内容。

[0003] 然而，立体图像并不是平面图像的简单空间拓展，因此人眼感知立体图像产生立体视觉的过程也不是简单的左视点图像和右视点图像叠加的过程，因此，立体视觉特征(例如：三维视觉注意力)并不是平面视觉特性的简单拓展。然而，现有的立体图像显著图提取方法还停留在平面图像显著提取方法的简单拓展上。因此，如何从立体图像中有效地提取出立体视觉特征、如何使得提取出的立体视觉特征符合人眼三维观看行为都是在对立体图像进行视觉显著图提取过程中需要研究解决的问题。

发明内容

[0004] 本发明所要解决的技术问题是提供一种立体图像视觉显著提取方法，其符合显著语义特征，且具有较强的提取稳定性和较高的提取准确性。

[0005] 本发明解决上述技术问题所采用的技术方案为：一种立体图像视觉显著提取方法，其特征在于包括以下步骤：

[0006] ①令SRGB表示待提取视觉显著的立体图像，将SRGB的左视点图像记为{LRGB(x,y)}，将SRGB的深度图像记为{D(x,y)}，其中，1≤x≤W,1≤y≤H，W表示SRGB的宽度，H表示SRGB的高度，LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值，D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值；

[0007] ②采用颜色空间变换方法，将{LRGB(x,y)}从RGB颜色空间变换到Lab颜色空间，得到{LRGB(x,y)}对应的L通道图、a通道图和b通道图，对应记为{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)}，其中，LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值；

[0008] ③将{D(x,y)}的像素值范围变换到区间[0,255]，将变换得到的图像记为{D0,255(x,y)}，其中，D0,255(x,y)表示{D0,255(x,y)}中坐标位置为(x,y)的像素点的像素值；

[0009] ④分别对{LLab,L(x,y)}、{LLab,a(x,y)}、{LLab,b(x,y)}和{D0,255(x,y)}实施log-Gabor低通滤波，对应得到{LLab,L(x,y)}的低通滤波特征图、{LLab,a(x,y)}的低通滤波特征图、{LLab,b(x,y)}的低通滤波特征图和{D0,255(x,y)}的低通滤波特征图，对应记为{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)}，其中，LLab,L,log(x,y)表示{LLab,L,log(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,a,log(x,y)表示{LLab,a,log(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,b,log(x,y)表示{LLab,b,log(x,y)}中坐标位置为(x,y)的像素点的像素值，D0,255,log(x,y)表示{D0,255,log(x,y)}中坐标位置为(x,y)的像素点的像素值；

[0010] ⑤根据{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)}，获取左视点视觉显著图，记为{Lsaliency(x,y)}，将{Lsaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Lsaliency(x,y)，

[0011] ⑥获取SRGB的中心偏好图，记为{Csaliency(x,y)}，将{Csaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Csaliency(x,y)，其中，e为自然基数，x0和y0对应表示SRGB中的中心像素点的横坐标和纵坐标，δx表示SRGB中的像素点的横坐标的标准差，δy表示SRGB中的像素点的纵坐标的标准差；

[0012] ⑦融合{Lsaliency(x,y)}和{Csaliency(x,y)}得到SRGB的视觉显著图，记为{S3D,saliency(x,y)}，其中，S3D,saliency(x,y)表示{S3D,saliency(x,y)}中坐标位置为(x,y)的像素点的像素值。

[0013] 所述的步骤③中，
其中，min()为取最小值函数，max()为取最大值函数。

[0014] 所述的步骤⑦中S3D,saliency(x,y)＝Lsaliency(x,y)×Csaliency(x,y)。

[0015] 与现有技术相比，本发明的优点在于：

[0016] 1)本发明方法采用log-Gabor低通滤波器，符合人眼视觉系统对关注物体的检测，使得本发明方法具有较高的提取准确性和较强的稳定性，并能够较好地反映各种因素的显著变化情况，符合显著语义特征。

[0017] 2)本发明方法将深度信息的特征融合到左视点视觉显著图提取之中，提高了立体视觉显著值预测的准确性和稳定性。

[0018] 3)本发明方法同时考虑立体图像的中心偏好图和左视点视觉显著图，并最终融合得到立体图像的视觉显著图，通过这个过程进一步提高了三维视觉显著值的预测准确性和稳定性，从而进一步提高了立体图像的视觉显著图的提取稳定性和提取准确性。附图说明

[0019] 图1为本发明方法的总体实现框图。

具体实施方式

[0020] 以下结合附图实施例对本发明作进一步详细描述。

[0021] 本发明提出的一种立体图像视觉显著提取方法，其总体实现框图如图1所示，其包括以下步骤：

[0022] ①令SRGB表示待提取视觉显著的立体图像，将SRGB的左视点图像记为{LRGB(x,y)}，将SRGB的右视点图像记为{RRGB(x,y)}，将SRGB的深度图像记为{D(x,y)}，其中，1≤x≤W,1≤y≤H，W表示SRGB的宽度，H表示SRGB的高度，LRGB(x,y)表示{LRGB(x,y)}中坐标位置为(x,y)的像素点的像素值，RRGB(x,y)表示{RRGB(x,y)}中坐标位置为(x,y)的像素点的像素值，D(x,y)表示{D(x,y)}中坐标位置为(x,y)的像素点的像素值。

[0023] ②采用现有的颜色空间变换方法，将{LRGB(x,y)}从RGB颜色空间变换到Lab颜色空间，得到{LRGB(x,y)}对应的L通道图、a通道图和b通道图，对应记为{LLab,L(x,y)}、{LLab,a(x,y)}和{LLab,b(x,y)}，其中，LLab,L(x,y)表示{LLab,L(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,a(x,y)表示{LLab,a(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,b(x,y)表示{LLab,b(x,y)}中坐标位置为(x,y)的像素点的像素值。

[0024] ③将{D(x,y)}的像素值范围变换到区间[0,255]，将变换得到的图像记为{D0,255(x,y)}，其中，D0,255(x,y)表示{D0,255(x,y)}中坐标位置为(x,y)的像素点的像素值，，min()为取最小值函数，max()为取最大值函数。

[0025] ④分别对{LLab,L(x,y)}、{LLab,a(x,y)}、{LLab,b(x,y)}和{D0,255(x,y)}实施现有的log-Gabor低通滤波，对应得到{LLab,L(x,y)}的低通滤波特征图、{LLab,a(x,y)}的低通滤波特征图、{LLab,b(x,y)}的低通滤波特征图和{D0,255(x,y)}的低通滤波特征图，对应记为{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)}，其中，LLab,L,log(x,y)表示{LLab,L,log(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,a,log(x,y)表示{LLab,a,log(x,y)}中坐标位置为(x,y)的像素点的像素值，LLab,b,log(x,y)表示{LLab,b,log(x,y)}中坐标位置为(x,y)的像素点的像素值，D0,255,log(x,y)表示{D0,255,log(x,y)}中坐标位置为(x,y)的像素点的像素值。

[0026] ⑤根据{LLab,L,log(x,y)}、{LLab,a,log(x,y)}、{LLab,b,log(x,y)}和{D0,255,log(x,y)}，获取左视点视觉显著图，记为{Lsaliency(x,y)}，将{Lsaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Lsaliency(x,y)，

[0027] ⑥获取SRGB的中心偏好图，记为{Csaliency(x,y)}，将{Csaliency(x,y)}中坐标位置为(x,y)的像素点的像素值记为Csaliency(x,y)，其中，e为自然基数，e＝2.7182818284…，x0和y0对应表示SRGB中的中心像素点的横坐标和纵坐标，δx表示SRGB中的像素点的横坐标的标准差，δy表示SRGB中的像素点的纵坐标的标准差。

[0028] 在本实施例中， δx＝94和δy＝94，其中，符号为向上取整符号。

[0029] ⑦融合{Lsaliency(x,y)}和{Csaliency(x,y)}得到SRGB的视觉显著图，记为{S3D,saliency(x,y)}，其中，S3D,saliency(x,y)表示{S3D,saliency(x,y)}中坐标位置为(x,y)的像素点的像素值，S3D,saliency(x,y)＝Lsaliency(x,y)×Csaliency(x,y)。

[0030] 为验证本发明方法的可行性和有效性，进行实验。

[0031] 在此，采用法国南特大学提供的三维人眼跟踪数据库(3D eye-tracking database)来分析本发明方法的准确性和稳定性。这里，利用评估视觉显著提取方法的3个常用客观参量作为评价指标，即Pearson相关系数(Pearson linear correlation
coefficient，PLCC)、Kullback-Leibler散度系数(Kullback-Leibler divergence，KLD)、AUC参数(the Area Under the receiver operating characteristics Curve，AUC)。

[0032] 利用本发明方法获取法国南特大学提供的三维人眼跟踪数据库中的每幅立体图像的视觉显著图，并与三维人眼跟踪数据库中的每幅立体图像的主观视觉显著图(三维人眼跟踪数据库中存在)进行比较，PLCC和AUC值越高、KLD值越低说明本发明方法提取的视觉显著图与主观视觉显著图的一致性越好。反映本发明方法的显著提取性能的PLCC、KLD和AUC相关指标如表1所列。从表1所列的数据可知，按本发明方法提取得到的视觉显著图与主观视觉显著图的准确性和稳定性是很好的，表明客观提取结果与人眼主观感知的结果较为一致，足以说明本发明方法的可行性和有效性。

[0033] 表1利用本发明方法提取得到的视觉显著图与主观视觉显著图的准确性和稳定性[0034]性能指标性能指标值
PLCC 0.5077
KLD 0.3449
AUC 0.7134
。

标题	发布/更新时间	阅读量
一种基于人工智能的服务器巡检方法及系统	2020-05-08	282
一种带降噪和视觉检测功能的油烟机及降噪方法	2020-05-08	304
一种多视高分辨率纹理图像与双目三维点云映射方法	2020-05-12	980
测量系统中视觉图像传感器与光点测距传感器测量坐标系的统一方法	2020-05-12	438
智能清扫车多层次立体避障控制方法及装置	2020-05-11	81
电子设备壳体及其制备方法和电子设备	2020-05-12	997
基于图像扫描、识别和路径规划的可移动洗衣助手机器人	2020-05-12	705
一种基于增强现实的机械组件质检方法及系统	2020-05-08	231
一种利用双目立体相机构建栅格地图的方法	2020-05-11	657
基于ARM和FPGA的工件位置获取系统	2020-05-11	379

一种立体图像视觉显著提取方法

一种立体图像视觉显著提取方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：