首页 / 专利库 / 多媒体工具与应用 / 宏模块 / 像素 / 背景像素 / 一种图像反射分离方法及装置

一种图像反射分离方法及装置

阅读:720发布:2020-05-08

专利汇可以提供一种图像反射分离方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种图像反射分离方法及装置,方法包括:将同一视点场景的图像组输入已训练的参数预测网络,由参数预测网络基于该图像组预测得到玻璃几何参数,该图像组由一 帧 偏振图像和一帧非偏振图像组成或者由两帧偏振 角 度不同的偏振图像组成;利用玻璃几何参数确定该图像组中每帧图像上各 像素 点的混合系数;依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像。通过将输入图像减少到两帧图像,减小了数据获取的难度,能够在手机相机、监控设备等设备中部署,扩大了 算法 应用范围。本方案充分利用了光的偏振特性,由预测得到的玻璃几何参数进行逐像素计算以实现图像的反射分离,可提升输出背景图像和反射图像的 质量 。,下面是一种图像反射分离方法及装置专利的具体信息内容。

1.一种图像反射分离方法,其特征在于,所述方法包括:
将同一视点场景的图像组输入已训练的参数预测网络,以由所述参数预测网络基于该图像组预测得到玻璃几何参数;
利用所述玻璃几何参数确定该图像组中每图像上各像素点的混合系数;
依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像;
其中,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振度不同的偏振图像组成。
2.根据权利要求1所述的方法,其特征在于,所述参数预测网络基于该图像组预测得到玻璃几何参数,包括:
通过本参数预测网络中的拼接层将该图像组中两帧图像沿RGB通道所在维度拼接构成第一输入张量,并输出给本参数预测网络中的卷积网络;
通过所述卷积网络对所述第一输入张量进行卷积操作得到输出张量,并将输出张量拉伸为一维向量后输出给本参数预测网络中的全连接网络;
通过所述全连接网络利用所述一维向量预测得到玻璃几何参数。
3.根据权利要求1所述的方法,其特征在于,利用所述玻璃几何参数确定该图像组中每帧图像上各像素点的混合系数,包括:
利用所述玻璃几何参数确定该图像组中每帧图像上各像素点的入射角和使振动方向垂直或平行于入射面的光分量通过最多的第一偏振片角度;
针对该图像组中的每帧图像,如果该帧图像为偏振图像,则利用该帧图像上各像素点的入射角、使振动方向垂直或平行于入射面的光分量通过最多的第一偏振片角度以及拍摄该帧图像时的第二偏振片角度确定该帧图像上各像素点的混合系数;
如果该帧图像为非偏振图像,则利用该帧图像上各像素点的入射角确定该帧图像上各像素点的混合系数。
4.根据权利要求1所述的方法,其特征在于,在利用每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像之后,所述方法还包括:
将该图像组中的两帧图像、分离出的反射图像和背景图像沿RGB通道所在维度拼接构成第二输入张量;
将所述第二输入张量输入已训练的优化网络,以由所述优化网络对所述第二输入张量进行优化操作,得到优化后的反射图像和背景图像。
5.根据权利要求1所述的方法,其特征在于,所述参数预测网络的训练过程,包括:
分别从反射图像集与背景图像集中选取一帧反射图像和一帧背景图像;
随机选择一组玻璃几何参数,并利用选择的玻璃几何参数分别确定用于训练参数预测网络的图像组中每帧图像上各像素点的混合系数;
对所述反射图像和所述背景图像分别进行动态范围调整,得到调整后的反射图像和调整后的背景图像;
利用调整后的反射图像、调整后的背景图像以及图像组中每帧图像上各像素点的混合系数,合成用于训练参数预测网络的图像组;
利用合成的图像组训练参数预测网络模型,直至损失值低于预设数值,停止训练;
其中,参数预测网络模型的损失值根据参数预测网络模型输出的玻璃几何参数和选择的玻璃几何参数获得。
6.一种图像反射分离装置,其特征在于,所述装置包括:
参数预测模,用于将同一视点场景的图像组输入已训练的参数预测网络,以由所述参数预测网络基于该图像组预测得到玻璃几何参数;
混合系数确定模块,用于利用所述玻璃几何参数确定该图像组中每帧图像上各像素点的混合系数;
分离模块,用于依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像;
其中,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振角度不同的偏振图像组成。
7.根据权利要求6所述的装置,其特征在于,所述参数预测模块,具体用于在由所述参数预测网络基于该图像组预测得到玻璃几何参数过程中,通过本参数预测网络中的拼接层将该图像组中两帧图像沿RGB通道所在维度拼接构成第一输入张量,并输出给本参数预测网络中的卷积网络;通过所述卷积网络对所述第一输入张量进行卷积操作得到输出张量,并将输出张量拉伸为一维向量后输出给本参数预测网络中的全连接网络;通过所述全连接网络利用所述一维向量预测得到玻璃几何参数。
8.根据权利要求6所述的装置,其特征在于,所述混合系数确定模块,具体用于利用所述玻璃几何参数确定该图像组中每帧图像上各像素点的入射角和使振动方向垂直或平行于入射面的光分量通过最多的第一偏振片角度;针对该图像组中的每帧图像,如果该帧图像为偏振图像,则利用该帧图像上各像素点的入射角、使振动方向垂直或平行于入射面的光分量通过最多的第一偏振片角度以及拍摄该帧图像时的第二偏振片角度确定该帧图像上各像素点的混合系数;
如果该帧图像为非偏振图像,则利用该帧图像上各像素点的入射角确定该帧图像上各像素点的混合系数。
9.根据权利要求6所述的装置,其特征在于,所述装置还包括:
优化模块,用于在所述分离模块利用每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像之后,将该图像组中的两帧图像、分离出的反射图像和背景图像沿RGB通道所在维度拼接构成第二输入张量;将所述第二输入张量输入已训练的优化网络,以由所述优化网络对所述第二输入张量进行优化操作,得到优化后的反射图像和背景图像。
10.根据权利要求6所述的装置,其特征在于,所述装置还包括:
训练模块,具体用于分别从反射图像集与背景图像集中选取一帧反射图像和一帧背景图像;随机选择一组玻璃几何参数,并利用选择的玻璃几何参数分别确定用于训练参数预测网络的图像组中每帧图像上各像素点的混合系数;对所述反射图像和所述背景图像分别进行动态范围调整,得到调整后的反射图像和调整后的背景图像;利用调整后的反射图像、调整后的背景图像以及图像组中每帧图像上各像素点的混合系数,合成用于训练参数预测网络的图像组;利用合成的图像组训练参数预测网络模型,直至损失值低于预设数值,停止训练;其中,参数预测网络模型的损失值根据参数预测网络模型输出的玻璃几何参数和选择的玻璃几何参数获得。

说明书全文

一种图像反射分离方法及装置

技术领域

[0001] 本发明涉及图像处理技术领域,具体涉及一种图像反射分离方法及装置。

背景技术

[0002] 在拍照时,反射干扰是一种常见的现象,如透过玻璃拍照时,拍照者会得到一张带有反射的图像。对于反射干扰,会使图像质量下降,并且还会影响更高层语义层面任务(如人脸识别、目标检测等任务)的处理,因此,在进行任务前需要对图像进行反射分离处理。
[0003] 在现有技术中,通过在相机加装偏振片,以在同一视点条件下捕捉三个不同偏振度的偏振图像,然后利用三张偏振图像提取偏振光的正交分量,通过遍历入射角的所有取值,利用每一入射角在正交方向上的分量计算每一入射角对应的背景图像和反射图像,最后计算每组背景图像与反射图像的互信息,并选取互信息最小的一组背景图像和反射图像输出。
[0004] 然而,上述实现需要输入三张不同偏振角度的偏振图像,对拍摄设备及相关条件控制要求较高,拍摄难度大,实用性不高。

发明内容

[0005] 本发明的目的是针对上述现有技术的不足提出的一种图像反射分离方法及装置,该目的是通过以下技术方案实现的。
[0006] 本发明的第一方面提出了一种图像反射分离方法,所述方法包括:
[0007] 将同一视点场景的图像组输入已训练的参数预测网络,以由所述参数预测网络基于该图像组预测得到玻璃几何参数;
[0008] 利用所述玻璃几何参数确定该图像组中每图像上各像素点的混合系数;
[0009] 依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像;
[0010] 其中,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振角度不同的偏振图像组成。
[0011] 本发明的第二方面提出了一种图像反射分离装置,所述装置包括:
[0012] 参数预测模,用于将同一视点场景的图像组输入已训练的参数预测网络,以由所述参数预测网络基于该图像组预测得到玻璃几何参数;
[0013] 混合系数确定模块,用于利用所述玻璃几何参数确定该图像组中每帧图像上各像素点的混合系数;
[0014] 分离模块,用于依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像;
[0015] 其中,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振角度不同的偏振图像组成。
[0016] 在本发明实施例中,通过将同一视点场景的图像组输入已训练的参数预测网络,以由参数预测网络基于该图像组预测得到玻璃几何参数,然后利用玻璃几何参数确定该图像组中每帧图像上各像素点的混合系数,并依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像。其中,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振角度不同的偏振图像组成。
[0017] 基于上述描述可知,通过将输入图像减少到两帧图像,既可以是一对偏振与非偏振图像,也可以是一对偏振角度不同的图像,减小了数据获取的难度,能够在手机相机、监控设备等摄像设备中部署,扩大了算法应用范围。本方案充分利用了光的偏振特性,由预测得到的玻璃几何参数进行逐像素计算以实现图像的反射分离,可提升输出背景图像和反射图像的质量。附图说明
[0018] 此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0019] 图1A为本发明根据一示例性实施例示出的一种图像反射分离方法的实施例流程图
[0020] 图1B为本发明根据图1A所示实施例示出的一种偏振图像与非偏振图像的拍摄装置结构图;
[0021] 图1C为本发明根据图1A所示实施例示出的一种图像反射分离流程结构示意图;
[0022] 图2为本发明根据一示例性实施例示出的一种电子设备的硬件结构图;
[0023] 图3为本发明根据一示例性实施例示出的一种图像反射分离装置的实施例流程图。

具体实施方式

[0024] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
[0025] 在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0026] 应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
[0027] 利用单张普通图像实现反射分离的方法,基于图像梯度稀疏分布、反射与背景图像的模糊程度不同以及玻璃厚度造成的重影效应等,当假设不满足时算法性能将大幅下降,因此适用的场景有限,算法泛化能较差。
[0028] 而基于物理的方法利用偏振图像,具有更可靠的理论依据,在物理模型满足的情况下求解相对适定的问题可以得到更稳定的图像恢复。利用偏振图像实现反射分离的物理基础在于,光线在玻璃表面发生镜面反射的同时,其偏振状态会发生改变。利用在相机前部加装可旋转的偏振片或者专业偏振相机可以捕捉到不同偏振角度下光强度变化的图像序列。该序列包含了透射图像与反射图像独立变化的强度系数,可以使用独立成分分析进行重叠图像的分离进而实现反射消除。通过分析玻璃反射与折射对光偏振状态的影响,可以对反射图像的形成过程进行物理上的建模,然后利用最优化求解或深度神经网络来实现独立的重叠图层分离。
[0029] 下面对利用三张偏振图像分离反射图像和背景图像的实现过程进行介绍:
[0030] 1)利用偏振片角度分别为0°、45°、90°的三张偏振图像I1(x),I2(x),I3(x)提取平方向分量和垂直方向分量I⊥(x),I||(x):
[0031]
[0032]
[0033] 其中,
[0034] 2)由菲涅尔公式导出反射图像Ir(x)和背景图像It(x):
[0035]
[0036]
[0037] 其中, 表示垂直方向的反射比
[0038]
[0039] 表示水平方向的反射比:
[0040]
[0041] 其中,θi为折射角,θi与θ满足斯涅尔定律的约束:
[0042] κsinθi=sinθ
[0043] κ可取典型值1.474。
[0044] 3)由于θ未知,将互信息作为目标损失函数,遍历θ所有可能取值,取损失函数值最小对应的分解结果作为最后解:
[0045]
[0046] 其中, 为互信息计算式,H(·)为图像熵计算式。
[0047] 虽然上述方法展示了优异的反射消除能力,但是需要输入同一场景三张以上不同偏振角度的图像,要求拍摄者精准旋转镜头前的偏振片,同时保证相机静止,对拍摄设备及相关条件控制要求较高,拍摄难度很大,难以广泛应用。
[0048] 为了解决上述技术问题,本发明提出了一种图像反射分离技术方案,通过将同一视点场景的图像组输入已训练的参数预测网络,以由参数预测网络基于该图像组预测得到玻璃几何参数,然后利用玻璃几何参数确定该图像组中每帧图像上各像素点的混合系数,并依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像。其中,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振角度不同的偏振图像组成。
[0049] 基于上述描述可知,通过将输入图像减少到两帧图像,既可以是一对偏振与非偏振图像,也可以是一对偏振角度不同的图像,减小了数据获取的难度,能够在手机相机、监控设备等摄像设备中部署,扩大了算法应用范围。本方案充分利用了光的偏振特性,由预测得到的玻璃几何参数进行逐像素计算以实现图像的反射分离,可提升输出背景图像和反射图像的质量。
[0050] 下面以具体实施例对本发明提出的图像反射分离方案进行详细阐述。
[0051] 图1A为本发明根据一示例性实施例示出的一种图像反射分离方法的实施例流程图,所述图像反射分离方法可以应用到电子设备(如PC机、终端设备等)。如图1A所示,所述图像反射分离方法包括如下步骤:
[0052] 步骤101:将同一视点场景的图像组输入已训练的参数预测网络,以由参数预测网络基于该图像组预测得到玻璃几何参数,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振角度不同的偏振图像组成。
[0053] 在执行步骤101之前,参数预测网络的训练过程可以是:分别从反射图像集与背景图像集中选取一帧反射图像和一帧背景图像,然后随机选择一组玻璃几何参数,并利用选择的玻璃几何参数分别确定用于训练参数预测网络的图像组中每帧图像上各像素点的混合系数,并对反射图像和背景图像分别进行动态范围调整,得到调整后的反射图像和调整后的背景图像,然后利用调整后的反射图像、调整后的背景图像以及图像组中每帧图像上各像素点的混合系数,合成用于训练参数预测网络的图像组,并利用合成的图像组训练参数预测网络模型,直至损失值低于预设数值,停止训练,所述损失值根据参数预测网络模型输出的玻璃几何参数和选择的玻璃几何参数获得。
[0054] 其中,反射图像集和背景图像集可以通过从PLACE2的训练数据集获取。在选取一帧反射图像之后,可以使用不同大小的卷积核对反射图像进行模糊处理,以模拟现实中反射层往往有不同程度的模糊的情况。
[0055] 下面以图像组由偏振图像与非偏振图像组成为例,对用于训练参数预测网络的图像组的合成过程进行详细介绍:
[0056] 1)随机选取平面旋转参数α,β,计算图像上每个像素点对应的世界坐标系中的三维坐标:
[0057]
[0058] 其中,(u,v)为图像上像素点的像素坐标,z0为玻璃旋转前与相机的距离,已知量,(px,py)为变换主点坐标,已知量,f为选择的相机参数中的焦距,已知量。
[0059] 2)计算图像上每个像素点的入射角和入射面的法向量:
[0060]
[0061] nPoI=nglass×X
[0062] 其中,nglass=[tanα -sinβ cosβ]T,表示玻璃法线方向;
[0063] 由上述入射角公式可知,图像组中的两帧图像上同一像素位置的入射角相同。
[0064] 由入射面法线方向导出使振动方向垂直于入射面的光分量通过最多的第一偏振片角度:
[0065]
[0066] 其中,xPoI为nPoI的x方向分量,yPoI为nPoI的y方向分量;
[0067] 若使用使振动方向平行于入射面的光分量通过最多的第一偏振片角度,[0068]
[0069] 3)根据菲涅尔公式和斯涅定律,分别计算用于训练参数预测网络的图像组中偏振图像的混合系数ζ(x)和非偏振图像的的混合系数ξ(x):
[0070]
[0071]
[0072] 其中,φ为偏振图像的第二偏振片角度(在训练网络时,该角度随机选择,在应用训练网络时,该角度为实际拍摄偏振图像时的偏振片角度),φ⊥(x)可用φ||(x)等价替换,与 为垂直方向与水平方向上的反射比:
[0073]
[0074]
[0075] 4)随机模拟反射来源方向与背景方向上的光照情况,对初始选择的反射图像I′r(x)与背景图像I′t(x)进行动态范围调整:
[0076] Ir(x)=I′r(x)/b
[0077] It(x)=I′t(x)/b
[0078] 其中,b为随机选取的动态范围因子。
[0079] 5)合成用于训练参数预测网络的偏振图像Ipol(x)和非偏振图像Iunpol(x):
[0080]
[0081]
[0082] 基于上述描述,可以通过将预测值与真实值的均方误差作为损失函数值,并通过反向传播算法更新参数预测网络中各计算层权重,由此可得损失值计算公式如下:
[0083] Loss=(α-α*)2+(β-β*)2
[0084] 其中,α*和β*为选择的玻璃几何参数,α和β为参数预测网络模型输出的玻璃几何参数。
[0085] 需要说明的是,当图像组由一对不同偏振角度的偏振图像组成时,对用于训练参数预测网络的图像组的合成过程中,上述步骤1)、2)、4)的公式不变,针对步骤3)根据菲涅尔公式和斯涅耳定律分别计算用于训练参数预测网络的图像组中偏振片角度为φ1的偏振图像的混合系数ζ1(x)和偏振片角度为φ2的偏振图像的混合系数ζ2(x)的公式如下:
[0086]
[0087]
[0088] 针对步骤5)合成用于训练参数预测网络的图像组中两帧偏振图像Ipol1(x)和Ipol2(x)的公式如下:
[0089]
[0090]
[0091] 在步骤101中,通过本参数预测网络中的拼接层将该图像组中两帧图像沿RGB通道所在维度拼接构成第一输入张量,并输出给本参数预测网络中的卷积网络,通过所述卷积网络对第一输入张量进行卷积操作得到输出张量,并将输出张量拉伸为一维向量后输出给本参数预测网络中的全连接网络,通过所述全连接网络利用一维向量预测得到玻璃几何参数。
[0092] 其中,拼接构成的输入张量大小为b×c×h×w,b为批训练大小,c为通道数目,h为图像的高,w为图像的宽,如果图像组中的图像的高和宽不是h和w,需要将图像的高和宽处理为h和w,处理方式可以是下采样或中心裁剪。
[0093] 示例性的,卷积网络中可以包括7个卷积层,以提取得到高维特征表示张量,每个卷积层的卷积计算公式如下:
[0094]
[0095] 其中, 表示窗口大小为w的卷积核,d表示输出张量的通道数目,表示卷积操作,x表示输入张量获上层卷积层的输出,b为偏置项,BN(·)为批标准化操作,f为泄露线性整流函数(Leaky Rectified Linear Unit,LeakyReLU),y为通道数为d的张量,即卷积层提取得到的特征。
[0096] 示例性的,全连接网络中可以包括2个全连接层。
[0097] 在本发明中,参数预测网络预测得到的玻璃几何参数表征的是拍摄角度,即相机拍摄图像组时反射玻璃的位置和方向,玻璃几何参数可以包括玻璃的水平旋转参数α和垂直旋转参数β,即使原本与相机拍摄方向垂直的玻璃先绕竖直轴旋转α,再绕水平轴旋转β。
[0098] 示例性的,如图1B所示,用于拍摄偏振图像和非偏振图像的装置上安装有两个镜头,其中一个镜头前放置偏振片,用于拍摄偏振图像,另一个镜头前未放偏振片,用于拍摄非偏振图像。
[0099] 步骤102:利用玻璃几何参数确定该图像组中每帧图像上各像素点的混合系数。
[0100] 在一实施例中,可以利用玻璃几何参数确定该图像组中每帧图像上各像素点的入射角和使振动方向垂直或平行于入射面的光分量通过最多的第一偏振片角度,针对该图像组中的每帧图像,如果该帧图像为偏振图像,则利用该帧图像上各像素点的入射角、使振动方向垂直或平行于入射面的光分量通过最多的第一偏振片角度以及拍摄该帧图像时的第二偏振片角度确定该帧图像上各像素点的混合系数;如果该帧图像为非偏振图像,则利用该帧图像上各像素点的入射角确定该帧图像上各像素点的混合系数。
[0101] 基于上述步骤101的描述,玻璃几何参数包括玻璃的水平旋转参数α和垂直旋转参数β。
[0102] 对每帧图像上各像素点的混合系数详细计算原理,可以参见上述参数预测网络训练过程涉及到的相关计算公式,本申请在此不再详述。
[0103] 与上述现有技术相比,现有实现假设偏振图像的入射角均相同,而实际图像中各像素点对应的入射角都不同,因此现有实现与实际情况相差较大。并且现有实现使用互信息作为损失函数预测物理参数准确性和稳定性较差,对物理信息的依赖程度较高,物理信息的预测误差会后向积累,使分离出的背景图像和反射图像失真。
[0104] 而本发明对反射分离求解所需物理信息进行了更准确的描述,本发明引入成像模型推导了玻璃几何参数与入射角、使振动方向垂直或平行于于入射面的光分量通过最多的偏振片方向的关系,对入射角和入射面法线方向的分布进行了完整描述,可提升输出背景图像和反射图像的质量。另外,针对玻璃几何参数的网络架构,可以提升物理信息预测的准确度与稳定性,进而可进一步提升输出背景图像和反射图像的质量。
[0105] 步骤103:依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像。
[0106] 由上述步骤101所述,针对合成用于训练参数预测网络的偏振图像Ipol(x)和非偏振图像Iunpol(x)的公式:
[0107]
[0108]
[0109] 可以推导出反射图像Ir(x)和背景图像It(x)的公式如下:
[0110]
[0111]
[0112] 针对合成用于训练参数预测网络的偏振角度为φ1的偏振图像Ipol1(x)和偏振角度为φ2的偏振图像Ipol2(x)的公式:
[0113]
[0114]
[0115] 可以推导出反射图像Ir(x)和背景图像It(x)的公式如下:
[0116]
[0117]
[0118] 在一实施例中,在步骤103之后,还可以对分离出的反射图像和背景图像进行优化,以进一步提升图像质量。优化过程可以是:将该图像组中的两帧图像、分离出的反射图像和背景图像沿RGB通道所在维度拼接构成第二输入张量,将第二输入张量输入已训练的优化网络,以由所述优化网络对所述第二输入张量进行优化操作,得到优化后的反射图像和背景图像。
[0119] 示例性的,优化网络可以采用编码器-解码器的网络结构。
[0120] 针对优化网络的训练过程中的损失函数可以通过反射图像与背景图像的均方误差,以及反射图像梯度与背景图像梯度的均方误差加权方式表示,损失函数值计算公式如下:
[0121] Loss=
[0122] λ1(Ir-Ir*)2+λ2(It-It*)2+λ3(G(Ir)-G(Ir*))2
[0123] +λ4(G(It)-G(It*))2
[0124] 其中,λi,i=1,2,3,4,为各分量加权系数,G(·)为梯度算子,输出图像上每一像素点的梯度模值。
[0125] 针对上述步骤101至步骤103的过程,以输入偏振图像和非偏振图像为例,如图1C所示,将偏振图像和非偏振图像输入参数预测网络预测玻璃的水平旋转参数α和垂直旋转参数β,由水平旋转参数α和垂直旋转参数β计算得到每帧图像上各像素点的入射角θ和使振动方向垂直/平行于入射面的光分量通过最多的第一偏振片角度φ⊥/φ||,以及非偏振和偏振图像的混合系数ξ和ζ,进而依据这些参数分离出反射图像 和背景图像 并经过优化网络进行优化处理,输出最终的反射图像和背景图像。
[0126] 在一实施例中,在获得质量较高的背景图像后,该背景图像可以应用在更高层语义层面任务(如人脸识别、目标检测等任务)的处理中。
[0127] 在本实施例中,通过将同一视点场景的图像组输入已训练的参数预测网络,以由参数预测网络基于该图像组预测得到玻璃几何参数,然后利用玻璃几何参数确定该图像组中每帧图像上各像素点的混合系数,并依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像。其中,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振角度不同的偏振图像组成。
[0128] 基于上述描述可知,通过将输入图像减少到两帧图像,既可以是一对偏振与非偏振图像,也可以是一对偏振角度不同的图像,减小了数据获取的难度,能够在手机相机、监控设备等摄像设备中部署,扩大了算法应用范围。本方案充分利用了光的偏振特性,由预测得到的玻璃几何参数进行逐像素计算以实现图像的反射分离,可提升输出背景图像和反射图像的质量。
[0129] 图2为本发明根据一示例性实施例示出的一种电子设备的硬件结构图,该电子设备包括:通信接口201、处理器202、机器可读存储介质203和总线204;其中,通信接口201、处理器202和机器可读存储介质203通过总线204完成相互间的通信。处理器202通过读取并执行机器可读存储介质203中与图像反射分离方法的控制逻辑对应的机器可执行指令,可执行上文描述的图像反射分离方法,该方法的具体内容参见上述实施例,此处不再累述。
[0130] 本发明中提到的机器可读存储介质203可以是任何电子、磁性、光学或其它物理存储装置,可以包含或存储信息,如可执行指令、数据,等等。例如,机器可读存储介质可以是:易失存储器非易失性存储器或者类似的存储介质。具体地,机器可读存储介质203可以是RAM(Random Access Memory,随机存取存储器)、闪存、存储驱动器(如硬盘驱动器)、任何类型的存储盘(如光盘、DVD等),或者类似的存储介质,或者它们的组合。
[0131] 与前述图像反射分离方法的实施例相对应,本发明还提供了图像反射分离装置的实施例。
[0132] 图3为本发明根据一示例性实施例示出的一种图像反射分离装置的实施例流程图,所述图像反射分离装置可以应用到电子设备。如图3所示,所述图像反射分离装置包括:
[0133] 参数预测模块310,用于将同一视点场景的图像组输入已训练的参数预测网络,以由所述参数预测网络基于该图像组预测得到玻璃几何参数;
[0134] 混合系数确定模块320,用于利用所述玻璃几何参数确定该图像组中每帧图像上各像素点的混合系数;
[0135] 分离模块,用于依据每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像;
[0136] 其中,该图像组由一帧偏振图像和一帧非偏振图像组成,或者由两帧偏振角度不同的偏振图像组成。
[0137] 在一可选实现方式中,所述参数预测模块310,具体用于在由所述参数预测网络基于该图像组预测得到玻璃几何参数过程中,通过本参数预测网络中的拼接层将该图像组中两帧图像沿RGB通道所在维度拼接构成第一输入张量,并输出给本参数预测网络中的卷积网络;通过所述卷积网络对所述第一输入张量进行卷积操作得到输出张量,并将输出张量拉伸为一维向量后输出给本参数预测网络中的全连接网络;通过所述全连接网络利用所述一维向量预测得到玻璃几何参数。
[0138] 在一可选实现方式中,所述混合系数确定模块320,具体用于利用所述玻璃几何参数确定该图像组中每帧图像上各像素点的入射角和使振动方向垂直或平行于入射面的光分量通过最多的第一偏振片角度;针对该图像组中的每帧图像,如果该帧图像为偏振图像,则利用该帧图像上各像素点的入射角、使振动方向垂直或平行于入射面的光分量通过最多的第一偏振片角度以及拍摄该帧图像时的第二偏振片角度确定该帧图像上各像素点的混合系数;如果该帧图像为非偏振图像,则利用该帧图像上各像素点的入射角确定该帧图像上各像素点的混合系数。
[0139] 在一可选实现方式中,所述装置还包括(图3中未示出):
[0140] 优化模块,用于在所述分离模块330利用每帧图像上各像素点的混合系数和该图像组分离出反射图像和背景图像之后,将该图像组中的两帧图像、分离出的反射图像和背景图像沿RGB通道所在维度拼接构成第二输入张量;将所述第二输入张量输入已训练的优化网络,以由所述优化网络对所述第二输入张量进行优化操作,得到优化后的反射图像和背景图像。
[0141] 在一可选实现方式中,所述装置还包括(图3中未示出):
[0142] 训练模块,具体用于分别从反射图像集与背景图像集中选取一帧反射图像和一帧背景图像;随机选择一组玻璃几何参数,并利用选择的玻璃几何参数分别确定用于训练参数预测网络的图像组中每帧图像上各像素点的混合系数;对所述反射图像和所述背景图像分别进行动态范围调整,得到调整后的反射图像和调整后的背景图像;利用调整后的反射图像、调整后的背景图像以及图像组中每帧图像上各像素点的混合系数,合成用于训练参数预测网络的图像组;利用合成的图像组训练参数预测网络模型,直至损失值低于预设数值,停止训练;其中,所述损失值根据参数预测网络模型输出的玻璃几何参数和选择的玻璃几何参数获得。
[0143] 上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
[0144] 对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
[0145] 本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本发明的其它实施方案。本发明旨在涵盖本发明的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本发明的一般性原理并包括本发明未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本发明的真正范围和精神由下面的权利要求指出。
[0146] 还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0147] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈