首页 / 专利库 / 电信 / 跟踪 / 视频中目标物体的跟踪方法、装置、设备及存储介质

视频中目标物体的跟踪方法、装置、设备及存储介质

阅读:956发布:2020-05-08

专利汇可以提供视频中目标物体的跟踪方法、装置、设备及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种视频中目标物体的 跟踪 方法、装置、设备及存储介质,其中方法包括:根据当前 帧 图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图;目标区域为目标物体所在的区域;根据初始前景分割图、初始背景分割图、上一帧图像的前背景分割图确定非待定区域和待定区域;针对待定区域的每个 像素 的像素 位置 和像素值,确定每个像素的像素类别;将非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像作为当前帧图像跟踪的目标区域对应的前背景分割图。,下面是视频中目标物体的跟踪方法、装置、设备及存储介质专利的具体信息内容。

1.一种视频中目标物体的跟踪方法,其特征在于,包括:
根据当前图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图;所述目标区域为目标物体所在的区域;
根据所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图确定非待定区域和待定区域;其中,所述非待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别一致的像素所组成的区域,所述待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别不一致的像素所组成的区域;所述像素类别包括前景、背景;
针对所述待定区域的每个像素的像素位置和像素值,确定所述每个像素的像素类别;
将所述非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像作为当前帧图像跟踪的目标区域对应的前背景分割图。
2.根据权利要求1所述的方法,其特征在于,所述根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图,包括:
根据所述当前帧图像的特征点、所述上一帧图像的目标区域的特征点和所述上一帧图像的前背景分割图确定前景空间变换信息和背景空间变换信息;
根据所述前景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始前景分割图;
根据所述背景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始背景分割图。
3.根据权利要求2所述的方法,其特征在于,根据所述当前帧图像的特征点、所述上一帧图像的目标区域的特征点和所述上一帧图像的前背景分割图确定前景空间变换信息和背景空间变换信息包括:
将所述当前帧图像的特征点与所述上一帧图像的目标区域的特征点进行匹配,得到多个特征点对;其中,每一特征点对包括:位于所述当前帧图像的特征点和在所述上一帧图像的目标区域中与该特征点匹配的特征点;
根据所述上一帧图像的前背景分割图对所述多个特征点对进行划分,得到前景特征点对和背景特征点对;
根据所述前景特征点对,得到所述前景空间变换信息;
根据所述背景特征点对,得到所述背景空间变换信息。
4.根据权利要求2所述的方法,其特征在于,根据所述前景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始前景分割图包括:
将所述上一帧图像的前背景分割图与所述前景空间变换信息进行运算,得到所述初始前景分割图;
根据所述背景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始背景分割图包括:
将所述上一帧图像的前背景分割图与所述背景空间变换信息进行运算,得到所述初始背景分割图。
5.根据权利要求3所述的方法,其特征在于,所根据所述上一帧图像的前背景分割图对所述多个特征点对进行划分,得到前景特征点对和背景特征点对,包括:
根据每一所述特征点对中位于上一帧图像的目标区域中的特征点在所述上一帧图像的前背景分割图中所对应的位置,将对应特征点对划分为待选前景特征点对或者待选背景特征点对;
分别剔除所述待选前景特征点对和所述待选背景特征点对中噪声特征点对,以分别得到所述前景特征点对和所述背景特征点对。
6.一种视频中目标物体的跟踪装置,其特征在于,包括:
第一确定模,用于根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图;所述目标区域为目标物体所在的区域;
第二确定模块,用于根据所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图确定非待定区域和待定区域;其中,所述非待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别一致的像素所组成的区域,所述待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别不一致的像素所组成的区域;所述像素类别包括前景、背景;
第三确定模块,用于针对所述待定区域的每个像素的像素位置和像素值,确定所述每个像素的像素类别;
第四确定模块,用于将所述非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像作为当前帧图像跟踪的目标区域对应的前背景分割图。
7.根据权利要求6所述的装置,其特征在于,所述第一确定模块具体用于:
根据所述当前帧图像的特征点、所述上一帧图像的目标区域的特征点和所述上一帧图像的前背景分割图确定前景空间变换信息和背景空间变换信息;
根据所述前景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始前景分割图;
根据所述背景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始背景分割图。
8.根据权利要求7所述的装置,其特征在于,第一确定模块具体用于:将所述当前帧图像的特征点与所述上一帧图像的目标区域的特征点进行匹配,得到多个特征点对;其中,每一特征点对包括:位于所述当前帧图像的特征点和在所述上一帧图像的目标区域中与该特征点匹配的特征点;
根据所述上一帧图像的前背景分割图对所述多个特征点对进行划分,得到前景特征点对和背景特征点对;
根据所述前景特征点对,得到所述前景空间变换信息;
根据所述背景特征点对,得到所述背景空间变换信息。
9.一种电子设备,其特征在于,所述电子设备包括如权利要求6-8中任一项所述的装置;或者,
包括存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于从所述存储器中调用所述计算机指令,以执行如权利要求1-5中任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-5中任一项所述的方法。

说明书全文

视频中目标物体的跟踪方法、装置、设备及存储介质

技术领域

[0001] 本发明涉及图像处理技术领域,更具体地,涉及一种视频中目标物体的跟踪方法、一种视频中目标物体的跟踪装置、一种电子设备以及一种计算机可读存储介质。

背景技术

[0002] 视频中目标物体的跟踪已经成为计算机视觉中一项重要的任务,被越来越广泛的应用。其中。视频中目标物体的跟踪指的是,在一个视频中能够对指定的目标物体进行持续跟踪。
[0003] 目前,在实现视频中的目标物体的跟踪时,通常使用深度学习的方法。比如,可以通过训练好的深度学习模型,识别视频的每一图像中目标物体所在的矩形区域,进而达到跟踪视频中的目标物体的跟踪的目的。
[0004] 但是,利用深度学习的方法实现视频中目标物体的跟踪时,只能识别出视频的每一帧图像中目标物体大致所在的矩形区域,即通过深度学习的方法只能对视频中目标物体进行粗略跟踪,这样使得跟踪不够精确。

发明内容

[0005] 本发明的一个目的是提供一种新的视频中目标物体的跟踪方案。
[0006] 根据本发明的第一方面,提供了一种视频中目标物体的跟踪方法,包括:
[0007] 根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图;所述目标区域为目标物体所在的区域;
[0008] 根据所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图确定非待定区域和待定区域;其中,所述非待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别一致的像素所组成的区域,所述待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别不一致的像素所组成的区域;所述像素类别包括前景、背景;
[0009] 针对所述待定区域的每个像素的像素位置和像素值,确定所述每个像素的像素类别;
[0010] 将所述非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像作为当前帧图像跟踪的目标区域对应的前背景分割图。
[0011] 可选的,所述根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图,包括:
[0012] 根据所述当前帧图像的特征点、所述上一帧图像的目标区域的特征点和所述上一帧图像的前背景分割图确定前景空间变换信息和背景空间变换信息;
[0013] 根据所述前景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始前景分割图;
[0014] 根据所述背景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始背景分割图。
[0015] 可选的,根据所述当前帧图像的特征点、所述上一帧图像的目标区域的特征点和所述上一帧图像的前背景分割图确定前景空间变换信息和背景空间变换信息包括:
[0016] 将所述当前帧图像的特征点与所述上一帧图像的目标区域的特征点进行匹配,得到多个特征点对;其中,每一特征点对包括:位于所述当前帧图像的特征点和在所述上一帧图像的目标区域中与该特征点匹配的特征点;
[0017] 根据所述上一帧图像的前背景分割图对所述多个特征点对进行划分,得到前景特征点对和背景特征点对;
[0018] 根据所述前景特征点对,得到所述前景空间变换信息;
[0019] 根据所述背景特征点对,得到所述背景空间变换信息。
[0020] 可选的,根据所述前景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始前景分割图包括:
[0021] 将所述上一帧图像的前背景分割图与所述前景空间变换信息进行运算,得到所述初始前景分割图;
[0022] 根据所述背景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始背景分割图包括:
[0023] 将所述上一帧图像的前背景分割图与所述背景空间变换信息进行运算,得到所述初始背景分割图。
[0024] 可选的,所根据所述上一帧图像的前背景分割图对所述多个特征点对进行划分,得到前景特征点对和背景特征点对,包括:
[0025] 根据每一所述特征点对中位于上一帧图像的目标区域中的特征点在所述上一帧图像的前背景分割图中所对应的位置,将对应特征点对划分为待选前景特征点对或者待选背景特征点对;
[0026] 分别剔除所述待选前景特征点对和所述待选背景特征点对中噪声特征点对,以分别得到所述前景特征点对和所述背景特征点对。
[0027] 根据本发明的第二方面,提供了一种视频中目标物体的跟踪装置,包括:
[0028] 第一确定模,用于根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图;所述目标区域为目标物体所在的区域;
[0029] 第二确定模块,用于根据所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图确定非待定区域和待定区域;其中,所述非待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别一致的像素所组成的区域,所述待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别不一致的像素所组成的区域;所述像素类别包括前景、背景;
[0030] 第三确定模块,用于针对所述待定区域的每个像素的像素位置和像素值,确定所述每个像素的像素类别;
[0031] 第四确定模块,用于将所述非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像作为当前帧图像跟踪的目标区域对应的前背景分割图。
[0032] 可选的,所述第一确定模块具体用于:
[0033] 根据所述当前帧图像的特征点、所述上一帧图像的目标区域的特征点和所述上一帧图像的前背景分割图确定前景空间变换信息和背景空间变换信息;
[0034] 根据所述前景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始前景分割图;
[0035] 根据所述背景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始背景分割图。
[0036] 可选的,第一确定模块具体用于:将所述当前帧图像的特征点与所述上一帧图像的目标区域的特征点进行匹配,得到多个特征点对;其中,每一特征点对包括:位于所述当前帧图像的特征点和在所述上一帧图像的目标区域中与该特征点匹配的特征点;
[0037] 根据所述上一帧图像的前背景分割图对所述多个特征点对进行划分,得到前景特征点对和背景特征点对;
[0038] 根据所述前景特征点对,得到所述前景空间变换信息;
[0039] 根据所述背景特征点对,得到所述背景空间变换信息。
[0040] 根据本发明的第三方面,提供了一种电子设备,所述电子设备包括如第二方面中任一项所述的装置;或者,
[0041] 包括存储器和处理器,所述存储器用于存储计算机指令,所述处理器用于从所述存储器中调用所述计算机指令,以执行如第一方面中任一项所述的方法。
[0042] 根据本发明的第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现根据第一方面中任一项所述的方法。
[0043] 在本实施例中,由于本实施例提供的视频中目标物体的跟踪方法,在根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图后,将在初始前景分割图、初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别一致的像素所组成的区域作为非待定区域,即一个确定的区域。而将初始前景分割图、初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别不一致的像素所组成的区域作为待定区域,即一个不确定的区域。进一步的针对待定区域的每个像素的像素位置和像素值,确定每个像素的像素类别,以实现对待定区域的每一个像素的类别进行精准的划分。因此,非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像为当前帧图像跟踪的目标区域对应的精准的前背景分割图,实现了像素级别的精确的目标区域的前背景分割图,进而可以得到精确的目标区域,进而使得跟踪更加精确。
[0044] 通过以下参照附图对本发明的示例性实施例的详细描述,本发明的其它特征及其优点将会变得清楚。

附图说明

[0045] 被结合在说明书中并构成说明书的一部分的附图示出了本发明的实施例,并且连同其说明一起用于解释本发明的原理。
[0046] 图1是本发明实施例提供的一种用于实现视频中目标物体的跟踪方法电子设备的硬件配置的框图
[0047] 图2是本发明实施例提供的一种视频中目标物体的跟踪方法的流程图
[0048] 图3是本发明实施例提供的一种上一帧图像的前背景分割图的示意图;
[0049] 图4是本发明实施例提供的一种通过SIFT算法获取到的当前帧图像的特征点的示意图;
[0050] 图5是本发明实施例提供的一种根据视频的当前帧图像的特征点和上一帧图像目标区域的的特征点,得到的特征点对的示意图;
[0051] 图6是本发明实施例提供的一种当前帧图像的初始前景分割图和初始背景分割图的示意图;
[0052] 图7是本发明实施例提供的一种包含待定区域和非待定区域的当前帧图像的示意图;
[0053] 图8是本发明实施例提供的一种当前帧图像的前背景分割图的示意图;
[0054] 图9是本发明实施例提供的一种剩余虚拟图像的显示效果的示意图;
[0055] 图10是本发明实施例提供的另一种剩余虚拟图像的显示效果的示意图;
[0056] 图11是本发明实施例提供的一种视频中目标物体的跟踪装置的结构示意图;
[0057] 图12是本发明实施例提供的一种电子设备的结构示意图。

具体实施方式

[0058] 现在将参照附图来详细描述本发明的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本发明的范围。
[0059] 以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本发明及其应用或使用的任何限制。
[0060] 对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为说明书的一部分。
[0061] 在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
[0062] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
[0063] <硬件配置>
[0064] 图1是可用于实现本发明任意实施例的视频中目标物体的跟踪方法的电子设备的硬件配置的框图。
[0065] 电子设备1000可以是手机、便携式电脑、平板电脑、掌上电脑、AR眼镜、AR头盔等等电子设备。
[0066] 电子设备1000可以包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500、输入装置1600、扬声器1700、麦克1800,等等。其中,处理器1100可以是中央处理器CPU、微处理器MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘非易失性存储器等。接口装置1300例如包括USB接口、机接口等。通信装置1400例如能够进行有线或无线通信。显示装置1500例如是液晶显示屏、触摸显示屏等。输入装置1600例如可以包括触摸屏键盘等。用户可以通过扬声器1700和麦克风1800输入/输出语音信息。
[0067] 尽管在图1中对电子设备1000均示出了多个装置,但是,本发明可以仅涉及其中的部分装置,例如,电子设备1000只涉及存储器1200和处理器1100。
[0068] 应用于本发明的实施例中,电子设备1000的所述存储器1200用于存储指令,所述指令用于控制所述处理器1100执行本发明实施例提供的视频中目标物体的跟踪方法。在上述描述中,技术人员可以根据本发明所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
[0069] <方法实施例>
[0070] 如图2所示,本实施例提供了一种视频中目标物体的跟踪方法,该方法包括如下S2100-S2400:
[0071] S2100、根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图。
[0072] 其中,目标区域为目标物体所在的区域。
[0073] 在本实施例中,上一帧图像的前背景分割图指的是,在上一帧图像为当前帧图像时,执行本发明实施例中任一项视频中目标物体的跟踪方法得到当前帧图像中追踪目标区域对应的前背景分割图。
[0074] 另外,为了下述描述简洁,将追踪目标区域对应的前背景分割图,直接称为前背景分割图。
[0075] 在一个示例中,上一帧图像的前背景分割图可如图3所示。
[0076] 另外,前背景分割图为包含前景遮挡的目标物体的图像的分割图。需要说明是,一般追踪的目标物体是背景区域,当追踪的目标物体存在遮挡时,遮挡部分则是前景区域。
[0077] 前背景分割图中属于前景区域的像素的像素值,不同于背景区域的像素的像素值。例如,通常将前背景分割图中属于前景区域的像素的像素值设置为0,而将前背景的分割图中属于背景区域的像素的像素值设置为255。
[0078] 同时,前景分割图指的是前景遮挡的图像的分割图,背景分割图指的是目标物体的图像中除过前景遮挡的图像外的图像的分割图。
[0079] 通常,前景分割图中属于前景图像的区域被显示突出。在一个例子中,前景分割图中属于前景图像的区域对应的像素的像素值可设置为255,前景分割图中除过前景图像以外的区域对应的像素的像素值可设置为0。
[0080] 对应的,背景分割图中属于背景的区域被显示突出。背景分割图中属于背景图像的区域对应的像素的像素值可设置为255,背景分割图中除过背景图像以外的区域对应的像素的像素值可设置为0。
[0081] 在一个例子中,当目标物体为一个被行人遮挡的地图指示牌的情况下,目标区域为地图指示牌在对应帧图像中的区域。前背景分割图为被行人遮挡的地图指示牌的图像的分割图。前景分割图为地图指示牌对应区域内行人图像的分割图,例如为一个将地图指示牌对应区域内行人图像的像素的像素值设置为255,将地图指示牌对应区域内除行人图像外的图像的像素的像素值设置为0的图像。
[0082] 对应的,背景分割图为地图指示牌对应区域中出行人图像外的图像的分割图。例如为一个将地图指示牌对应区域内行人图像的像素的像素值设置为0,将地图指示牌对应区域内除行人图像外的图像的像素的像素值设置为255的图像。
[0083] 需要说明的是,在本实施例中,针对与第一帧图像来说,第一帧图像中可以是无前景遮挡,通过人工介入的方式标定出第一帧图像中目标区域。在一个例子中,当目标物体为视频中的一个矩形物体时,可以在视频的第一帧图像中标定出该矩形物体的四个顶点
[0084] 在一个实施例中,上述S2100可具体通过如下S2110-S2130来实现:
[0085] S2110、根据当前帧图像的特征点、上一帧图像的目标区域的特征点和上一帧图像的前背景分割图确定前景空间变换信息和背景空间变换信息。
[0086] 在一个实施例中,获取当前帧图像的特征点具体实现方式可以:将当前帧图像输入至SIFT(Scale Invariant Feature Transform;尺度不变特征变换)算法,或者SURF(Speeded-Up Robust Features;加速稳健特征)算法中,以得到当前帧图像的特征点。
[0087] 需要说明的是,特征点可以是图像中比较突出的点,比如可以是不会因光照、仿射变换和噪音等因素而变化的点,具体的,可以是点、边缘点、暗区的亮点或亮区的暗点等,并不限于此。
[0088] 在一个示例中,将当前帧图像输入至SIFT算法得到的当前帧图像的特征点可如图4所示。其中,图4中所示的圆圈大小对应于特征点尺度的大小,圆圈中的线代表的是特征点的方向,圆圈的圆心代表的是特征点对应的位置。
[0089] 需要说明的是,获取上一帧图像的目标区域的特征点的方式,与上述获取上述当前帧图像的特征点的方式相同,这里不再赘述。
[0090] 在一个实施例中,上述S2110的具体实现可以为如下的S2111-S2114来实现:
[0091] S2111、将当前帧图像的特征点与上一帧图像的目标区域的特征点进行匹配,得到多个特征点对。
[0092] 其中,每一特征点对包括:位于当前帧图像的特征点和在上一帧图像的目标区域中与该特征点匹配的特征点。
[0093] 在一个实施例中,每一个特征点具体包括:位于当前帧图像的特征点,和在上一帧图像的目标区域中与该特征点在向量空间上距离最近的特征点。
[0094] 在本实施例中,由于每一特征点对中的位于当前帧图像的特征点,和在上一帧图像的目标区域中的特征点是相匹配的,这说明每对特征点中的当前帧图像的特征点,与上一帧图像的目标区域中特征点是相似的。基于此,在特征点对中的特征点对应有坐标信息,即对应有空间位置信息的基础上,根据上述S2111得到的特征点对可以反映出当前帧图像的与上一帧图像的目标区域之间的空间位置关系。
[0095] 需要说明的是,本实施例涉及到的特征点可以对应有以下至少之一相关信息:特征点的尺度、特征点的坐标、特征点的方向、特征点对应的像素的像素值。
[0096] S2112、根据上一帧图像的前背景分割图对多个特征点对进行划分,得到前景特征点对和背景特征点对。
[0097] 在本实施例中,针对于基于上述S2111得到的每一对特征点对,若该特征点对中属于上一帧图像的特征点,位于上一帧图像的前背景分割图中的前景区域内时,则将该特征点对划分为前景特征点对。
[0098] 对应的,若该特征点对中属于上一帧图像的特征点,位于上一帧图像的前背景分割图中的背景区域内,将该特征点对划分为背景特征点对。
[0099] 在一个示例中,基于上述S2112得到的特征点对可如图5所示。其中,连线的两端对应于一对特征点对。
[0100] S2113、根据前景特征点对,得到前景空间变换信息。
[0101] S2114、根据背景特征点对,得到背景空间变换信息。
[0102] 在本实施例中,前景空间变换信息指的是,当前帧图像的前景分割图,相对于上一帧图像的前背景分割图的空间变换信息。对应的,背景空间变换信息指的是,当前帧图像的背景分割图,相对于上一帧图像的前背景分割图的空间变换信息。
[0103] 在一个实施例中,上述S2113和S2114可通过透射变换的方法来实现。此时,上述的空间变换信息可通过一个可反映出平移和旋转的相关信息的变换矩阵来表示。
[0104] 在一个实施例中,可根据基于上述2113和S2114得到的特征点对中的部分特征点对,分别通过例如透射变换的方法来确定上述的前景空间变换信息和背景空间变换信息。
[0105] 例如,在该实施例中,以上述S2113为例,可从基于上述S2112得到的前景特征点对中随机的抽取出不少以4对特征点对,以通过例如透射变换的方法来确定前景空间变换信息。
[0106] 在另一个实施例中,可根据基于上述S2113得到的所有特征点对,通过例如透射变换的方法来确定前景空间变换信息。
[0107] 在一个例子中,当根据不少于4对特征点对,以通过透射变换的方法来确定前景空间变换时,结合最小二乘法以得到更为准确的空间变换信息。
[0108] S2120、根据前景空间变换信息、上一帧图像的前背景分割图,确定初始前景分割图。
[0109] 在一个实施例中,上述S2120的具体实现方式可以为如下的S2121:
[0110] S2121、上一帧图像的前背景分割图与前景空间变换信息进行运算,得到初始前景分割图。
[0111] 在一个实施例中上述S2121的具体实现可以为:将上一帧图像的前背景分割图与反映前景空间变换信息的变换矩阵进行叉乘,得到初始前景分割图。
[0112] S2130、根据背景空间变换信息、上一帧图像的前背景分割图,确定初始背景分割图。
[0113] 在一个实施例中,上述的S2130的具体实现可以为如下的S2131:
[0114] S2131、将上一帧图像的前背景分割图与背景空间变换信息进行运算,得到所述初始背景分割图。
[0115] 在一个实施例中上述S2131的具体实现可以为:将上一帧图像的前背景分割图与反映背景空间变换信息的变换矩阵进行叉乘,得到初始背景分割图。
[0116] 需要说明的是,由于空间变换信息可反映出平移和旋转的相关信息,因此,上述S2120得到的初始前景分割图和上述和S2130得到初始背景分割图中也包含有平移和旋转的相关信息,即包含有位姿信息。
[0117] 在本实施例中,由于是独立的确定出前景变换信息和背景变换信息,这样可排除前景和背景之间的相互干扰,从而得到两个精确的空间变换信息,从而提高确定出的初始背景分割图和初始前景分割图的精准度,进而可以提高最终得到的前背景分割图的精确度。
[0118] 在一个示例中,当前帧图像的初始前景分割图(左)、当前帧图像的初始背景分割图(右)可如图6所示。
[0119] S2200、根据初始前景分割图、初始背景分割图、上一帧图像的前背景分割图确定非待定区域和待定区域;其中,非待定区域为初始前景分割图、初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别一致的像素所组成的区域,待定区域为初始前景分割图、初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别不一致的像素所组成的区域;像素类别包括前景、背景。
[0120] 在一个实施例中,上述S2200的具体实现可以为:以初始前景分割图的每一像素为基准,在对应像素在初始前景分割图中属于前景,以及在初始背景分割图中与对应像素的像素位置相同像素属于前景,以及在上一帧图像的前背景分割图中与对应像素的像素位置相同像素属于前景,的情况下,将对应像素作为前景像素
[0121] 在对应像素在初始前景分割图中属于背景,以及在初始背景分割图中与对应像素的像素位置相同像素属于背景,以及在上一帧图像的前背景分割图中与对应像素的像素位置相同像素属于背景,的情况下,将对应像素作为背景像素
[0122] 将初始前景分割图中,除过前景像素和背景像素以外的像素作为待定像素。
[0123] 基于上述内容,将前景像素、背景像素组成的区域作为非待定区域。将待定像素组成的区域作为待定区域。
[0124] 在一个示例中,当前帧图像的非待定区域和待定区域可如图7所示。
[0125] S2300、针对待定区域的每个像素的像素位置和像素值,确定每个像素的像素类别。
[0126] 在一种实施例中,可采用图切算法实现上述的S2300。具体的,将前景像素、背景像素,设置为图切算法的先验信息。然后将待定区域的每个像素输入至设置有先验信息的图切算法中,由图切算法输出对应像素的类别。
[0127] S2400、将非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像作为当前帧图像跟踪的目标区域对应的前背景分割图。
[0128] 在一个示例中,当前帧图像的前背景分割图如8所示。将图8与图7、图4相比,可明显的看出,图8为一个当前帧图像的前背景分割图,
[0129] 在本实施例中,由于本实施例提供的视频中目标物体的跟踪方法,在根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图后,将在初始前景分割图、初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别一致的像素所组成的区域作为非待定区域,即一个确定的区域。而将初始前景分割图、初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别不一致的像素所组成的区域作为待定区域,即一个不确定的区域。进一步的针对待定区域的每个像素的像素位置和像素值,确定每个像素的像素类别,以实现对待定区域的每一个像素的类别进行精准的划分。因此,非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像为当前帧图像跟踪的目标区域对应的精准的前背景分割图,实现了像素级别的精确的目标区域的前背景分割图,进而可以得到精确的目标区域,进而使得跟踪更加精确。
[0130] 在上述任一实施例的基础上,本实施例提供的视频中目标物体的跟踪方法在上述S2112可具体通过如下S2112-1和S2112-2来实现:
[0131] S2112-1、根据每一特征点对中位于上一帧图像的目标区域中的特征点在上一帧图像的前背景分割图中所对应的位置,将对应特征点对划分为待选前景特征点对或者待选背景特征点对。
[0132] 在本实施例中,上述S2112-1的具体实现可以为:
[0133] 若该特征点对中属于上一帧图像的特征点,位于上一帧图像的前背景分割图中的前景区域内时,则将该特征点对划分为待选前景特征点对。
[0134] 对应的,若该特征点对中属于上一帧图像的特征点,位于上一帧图像的前背景分割图中的背景区域内,将该特征点对划分为待选背景特征点对。
[0135] S2112-2、分别剔除待选前景特征点对和待选背景特征点对中噪声特征点对,以分别得到前景特征点对和背景特征点对。
[0136] 在一个实施例中,上述S2112-2的具体实现可以为,将待选前景特征点对和待选背景特征点对分别输入至RANSAC(Random Sample Consesus;随机采样一致性)算法中,以分别得到前景特征点对和背景特征点对。
[0137] 在本实施例中,通过提出噪声特点点对,可得到精准的前景特征点对和背景特征点对。
[0138] 在上述任一实施例的基础上,可根据当前帧的前背景图像,可直接区分出目标区域的前景区域和背景区域。基于此,可直接得到具体的背景区域和具体的前景区域。此时,可从与目标区域大小相同的虚拟图像,裁剪掉与前景区域在目标区域中位置、大小相同的部分虚拟图像,然后将裁剪后的剩余虚拟图像显示在背景区域。在一个示例中,对剩余虚拟图像的显示效果可如图9或10所示。
[0139] <装置实施例>
[0140] 本实施例提供了一种视频中目标物体的跟踪装置3000,如图11所示,该装置3000包括第一确定模块3100、第二确定模块3200、第三确定模块3300、第四确定模块3400。
[0141] 第一确定模块3100,用于根据当前帧图像、上一帧图像的目标区域和上一帧图像的前背景分割图确定当前帧图像中跟踪的目标区域对应的初始前景分割图、初始背景分割图;所述目标区域为目标物体所在的区域;
[0142] 第二确定模块3200,用于根据所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图确定非待定区域和待定区域;其中,所述非待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别一致的像素所组成的区域,所述待定区域为所述初始前景分割图、所述初始背景分割图、上一帧图像的前背景分割图中相同像素位置处的像素类别不一致的像素所组成的区域;所述像素类别包括前景、背景;
[0143] 第三确定模块3300,用于针对所述待定区域的每个像素的像素位置和像素值,确定所述每个像素的像素类别;
[0144] 第四确定模块3400,用于将所述非待定区域和确定像素类别后的待定区域中、像素类别为前景的像素和像素类别为背景的像素组成的图像作为当前帧图像跟踪的目标区域对应的前背景分割图。
[0145] 在一个实施例中,所述第一确定模块3100具体用于:
[0146] 根据所述当前帧图像的特征点、所述上一帧图像的目标区域的特征点和所述上一帧图像的前背景分割图确定前景空间变换信息和背景空间变换信息;
[0147] 根据所述前景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始前景分割图;
[0148] 根据所述背景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始背景分割图。
[0149] 在一个实施例中,第一确定模块3100具体用于:将所述当前帧图像的特征点与所述上一帧图像的目标区域的特征点进行匹配,得到多个特征点对;其中,每一特征点对包括:位于所述当前帧图像的特征点和在所述上一帧图像的目标区域中与该特征点匹配的特征点;
[0150] 根据所述上一帧图像的前背景分割图对所述多个特征点对进行划分,得到前景特征点对和背景特征点对;
[0151] 根据所述前景特征点对,得到所述前景空间变换信息;
[0152] 根据所述背景特征点对,得到所述背景空间变换信息。
[0153] 在一个实施例中,第一确定模块3100具体用于:
[0154] 将所述上一帧图像的前背景分割图与所述前景空间变换信息进行运算,得到所述初始前景分割图;
[0155] 根据所述背景空间变换信息、所述上一帧图像的前背景分割图,确定所述初始背景分割图包括:
[0156] 将所述上一帧图像的前背景分割图与所述背景空间变换信息进行运算,得到所述初始背景分割图。
[0157] 在一个实施例中,第一确定模块3100具体用于:
[0158] 根据每一所述特征点对中位于上一帧图像的目标区域中的特征点在所述上一帧图像的前背景分割图中所对应的位置,将对应特征点对划分为待选前景特征点对或者待选背景特征点对;
[0159] 分别剔除所述待选前景特征点对和所述待选背景特征点对中噪声特征点对,以分别得到所述前景特征点对和所述背景特征点对。
[0160] <设备实施例>
[0161] 如图12所示,本实施例提供了一种电子设备4000,该电子设备4000包括上一实施例提供的视频中目标物体的跟踪装置3000。或者,该电子设备包括存储器4100和处理器4200。其中,所述存储器4100用于存储计算机指令,所述处理器4200用于从所述存储器4100中调用所述计算机指令,以执行如上述方法实施例中任一项所述的视频中目标物体的跟踪方法。
[0162] <计算机可读存储介质>
[0163] 本实施例了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序在被处理器执行时实现如上述方法实施例中任一项所述的视频中目标物体的跟踪方法。
[0164] 本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面的计算机可读程序指令。
[0165] 计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号
[0166] 这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0167] 用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本发明的各个方面。
[0168] 这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0169] 这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0170] 也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0171] 附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
[0172] 以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本发明的范围由所附权利要求来限定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈