首页 / 专利库 / 电脑图像 / 深度图 / 通用动量方法、基于通用动量方法的目标检测与识别方法

通用动量方法、基于通用动量方法的目标检测与识别方法

阅读:289发布:2020-05-11

专利汇可以提供通用动量方法、基于通用动量方法的目标检测与识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种通用动量方法、以及基于通用动量方法的目标检测与识别方法,包括:获取待检测与识别的样本图像;获取图像的目标候选区域;根据深度 卷积神经网络 提取目标候选区域的特征;采用通用动量方法,建立非光滑稀疏学习分类模型对提取的特征进行分类;根据分类效果,精调分类模型的参数;通过边界框回归 算法 重新 定位 目标边界框。本发明提出的通用动量方法泛化能 力 更强,使用个体输出的形式更有助于稀疏性地保持,并且能够自适应地调整分类模型的各项参数,对于不同类型的样本图像,均可以更好地提高R-CNN对于目标检测与识别的速度,具有更加普适的实践意义;另外,通过采用通用动量方法和精修候选框 位置 ,提高检测与识别的速率、成功率和准确率,普遍提高R-CNN对于目标检测与识别的速度。,下面是通用动量方法、基于通用动量方法的目标检测与识别方法专利的具体信息内容。

1.一种通用动量方法,适于目标检测与识别,其特征在于,所述通用动量方法包括:
S1:建立识别阶段非光滑稀疏学习分类模型:
其中,λ||w||1是正则化项,λ是正则化参数,w是优化权重向量; 是
hinge损失函数,l(w;(xi,yi))=max{0,1-yi};xi∈Rn是输入的特征向量,yi∈{+1,-
1}是第i个样例的类标。
S2:采用下述迭代公式以更新优化权重向量w,其迭代步骤为:
其中,η为步长,β为动量参数,s为自由参数, 为随机次梯度。通过设置动量项巧妙选取变步长 可以得到具有稀
疏性的个体输出解向量w。初始化 经过T次迭代最终得到更新优化权重向量wT;
S3:将分类模型表示为f(wT),对每一个特征向量进行分类,输出相应的类别。
2.根据权利要求1所述的通用动量方法,其特征在于,所述通用动量方法还包括:
S4:根据分类效果,精调非光滑稀疏学习分类模型的各项参数。
3.根据权利要求2所述的通用动量方法,其特征在于,步骤S4中,所述根据分类效果,精调非光滑稀疏学习分类模型的各项参数的过程包括:
获取分类结果的实际误差值,将实际误差值与预设的误差值阈值做比对,如果实际误差值大于误差值阈值,采用当前参数的非光滑稀疏学习分类模型作为最终分类模型,否则,重复步骤S1-S3,调整包括正则化参数λ、自由参数s在内的非光滑稀疏学习分类模型的各项参数,直至分类结果的实际误差值大于误差值阈值。
4.一种基于通用动量方法的目标检测与识别方法,其特征在于,所述目标检测与识别方法包括:
S101:获取待检测与识别的样本图像;
S102:获取样本图像的若干个目标候选区域;
S103:根据深度卷积神经网络提取每个目标候选区域的特征;
S104:采用如权利要求1-3任意一项中所述的通用动量方法,训练非光滑稀疏学习分类模型对提取的特征进行分类;
S105:根据分类效果,精调非光滑稀疏学习分类模型的各项参数;
S106:采用边界框回归算法重新定位目标边界框。
5.根据权利要求4所述的基于通用动量方法的目标检测与识别方法,其特征在于,步骤S102中,所述获取样本图像的若干个目标候选区域的过程包括以下步骤:
对接收的样本图像,采用选择搜索的策略,预先提取1k-2k个可能包含物体的候选区域作为目标候选区域,并缩放处理为一致的尺寸,得到固定大小的候选区域图像。
6.根据权利要求4所述的基于通用动量方法的目标检测与识别方法,其特征在于,步骤S103中,所述根据深度卷积神经网络提取每个目标候选区域的特征的过程包括以下步骤:
通过特征提取的CNN网络,针对每一个特征候选区得到一个固定长度的特征向量。
7.根据权利要求4所述的基于通用动量方法的目标检测与识别方法,其特征在于,步骤S106中,所述通过边界框回归算法重新定位目标边界框的过程包括以下步骤:
建立候选框位置评估的损失函数,即真实框的位置与有效候选框位置的回归器,根据二者的交叠面积是否大于某个设定的阈值来判别有效性,以完成候选框位置的精修。

说明书全文

通用动量方法、基于通用动量方法的目标检测与识别方法

技术领域

[0001] 本发明涉及目标检测与识别技术领域,具体而言涉及一种通用动量方法、以及基于通用动量方法的目标检测与识别方法。

背景技术

[0002] 传统目标检测与识别方法中使用的动量技术包括Heavy-ball型动量方法和NAG型动量方法两种,对于分类模型算法能够起到一定的加速效果,并且有助于保持算法的稳定性
[0003] 但这两种动量方法有其各自适用的条件。Heavy-ball型动量方法更多用于光滑强凸情况,NAG型动量方法更多用于光滑情况,两者在处理某些类别的样本图像时,并不能较大幅度地提升检测与识别速度,用户需要提前对样本图像的特征类型进行预判,以选择最适用的动量方法以达到预想的加速效果。另外,前述两种动量方法采用平均的输出方式,内存开销大,不具有稀疏性,对于非光滑情况的收敛速率提升帮助较小,用户需要针对非光滑情况另作处理。当目标检测过程中出现的特征类型较复杂时,处理过程将更加繁复困难。

发明内容

[0004] 针对前述问题,本发明目的在于提供一种通用动量方法、以及基于通用动量方法的目标检测与识别方法,以解决传统Heavy-ball型动量方法或NAG型动量方法对于某类样本图像检测与识别速度慢的问题。采用的通用动量方法泛化能更强,使用个体输出的形式更有助于稀疏性地保持,能够自适应地调整分类模型的各项参数,对于不同类型的样本图像,均可以更好地提高R-CNN对于目标检测与识别的速度,具有更加普适的实践意义。
[0005] 为达成上述目的,结合图1,本发明提出一种通用动量方法,适于目标检测与识别,所述通用动量方法包括:
[0006] S1:建立识别阶段非光滑稀疏学习分类模型:
[0007]
[0008] 其中,λ||w||1是正则化项,λ是正则化参数,w是优化权重向量;是hinge损失函数,l(w;(xi,yi))=max{0,1-yi};xi∈Rn是输入的特征向量,yi∈{+
1,-1}是第i个样例的类标。
[0009] S2:采用下述迭代公式以更新优化权重向量w,其迭代步骤为:
[0010]
[0011] 其中,η为步长,β为动量参数,s为自由参数, 为随机次梯度。通过设置动量项巧妙选取变步长 可以得到具有稀疏性的个体输出解向量w。初始化 经过T次迭代最终得到更新优化权重向量wT;
[0012] S3:将分类模型表示为f(wT),对每一个特征向量进行分类,输出相应的类别。
[0013] 进一步的实施例中,所述通用动量方法还包括:
[0014] S4:根据分类效果,精调非光滑稀疏学习分类模型的各项参数。
[0015] 进一步的实施例中,所述根据分类效果,精调非光滑稀疏学习分类模型的各项参数的过程包括:
[0016] 获取分类结果的实际误差值,将实际误差值与预设的误差值阈值做比对,如果实际误差值大于误差值阈值,采用当前参数的非光滑稀疏学习分类模型作为最终分类模型,否则,重复步骤S1-S3,调整包括正则化参数λ、自由参数s在内的非光滑稀疏学习分类模型的各项参数,直至分类结果的实际误差值大于误差值阈值。
[0017] 基于前述通用动量方法,本发明还提及一种基于通用动量方法的目标检测与识别方法,所述目标检测与识别方法包括:
[0018] S101:获取待检测与识别的样本图像;
[0019] S102:获取样本图像的若干个目标候选区域;
[0020] S103:根据深度卷积神经网络提取每个目标候选区域的特征;
[0021] S104:采用如权利要求1-3任意一项中所述的通用动量方法,训练非光滑稀疏学习分类模型对提取的特征进行分类;
[0022] S105:根据分类效果,精调非光滑稀疏学习分类模型的各项参数;
[0023] S106:采用边界框回归算法重新定位目标边界框。
[0024] 进一步的实施例中,步骤S102中,所述获取样本图像的若干个目标候选区域的过程包括以下步骤:
[0025] 对接收的样本图像,采用选择搜索的策略,预先提取1k-2k个可能包含物体的候选区域作为目标候选区域,并缩放处理为一致的尺寸,得到固定大小的候选区域图像。
[0026] 进一步的实施例中,步骤S103中,所述根据深度卷积神经网络提取每个目标候选区域的特征的过程包括以下步骤:
[0027] 通过特征提取的CNN网络,针对每一个特征候选区得到一个固定长度的特征向量。
[0028] 进一步的实施例中,步骤S106中,所述通过边界框回归算法重新定位目标边界框的过程包括以下步骤:
[0029] 建立候选框位置评估的损失函数,即真实框的位置与有效候选框位置的回归器,根据二者的交叠面积是否大于某个设定的阈值来判别有效性,以完成候选框位置的精修。
[0030] 以上本发明的技术方案,与现有相比,其显著的有益效果在于:
[0031] (1)采用的通用动量方法泛化能力更强,能够自适应地调整分类模型的各项参数,对于不同类型的样本图像,均可以更好地提高R-CNN对于目标检测与识别的速度,能够解决传统Heavy-ball型动量方法或NAG型动量方法对于某类样本图像检测与识别速度慢的问题,具有更加普适的实践意义。
[0032] (2)通用动量方法对于非光滑一般凸情况就能达到个体 的收敛速率,而且以个体输出的形式更能够保持稀疏性,适用性更强,应用范围更广。
[0033] (3)根据真实框的位置与有效候选框位置的交叠面积是否大于某个设定的阈值来判别有效性,完成候选框位置的精修,提高检测与识别的速率、成功率和准确率。
[0034] 应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。另外,所要求保护的主题的所有组合都被视为本公开的发明主题的一部分。
[0035] 结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征或有益效果将在下面的描述中显见,或通过根据本发明教导的具体实施方式的实践中得知。

附图说明

[0036] 附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:
[0037] 图1是本发明的通用动量方法的流程图
[0038] 图2是本发明的基于通用动量方法的目标检测与识别方法的流程图。
[0039] 图3是本发明的以单个样本图像为例的通用动量方法流程图。

具体实施方式

[0040] 为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
[0041] 结合图1,本发明提供了一种适用于目标检测与识别的通用动量方法,所述通用动量方法包括:
[0042] S1:建立识别阶段非光滑稀疏学习分类模型:
[0043]
[0044] 其中,λ||w||1是正则化项,λ是正则化参数,w是优化权重向量;是hinge损失函数,l(w;(xi,yi))=max{0,1-yi};xi∈Rn是输入的特征向量,yi∈{+
1,-1}是第i个样例的类标。
[0045] S2:采用下述迭代公式以更新优化权重向量w,其迭代步骤为:
[0046]
[0047] 其中,η为步长,β为动量参数,s为自由参数, 为随机次梯度。通过设置动量项 巧妙选取变步长 可以得到具有稀疏性的个体输出解向量w。初始化 经过T次迭代最终得到更新优化权重向量wT;
[0048] S3:将分类模型表示为f(wT),对每一个特征向量进行分类,输出相应的类别。
[0049] 优选的,所述通用动量方法还包括:
[0050] S4:根据分类效果,精调非光滑稀疏学习分类模型的各项参数。
[0051] 由前述可知,当更新非光滑稀疏学习分类模型的优化权重向量时,通过引入自由参数,可以根据特征类型、以提高收敛速率为优化目标自适应地对非光滑稀疏学习分类模型的各个子项参数(如随机梯度的权重等)进行调整,以达到适应多种不同特征类型图像处理的目的。
[0052] 更加优选的,步骤S4中,所述根据分类效果,精调非光滑稀疏学习分类模型的各项参数的过程包括:
[0053] 获取分类结果的实际误差值,将实际误差值与预设的误差值阈值做比对,如果实际误差值大于误差值阈值,采用当前参数的非光滑稀疏学习分类模型作为最终分类模型,否则,重复步骤S1-S3,调整包括正则化参数λ、自由参数s在内的非光滑稀疏学习分类模型的各项参数,直至分类结果的实际误差值大于误差值阈值。
[0054] 图3为本发明所提供的以单个样本图像为例的通用动量方法的流程图,包括:
[0055] 初始化正则化参数λ、自由参数s,优化权重向量 输入经CNN网络提取到的特征向量,采用通用动量方法,主要迭代步骤为:
[0056]
[0057] 经过K次迭代后得到优化权重向量wT后,非光滑稀疏学习分类模型就可以表示为f(wT),从而对每一个特征向量进行分类,输出相应的类别。根据分类效果,可以进一步精调分类模型的参数,达到更优的效果。
[0058] 实际上,本发明提及的通用动量方法在迭代中包含了Heavy-ball型动量方法和NAG型动量方法。例如,当s为0时,为Heavy-ball方法;当s为1时,为NAG方法。但本发明所提及的通用动量方法并不局限于此,对于非光滑情况也适用。在实际迭代过程中,会根据处理的图像类型自适应地调整s的取值,以自动选择最佳的非光滑稀疏学习分类模型参数。
[0059] 通过大量实践应用数据证明,通用动量方法对于非光滑一般凸情况就能达到个体的收敛速率,而且以个体输出的形式更能够保持稀疏性,适用性更强,应用范围更广。因此对于不同类型的样本图像,通用动量方法泛化能力更强,可以更好地提高R-CNN对于目标检测与识别的速度,具有更加普适的实践意义。
[0060] 图2为本发明所提供的基于通用动量方法的目标检测与识别方法的流程图,如图2所示,一种基于通用动量方法的目标检测与识别方法,包括:
[0061] 步骤101:获取待检测与识别的样本图像。
[0062] 步骤102:获取图像的目标候选区域。接收图像,采用选择搜索的策略(Selective Search),预先提取1k-2k个可能包含物体的候选区域,并缩放处理为一致的尺寸,得到固定大小的候选区域图像。
[0063] 步骤103:根据深度卷积神经网络提取目标候选区域的特征。通过特征提取的CNN网络,每一个特征候选区得到一个固定长度的特征向量。
[0064] 步骤104:采用前述通用动量方法,训练非光滑稀疏学习分类模型对特征进行分类。建立识别阶段非光滑稀疏学习分类模型, 其中,λ||w||1是正则化项,λ是正则化参数,w是优化权重向量; 是hinge损失函n
数,l(w;(xi,yi))=max{0,1-yi};xi∈R是输入的特征向量,yi∈{+1,-1}是第i个样例的类标。
[0065] 在更新w时,采用通用动量技术,其迭代步骤为:
[0066]
[0067] 其中,η为步长,β为动量参数,s为自由参数, 为随机次梯度。通过设置动量项巧妙选取变步长 可以得到具有稀疏性的个体输出解向量w。初始化 经过T次迭代最终得到更新优化权重向量wT;
[0068] 步骤105:根据分类效果,精调分类模型的参数。调整正则化参数λ、自由参数s。
[0069] 步骤106:通过边界框回归算法重新定位目标边界框。建立候选框位置评估的损失函数,即真实框的位置与有效候选框位置的回归器,根据二者的交叠面积是否大于某个设定的阈值来判别有效性,完成候选框位置的精修。通过对候选框位置的精修,能够进一步提高检测与识别的速率、成功率和准确率,结合前述通用动量方法,取得更好的检测与识别效果。
[0070] 在本公开中参照附图来描述本发明的各方面,附图中示出了许多说明的实施例。本公开的实施例不必定义在包括本发明的所有方面。应当理解,上面介绍的多种构思和实施例,以及下面更加详细地描述的那些构思和实施方式可以以很多方式中任意一种来实施,这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。
[0071] 虽然本发明已以较佳实施例揭露如上,然其并非用以限定本发明。本发明所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作各种的更动与润饰。因此,本发明的保护范围当视权利要求书所界定者为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈