专利汇可以提供基于强化学习和双线性卷积网络的车型识别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 强化学习 和双线性卷积网络的车型识别方法,构建深度网络模型,设置细粒度分类网络的超参数并初始化网络;建立优化显著性特征的 马 尔科夫决策模型;对数据集进行尺度变换;优化注意 力 区域:在细粒度分类网络参数固定的情况下,将数据集输入细粒度分类网络,并采用强化学习 算法 优化显著性区域,选择最优的注意力区域;建立对细粒度分类网络参数进行更新的损失函数;融合特征后重复训练网络直到注意力区域不再变化为止;采用需要测试的车型图像输入到训练完成的模型中,获得相应的检测结果。本发明利用强化学习网络来提取底层的显著性特征,并通过双线性插值法来对高层语义特征和低层的显著性特征进行融合提高识别准确率。,下面是基于强化学习和双线性卷积网络的车型识别方法专利的具体信息内容。
1.一种基于强化学习和双线性卷积网络的车型识别方法,其特征在于,包括以下步骤:
(1)构建深度网络模型:构建用于进行车辆识别的基于强化学习和双线性卷积网络的细粒度分类网络;
(2)设置细粒度分类网络的超参数:所述超参数包括网络的学习率、迭代次数和批量大小;
(3)初始化网络:初始化细粒度分类网络的权值和阈值;
(4)建立优化显著性特征的马尔科夫决策模型;
(5)预处理数据集:对数据集进行尺度变换;
(6)优化注意力区域:在细粒度分类网络参数固定的情况下,将数据集输入细粒度分类网络,并采用强化学习算法优化显著性区域,选择最优的注意力区域;
(7)构造损失函数:建立对细粒度分类网络参数进行更新的损失函数,损失函数的定义为数据的真实标签与数据的预测标签的误差平方和;
(8)融合特征:对数据集中的每个数据,利用步骤(6)优化的注意力区域和第五卷积层的特征,可以得到最终融合的结果,并用于进行分类;
(9)训练网络:在固定最优注意力区域的情况下,利用数据集并采用梯度下降方法对细粒度分类网络再次训练,直到训练误差小于预设的阈值;
(10)交替训练:重复执行(6)-(9)直到注意力区域不再变化为止;
(11)采用需要测试的车型图像输入到训练完成的深度网络模型中,获得相应的检测结果。
2.根据权利要求1所述的基于强化学习和双线性卷积网络的车型识别方法,其特征在于,所述步骤(1)中所述的双线性卷积网络的并行特征提取层采用VGG16的第一卷积层至第五卷积层,所述第一卷积层至第五卷积层输出的特征从细节特征向高级的语义特征注意力过渡,在所述第五卷积层后通过外积操作获得一个双线性向量,最后连接全连接层,并在输出上进行软最大化操作,实现对车型的识别与分类。
3.根据权利要求1所述的基于强化学习和双线性卷积网络的车型识别方法,其特征在于,所述步骤(4)建立优化显著性特征的马尔科夫决策模型的包括:
401)状态空间X设为第三卷积层生成的特征中尺度大小为第五卷积层的所有子特征构成的集合,X={x1,x2,...,xn};
402)动作空间U设为状态在状态空间的上下左右的移动构成的集合;
403)状态迁移函数为f:X×U→X,对于状态空间中的任意状态x∈X,从动作空间中任意一个动作u∈U,下一个状态为动作u发生后的状态,该状态为第三卷积层生成的特征中的尺度大小为第五卷积层的某个子特征;
404)奖赏函数为:r:X×U→R,对于状态空间中的任意x∈X,从动作空间中任意一个动作u∈U,得到的立即奖赏。
4.根据权利要求3所述的基于强化学习和双线性卷积网络的车型识别方法,其特征在于,所述动作空间U={0,1,2,3},0表示状态向上的移动,1表示状态向左的移动,2表示状态向下的移动,3表示状态向右的移动。
5.根据权利要求1所述的基于强化学习和双线性卷积网络的车型识别方法,其特征在于,所述步骤(6)优化注意力区域包括步骤:
601设置参数的值:折扣率γ,衰减因子λ,迭代的轮数e,每个迭代对应的最大时间步T,学习率α,探索率ε;
602)对于 初始化Q01(x,u)=0,Q02(x,u)=0;
603)判断情节数已达到最大值E:如果达到,转入步骤612);否则转入步骤604);
604)判断是否达到最大时间步:如果达到,转入步骤603);否则转入步骤605)
605)初始化当前状态x=x0;
606)在(0,1)之间随机产生一个概率p,判断p<ε是否成立:如果成立,在当前状态选择的动作为:u=argmaxu(Q1(x,u)+Q2(x,u));否则在动作集中随机选择任意一个动作;
607)执行当前选择的动作u,得到其对应的下一个状态x′;
608)判断输出层得到的分类结果与真实标签是否一样:如果相同,立即奖赏r=1;否则立即奖赏r=0;
609)在(0,1)之间随机产生一个概率p,判断p<0.5是否成立:如果成立,更新Q值:Q1(x,u)=r+γmaxuQ1(x′,u);否则更新Q值:Q2(x,u)=r+γmaxuQ2(x′,u);
610)更新当前时间步:t=t+1,并转步骤604)进行判断;
611)更新当前情节:e=e+1;
612)输出当前的最优策略和值函数Q1(x,u)、Q2(x,u)。
6.根据权利要求1所述的基于强化学习和双线性卷积网络的车型识别方法,其特征在于,所述步骤(7)中损失函数为:
其中,y表示网络得到处的车型分类结果,y′表示车型图片的真实的标签。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于深度强化学习的异构网络选择方法 | 2020-05-08 | 113 |
视频摘要模型的训练方法、视频摘要生成方法及装置 | 2020-05-13 | 605 |
基于强化学习和双线性卷积网络的车型识别方法 | 2020-05-11 | 923 |
基于深度增强学习的预观控制仿人机器人步态规划方法 | 2020-05-12 | 704 |
基于改进直流潮流算法的电网无功潮流调整方法及装置 | 2020-05-12 | 393 |
一种用辩证法研究钢琴教学的方法 | 2020-05-13 | 164 |
一种基于相似上下文和强化学习的中文词向量生成方法 | 2020-05-13 | 585 |
基于强化学习的波动鳍推进水下作业机器人追踪控制方法 | 2020-05-11 | 144 |
一种基于强化学习的人脸识别方法 | 2020-05-11 | 825 |
一种电力信息通信设备自动化测试资源调度方法 | 2020-05-13 | 665 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。