专利汇可以提供基于Faster-RCNN的身份证复印件检测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于Faster-RCNN的身份证复印件检测方法,包括:选择若干身份证复印件图像,制作Faster-RCNN模型的数据集,设置Faster-RCNN模型的参数,对身份证复印件测试图像进行预处理,基于数据集对Faster-RCNN模型进行训练,输入测试图像,利用训练好的Faster-RCNN模型进行检测。本发明方法对图像模糊、 角 度众多、边框不清晰的身份证复印件同样能够取得较好的检测结果,实用性强,检测效果较好,发展前景良好。,下面是基于Faster-RCNN的身份证复印件检测方法专利的具体信息内容。
1.一种基于Faster-RCNN的身份证复印件检测方法,其特征在于,包括以下步骤:
步骤S1:制作Faster-RCNN模型的数据集;
步骤S2:设置Faster-RCNN模型的参数;
步骤S3:对身份证复印件测试图像进行预处理;
步骤S4:基于数据集对Faster-RCNN模型进行训练;
步骤S5:输入测试图像,利用训练好的Faster-RCNN模型进行检测。
2.根据权利要求1所述的身份证复印件检测方法,其特征在于,所述步骤S1具体包括:
步骤S11:选择若干身份证复印件图像作为数据集样本;
步骤S12:将数据集样本缩放到统一大小,采用最近邻内插值法,利用如下公式:
dsty=dstw/srcw*srcy dstx=dsth/srch*srcx f(dstx,dsty)=f(srcx,srcy)其中,dstx表示缩放后图像的横坐标,dsty表示缩放后图像的纵坐标,dstw表示缩放后图像的宽度,dsth表示缩放后图像的高度,srcx表示原图像的横坐标,srcy表示原图像的纵坐标,srcw表示原图像的宽度,srch表示原图像的高度,f(dstx,dsty)表示缩放后图像像素点(dstx,dsty)处的像素值,f(srcx,srcy)表示原图像素点(srcx,srcy)处的像素值;
步骤S13:利用标注工具获取数据集样本的图片名称、类别、身份证图片的左上角坐标、右下角坐标,并且将获取的数据保存到txt文件中;
步骤S14:将得到的txt文件,制作成VOC2007数据集Annotations文件中的xml文件;
步骤S15:根据xml文件生成VOC2007数据集中的训练集train.txt、验证集val.txt、训练验证集trainval.txt和测试集test.txt;格式为txt;
步骤S16:下载VOC2007数据集,用步骤S14得到的xml文件替换Annotations文件中的数据,用步骤S15得到的txt数据替换ImageSets文件中的数据,将数据集样本图片放在JPEGImages文件中。
3.根据权利要求2所述的身份证复印件检测方法,其特征在于,所述步骤S2具体包括:
步骤S21:根据数据集样本的类别总数修改Faster-RCNN模型中与类别总数相关的参数;
步骤S22:根据数据集样本类别修改Faster-RCNN模型的类别标签;
步骤S23:修改append_flipped_images(self)函数。
4.根据权利要求1所述的身份证复印件检测方法,其特征在于,所述步骤S3具体包括:
步骤S31:输入测试图像;
步骤S32:测试图像采用最近邻插值法缩放到统一大小;
步骤S33:将测试图像转化为灰度图,使用如下公式:
Gray(u,v)=0.299*R(u,v)+0.587*G(u,v)+0.144*B(u,v)
其中,u表示测试图像上横坐标,v表示测试图像上纵坐标,R(u,v)表示像素点(u,v)处的红色通道值,G(u,v)表示像素点(u,v)处的绿色通道值,B(u,v)表示像素点(u,v)处的蓝色通道值,Gray(u,v)表示灰度图中像素点(u,v)处的灰度值;
步骤S34:测试图像中值滤波平滑,利用如下式子:
dst(u,v)=median{src(u+k,v+l)|(k,l)∈H}
其中,dst(u,v)表示输出图像上像素点(u,v)处的像素值,H表示二维模板,k表示二维模板上的横坐标,l表示二维模板上的纵坐标,src(u+k,v+l)表示测试图像上像素点(u+k,v+l)处的像素值,median表示取中位数。
5.根据权利要求2所述的身份证复印件检测方法,其特征在于,所述步骤S4具体包括:
步骤S401:下载ImageNet数据集下预训练得到的模型参数,用于初始化;
步骤S402:输入数据集的图像;
步骤S403:通过卷积神经网络提取图像特征图;
步骤S404:RPN通过分类函数判断anchors是否是检测目标;
步骤S405:计算预测框的缩放尺度与平移尺度,利用如下式子:
tw=log(w/wa) th=log(h/ha) tx=(x-xa)/wa ty=(y-ya)/ha
其中,x表示预测框的中心横坐标,y表示预测框的中心纵坐标,w表示预测框的宽,h表示预测框的高,xa表示anchor box的中心横坐标,ya表示anchor box的中心纵坐标,wa表示anchor box的宽,ha表示anchor box的高,tx表示预测框横坐标方向的位置平移尺度,ty表示预测框纵坐标方向的位置平移尺度,tw表示预测框宽的缩放尺度,th表示预测框高的缩放尺度;
步骤S406:计算标定框的缩放尺度与平移尺度,利用如下式子:
* * * *
其中,x 表示标定框的中心横坐标,y表示标定框的中心纵坐标,w表示标定框的宽,h表示标定框的高,表示标定框横坐标方向的位置平移尺度,表示标定框纵坐标方向的位置平移尺度, 表示标定框宽的缩放尺度,表示标定框高的缩放尺度;
步骤S407:通过平移尺度与缩放尺度对检测目标进行位置修正,获取建议框,同时剔除太小和超出边界的建议框;
步骤S408:计算RPN的整体损失以便RPN训练,利用如下式子:
其中,i为整数,pi表示第i个anchor预测为目标的概率, 表示第i个anchor对应的GT预测概率,ti={tx,ty,tw,th}表示预测框的四个参数化坐标的向量, 是与positive anchor对应的标定框的坐标向量, 表示分类损失, 表示回归损失,R表示Smooth L1函数,Ncls表示cls项的归一化值为mini-batch的大小,Nreg表示reg项归一化为anchor位置的数量,L({pi},{ti})表示损失函数;
步骤S409:将建议框映射到卷积神经网络的最后一层卷积特征图上;
步骤S410:通过RoI Pooling层使得每个矩形框生成尺寸大小相同的特征图;
步骤S411:获取RoI Pooling层生成的特征图,进行分类并输出类别的概率;
步骤S412:再次计算平移尺度与缩放尺度,并进行位置精修,获取目标检测框;
步骤S413:根据训练结果调整学习率和迭代次数,重新训练,得到身份证复印件检测模型。
6.根据权利要求1所述的身份证复印件检测方法,其特征在于,所述步骤S5具体包括:
步骤S51:输入测试图像;
步骤S52:利用卷积神经网络提取测试图像的特征图;
步骤S53:使用滑动窗口在特征图上滑动,将其映射到一个维度更低的图像上;
步骤S54:利用RPN在每个滑动窗口上生成多个建议窗口;
步骤S55:将建议窗口映射到卷积神经网络最后一层卷积特征图上;
步骤S56:利用RoI Pooling层使得每个矩形框生成尺寸大小相同的特征图;
步骤S57:根据特征图进行分类并输出结果。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种引入对抗训练的基于内容的实例检索方法 | 2021-01-08 | 2 |
一种基于人工智能的消化内镜检查质量自动评估方法和系统 | 2021-04-02 | 2 |
一种面向嵌入式应用的深度对抗网络优化方法 | 2022-12-14 | 1 |
一种基于改进卷积神经网络的焊缝缺陷识别方法 | 2022-09-21 | 1 |
卷积神经网络压缩方法及人脸检测方法 | 2022-10-24 | 0 |
一种面向智慧社区的多摄像机联动多目标追踪方法及系统 | 2020-09-04 | 0 |
一种实现神经网络模型的装置及方法 | 2023-06-24 | 0 |
神经网络分类 | 2020-09-03 | 1 |
一种无切分的脱机手写汉字文本识别方法 | 2023-07-25 | 0 |
关键点检测、图像处理方法、装置、电子设备及存储介质 | 2020-05-27 | 1 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。