答题卡识读方法、装置和计算机可读存储介质专利检索-自动光学检测电路专利检索查询-专利查询网

答题卡识读方法、装置和计算机可读存储介质

阅读：1076发布：2020-05-24

专利汇可以提供答题卡识读方法、装置和计算机可读存储介质专利检索，专利查询，专利分析的服务。并且本发明提供了一种答题卡识读方法、装置和计算机可读存储介质，其中，答题卡识读方法包括：识别答题卡的图像中的字符，根据字符确定答题卡的子区域的位置信息；判断位置信息对应的答题内容的有效性；对子区域进行水平投影和垂直投影，以获取答题卡的图像中子区域的作答框的坐标。通过本发明的技术方案，利用字符识别技术，获取答题卡子区域位置信息，而不需要定位块定位，对存在作答框的子区域采用水平投影和垂直投影的方法获取每个作答框的位置，抗干扰能力强，识别率高。，下面是答题卡识读方法、装置和计算机可读存储介质专利的具体信息内容。

权利要求

1.一种答题卡识读方法，其特征在于，包括：
识别所述答题卡的图像中的字符，根据所述字符确定所述答题卡的子区域的位置信息；
确定所述位置信息对应的答题内容的有效性；
对所述子区域进行水平投影和垂直投影，以获取所述答题卡的图像中子区域的作答框的坐标。
2.根据权利要求1所述的答题卡识读方法，其特征在于，所述识别所述答题卡的图像中的字符，根据所述字符确定所述答题卡的子区域的位置信息，具体包括：
识别所述图像中的字符，以获取由所述字符构成的文本信息；
采用第一文本模版与所述文本信息匹配，根据匹配结果获取第一边界；
采用第二文本模版与所述文本信息匹配，根据匹配结果获取第二边界；
所述第一边界与所述第二边界之间的区域对应于所述答题卡的子区域。
3.根据权利要求1所述的答题卡识读方法，其特征在于，对所述子区域进行水平投影和垂直投影，以获取所述答题卡的图像中子区域的作答框的坐标，具体包括：
识别客观题所述子区域的字符以确定选项的文本信息，根据所述选项的文本信息确定选项行数，以及每行的选项个数；
对所述客观题子区域的图像进行二值化处理，以确定二值图；
对所述二值图进行水平投影和垂直投影，以确定水平投影数据和垂直投影数据；
根据所述水平投影数据确定选项的水平方向的坐标区域，以及根据所述垂直投影数据确定选项的垂直方向的坐标区域，所述水平方向的坐标区域对应于选项的上边界和下边界，所述垂直方向的坐标区域对应于选项的左边界和右边界；
根据所述上边界、所述下边界、所述左边界和所述右边界确定所述选项的坐标，其中，所述作答框包括客观题的选项，所述水平投影用于计算所述二值图在水平方向上的像素点个数，所述垂直投影用于计算所述二值图在垂直方向上的像素点个数。
4.根据权利要求3所述的答题卡识读方法，其特征在于，还包括：
根据所述选项的行宽对所述水平投影数据进行宽度过滤；
根据两个相邻的选项之间的间距对所述垂直投影数据进行简化，并根据所述选项的行高对简化后的垂直投影数据进行高度过滤；
或根据所述选项的行高对所述垂直投影数据进行高度过滤，并根据两个相邻的选项之间的间距对高度过滤后的垂直投影数据进行简化。
5.根据权利要求3所述的答题卡识读方法，其特征在于，还包括：
根据所述选项的坐标以及自动阈值法确定所述选项的有效性。
6.根据权利要求5所述的答题卡识读方法，其特征在于，所述根据所述选项的坐标以及自动阈值法确定所述选项的有效性，具体包括：
在所述二值图中，计算全部所述选项的平均像素点值，以确定平均值列表；
对所述平均值列表进行求和之后再除以所述选项的个数，以确定阈值；
若所述选项的平均像素点值小于所述阈值，则确定所述选项为已填涂，并记录对应的字符。
7.根据权利要求1至6中任一项所述的答题卡识读方法，其特征在于，还包括：
获取所述子区域的边缘轮廓；
检测所述边缘轮廓的倾斜角度；
根据所述倾斜角度旋转所述子区域。
8.根据权利要求1至6中任一项所述的答题卡识读方法，其特征在于，还包括：
保存所述字符，和/或保存所述图像；
响应于接收到的查询请求或报错信息，提取对应的图像和/或字符进行显示。
9.根据权利要求1至6中任一项所述的答题卡识读方法，其特征在于，所述识别所述答题卡的图像中的字符，具体包括：
获取空白答题卡图像和/或获取答题卡图像；
通过光学字符识别系统对图像中的字符进行识别。
10.一种答题卡识别装置，所述答题卡识别装置包括处理器，其特征在于，所述处理器执行计算机程序时实现如权利要求1至9中任一项所述的答题卡识读方法的步骤。
11.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被执行时，实现如权利要求1至9中任一项所述的答题卡识读方法的步骤。

说明书全文

答题卡识读方法、装置和计算机可读存储介质

技术领域

[0001] 本发明涉及图像处理领域，具体而言，涉及一种答题卡识读方法、一种答题卡识读装置和一种计算机可读存储介质。

背景技术

[0002] 随着信息技术的发展，计算机处理的数据量越来越大，在很多领域里，亟需解决海量数据的采集、识别和录入的问题，目前，在高考、成人高考、全国大学英语等级考试等大型考试使用OMR(Optical Mark Reader，光学标记阅读机)应对该问题，机读答题卡能够在一定程度上提升数据录入速度。

[0003] 相关技术中，答题卡的识读过程通常使用识别定位块来确定答题区域的位置，进而以确定客观题的区域，或者使用以填涂点相对于标记点的位置来定位填涂点的方式来确定客观题的区域，上述技术方案至少存在以下技术问题：

[0004] (1)当答题卡的排版布局改变，答题卡纸张大小改变或纸张材质改变时，都会影响客观题(子区域)的定位结果。

[0005] (2)当答题卡上存在沾污或者墨迹不清等问题时，可能导致读取的答题内容无效。

[0006] 另外，整个说明书对背景技术的任何讨论，并不代表该背景技术一定是所属领域技术人员所知晓的现有技术，整个说明书中的对现有技术的任何讨论并不代表认为该现有技术一定是广泛公知的或一定构成本领域的公知常识。

发明内容

[0007] 本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。

[0008] 为此，本发明的一个目的在于提出了一种答题卡识读方法。

[0009] 本发明的另一个目的在于提出了一种答题卡识读装置。

[0010] 本发明的又一个目的在于提出了一种计算机可读存储介质。

[0011] 在本发明的第一方面的技术方案中，提出了一种答题卡识读方法，包括：识别答题卡的图像中的字符，根据字符确定答题卡的子区域的位置信息；判断位置信息对应的答题内容的有效性；对子区域进行水平投影和垂直投影以获取子区域的各个作答框的坐标。

[0012] 在该技术方案中，通过利用字符识别技术识别答题卡图像，从而获取含有坐标的文本信息，再根据文本信息确定客观题子区域的边界，不需要定位块去识别客观题子区域，而是根据坐标的文本信息去确定客观题子区域的边界，当答题卡大小改变，或材质改变，或答题卡排版布局改变都不会影响坐标的文本信息的获取，也不影响客观题子区域的确定。

[0013] 具体地，根据本发明提供的识读方法，使得答题卡纸张大小和材质不限于特定规格，答题卡题目排版顺序也不限于同种格式，数据录入过程或判题过程对答题卡的兼容度大大提升，不再需要为特定的判题设备制作统一规格的答题卡，降低了答题卡制作难度和普及难度。

[0014] 其中，字符识别技术可为OCR(Optical Character Recognition，光学字符识别)，OCR是指电子设备检查纸上打印的字符，通过检测暗亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

[0015] 另外，值得特别指出的是，有效性是指读取的答题内容的可靠性，取值范围为0～100％，尤其是针对答题卡上存在墨迹沾污、批注字迹和字迹不清晰等情况，能够通过确定答题内容的有效性，来进一步地提升识读答题卡的可靠性和准确性。

[0016] 通过对子区域进行水平投影和垂直投影以获取子区域的各个作答框的坐标，其中，对水平方向上投影，获取子区域的上边界和下边界，对垂直方向上的投影，获取客观题选项区域的左边界和右边界。

[0017] 另外，也可以先进行垂直投影，再进行水平投影，结合水平投影和垂直投影确定客观题的各个边界，即使答题卡排版改变，都不会对其区域确定有影响，使其识别效率有了较大提升，并且当题目序号旁边有写字的情况，或者试卷纸质差，选项出现模糊不清的情况，也能够准确的识别出每个选项框是否填涂，抗干扰性好。

[0018] 其中，水平投影和垂直投影是指，在该水平方向或者垂直方向取一条直线，统计垂直于该直线(轴)方向上的像素黑点的数量，累加求和作为该轴该位置的值。

[0019] 另外，根据本发明上述实施例的答题卡识读方法，还可以具有如下附加的技术特征：

[0020] 在上述任一技术方案中，可选地，所述识别所述答题卡的图像中的字符，根据所述字符确定所述答题卡的子区域的位置信息，具体包括：识别所述图像中的字符，以获取由所述字符构成的文本信息；采用第一文本模版与文本信息匹配，根据匹配结果获取第一边界；采用第二文本模版与文本信息匹配，根据匹配结果获取第二边界；第一边界与第二边界之间的区域对应于答题卡的子区域。

[0021] 在该技术方案中，通过利用识别图像中的字符获得的含有坐标的文本信息去确定客观题的区域，不需要定位块去识别客观题子区域，而是根据坐标的文本信息去确定客观题子区域的边界，当答题卡大小改变，或材质改变，或答题卡排版布局改变，都不会影响坐标的文本信息的获取，也不影响客观题子区域的确定。

[0022] 譬如，输入答题卡图像，进行OCR识别，以确定了含有答题卡坐标的文本信息，通过获得的文本信息去匹配客观题对应的标题模块，若匹配成功，则会返回其矩形框坐标，矩形框的纵坐标就为客观题的上边界，之后再根据文本信息去匹配大题序号模块，若成功则返回矩形框坐标，矩形框的纵坐标作为客观题子区域的下边界，这样就确定出了客观题的区域。

[0023] 另外，现有技术中的答题卡识别方案中，通常对答题卡有特殊要求，如答题卡必须为含铅铜版纸进行彩色印刷，且对答题卡裁切精度有严格要求，这样经济成本、环境成本高，而且受限于光电头安装位置和排列密度相对固定，对于不同格式的答题卡调整难度很大。

[0024] 而基于本申请的技术方案，由于识读对象是文本信息，所以即使存在答题卡摆放倾斜，答题卡排版改变，答题卡纸张大小改变等情况，都不会对其区域确定产生影响，使其识别效率有了较大地提升，并且纸张也不需要专用纸质，有利于降低印制答题卡的成本。

[0025] 在上述任一技术方案中，可选地，识别子区域的字符得到选项的文本信息，根据选项的文本信息确定选项行数以及每行的选项个数；对子区域的图像进行二值化处理，得到二值图；对所述客观题子区域的图像进行二值化处理，以确定二值图；对所述二值图进行水平投影和垂直投影，以确定水平投影数据和垂直投影数据；根据所述水平投影数据确定选项的水平方向的坐标区域，以及根据所述垂直投影数据确定选项的垂直方向的坐标区域，所述水平方向的坐标区域对应于选项的上边界和下边界，所述垂直方向的坐标区域对应于选项的左边界和右边界；根据所述上边界、所述下边界、所述左边界和所述右边界确定所述选项的坐标，其中，所述作答框包括客观题的选项，所述水平投影用于计算所述二值图在水平方向上的像素点个数，所述垂直投影用于计算所述二值图在垂直方向上的像素点个数。

[0026] 在该技术方案中，由于摄像头所拍摄的图片，大多是彩色图片，彩色图片所含有的信息量巨大，通过将子区域的图像进行二值化处理，进而确定了文本信息(为黑色)和背景信息(为白色)，有利于降低识读答题卡过程的计算量，以及提升答题卡识读方案的效率和可靠性。

[0027] 另外，通过对二值图进行水平投影和垂直投影，当题目序号旁边有写字的情况，或者试卷纸质差，作答框出现模糊不清的情况，也能够准确的识别出每个选项框，抗干扰性好。

[0028] 在上述任一技术方案中，可选地，还包括：根据所述选项的行宽对所述水平投影数据进行宽度过滤；根据两个相邻的选项之间的间距对所述垂直投影数据进行简化，并根据所述选项的行高对简化后的垂直投影数据进行高度过滤；或根据所述选项的行高对所述垂直投影数据进行高度过滤，并根据两个相邻的选项之间的间距对高度过滤后的垂直投影数据进行简化。

[0029] 在该技术方案中，通过进行宽度过滤数据简化和高度过滤，旨在过滤掉宽度上的噪声和高度上的噪声，以提升答题卡识读的准确性和可靠性，其中，在对水平投影数据进行宽度过滤后，并不需要限制高度过滤和数据简化的执行顺序。

[0030] 在上述任一技术方案中，可选地，还包括：根据所述选项的坐标以及自动阈值法确定所述选项的有效性。

[0031] 在该技术方案中，自动阈值法是根据子区域的像素点值确定的阈值，并根据阈值判断答题内容的有效性，尤其是客观题的选项中的填涂区域(子区域)的有效性，提取有效的答题内容，也即可以在识读答题卡过程中过滤掉无效的答题内容，能够降低答题卡识读方案中的冗余数据。

[0032] 在上述任一技术方案中，可选地，所述根据所述选项的坐标以及自动阈值法确定所述选项的有效性，具体包括：在所述二值图中，计算全部所述选项的平均像素点值，以确定平均值列表；对所述平均值列表进行求和之后再除以所述选项的个数，以确定阈值；若所述选项的平均像素点值小于所述阈值，则确定所述选项为已填涂，并记录对应的字符。

[0033] 在上述任一技术方案中，可选地，还包括：获取子区域的边缘轮廓；检测边缘轮廓的倾斜角度；根据倾斜角度旋转子区域。

[0034] 在该技术方案中，通过对图像进行倾斜校正，使得字符识别更为准确，坐标信息更为准确获得，使其识别效率有了较大提升。

[0035] 例如：输入的答题卡图像，截取客观题的子区域，对子区域进行倾斜校正，通过边缘检测算法得到图像的边缘轮廓，再用霍夫直线检测的方法检测子区域中的直线，取角度小于30度的水平直线，再从中取长度最大的直线，计算其水平角度，若该水平角度大于0.2度，则以该水平角度对答题卡图像进行旋转。

[0036] 在上述任一技术方案中，可选地，还包括：保存所述字符，和/或保存所述图像；响应于接收到的查询请求或报错信息，提取对应的图像和/或字符进行显示。

[0037] 在该技术方案中，通过保存字符，和/或保存答题卡的图像，能保存识别过的答题卡图像，若对判题结果有异议可迅速调取相关答题卡进行取证或重新判题，不需要人工从纸质答题卡中重新分拣出来核对，判题透明性高。

[0038] 另外，若答题卡识读失败，可迅速地找到相应的图像重新执行识读，简单方便。

[0039] 在上述任一技术方案中，可选地，所述识别所述答题卡的图像中的字符，具体包括：获取空白答题卡图像和/或获取答题卡图像；通过光学字符识别系统对图像中的字符进行识别。

[0040] 在该技术方案中，空白答题卡中无效信息(干扰信息)较少，方便进行分析，能够更准确地划分出各个子区域，对于同样结构的答题卡(已做答)有较为重要的参考意义。

[0041] 另外，通过获取空白答题卡图像，获取答题卡子区域，然后对答题卡(可能已经存在干扰信息或者结构损坏)子区域识别，并通过光学字符识别系统识别图像的内容信息，光学字符识别系统识别准确，可靠性高。

[0042] 在本发明的第二方面的技术方案中，提出了一种答题卡识读装置，所答题卡识读装置包括处理器，所述处理器执行计算机程序时实现：如上述任一项所述的答题卡识读方法的步骤，因此驱动控制装置具有上述任一项答题卡识读方法的有益技术效果，在此不再赘述。

[0043] 在本发明的第三方面的技术方案中，提出了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被执行时，实现如上述任一项技术方案所述的答题卡识读方法的步骤。

[0044] 本发明的附加方面和优点将在下面的描述部分中变得明显，或通过本发明的实践了解到。附图说明

[0045] 本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

[0046] 图1示出了根据本发明的一个实施例的答题卡识读方法的流程示意图；

[0047] 图2示出了根据本发明的另一个实施例的答题卡识读方法的流程示意图；

[0048] 图3示出了根据本发明的另一个实施例的答题卡识读方法的流程示意图；

[0049] 图4示出了根据本发明的另一个实施例的答题卡识读方法的答题卡示意图；

[0050] 图5示出了根据本发明的另一个实施例的答题卡识读方法的答题卡示意图；

[0051] 图6示出了根据本发明的一个实施例的答题卡识读方法的水平投影图；

[0052] 图7示出了根据本发明的另一个实施例的答题卡识读方法的水平投影图；

[0053] 图8示出了根据本发明的一个实施例的答题卡识读方法的垂直投影图；

[0054] 图9示出了根据本发明的另一个实施例的答题卡识读方法的垂直投影图。

具体实施方式

[0055] 为了能够更清楚地理解本发明的上述目的、特征和优点，下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是，在不冲突的情况下，本申请的实施例及实施例中的特征可以相互组合。

[0056] 在下面的描述中阐述了很多具体细节以便于充分理解本发明，但是，本发明还可以采用其他不同于在此描述的其他方式来实施，因此，本发明的保护范围并不受下面公开的具体实施例的限制。

[0057] 图1示出了根据本发明的一个实施例的答题卡识读方法的流程示意图。

[0058] 如图1所示，根据本发明的一个实施例的答题卡识读方法，包括：步骤S102，识别答题卡的图像中的字符，根据字符确定答题卡的子区域的位置信息；步骤S104，判断位置信息对应的答题内容的有效性；步骤S106，对子区域进行水平投影和垂直投影以获取子区域的各个作答框的坐标。

[0059] 在该技术方案中，通过利用字符识别技术识别答题卡图像，从而获取含有坐标的文本信息，再根据文本信息确定客观题子区域的边界，不需要定位块去识别客观题子区域，而是根据坐标的文本信息去确定客观题子区域的边界，当答题卡大小改变，或材质改变，或答题卡排版布局改变都不会影响坐标的文本信息的获取，也不影响客观题子区域的确定。

[0060] 具体地，根据本发明提供的识读方法，使得答题卡纸张大小和材质不限于特定规格，答题卡题目排版顺序也不限于同种格式，数据录入过程或判题过程对答题卡的兼容度大大提升，不再需要为特定的判题设备制作统一规格的答题卡，降低了答题卡制作难度和普及难度。

[0061] 其中，字符识别技术可为OCR(Optical Character Recognition，光学字符识别)，OCR是指电子设备检查纸上打印的字符，通过检测暗亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

[0062] 另外，值得特别指出的是，有效性是指读取的答题内容的可靠性，取值范围为0～100％，尤其是针对答题卡上存在墨迹沾污、批注字迹和字迹不清晰等情况，能够通过确定答题内容的有效性，来进一步地提升识读答题卡的可靠性和准确性。

[0063] 通过对子区域进行水平投影和垂直投影以获取子区域的各个作答框的坐标，其中，对水平方向上投影，获取子区域的上边界和下边界，对垂直方向上的投影，获取客观题选项区域的左边界和右边界。

[0064] 另外，也可以先进行垂直投影，再进行水平投影，结合水平投影和垂直投影确定客观题的各个边界，即使答题卡排版改变，都不会对其区域确定有影响，使其识别效率有了较大提升，并且当题目序号旁边有写字的情况，或者试卷纸质差，选项出现模糊不清的情况，也能够准确的识别出每个选项框是否填涂，抗干扰性好。

[0065] 其中，水平投影和垂直投影是指，在该水平方向或者垂直方向取一条直线，统计垂直于该直线(轴)方向上的像素黑点的数量，累加求和作为该轴该位置的值。

[0066] 另外，根据本发明上述实施例的答题卡识读方法，还可以具有如下附加的技术特征：

[0067] 在上述任一技术方案中，可选地，所述识别所述答题卡的图像中的字符，根据所述字符确定所述答题卡的子区域的位置信息，具体包括：识别所述图像中的字符，以获取由所述字符构成的文本信息；采用第一文本模版与文本信息匹配，根据匹配结果获取第一边界；采用第二文本模版与文本信息匹配，根据匹配结果获取第二边界；第一边界与第二边界之间的区域对应于答题卡的子区域。

[0068] 在该技术方案中，通过利用识别图像中的字符获得的含有坐标的文本信息去确定客观题的区域，不需要定位块去识别客观题子区域，而是根据坐标的文本信息去确定客观题子区域的边界，当答题卡大小改变，或材质改变，或答题卡排版布局改变，都不会影响坐标的文本信息的获取，也不影响客观题子区域的确定。

[0069] 譬如，输入答题卡图像，进行OCR识别，以确定了含有答题卡坐标的文本信息，通过获得的文本信息去匹配客观题对应的标题模块，若匹配成功，则会返回其矩形框坐标，矩形框的纵坐标就为客观题的上边界，之后再根据文本信息去匹配大题序号模块，若成功则返回矩形框坐标，矩形框的纵坐标作为客观题子区域的下边界，这样就确定出了客观题的区域。

[0070] 另外，现有技术中的答题卡识别方案中，通常对答题卡有特殊要求，如答题卡必须为含铅铜版纸进行彩色印刷，且对答题卡裁切精度有严格要求，这样经济成本、环境成本高，而且受限于光电头安装位置和排列密度相对固定，对于不同格式的答题卡调整难度很大。

[0071] 而基于本申请的技术方案，由于识读对象是文本信息，所以即使存在答题卡摆放倾斜，答题卡排版改变，答题卡纸张大小改变等情况，都不会对其区域确定产生影响，使其识别效率有了较大地提升，并且纸张也不需要专用纸质，有利于降低印制答题卡的成本。

[0072] 在上述任一技术方案中，可选地，识别子区域的字符得到选项的文本信息，根据选项的文本信息确定选项行数以及每行的选项个数；对子区域的图像进行二值化处理，得到二值图；对所述客观题子区域的图像进行二值化处理，以确定二值图；对所述二值图进行水平投影和垂直投影，以确定水平投影数据和垂直投影数据；根据所述水平投影数据确定选项的水平方向的坐标区域，以及根据所述垂直投影数据确定选项的垂直方向的坐标区域，所述水平方向的坐标区域对应于选项的上边界和下边界，所述垂直方向的坐标区域对应于选项的左边界和右边界；根据所述上边界、所述下边界、所述左边界和所述右边界确定所述选项的坐标，其中，所述作答框包括客观题的选项，所述水平投影用于计算所述二值图在水平方向上的像素点个数，所述垂直投影用于计算所述二值图在垂直方向上的像素点个数。

[0073] 在该技术方案中，由于摄像头所拍摄的图片，大多是彩色图片，彩色图片所含有的信息量巨大，通过将子区域的图像进行二值化处理，进而确定了文本信息(为黑色)和背景信息(为白色)，有利于降低识读答题卡过程的计算量，以及提升答题卡识读方案的效率和可靠性。

[0074] 另外，通过对二值图进行水平投影和垂直投影，当题目序号旁边有写字的情况，或者试卷纸质差，作答框出现模糊不清的情况，也能够准确的识别出每个选项框，抗干扰性好。

[0075] 在上述任一技术方案中，可选地，还包括：根据所述选项的行宽对所述水平投影数据进行宽度过滤；根据两个相邻的选项之间的间距对所述垂直投影数据进行简化，并根据所述选项的行高对简化后的垂直投影数据进行高度过滤；或根据所述选项的行高对所述垂直投影数据进行高度过滤，并根据两个相邻的选项之间的间距对高度过滤后的垂直投影数据进行简化。

[0076] 在该技术方案中，通过进行宽度过滤数据简化和高度过滤，旨在过滤掉宽度上的噪声和高度上的噪声，以提升答题卡识读的准确性和可靠性，其中，在对水平投影数据进行宽度过滤后，并不需要限制高度过滤和数据简化的执行顺序。

[0077] 在上述任一技术方案中，可选地，还包括：根据所述选项的坐标以及自动阈值法确定所述选项的有效性。

[0078] 在该技术方案中，自动阈值法是根据子区域的像素点值确定的阈值，并根据阈值判断答题内容的有效性，尤其是客观题的选项中的填涂区域(子区域)的有效性，提取有效的答题内容，也即可以在识读答题卡过程中过滤掉无效的答题内容，能够降低答题卡识读方案中的冗余数据。

[0079] 在上述任一技术方案中，可选地，所述根据所述选项的坐标以及自动阈值法确定所述选项的有效性，具体包括：在所述二值图中，计算全部所述选项的平均像素点值，以确定平均值列表；对所述平均值列表进行求和之后再除以所述选项的个数，以确定阈值；若所述选项的平均像素点值小于所述阈值，则确定所述选项为已填涂，并记录对应的字符。

[0080] 在上述任一技术方案中，可选地，还包括：获取子区域的边缘轮廓；检测边缘轮廓的倾斜角度；根据倾斜角度旋转子区域。

[0081] 在该技术方案中，通过对图像进行倾斜校正，使得字符识别更为准确，坐标信息更为准确获得，使其识别效率有了较大提升。

[0082] 例如：输入的答题卡图像，截取客观题的子区域，对子区域进行倾斜校正，通过边缘检测算法得到图像的边缘轮廓，再用霍夫直线检测的方法检测子区域中的直线，取角度小于30度的水平直线，再从中取长度最大的直线，计算其水平角度，若该水平角度大于0.2度，则以该水平角度对答题卡图像进行旋转。

[0083] 在上述任一技术方案中，可选地，还包括：保存所述字符，和/或保存所述图像；响应于接收到的查询请求或报错信息，提取对应的图像和/或字符进行显示。

[0084] 在该技术方案中，通过保存字符，和/或保存答题卡的图像，能保存识别过的答题卡图像，若对判题结果有异议可迅速调取相关答题卡进行取证或重新判题，不需要人工从纸质答题卡中重新分拣出来核对，判题透明性高。

[0085] 另外，若答题卡识读失败，可迅速地找到相应的图像重新执行识读，简单方便。

[0086] 在上述任一技术方案中，可选地，所述识别所述答题卡的图像中的字符，具体包括：获取空白答题卡图像和/或获取答题卡图像；通过光学字符识别系统对图像中的字符进行识别。

[0087] 在该技术方案中，空白答题卡中无效信息(干扰信息)较少，方便进行分析，能够更准确地划分出各个子区域，对于同样结构的答题卡(已做答)有较为重要的参考意义。

[0088] 另外，通过获取空白答题卡图像，获取答题卡子区域，然后对答题卡(可能已经存在干扰信息或者结构损坏)子区域识别，并通过光学字符识别系统识别图像的内容信息，光学字符识别系统识别准确，可靠性高。

[0089] 如图2所示，根据本发明的另一个实施例的答题卡识读方法，包括：步骤S202，采集答题卡的图像，并进行ORC识别；步骤S204，识别所述图像中的字符，以获取具有坐标信息由所述字符构成的文本信息；步骤S206，根据文本信息确定答题卡的各个子区域；步骤S208，对所述子区域进行水平投影和垂直投影，以获取所述答题卡的图像中子区域的各个作答框的坐标；步骤S210，根据所述选项的坐标以及自动阈值法判断确定所述选项的填涂情况。

[0090] 如图3所示，根据本发明的另一个实施例的答题卡识读方法，包括：步骤S302，采集空白答题卡的图像，并进行ORC识别；步骤S304，识别所述图像中的字符，以获取具有坐标信息由所述字符构成的文本信息；步骤S306，根据文本信息确定空白答题卡上的答题区域；步骤S308，采集已涂写答题卡的图像，并确定子区域；步骤S310，对所述子区域进行水平投影和垂直投影，以获取所述答题卡的图像中子区域的各个作答框的坐标；步骤S312，根据所述选项的坐标以及自动阈值法判断确定所述选项的填涂情况。

[0091] 下面结合图4至图9对根据本发明的答题卡识读方案进行具体说明。

[0092] 1、输入空白答题卡图像，进行OCR识别，得到含坐标的文本信息。

[0093] 2、从文本信息中分析出选择题的区域，其中，选择题即客观题的一种实施例，具体包括以下步骤：

[0094] 2.1确定选择题区域的上边界：遍历文本信息，文本信息用于匹配选择题标题模板，若成功则返回其矩形框坐标，矩形框的y坐标作为选择题的区域的上边界，选择题的标题模板中通常包括字符和/符号。

[0095] 2.2再确定选择题区域的下边界：继续2.1的遍历，匹配主观题的序号模板，若成功则返回其矩形框坐标，矩形框的y坐标作为选择题的区域的下边界，主观题的标题模板中通常包括字符和/符号。

[0096] 2.3根据上边界和下边界得到选择题的矩形区域，再对其进行上下扩展50个像素点，防止倾斜导致截图不完整问题。

[0097] 2.4取上边界和下边界之间的文本作为选择题的文本信息。

[0098] 3、通过投影方法，结合选项文本信息得到每个选项框的矩形坐标，具体包括以下步骤：

[0099] 3.1从选项文本信息得到选项的行数，每行选项的个数。

[0100] 3.1.1遍历文本信息，删除文本信息中的数字字母之外的字符，得到形如“1ABCD2ABCD3ABCD”的选项行字符串。

[0101] 3.1.2以数字作为分隔符，拆分选项行字符串得到每行的选项列表，形如：[[1，A，B，C，D]，[2，A，B，C，D]，[3，A，B，C，D]]。

[0102] 3.1.3从而可得选项的行数，每行选项的个数。

[0103] 3.2通过投影方法，得到每个选项的矩形坐标。

[0104] 3.2.1输入学生作答了的答题卡图像，截取选择题的区域子图。

[0105] 3.2.2对答题卡图像进行倾斜矫正，使用opencv中的Canny方法得到图像的边缘轮廓，再用opencv的HoughLinesP方法检测直线，取角度小于30°的水平直线，再从中取长度最大的直线，计算其水平角度，若该角度大于0.2°，则以该角度对答题卡图像进行旋转。

[0106] 3.2.3对答题卡图像进行二值化处理，得到二值图。

[0107] 3.2.4如图6所示，对答题卡图像进行水平投影(即在水平方向数0的个数)，得到投影数组。

[0108] 3.2.5对答题卡图像进行宽度过滤，过滤掉小于16的部分，得到数组如图7所示。

[0109] 3.2.6因选项的第一行的一定大于等于第二行的选项个数，故按照该逻辑过滤掉首行较小的噪声行，得到数组。

[0110] 3.2.7从数组中依次取行作为选项行，取每行对应的区域作为选项行的区域。

[0111] 3.2.8取前n个选项行的区域子图进行垂直投影(即在垂直方向数0的个数)，得到每个子图的投影其中，n的取值方法为若第2行的选项个数等于第1行的，则n＝2，若第3行的选项个数等于第1行的，则n＝3，依次类推得到n。

[0112] 3.2.9对进行水平方向求和，得到垂直投影数组如图8所示。

[0113] 3.2.10对子图的投影进行简化，假设2个选项之间的最小宽度大于8，以8作为宽度化简垂直投影数组，在垂直投影数组[i:i+8]范围内取最大值，对应的参数值设为最大阈值，其余设为0，再以(n-0.5)乘以选项的行高，乘积值用于进行高度过滤，得到垂直投影数组如图9所示。

[0114] 3.2.11对垂直投影数组进行遍历，若垂直投影数组[i]！＝0，则i作为选项的左边界，进行遍历，跳过8宽度内的非0值，则得到选项的右边界，若其后8宽度内存在垂直投影数组[k]！＝0，则右边界＝k，依次类推，最后得到。

[0115] 3.2.12以左边界到右边界的距离作为单个选项的宽度，继续对垂直投影数组进行遍历，垂直投影数组[i]！＝0，则i作为下一个选项的左边界，以i+单个选项的宽度为七点，在其前后8宽度范围内，从前往后找垂直投影数组[k]！＝0，则k即为选项的右边界。

[0116] 3.2.13重复3.2.12，即可得到所有选项的左边界和右边界。

[0117] 3.2.14结合3.1.2中的text，找到每个选项A对应的区域，在其之前16个像素点添加宽度为6的矩形。

[0118] 3.2.15结合水平投影结果，最终得到每个序号、选项对应的矩形框。

[0119] 4、根据自动阈值判断每个选项填涂与否，具体包括以下步骤：

[0120] 4.1在中取所有选项(ABCDEFG...)对应的矩形框的子图，计算该子图的平均像素点值。

[0121] 4.2计算自动阈值，对平均像素点值进行求和得到总像素点值，再除以所有选项个数，得到阈值，若阈值大于125，则设阈值＝125，即选项至少涂了一半区域，否则视为无效填涂，即通过自动阈值来确定答题内容的有效性。

[0122] 4.3遍历所有选项，在中取对应的矩形框的子图，计算该子图的平均像素点值，得到平均像素点值，若平均像素点值＜平均像素点值的阈值，则该选项视为填涂了，记录对应的字母，从而可以得到所有填涂的字母。

[0123] 4.4结合文本信息即可得到所有的序号的填涂结果，如图4和图5的答题卡可被识读出以下答题内容：

[0124] [['1'，['A']]，['2'，['A']]，['3'，['C']]，['4'，['D']]，['5'，['B']]，['6'，['C']]，['7'，['D']]，['8'，['A']]，['9'，['C']]，['10'，['D']]，['11'，['A']]，['12'，['B']]]。

[0125] 针对现有技术中存在的技术问题，本发明提出了一种答题卡识读方法、装置和计算机可读存储介质，通过利用字符识别技术识别答题卡图像，从而获取含有坐标的文本信息，再根据文本信息确定客观题子区域的边界，不需要定位块去识别客观题子区域，而是根据坐标的文本信息去确定客观题子区域的边界，当答题卡大小改变，或材质改变，或答题卡排版布局改变都不会影响坐标的文本信息的获取，也不影响客观题子区域的确定。

[0126] 本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

[0127] 本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

[0128] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

[0129] 这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

[0130] 应当注意的是，在权利要求中，不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的部件或步骤。位于部件之前的单词“一”或“一个”不排除存在多个这样的部件。本发明可以借助于包括有若干不同部件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中，这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。

[0131] 尽管已描述了本发明的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例做出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

[0132] 以上仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

标题	发布/更新时间	阅读量
一种本质安全型加油站	2020-05-08	428
纱线监视装置、纱线卷取机、以及自动络纱机	2020-05-08	90
用于光学仪器的连续异步自动聚焦的系统和方法	2020-05-11	975
一种基于深度学习的2D+3D大飞机外形缺陷检测与分析方法	2020-05-11	214
一种平板玻璃瑕疵的抽检装置及方法	2020-05-08	63
一种天地一体的AI智能水环保实时监测系统	2020-05-08	753
用于文档数字化的多纸张处理	2020-05-11	687
一种细胞自动培养装置	2020-05-08	174
用于生物医疗的显微视觉检测装置	2020-05-08	49
软包电池自动组装温度保险模组环形生产线	2020-05-08	706

答题卡识读方法、装置和计算机可读存储介质

答题卡识读方法、装置和计算机可读存储介质

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：