首页 / 专利库 / 专利权 / 申请 / 国际申请 / 权利要求 / 题目确定方法、装置、设备及存储介质

题目确定方法、装置、设备及存储介质

阅读:848发布:2021-04-14

专利汇可以提供题目确定方法、装置、设备及存储介质专利检索,专利查询,专利分析的服务。并且本 申请 实施例 公开了一种题目确定方法、装置、设备及存储介质,涉及 人工智能 技术领域,其包括:获取题目选取框中的文本信息以及用户 手指 在习题页面的手指坐标,其中,所述题目选取框包含在所述习题页面中且根据所述手指坐标确定;根据所述文本信息确定所述题目选取框中每个习题题目的边界坐标;根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目。采用上述方案可以解决 现有技术 中当选取框包含多个习题的题目时,无法准确确定待搜索习题的题目的技术问题。,下面是题目确定方法、装置、设备及存储介质专利的具体信息内容。

1.一种题目确定方法,其特征在于,包括:
获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,其中,所述题目选取框包含在所述习题页面中且根据所述手指坐标确定;
根据所述文本信息确定所述题目选取框中每个习题题目的边界坐标;
根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目。
2.根据权利要求1所述的题目确定方法,其特征在于,所述根据所述文本信息确定所述题目选取框中每个习题题目的边界坐标包括:
根据所述文本信息的纵轴坐标确定所述文本信息中每一行包含的子文本信息;
根据所述子文本信息划分出所述题目选取框中的每个习题题目;
确认划分得到的每个习题题目的边界坐标。
3.根据权利要求2所述的题目确定方法,其特征在于,所述根据所述文本信息的纵轴坐标确定所述文本信息中每一行包含的子文本信息包括:
确定所述文本信息中每个字符的纵轴坐标;
根据所述每个字符的纵轴坐标确定每个字符所属的行号,并得到每一行包含的子文本信息,每个行号对应一行子文本信息。
4.根据权利要求3所述的题目确定方法,其特征在于,所述根据所述每个字符的纵轴坐标确定每个字符所属的行号之后,包括:
根据每个字符所属的行号对每个字符进行规整。
5.根据权利要求2所述的题目确定方法,其特征在于,所述根据所述子文本信息划分出所述题目选取框中的每个习题题目包括:
获取每一行的所述子文本信息中的题目特征;
根据所述题目特征和行特征划分出所述题目选取框中的每个习题题目。
6.根据权利要求2-5任一所述的题目确定方法,其特征在于,所述根据所述子文本信息划分出所述题目选取框中的每个习题题目之前,还包括:
根据所述子文本信息确定对应行是否属于缺失文本行,若属于缺失文本行,则将所述题目选取框扩大第一设定行数,并返回执行根据所述文本信息的纵轴坐标确定所述文本信息中每一行包含的子文本信息的操作;或,
若确认所述题目选取框中包含的行数小于第二设定行数,则将所述题目选取框扩大第三设定行数,并返回执行根据所述文本信息的纵轴坐标确定所述文本信息中每一行包含的子文本信息的操作。
7.根据权利要求1所述的题目确定方法,其特征在于,所述根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目之后,还包括:
根据所述目标习题题目在习题搜索引擎中进行搜索,以得到所述目标习题题目的习题搜索结果。
8.一种题目确定装置,其特征在于,包括:
信息获取模,用于获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,其中,所述题目选取框包含在所述习题页面中且根据所述手指坐标确定;
坐标确定模块,用于根据所述文本信息确定所述题目选取框中每个习题题目的边界坐标;
题目确定模块,用于根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目。
9.一种题目确定设备,其特征在于,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的题目确定方法。
10.一种包含计算机可执行指令的存储介质,其特征在于,所述计算机可执行指令在由计算机处理器执行时用于执行如权利要求1-7中任一所述的题目确定方法。

说明书全文

题目确定方法、装置、设备及存储介质

技术领域

[0001] 本申请实施例涉及人工智能技术领域,尤其涉及一种题目确定方法、装置、设备及存储介质。

背景技术

[0002] 随着人工智能的发展与普及,各类具备人工智能的智能设备被广泛应用于人们生活的各类场景,如用于辅助学习的家教机。通常,家教机的摄像头可以扫描用户当前使用的图书、习题册或试卷等纸质内容,然后,若用户需要对某道习题进行搜索,则可以将手指放置在习题上,此时,家教机检测到用户手指指向纸质内容时,识别用户手指指向的内容,并根据指向的内容得到用户需要搜索的习题题目。
[0003] 通常,在识别用户手指指向的内容时,会生成一个包含指向内容的选取框,以通过识别选取框中的全部内容得到待搜索习题的题目。然而,当选取框包含多个习题的题目时,无法准确确定待搜索习题的题目,进而无法保证搜题结果的准确性。发明内容
[0004] 本申请提供了一种题目确定方法、装置、设备及存储介质,以解决现有技术中当选取框包含多个习题的题目时,无法准确确定待搜索习题的题目的技术问题。
[0005] 第一方面,本申请实施例提供了一种题目确定方法,包括:
[0006] 获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,其中,所述题目选取框包含在所述习题页面中且根据所述手指坐标确定;
[0007] 根据所述文本信息确定所述题目选取框中每个习题题目的边界坐标;
[0008] 根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目。
[0009] 第二方面,本申请实施例还提供了一种题目确定装置,包括:
[0010] 信息获取模,用于获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,其中,所述题目选取框包含在所述习题页面中且根据所述手指坐标确定;
[0011] 坐标确定模块,用于根据所述文本信息确定所述题目选取框中每个习题题目的边界坐标;
[0012] 题目确定模块,用于根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目。
[0013] 第三方面,本申请实施例还提供了一种题目确定设备,包括:
[0014] 一个或多个处理器;
[0015] 存储器,用于存储一个或多个程序;
[0016] 当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如第一方面所述的题目确定方法。
[0017] 第四方面,本申请实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的题目确定方法。
[0018] 上述题目确定方法、装置、设备及存储介质,通过获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,之后,根据文本信息确定题目选取框中包含的每个习题题目的边界坐标,并且,选择手指坐标落入的边界坐标对应的习题题目作为目标习题题目的技术手段,解决现有技术中当选取框包含多个习题的题目时,无法准确性的确定待搜索习题的题目的技术问题。通过文本信息的识别可以确定题目选取框中包含的每个习题的题目,保证了习题题目的准确性。之后,结合每个习题题目在习题页面的边界坐标以及用户的手指坐标可以准确确定用户选择的目标习题题目,尤其当包含多个习题题目时,可以准确得到待搜索习题的题目,进而保证后续搜题的准确性。附图说明
[0019] 图1为本申请实施例一提供的一种题目确定方法的流程图
[0020] 图2为本申请实施例二提供的一种题目确定方法的流程图;
[0021] 图3为本申请实施例二提供的题目选取框示意图;
[0022] 图4为本申请实施例三提供的一种题目确定装置的结构示意图;
[0023] 图5为本申请实施例四提供的一种题目确定设备的结构示意图。

具体实施方式

[0024] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例用于解释本申请,而非对本申请的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本申请相关的部分而非全部结构。
[0025] 需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或操作或对象与另一个实体或操作或对象区分开来,而不一定要求或者暗示这些实体或操作或对象之前存在任何这种实际的关系或顺序。例如,第一设定行数和第二设定行数的“第一”和“第二”用来区分两个不同的设定行数。
[0026] 实施例一
[0027] 图1为本申请实施例一提供的一种题目确定方法的流程图。实施例中提供的题目确定方法可以由题目确定装置执行,该题目确定装置可以通过软件和/或硬件的方式实现,并集成在题目确定设备中。其中,题目确定设备可以是家教机、电脑、手机等具有数据处理及分析能的智能设备。实施例中以题目确定设备为家教机为例。
[0028] 具体的,参考图1,该题目确定方法具体包括:
[0029] 步骤110、获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,其中,题目选取框包含在习题页面中且根据手指坐标确定。
[0030] 可以理解,习题页面可以是用户当前使用的纸质习题页面。此时,用户可以将当前使用的纸质习题页面放置家教机摄像头可以扫描到的范围。当摄像头检测到用户的手指点击或指向纸质习题页面时,获取当前的纸质习题页面的实时图像或者对纸质习题页面进行拍摄得到一张图片,实施例中以图片为例进行表述。还可以理解,习题页面也可以是用户当前播放的电子习题页面。此时,当检测到用户在电子习题页面的点击操作时,对电子习题页面进行截图,生成一张图片。之后,结合用户手指在习题页面的手指坐标在图片中生成一个题目选取框。该题目选取框包含手指坐标且可以认为是对图片中某个区域的截图。其中,手指坐标的确定方式实施例不作限定,例如,根据用户手指在摄像头采集范围的坐标系下的位置确定其在习题页面的手指坐标,此时,摄像头采集的纸质习题页面生成的图片的坐标系与摄像头采集范围的坐标系可以相同。又如,根据用户在电子习题页面的点击位置确定手指坐标。实施例中,以习题页面为纸质习题页面为例进行表述。
[0031] 进一步的,该题目选取框中的内容可以为初次识别得到的结果。其中,题目选取框中内容的识别方式实施例不做限定。例如,采用OCR(Optical Character Recognition,光学字符识别)技术识别出题目选取框中的文本信息,并将文本信息作为初次识别得到的结果。
[0032] 步骤120、根据文本信息确定题目选取框中每个习题题目的边界坐标。
[0033] 一般而言,题目选取框中包含至少一个习题题目,因此,需要根据文本信息识别出每个习题题目,进而得到边界坐标。具体的,根据文本信息可以确定题目选取框中每个字符所属的行,之后,可以获取每一行的子文本信息中的题目特征,并根据题目特征和行特征划分出题目选取框中的每个习题题目。其中,题目特征可包含题号特征。题号特征可以包含至少一级,例如,题号特征分为两级,一级题号特征为大写数字,二级题号特征为阿拉伯数字。行特征可以包含行首缩进量、行间距等。进一步的,根据题目特征和行特征划分出题目选取框中的每个习题题目的具体方式实施例不作限定。例如,某一行的行首缩进量为2个字符,且该行行首为一级题号特征,则可以将该行作为一道习题题目。之后,确定该行的下一行的行首缩进量为0,且该行与下一行的行间距小于2倍行间距,同时,下一行的行首没有题目特征,则可以将下一行与该行划分为一道习题的题目。再如,某一行的行首缩进量为2个字符,且该行行首为一级题号特征,则可以将该行作为一道习题题目,之后,确定该行的下一行的行首缩进量为0,同时,确定下一行的行首为二级题号特征且二级题号特征具体的数值为1,则可以认为下一行是该行下的一个子问题题目,进而将下一行与该行划分为一道习题的题目。还如,某一行的行首缩进量为2个字符,且该行行首为一级题号特征,则可以将该行作为一个习题的题目。之后,确定该行的下一行的行首缩进量为2个字符,且下一行的行首同样为一级题号特征,则可以认为下一行是另一个习题题目。一般而言,根据题目选取框中每一行的行特征以及题目特征便可以确定每一行所属的习题题目。
[0034] 之后,确定每个习题题目在题目选取框中的边界坐标。其中,题目选取框与图片可以共用一个坐标系。边界坐标可以理解为一个坐标范围。边界坐标可以是包含对应习题题目的最小边框的坐标,或者是,包含对应习题题目的最小边框中上边界和下边界的坐标。
[0035] 步骤130、根据边界坐标和手指坐标确定用户选择的目标习题题目。
[0036] 具体的,依次询问每个习题题目的边界坐标,以确定哪个边界坐标的坐标范围内包含手指坐标,进而确定手指坐标落入的边界坐标。之后,落入的边界坐标对应的习题题目确定为用户选中的待搜索的习题题目,实施例中,将确定的习题题目记为目标习题题目。
[0037] 上述,通过获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,之后,根据文本信息确定题目选取框中包含的每个习题题目的边界坐标,并且,选择手指坐标落入的边界坐标对应的习题题目作为目标习题题目的技术手段,解决现有技术中当选取框包含多个习题的题目时,无法准确性的确定待搜索习题的题目的技术问题。通过文本信息的识别可以确定题目选取框中包含的每个习题的题目,保证了习题题目的准确性。之后,结合每个习题题目在习题页面的边界坐标以及用户的手指坐标可以准确确定用户选择的目标习题题目,尤其当包含多个习题题目时,可以准确得到待搜索习题的题目,进而保证后续搜题的准确性。
[0038] 在上述实施例的基础上,得到目标习题题目后,可以在习题搜索引擎中进行搜索。此时,设定根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目之后,还包括:
根据目标习题题目在习题搜索引擎中进行搜索,以得到目标习题题目的习题搜索结果。
[0039] 具体的,习题搜索引擎可以理解为习题库,其可以配置在题目确定设备端,或者是配置在后台服务器。当习题搜索引擎配置在后台服务器时,题目确定设备可以通过访问后台服务器的方式在习题搜素引擎中进行查找。进一步的,每个习题搜索引擎可以对应一个习题集合,例如,习题搜索引擎对应的习题集合是:小学三年级数学书中包含的习题,或者,小学全部数学教材中包含的习题。
[0040] 进一步的,计算目标习题题目与习题搜索引擎中各习题题目的置信度,之后,选择置信度最高的设定数量的习题题目作为习题搜索引擎的习题搜索结果,并反馈至题目确定设备进行显示,以供用户选择。此时,用户可以选择需要的习题题目,之后,题目确定设备可以显示该习题,或者是,显示该习题的解释方法,又或是显示该习题的相似习题。
[0041] 上述,由于目标习题题目具有高准确度,因此,习题搜索结果同样具有高准确度。
[0042] 实施例二
[0043] 图2为本申请实施例二提供的一种题目确定方法的流程图。本实施例提供的题目确定方法是在上述实施例的基础上进行具体化。具体的,本实施例提供的题目确定方法包括:
[0044] 步骤210、获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,其中,题目选取框包含在习题页面中且根据手指坐标确定。
[0045] 步骤220、根据文本信息的纵轴坐标确定文本信息中每一行包含的子文本信息。
[0046] 示例性的,识别出题目选取框中的文本信息后,可以确认文本信息中包含的每个字符以及该字符在图片中的坐标,之后,根据每个文字的纵轴坐标便可以确定题目选取框中包含的行数,以及每一行包含的全部字符。实施例中,将每一行包含的全部字符记为该行包含的子文本信息。文本信息中包含字符可以是文字、单词或者数字。具体的,该步骤具体包括:
[0047] 步骤221、确定文本信息中每个字符的纵轴坐标。
[0048] 具体的,文本信息中某个字符为文字时,可以确定该文字在图片中的坐标。文本信息中字符为单词时,可以确定该单词在图片中的坐标,文本信息中字符为数字时,可以确定该数字在图片中的坐标。其中,坐标可以是指包含字符的最小矩形区域在图片中的坐标范围,相应的,纵轴坐标可以认为是对应坐标范围中的纵坐标范围。或者,确认包含字符的最小矩形区域,之后,将该最小矩形区域的中心或重心在图片中的坐标作为字符的坐标,相应的,纵轴坐标可以认为是中心或重心在图片的纵坐标。可以理解,最小矩形区域只是确定字符坐标的一种可选参考量,实际应用中,还可以选择其他方式确定字符坐标。
[0049] 步骤222、根据每个字符的纵轴坐标确定每个字符所属的行号,并得到每一行包含的子文本信息,每个行号对应一行子文本信息。
[0050] 具体的,行号可以对应于图片,即图片中所属的第几行,也可以对应于题目选取框,即题目选取框中所属的第几行,其中,行号对应图片和行号对应题目选取框时,本步骤采用的技术手段相同,仅是行号对应的数值不同。因此,实施例中,以行号对应于题目选取框为例进行表述。
[0051] 可选的,根据每个字符的纵轴坐标可以确定属于同一行的字符,通常,同一行的字符之间的纵轴坐标的比较接近。因此,可以将处于同一纵轴坐标范围的字符确定为同一行的字符,其中,纵轴坐标范围可以结合实际情况选定。之后,可以得到题目选取框包含的行的总数量,并根据行的总数量从1开始为每一行分配行号。此时,便可以确定每个字符所属的行号。
[0052] 还可选的,得到题目选取框的文本信息时,可以同步确定题目选取框包含的行的总数量以及每一行的纵轴坐标范围,并根据行的总数量从1开始为每一行分配行号,之后,根据每个字符的纵轴坐标以及每一行的纵轴坐标范围确定字符所属的行号。
[0053] 考虑到实际应用中,摄像头的度不同会导致拍摄的图片中文字产生倾斜等效果。此时,原本应该属于另一行的文字可能误判到相邻行的行号下。因此,为了防止误判的发生,实施例中,设定根据每个字符的纵轴坐标确定每个字符所属的行号之后,还包括:根据每个字符所属的行号对每个字符进行规整。具体的,计算当前行号中相邻的每两个字符之间的纵轴坐标的差值,若某个字符与相邻的两个字符之间的纵轴坐标的差值均大于设定值(该设定值可以根据实际情况设定),则将该字符确定为另一行的字符,即更换该字符的行号。此时,可以根据差值的正负确定该字符属于上一行的字符还是属于下一行的字符。按照上述方式便可以对每行中的字符进行规整,以保证行号准确性。
[0054] 进一步的,确定每个字符所属的行号后,便可以得到每一行下包含的全部字符,即得到每个行号对应的子文本信息。
[0055] 步骤230、判断是否需要向下扩大题目选取框。若是,则执行步骤240。否则,执行步骤250。
[0056] 考虑到实际应用中,当题目选取框中可能包含较少的文本信息时,无法保证目标习题题目的准确性,进而影响后续搜索结果。因此,实施例中,在确定每行对应的子文本信息后,判断是否需要扩大题目选取框。其中,判断是否需要扩大题目选取框时可以包含任一方案:
[0057] 方案一、根据子文本信息确定对应行是否属于缺失文本行。若属于缺失文本行,则执行步骤240,否则,执行步骤250。
[0058] 具体的,缺失文本行是指当前行包含的子文本信息所能体现的信息量过少。其中,缺失文本行可以通过识别子文本信息中的关键字符确定。此时,预先设定属于缺失文本行的题型,并确定题型对应的关键字符。之后,提取子文本信息中的关键字符,并通过关键字符确定是否属于缺失文本行。举例而言,设定填空题为缺失文本行的题型,且关键字符包括:“填写”、“___”等,此时,通过确定子文本信息是否包含该关键字符确定子文本信息是否属于缺失文本行。再举例而言,设定判断题为缺失文本行的题型,且关键字符包括:“判断”。此时,通过确定子文本信息是否包含该关键字符确定子文本信息是否属于缺失文本行。
[0059] 可选的,由于题目选取框中存在至少一条子文本信息,因此,只要其中一条子文本信息属于缺失文本行,则执行步骤240。若每条子文本信息均不属于缺失文本行,则执行步骤250。
[0060] 方案二、确定题目选取框中包含的行数是否小于第二设定行数。若确认所述题目选取框中包含的行数小于第二设定行数,则执行步骤240。否则,执行步骤250。
[0061] 具体的,在设置行号时,已经明确了题目选取框中包含的行的总数量(即行数),因此,本步骤可以直接获取行数。之后,将行数与第二设定行数进行比较。若行数小于第二设定行数,则说明题目选取框中包含的行数较少,通过每行子文本信息可以得到的信息量过少,因此,需要执行步骤240。否则,执行步骤250。其中,第二设定行数可以根据实际情况设定。例如,第二设定行数为3行。此时,若检测到题目选取框中的行数小于三行,则执行步骤240。
[0062] 步骤240、扩大题目选取框。返回执行步骤220。
[0063] 具体的,当需要扩大题目选取框时,对题目选取框进行扩大。其中。扩大题目选取框的方式可以结合实际情况设定。例如,向下和/或向上拉长题目选取框,以使题目选取框包含更多的行数,进而得到更多的子文本信息。实施例中以向下拉取题目选取框为例进行描述。
[0064] 其中,当判断是否需要扩大题目选取框时,采用方案一,则本步骤具体包括:将所述题目选取框扩大第一设定行数。当判断是否需要扩大题目选取框时,采用方案二,则本步骤具体包括:将所述题目选取框扩大第三设定行数。其中,第一设定行数与第三设定行数可以根据实际情况设定,其可以相同,也可以不同。例如,第一设定行数和第三设定行数为4,则将题目选取框在图片中向下拉取4行,以将题目选取框下面4行的文本数据填入题目选取框。
[0065] 进一步的,扩大题目选取框后,根据新加入的文本信息的纵轴坐标确定新加入的文本信息中每一行包含的子文本信息。或者是,根据题目选取框内全部文本信息的纵轴坐标确定新加入的文本信息中每一行包含的子文本信息。
[0066] 步骤250、根据子文本信息划分出题目选取框中的每个习题题目。
[0067] 具体的,得到每行的子文本信息后,便可以根据子文本信息得到题目选取框中的每个习题题目。具体的,逐一对每一行子文本信息进行识别,以确定其与上一行子文本信息是否属于同一习题题目,题目选取框内的每一行子文本信息均被识别后,便可以得到每个习题题目。
[0068] 其中,该步骤具体包括:
[0069] 步骤251、获取每一行的子文本信息中的题目特征。
[0070] 其中,题目特征是指可以确定习题题目的相关特征。题目特征可以包含题号特征、关键字符等内容。实施例中,以题目特征包含题号特征为例。题号特征可以理解为习题的题号。一般而言,题号位于行首位置。相邻习题的题号不相同。可选的,可以为题号特征设置级别,例如,一级题号特征为大写数值,二级题号特征为阿拉伯数字。一级题号特征优先于二级题号特征。即当某道习题包含多个问题时,该题可以使用一级题号特征,对应的多个问题可以使用二级题号特征,此时,在后续识别时,每个二级题号特征所在的子文本信息不会被单独识别为一个习题题目。此外,一级题号特征和二级题号特征都可以作为某一个习题题目的题号。
[0071] 具体的,题号特征的识别方式可以根据实际情况设定,例如,对行首位置的字符进行语义识别,以确定其是否为题号特征。
[0072] 步骤252、根据题目特征和行特征划分出题目选取框中的每个习题题目。
[0073] 示例性的,行特征可以包括:行间距、行首文字的坐标等内容。行间距可以通过每一行中子文本信息的横轴坐标确定。
[0074] 具体的,根据题目特征和行特征划分习题题目的规则可以根据实际情况设定。实施例中,示例性设定该规则包括下述至少一项内容:
[0075] 一、若相邻两行之间的行间距大于设定行间距,且所述相邻两行中的前一行不包含一级题号特征,则将相邻两行识别为两个习题题目。
[0076] 其中,设定行间距可以根据实际情况设定,例如,设定行间距为2倍行距。当相邻两行之间的行间距大于设定行间距,则可以说明相邻两行属于不同的段落,即相邻两行存在属于不同习题题目的可能,此时,获取相邻两行中的前一行所在的段,其中,段的识别手段可以根据实际情况设定,如某行不包含题号特征,且前一行为首行缩进或前一行与本行行首文字对齐,且前一行与该行行间距小于两倍行距,则将该行与前一行确定为一段。进一步的,确定前一行所在的段是否包含一级题号特征,即先确定前一行所在的段是否包含题号特征,若包含题号特征,则确定该题号特征是否为一级题号特征,如果不包含,其说明前一行所在的段为另一个习题题目的题干。若包含,则说明相邻两行中的后一行可能是前一行所在段下的一个子问题,此时,采用其他规则进行判断。
[0077] 举例而言,图3为本申请实施例二提供的题目选取框示意图。为了便于表述,在题目选取框外标识了行号,且增加了题目选取框包含的行数,实际应用中,题目选取框包含的行数会少于图3中题目选取框包含的行数。参考图3,第一行和第二行之间的行间距大于两倍行距,且题目选取框内第一行所在段不包含一级题号特征,此时,将第一行和第二行确认为两个习题题目。
[0078] 二、若相邻两行之间的行间距大于设定行间距,且相邻两行的行首文字坐标在横轴上对齐以及相邻两行中均包含题号特征,则将相邻两行识别为两个习题题目。
[0079] 具体的,相邻两行的行首文字的横轴坐标相等,则说明横轴坐标对齐,进而说明两行为并列的两行,且相邻两行均包含题号特征,则说明相邻两行为两个习题题目,该题号特征可以是一级题号特征或者二级题号特征,两个题号特征的级别可以相同或不同。举例而言,参考图3,第九行和第十行的行间距大于2倍行距,且第九行和第十行的行首文字横轴坐标对齐,且第九行和第十行均包含相同的题号特征,则将第九行和第十行识别为两个习题题目。
[0080] 三、若根据当前行的行首文字的坐标确定当前行属性为首行缩进,且当前行的前一行中没有题号特征或当前行包含题号特征,则将当前行识别为一个习题题目。
[0081] 当前行首行缩进时,可以确定当前行为新的一段,此时,通过确认前一行中没有题号特征或当前行包含题号特征,则确定当前行识别为一个习题题目。
[0082] 举例而言,图3中,第七行为首行缩进且包含题号特征,则确定第七行为一个习题题目。第十五行为首行缩进,且前一行没有题号,则确定第十五行为一个习题题目。
[0083] 四、若根据相邻两行的行首文字的坐标确定相邻两行的行首文字在横轴上的坐标差值在设定差值范围内,且相邻两行包含的题号特征的数值差值为第一差值,则将相邻两行识别为两个习题题目。
[0084] 设定差值范围可以根据实际情况设定,例如,设定差值范围为一个字符。第一差值可以根据实际情况设定,实施例中设定第一差值为1。此时,参考图3,第五行和第六行的行首文字在横轴上坐标差值大于一个字符,则先不将第五行和第六行确定为两个习题题目。第九行和第十行的行首文字在横轴上坐标差值小于一个字符,且两行的题号特征的数值差值为1,则将第九行和第十行确定为两个习题题目。
[0085] 五、若根据当前行行首文字的坐标以及当前行的前一行行首文字的坐标确定当前行行首文字与前一行行首文字在横轴上的坐标差值在设定差值范围内,且当前行包含的题号特征与前一行所在段包含的题号特征之间的数值差值为第二差值,则将当前行识别为一个习题题目。
[0086] 对于第四项而言,若某个习题题目超过了两行,则第四项无法准确得到习题题目。此时,可以结合第五项,即前一行不包含题号特征时,确认前一行所在段是否包含题号特征,若包含,则确认该题号特征与当前行题号特征的数值差值是否为第二差值,若是,则将当前行识别为一个习题题目。其中,第二差值优选为1。例如,参考图3,第十三行为当前行,其与第十二行的行首文字在横轴上的坐标差值在设定差值范围内,且第十三行与第十二行所在段的题号特征之间的数值差值为1,则将第十三行识别为一个习题题目。即第十二行和第十三行为不同的习题题目。
[0087] 六、若当前行的题号特征为二级题号特征且数值大于设定数值,以及当前行的前一行所在段的题号特征为一级题号特征,则将当前行识别为一个习题题目。
[0088] 其中,设定数值为2。例如,参考图3,第九行为二级题号特征且数值大于2,第八行所在段为一级题号特征且数值为四,此时,将第九行确定为一个习题题目。
[0089] 七、属于同一大题下的独立小题。
[0090] 具体的,大题对应的关键字符为:“填空题”、“选择题”、“判断题”、“应用题”等,即大题表示一种类型的习题题目。此时,通过关键字符可以识别出大题。独立小题是指一个大题后面、另一个大题前面之间的内容,之后,仅将之间的内容作为本文数据,并可以按照上述各项的方式识别出其包含每一道习题题目,此时,每一道习题题目可以认为是一道小题。
[0091] 八、若当前行以特定关键字符开头或者当前行拥有一级题号特征,则将当前行识别为一个习题题目。
[0092] 例如,特定关键字符可以是“判断”、“选择”等,此时,若当前行的行首出现特定关键字,则可以将其识别为一个习题题目。或者是,当前行拥有一级题号特征,则可以直接将当前行识别为一个习题题目。
[0093] 九、当前行的前一行为选择题的选项,则将当前行识别为一个习题题目。
[0094] 该项对应于选择题而言,若某一行的前一行被识别为选项,则将当前行确定为一个习题题目。
[0095] 可以理解,实际应用中,可以综合上述多项对各子文本信息的进行确认,以保证习题题目划分的准确性。
[0096] 步骤260、确认划分得到的每个习题题目的边界坐标。
[0097] 具体的,得到每个习题题目后,便可以确定习题题目对应的边界坐标。
[0098] 步骤270、根据边界坐标和手指坐标确定用户选择的目标习题题目。
[0099] 上述,通过获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,之后,根据文本信息每个字符的纵轴坐标确定文本信息中每一行包含的子文本信息,根据子文本信息可以划分出题目选取框中的每个习题题目,进而得到每个习题题目的边界坐标,之后,选择手指坐标落入的边界坐标对应的习题题目作为目标习题题目的技术手段,解决现有技术中当选取框包含多个习题的题目时,无法准确性的确定待搜索习题的题目的技术问题。通过对文本信息进行分行,且结合行与行之间的关系可以准确确定题目选取框中包含的每个习题的题目,保证了习题题目的准确性。之后,结合每个习题题目在习题页面的边界坐标以及用户的手指坐标可以准确确定用户选择的目标习题题目,尤其当包含多个习题题目时,可以准确得到待搜索习题的题目,进而保证后续搜题的准确性。
[0100] 实施例三
[0101] 图4为本申请实施例三提供的一种题目确定装置的结构示意图。参考图4,本实施例提供的题目确定装置包括:信息获取模块301、坐标确定模块302、题目确定模块303。
[0102] 其中,信息获取模块301,用于获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,其中,所述题目选取框包含在所述习题页面中且根据所述手指坐标确定;坐标确定模块302,用于根据所述文本信息确定所述题目选取框中每个习题题目的边界坐标;题目确定模块303,用于根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目。
[0103] 上述,通过获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,之后,根据文本信息确定题目选取框中包含的每个习题题目的边界坐标,并且,选择手指坐标落入的边界坐标对应的习题题目作为目标习题题目的技术手段,解决现有技术中当选取框包含多个习题的题目时,无法准确性的确定待搜索习题的题目的技术问题。通过文本信息的识别可以确定题目选取框中包含的每个习题的题目,保证了习题题目的准确性。之后,结合每个习题题目在习题页面的边界坐标以及用户的手指坐标可以准确确定用户选择的目标习题题目,尤其当包含多个习题题目时,可以准确得到待搜索习题的题目,进而保证后续搜题的准确性。
[0104] 在上述实施例的基础上,坐标确定模块302包括:子信息确定单元,用于根据所述文本信息的纵轴坐标确定所述文本信息中每一行包含的子文本信息;题目划分单元,用于根据所述子文本信息划分出所述题目选取框中的每个习题题目;坐标确认单元,用于确认划分得到的每个习题题目的边界坐标。
[0105] 在上述实施例的基础上,子信息确定单元包括:坐标确定子单元,用于确定所述文本信息中每个字符的纵轴坐标;行号确定子单元,用于根据所述每个字符的纵轴坐标确定每个字符所属的行号,并得到每一行包含的子文本信息,每个行号对应一行子文本信息。
[0106] 在上述实施例的基础上,还包括:规则模块,用于根据所述每个字符的纵轴坐标确定每个字符所属的行号之后,根据每个字符所属的行号对每个字符进行规整。
[0107] 在上述实施例的基础上,题目划分单元包括:获取确定子单元,用于获取每一行的所述子文本信息中的题目特征;划分子单元,用于根据所述题目特征和行特征划分出所述题目选取框中的每个习题题目。
[0108] 在上述实施例的基础上,还包括:扩大模块,用于根据所述子文本信息划分出所述题目选取框中的每个习题题目之前,根据所述子文本信息确定对应行是否属于缺失文本行,若属于缺失文本行,则将所述题目选取框扩大第一设定行数,并返回执行根据所述文本信息的纵轴坐标确定所述文本信息中每一行包含的子文本信息的操作;或,用于根据所述子文本信息划分出所述题目选取框中的每个习题题目之前,若确认所述题目选取框中包含的行数小于第二设定行数,则将所述题目选取框扩大第三设定行数,并返回执行根据所述文本信息的纵轴坐标确定所述文本信息中每一行包含的子文本信息的操作。
[0109] 在上述实施例的基础上,还包括:搜索模块,用于根据所述边界坐标和所述手指坐标确定用户选择中的目标习题题目之后,根据所述目标习题题目在习题搜索引擎中进行搜索,以得到所述目标习题题目的习题搜索结果。
[0110] 本实施例提供的题目确定装置包含在题目确定设备中,可以用于执行上述任意实施例提供的题目确定方法,具备相应的功能和有益效果。
[0111] 实施例四
[0112] 图5为本申请实施例四提供的一种题目确定设备的结构示意图。具体的,如图5所示,该题目确定设备包括处理器40、存储器41、输入装置42以及输出装置43;该题目确定设备中处理器40的数量可以是一个或多个,图5中以一个处理器40为例;该题目确定设备中的处理器40、存储器41、输入装置42以及输出装置43可以通过总线或其他方式连接,图5中以通过总线连接为例。
[0113] 存储器41作为一种计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本申请实施例中的题目确定方法中的程序指令/模块(例如,题目确定装置中的信息获取模块301、坐标确定模块302和题目确定模块303)。处理器40通过运行存储在存储器41中的软件程序、指令以及模块,从而执行题目确定设备的各种功能应用以及数据处理,即实现上述任意实施例提供的题目确定方法。
[0114] 存储器41可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序;存储数据区可存储根据题目确定设备的使用所创建的数据等。此外,存储器41可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非易失性固态存储器件。在一些实例中,存储器41可进一步包括相对于处理器40远程设置的存储器,这些远程存储器可以通过网络连接至题目确定设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
[0115] 输入装置42可用于接收输入的数字或字符信息,以及产生与题目确定设备的用户设置以及功能控制有关的键信号输入、以及摄像头等设备。输出装置43可包括显示屏、扬声器等设备。
[0116] 上述题目确定设备包含实施例三提供的题目确定装置,可以用于执行任意实施例提供的题目确定方法,具备相应的功能和有益效果。
[0117] 实施例五
[0118] 本申请实施例还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种题目确定方法,该方法包括:
[0119] 获取题目选取框中的文本信息以及用户手指在习题页面的手指坐标,其中,所述题目选取框包含在所述习题页面中且根据所述手指坐标确定;
[0120] 根据所述文本信息确定所述题目选取框中每个习题题目的边界坐标;
[0121] 根据所述边界坐标和所述手指坐标确定用户选择的目标习题题目。
[0122] 当然,本申请实施例所提供的一种包含计算机可执行指令的存储介质,其计算机可执行指令不限于如上所述的方法操作,还可以执行本申请任意实施例所提供的题目确定方法中的相关操作。
[0123] 通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本申请可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述的题目确定方法。
[0124] 值得注意的是,上述题目确定装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。
[0125] 注意,上述仅为本申请的较佳实施例及所运用技术原理。本领域技术人员会理解,本申请不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本申请的保护范围。因此,虽然通过以上实施例对本申请进行了较为详细的说明,但是本申请不仅仅限于以上实施例,在不脱离本申请构思的情况下,还可以包括更多其他等效实施例,而本申请的范围由所附的权利要求范围决定。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈