首页 / 专利库 / 专利权 / 申请 / 国际申请 / 附图 / 文本内容的处理方法、装置、设备以及存储介质

文本内容的处理方法、装置、设备以及存储介质

阅读:974发布:2020-05-13

专利汇可以提供文本内容的处理方法、装置、设备以及存储介质专利检索,专利查询,专利分析的服务。并且本 申请 提供一种文本内容的处理方法、装置、设备以及存储介质。该方法包括: 电子 设备通过 接口 获取待处理的文本内容。电子设备根据 附图 信息和/或表格信息的特征筛选文本内容中的附图信息和/或表格信息。进而,电子设备将筛选得到的附图信息和/或表格信息显示在电子设备的显示器中。本申请中,电子设备对文本内容进行处理,使文本内容中的附图信息和/或表格信息得以在显示器中显示,进而方便用户整体查看并梳理附图信息和/或表格信息,避免文本的篇幅、排版等原因导致的遗漏或者忽视现象,提高校对的准确率。,下面是文本内容的处理方法、装置、设备以及存储介质专利的具体信息内容。

1.一种文本内容的处理方法,其特征在于,所述方法包括:
获取待处理的文本内容;
根据第一预设规则,对所述待处理的文本内容进行筛选,得到第一筛选结果,所述第一预设规则用于筛选文本内容中的附图信息和/或表格信息;
将所述第一筛选结果进行显示。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据第二预设规则,对所述待处理的文本内容进行筛选,得到第二筛选结果,所述第二预设规则用于筛选文本内容中的附图和/或表格。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
将所述第一筛选结果中的附图信息与所述第二筛选结果中的附图进行匹配,确定附图与附图信息是否对应;
若存在第一附图不存在对应的附图信息和/或第一附图信息不存在对应的附图,则显示第一提示信息,所述第一提示信息用于指示附图与附图信息不匹配。
4.根据权利要求3所述的方法,其特征在于,附图信息包括图序和图题,则所述方法还包括:
将所述第一筛选结果中与第二筛选结果中的附图匹配成功的附图信息作为第三筛选结果;
确定所述第三筛选结果中的附图信息是否满足第一预设条件;
若不满足,则显示第二提示信息,所述第二提示信息用于提示附图信息有误;
其中,所述第一预设条件包括以下至少一个:图题满足图题命名规则,图序连续,图序编码规则一致。
5.根据权利要求2至4任一项所述的方法,其特征在于,所述方法还包括:
将所述第一筛选结果中的表格信息与所述第二筛选结果中的表格进行匹配,确定表格与表格信息是否对应;
若存在第一表格不存在对应的表格信息和/或第一表格信息不存在对应的表格,则显示第三提示信息,所述第三提示信息用于指示表格与表格信息不匹配。
6.根据权利要求5所述的方法,其特征在于,表格信息包括表序和表题,则所述方法还包括:
将所述第一筛选结果中与第二筛选结果中的表格匹配成功的表格信息作为第四筛选结果;
确定所述第四筛选结果中的表格信息是否满足第二预设条件;
若不满足,则显示第四提示信息,所述第四提示信息用于提示表格信息有误;
其中,所述第二预设条件包括以下至少一个:表格满足表题命名规则,表序连续,表序编码规则一致。
7.一种文本内容的处理装置,其特征在于,包括:
获取模,用于获取待处理的文本内容;
处理模块,用于根据第一预设规则,对所述待处理的文本内容进行筛选,得到第一筛选结果,所述第一预设规则用于筛选文本内容中的附图信息和/或表格信息;
显示模块,用于将所述第一筛选结果进行显示。
8.根据权利要求7所述的装置,其特征在于,所述处理模块还用于:
根据第二预设规则,对所述待处理的文本内容进行筛选,得到第二筛选结果,所述第二预设规则用于筛选文本内容中的附图和/或表格。
9.根据权利要求8所述的装置,其特征在于,所述处理模块还用于:
将所述第一筛选结果中的附图信息与所述第二筛选结果中的附图进行匹配,确定附图与附图信息是否对应;
若存在第一附图不存在对应的附图信息和/或第一附图信息不存在对应的附图,则显示第一提示信息,所述第一提示信息用于指示附图与附图信息不匹配。
10.根据权利要求9所述的装置,其特征在于,附图信息包括图序和图题,则所述处理模块还用于:
将所述第一筛选结果中与第二筛选结果中的附图匹配成功的附图信息作为第三筛选结果;
确定所述第三筛选结果中的附图信息是否满足第一预设条件;
若不满足,则显示第二提示信息,所述第二提示信息用于提示附图信息有误;
其中,所述第一预设条件包括以下至少一个:图题满足图题命名规则,图序连续,图序编码规则一致。
11.根据权利要求8至10任一项所述的装置,其特征在于,所述处理模块还用于:
将所述第一筛选结果中的表格信息与所述第二筛选结果中的表格进行匹配,确定表格与表格信息是否对应;
若存在第一表格不存在对应的表格信息和/或第一表格信息不存在对应的表格,则显示第三提示信息,所述第三提示信息用于指示表格与表格信息不匹配。
12.根据权利要求11所述的装置,其特征在于,表格信息包括表序和表题,则所述处理模块还用于:
将所述第一筛选结果中与第二筛选结果中的表格匹配成功的表格信息作为第四筛选结果;
确定所述第四筛选结果中的表格信息是否满足第二预设条件;
若不满足,则显示第四提示信息,所述第四提示信息用于提示表格信息有误;
其中,所述第二预设条件包括以下至少一个:表格满足表题命名规则,表序连续,表序编码规则一致。
13.一种电子设备,其特征在于,包括:存储器,显示器,处理器;
存储器用于存储程序指令;
显示器用于显示处理器的处理结果;
处理器用于调用存储器中的程序指令执行如权利要求1至7任一项所述的文本内容的处理方法。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时用于实现如权利要求1至7任一项所述的文本内容的处理方法。

说明书全文

文本内容的处理方法、装置、设备以及存储介质

技术领域

[0001] 本申请涉及计算机领域,尤其涉及一种文本内容的处理方法、装置、设备以及存储介质。

背景技术

[0002] 在图书、期刊、稿件等文本内容的编辑过程中,用户经常需要采用附图或者表格,对文本内容进行说明。
[0003] 在对文本内容进行编辑的过程中,每个附图或者表格都需要进行编号和命名,以方便对图片或者表格进行说明,以及在正文中引用。用户在编辑过程中,常常需要对附图和表格进行删减或者调整等操作,不可避免地,会产生附图信息和表格信息的错误或者缺失等问题。因此,检验附图信息和表格信息是否正确,是编审和校对过程中尤为重要的内容。
[0004] 然而,在通过人工方式对文本编审和校对过程中,因为篇幅、排版等原因,容易出现遗漏或者忽视,存在校对的准确率参差不齐的问题。发明内容
[0005] 本申请提供一种文本内容的处理方法、装置、设备以及存储介质,以解决现有技术中,采用人工的方式对文本进行变身和校对时,容易出现遗漏或者忽视,存在校对的准确率参差不齐问题。
[0006] 第一方面,本申请提供一种文本内容的处理方法,包括:
[0007] 获取待处理的文本内容;
[0008] 根据第一预设规则,对所述待处理的文本内容进行筛选,得到第一筛选结果,所述第一预设规则用于筛选文本内容中的附图信息和/或表格信息;
[0009] 将所述第一筛选结果进行显示。
[0010] 可选地,所述方法还包括:
[0011] 根据第二预设规则,对所述待处理的文本内容进行筛选,得到第二筛选结果,所述第二预设规则用于筛选文本内容中的附图和/或表格。
[0012] 可选地,所述方法还包括:
[0013] 将所述第一筛选结果中的附图信息与所述第二筛选结果中的附图进行匹配,确定附图与附图信息是否对应;
[0014] 若存在第一附图不存在对应的附图信息和/或第一附图信息不存在对应的附图,则显示第一提示信息,所述第一提示信息用于指示附图与附图信息不匹配。
[0015] 可选地,附图信息包括图序和图题,则所述方法还包括:
[0016] 将所述第一筛选结果中与第二筛选结果中的附图匹配成功的附图信息作为第三筛选结果;
[0017] 确定所述第三筛选结果中的附图信息是否满足第一预设条件;
[0018] 若不满足,则显示第二提示信息,所述第二提示信息用于提示附图信息有误;
[0019] 其中,所述第一预设条件包括以下至少一个:图题满足图题命名规则,图序连续,图序编码规则一致。
[0020] 可选地,所述方法还包括:
[0021] 将所述第一筛选结果中的表格信息与所述第二筛选结果中的表格进行匹配,确定表格与表格信息是否对应;
[0022] 若存在第一表格不存在对应的表格信息和/或第一表格信息不存在对应的表格,则显示第三提示信息,所述第三提示信息用于指示表格与表格信息不匹配。
[0023] 可选地,表格信息包括表序和表题,则所述方法还包括:
[0024] 将所述第一筛选结果中与第二筛选结果中的表格匹配成功的表格信息作为第四筛选结果;
[0025] 确定所述第四筛选结果中的表格信息是否满足第二预设条件;
[0026] 若不满足,则显示第四提示信息,所述第四提示信息用于提示表格信息有误;
[0027] 其中,所述第二预设条件包括以下至少一个:表格满足表题命名规则,表序连续,表序编码规则一致。
[0028] 第二方面,本申请提供一种文本内容的处理装置,包括:
[0029] 获取模,用于获取待处理的文本内容;
[0030] 处理模块,用于根据第一预设规则,对所述待处理的文本内容进行筛选,得到第一筛选结果,所述第一预设规则用于筛选文本内容中的附图信息和/或表格信息;
[0031] 显示模块,用于将所述第一筛选结果进行显示。
[0032] 可选地,所述处理模块还用于:
[0033] 根据第二预设规则,对所述待处理的文本内容进行筛选,得到第二筛选结果,所述第二预设规则用于筛选文本内容中的附图和/或表格。
[0034] 可选地,所述处理模块还用于:
[0035] 将所述第一筛选结果中的附图信息与所述第二筛选结果中的附图进行匹配,确定附图与附图信息是否对应;
[0036] 若存在第一附图不存在对应的附图信息和/或第一附图信息不存在对应的附图,则显示第一提示信息,所述第一提示信息用于指示附图与附图信息不匹配。
[0037] 可选地,附图信息包括图序和图题,则所述处理模块还用于:
[0038] 将所述第一筛选结果中与第二筛选结果中的附图匹配成功的附图信息作为第三筛选结果;
[0039] 确定所述第三筛选结果中的附图信息是否满足第一预设条件;
[0040] 若不满足,则显示第二提示信息,所述第二提示信息用于提示附图信息有误;
[0041] 其中,所述第一预设条件包括以下至少一个:图题满足图题命名规则,图序连续,图序编码规则一致。
[0042] 可选地,所述处理模块还用于:
[0043] 将所述第一筛选结果中的表格信息与所述第二筛选结果中的表格进行匹配,确定表格与表格信息是否对应;
[0044] 若存在第一表格不存在对应的表格信息和/或第一表格信息不存在对应的表格,则显示第三提示信息,所述第三提示信息用于指示表格与表格信息不匹配。
[0045] 可选地,表格信息包括表序和表题,则所述处理模块还用于:
[0046] 将所述第一筛选结果中与第二筛选结果中的表格匹配成功的表格信息作为第四筛选结果;
[0047] 确定所述第四筛选结果中的表格信息是否满足第二预设条件;
[0048] 若不满足,则显示第四提示信息,所述第四提示信息用于提示表格信息有误;
[0049] 其中,所述第二预设条件包括以下至少一个:表格满足表题命名规则,表序连续,表序编码规则一致。
[0050] 第三方面,本申请提供一种电子设备,包括:存储器,显示器,处理器;
[0051] 存储器用于存储程序指令;
[0052] 显示器用于显示处理器的处理结果;
[0053] 处理器用于调用存储器中的程序指令执行第一方面及第一方面任一种可能的设计中的文本内容的处理方法。
[0054] 第四方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机执行指令,所述计算机执行指令被处理器执行时,用于实现第一方面及第一方面任一种可能的设计中的文本内容的处理方法。
[0055] 本申请提供的文本内容的处理方法、装置、设备以及存储介质,通过电子设备的接口获取待处理的文本内容。电子设备根据附图信息和/或表格信息的特征筛选文本内容中的附图信息和/或表格信息。进而,电子设备将筛选得到的附图信息和/或表格信息显示在电子设备的显示器中。本申请中,电子设备对文本内容进行处理,将文本内容中的附图信息和/或表格信息显示在显示器中,进而方便用户查看并梳理附图信息和/或表格信息,避免因为文本内容的篇幅、排版等原因导致的遗漏或者忽视现象,实现提高校对的准确率的效果。

附图说明

[0056] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。
[0057] 图1为本申请一实施例提供的文本内容的处理方法的流程图
[0058] 图2为本申请一实施例提供的文本内容的处理方法的流程图;
[0059] 图3为本申请一实施例提供的文本内容的处理方法的流程图;
[0060] 图4为本申请一实施例提供的文本内容的处理装置的结构示意图;
[0061] 图5为本申请一实施例提供的电子设备的硬件结构示意图。
[0062] 通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为本领域技术人员说明本公开的概念。

具体实施方式

[0063] 为使本申请的目的、技术方案和优点更加清楚,下面将结合本申请中的附图,对本申请中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0064] 应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0065] 在现有技术中,对图书、期刊、稿件等文本内容的编审和校对过程,通常是用户在电子设备上完成的。在用户编审和校对过程中,因为电子设备的显示器大小有限,无法清楚的显示全部文本内容,并且由于文本的篇幅、排版等原因,用户需要上下翻看,以校对附图信息或者表格信息。而手动的翻看过程通常存在不稳定性,容易出现遗漏或者忽视,导致校对的准确率参差不齐。
[0066] 为了解决上述问题,本申请提供一种文本内容的处理方法、装置、设备以及存储介质。本申请中,电子设备通过使用预设规则,对文本内容中的附图信息和/或表格信息进行筛选,并对筛选内容进行显示。用户可以通过电子设备查看筛选得到的附图信息和/或表格信息,进而可以从整体上对附图信息和/或表格信息进行梳理,便于文本内容的编审和校对,实现提高校对的准确率的效果。
[0067] 本申请的执行主体为电子设备,该电子设备可以为手机、平板电脑笔记本电脑服务器等可以集成显示器或者可以外接显示器的电子设备,本申请对此不做限制。
[0068] 图1示出了本申请一实施例提供的文本内容的处理方法的流程图。如图1所示,以电子设备为执行主体,本实施例的方法可以包括:
[0069] S101、电子设备获取待处理的文本内容。
[0070] 本方案主要是为了对文本内容中的图和/或表格等内容进行校验,首先电子设备需要获取待处理的文本内容。一般来说,电子设备可通过接口获取待处理的文本内容。
[0071] 其中,用于获取待处理的文本内容的接口的表现形式包括但不限于窗口或者网页。该接口可以与处理器显示在同一个电子设备上,也可以与处理器显示在不同电子设备上。用户通过接口,选择待处理的文本内容,进而将文本内容传输到电子设备,由电子设备的处理器进行处理。
[0072] 其中,上述获取到的待处理的文本内容可以是图书、期刊、稿件等。
[0073] S102、电子设备根据第一预设规则,对待处理的文本内容进行筛选,得到第一筛选结果,第一预设规则用于筛选文本内容中的附图信息和/或表格信息。
[0074] 在本实施例中,为了能够使用户方便快速的确认附图信息和/或表格信息是否正确,而不需要反复翻阅文本内容,电子设备需要从文本内容中获取所有的附图信息和/或表格信息。在具体实现中,电子设备根据第一预设规则对文本内容进行筛选。
[0075] 其中,第一预设规则的筛选条件,可以是附图信息和/或表格信息的特征,例如,段首为图序或者表序。图序或者表序是指附图信息或者表格信息的头部,例如,附图信息或者表格信息中,图+数字部分的信息,该部分信息还可以是图示+数字、Fig+数字、表+数字、Table+数字等。
[0076] 电子设备通过对文本内容,采用上述的规则进行筛选得到第一筛选结果。
[0077] 其中,第一筛选结果包括文本内容中的附图信息和/或表格信息。其中,可能包括正确的附图信息和/或表格信息,或者已经删除附图和/或表格但是忘记对应删除的附图信息和/或表格信息等。
[0078] S103、电子设备将第一筛选结果进行显示。
[0079] 在本实施例中,S102中筛选得到了附图信息和/或表格信息,电子设备在显示器上显示该第一筛选结果。
[0080] 其中,该附图信息和/或表格信息可以通过列表或者表格的方式进行显示,该列表或者表格可以显示在电子设备的窗口或者网页上。
[0081] 优选地,电子设备可以关联第一筛选结果和文本内容。用户在上述窗口或者网页上,点击显示一条附图信息或者表格信息,文本内容对应跳转到该附图信息或者表格信息的对应位置。该跳转功能的使用,可以方便用户在查看附图信息和/或表格信息后,对一条附图信息或者表格信息进行处理。
[0082] 本申请提供的文本内容的处理方法,通过电子设备的接口获取待处理的文本内容。电子设备根据附图信息和/或表格信息的特征,筛选文本内容中的附图信息和/或表格信息。进而,电子设备将筛选得到的附图信息和/或表格信息显示在电子设备的显示器中。电子设备还可以通过点击一条附图信息或者表格信息的方式,使文本内容跳转到对应的附图信息或者表格信息所在的位置。本申请中,电子设备对文本内容进行处理,并将处理结果显示在显示器中,进而方便用户查看并梳理附图信息和/或表格信息,避免因为文本内容的篇幅、排版等原因导致的遗漏或者忽视现象,实现提高校对的准确率的效果。电子设备还可以通过关联附图信息和/或表格信息与文本内容,方便用户对附图信息或者表格信息进行处理,使文本内容在编审和校对过程中,可以更加准确的定位修改的内容和修改的位置,进而,实现提高校对的准确率的效果。
[0083] 在上述图1所示实施例的基础上,结合图2,对图1中S102根据第一预设规则,对待处理的文本内容进行筛选,得到第一筛选结果,第一预设规则用于筛选文本内容中的附图信息和/或表格信息的具体实现方式进行详细的说明。
[0084] 图2示出了本申请一实施例提供的文本内容的处理方法的流程图。如图2所示,本实施例的方法可以包括:
[0085] S201、电子设备获取待处理的文本内容。
[0086] 其中,S201与图1实施例中的S101实现方式类似,本实施例此处不再赘述。
[0087] S202、电子设备根据第一预设规则,对待处理的文本内容进行筛选,得到第一筛选结果,第一预设规则用于筛选文本内容中的附图信息和/或表格信息。
[0088] 其中,S202与图1实施例中的S102实现方式类似,本实施例此处不再赘述。
[0089] S203、电子设备根据第二预设规则,对待处理的文本内容进行筛选,得到第二筛选结果,第二预设规则用于筛选文本内容中的附图和/或表格。
[0090] 在本实施例中,为了更准确的校对附图信息和/或表格信息,电子设备还需要从文本内容中获取附图和/或表格。
[0091] 在文本内容中,附图除了用作对正文进行说明的附图,还有用作封面的封面附图,以及用于加入公式符号等内容的行内图片。在上述附图种类中,封面附图和行内附图并没有用作对正文进行说明,因此,封面附图和行内附图不需要附图信息,不属于本次筛选结果。而表格中,因为表格的位置和篇幅原因,可能出现续表的情况。由于表格的表格信息出现在表格前,而续表前不需要再重复添加表格信息,所以,续表同样不属于本次筛选结果。
[0092] 为了确保本步骤筛选出的附图和/或表格中,不包括封面附图、行内附图和/或续表,本步骤中,电子设备可以在从文本内容中,筛选出全部的附图和/或表格后,再对上述附图和/或表格进行进一步的筛选,以筛除其中的封面附图、行内附图和/或续表。
[0093] 其中,封面附图的筛选规则为筛除前预设张附图,预设张数根据文本内容确定。
[0094] 其中,行内附图的筛选规则为筛除附图中,没有独立成段的附图,或者附图中,附图的宽度小于版面宽度的二分之一的附图。
[0095] 其中,续表的筛选过程中,通过比较两个连续表格的位置进行判断是否为续表。如果第一个表格出现在第一页的末尾,第二个表格出现在第二页的开头,且两个表格之间没有除页眉和页脚以外的文字,则认为第二个表格为第一个表格的续表,进而,筛除续表。
[0096] 电子设备通过对文本内容,采用上述规则进行筛选,得到第二筛选结果。
[0097] 其中,第二筛选结果中包括除封面附图和行内附图以外的附图和/或除续表以外的表格。其中,可能包括附图信息和/或表格信息正确的附图和/或表格,或者附图信息和/或表格信息丢失的附图和/或表格等。
[0098] 在本实施例中,步骤S202和S203的执行没有先后顺序。
[0099] S204、电子设备将第一筛选结果中的附图信息与第二筛选结果中的附图进行匹配,确定附图与附图信息是否对应。
[0100] 在本实施例中,以现有的图书、期刊、稿件等文本内容为例,附图信息用于对附图进行简单的说明,以及方便在正文中引用。因此,附图信息通常情况下,出现在附图下方,且位置紧挨附图。因此,在本步骤中,电子设备根据第一筛选结果中的附图信息与第二筛选结果中的附图的位置,匹配附图以及紧挨着附图的附图信息。
[0101] 此外,在中文的文本内容中,附图信息中包含中文的附图信息,在中文的附图信息下方还可能出现英文的附图信息或者其他语言的附图信息。在英文的文本内容中,附图信息中包含英文的附图信息,在英文的附图信息下方还可能出现中文的附图信息或者其他语言的附图信息。
[0102] S205、若存在第一附图不存在对应的附图信息和/或第一附图信息不存在对应的附图,则电子设备显示第一提示信息,第一提示信息用于指示附图与附图信息不匹配。
[0103] 在本实施例中,在电子设备的匹配过程中,若附图下方紧挨着附图的位置存在附图信息,则附图与附图信息匹配成功。否则,若附图下方紧挨着附图的位置不存在附图信息,或者附图信息上方紧挨着附图信息的位置不存在附图,则匹配不成功,电子设备显示第一提示信息。
[0104] 其中,电子设备显示的第一提示信息用于指示附图与附图信息不匹配。该第一提示信息与附图或者附图信息同时显示,用于提示用户注意,该附图缺失附图信息,或者附图信息可能为多余的附图信息。
[0105] S206、电子设备将第一筛选结果中与第二筛选结果中的附图匹配成功的附图信息作为第三筛选结果。
[0106] 在本实施例中,在电子设备的匹配过程中,若附图与附图信息匹配成功,则将该匹配成功的附图与附图信息中的附图信息作为第三筛选结果。
[0107] S207、电子设备确定第三筛选结果中的附图信息是否满足第一预设条件。若不满足,则电子设备显示第二提示信息,第二提示信息用于提示附图信息有误。
[0108] 在本实施例中,第三筛选结果的附图信息为与附图匹配成功的附图信息。为了方便用户,电子设备对该附图信息进行进一步的判断,用于分析该附图信息的图题或者图序是否有误。若图题或者图序出现错误,则显示第二提示信息。
[0109] 其中,第一预设条件用于判断附图信息的图题或者图序是否正确,该第一预设条件,具体可以是图题的内容正确、图序的编号正确、图序的编码规则一致、或者上述一种或者多种的组合。
[0110] 当第一预设条件用于判断图题的内容是否正确时,该第一预设条件包括但不限于如下条件:图题内容不超过50个字符,图题的结束位置不能是分号、逗号或者问号,中文文本内容必须有中文图题,以及英文文本内容必须有英文图题。
[0111] 如果,附图信息不符合第一预设条件,则电子设备显示第二提示信息。
[0112] 其中,第二提示信息用于提示附图信息的图题有误。该第二提示信息与附图信息同时显示,用于提示用户注意,该附图信息的图题不符合要求,需要修改。
[0113] 当第一预设条件用于判断附图信息中图序的编号是否正确时,该第一预设条件包括但不限于如下条件:编号方式是否一致和编号是否连续。
[0114] 其中,编号方式有全篇编号和分章编号两种。在全篇编号中,图序的编号从1开始,依次递增。如,图1,图2,图3,……,图n。在分章编号中,图序的编号为章节号+连接符+编号。在每一个章节中,编号从1开始,依次递增,章节号同样从1开始,依次递增。连接符包括但不限于“.”或者“-”。如,图1-1,图1-2,……,图1-n,图2-1,图2-2,……,图2-m。
[0115] 如果,文本内容中同时出现全篇编号和分章编号,或者分章编号的连接符号不一致,则电子设备显示第二提示信息。
[0116] 其中,第二提示信息用于提示附图信息的图序编号方式有误。该第二提示信息与附图信息同时显示,用于提示用户注意,该附图信息中图序的编号方式不一致。
[0117] 如果,文本内容中图序的编号不是从1开始,且依次递增,或者在每一个章节中,编号不是从1开始,且依次递增,则电子设备显示第二提示信息。
[0118] 其中,第二提示信息用于提示附图信息的图序编号连续性错误。该第二提示信息与附图信息同时显示,用于提示用户注意,该附图信息中编号不连续。
[0119] 当第一预设条件用于判断附图信息中图序的编码规则是否一致时,该第一预设条件包括但不限于如下条件:图题的文字部分不一致或者图题的数字类型不一致。
[0120] 其中,编码规则一致,要求图序的文字部分的文字内容一致,以及图序的数字部分的数字类型一致。图序的文字内容一致,可以是图序的文字内容为图+数字、图示+数字或者Fig+数字等形式中的一种。图序的数字类型一致,可以是图序的数字类型为中文数字、英文数字或者罗数字等类型中的一种,如图序的数字类型为一、贰、3或者IV等类型中的一种。
[0121] 如果,文本内容中图序的文字部分不一致或者数字类型不一致,则显示第二提示信息。
[0122] 其中,第二提示信息用于提示附图信息中,图序的编码规则有误。该第二提示信息与附图信息同时显示,用于提示用户注意,该附图信息中存在编码规则不一致的图序。
[0123] 当第一预设条件用于判断上诉一个或者多个条件时,第一预设条件可以是图题的内容是否正确、图序的编号是否正确、图序的编码规则是否一致。如果,文本内容中,图题或者图序不符合上诉一个或者多个条件,则电子设备显示的第一提示信息中,包括上述一个或者多个条件对应的一个或多个提示信息。
[0124] S208、电子设备将第一筛选结果进行显示。
[0125] 其中,S208与图1实施例中的S102实现方式类似,本实施例此处不再赘述。
[0126] 表1
[0127] 章号 序号 图题 错误类型 修改建议第一章 图1 猕猴 图序号正确  
第一章 图2 太行山猕猴的分布 图序号正确  
第一章 图4 黑颈鹤音节测量参数示意图 图序号不连续 图3
第一章 无 无 图序号缺失 图4
第一章 图5 文本的CNN结构 图序号正确  
第一章 图6 原始监控视频人脸图像 图序号正确  
第二章 无 无 图序号缺失 图7
第二章 【组图】 图2-2在猕猴左掌面 图序号编号方式不一致 图8
第二章 图2-3 FA1的SEM照片 图序号编号方式不一致 图9
第二章 【组图】 图2.4双DOC 图序号编号方式不一致 图10
第二章 图2.5 流程图【对象图】 图序号编号方式不一致 图11
[0128] 如表1所示,为第一筛选结果的一种表格形式的显示示例。下面,结合表1,电子设备以电脑为例,用户对文本内容的处理的具体步骤如下:
[0129] 步骤1、用户通过窗口的接口导入待处理的文本内容。
[0130] 步骤2、电子设备通过文本内容的处理方法处理得到第一筛选结果。表1为第一筛选结果以表格的形式进行显示的一个示例。表格中包括附图信息和附图的章节号(章节号),附图信息的图序(序号),附图信息的图题(图题),附图信息的第一提示信息和第二提示信息(错误类型),以及根据第一提示信息、第二提示信息和附图信息对应生成的修改建议(修改建议)。该表格可以显示在电子设备上的窗口中,也可以显示在网页中。
[0131] 步骤3、用户点击显示窗口中一条附图信息的序号或者图题,在文本内容中,光标对应跳转到附图信息所在的位置,以方便用户修改文本内容的该条附图信息。
[0132] 步骤4、在修改该附图信息后,用户在显示窗口或者网页中,同步看到修改后的附图信息。进而,用户可以通过显示窗口或者网页,方便快捷的梳理全部附图信息,以及查看修改效果。
[0133] 本申请提供的文本内容的处理方法,通过电子设备获取文本内容。电子设备根据第二筛选规则,筛选文本内容中的附图,并将该附图与根据第一筛选规则筛选得到的附图信息进行匹配。电子设备根据第一预设条件对匹配成功的附图信息进行判断。电子设备根据匹配结果和判断结果分别生成第一提示信息和第二提示信息,并进行显示。本申请中,电子设备以表格的形式,显示附图信息,第一提示信息和第二提示信息,以及根据第一提示信息、第二提示信息和附图信息对应生成修改建议。电子设备显示的信息,可以辅助用户整理文本内容中的附图和附图信息,避免因为文本内容的篇幅、排版等原因导致的遗漏或者忽视现象,从而,实现提高校对的准确率的效果。
[0134] 在上述图1至图2所示实施例的基础上,结合图3,对图1中S102根据第一预设规则,对待处理的文本内容进行筛选,得到第一筛选结果,第一预设规则用于筛选文本内容中的附图信息和/或表格信息的具体实现方式进行详细的说明。
[0135] 图3示出了本申请一实施例提供的文本内容的处理方法的流程图。如图3所示,本实施例的方法可以包括:
[0136] S301、电子设备获取待处理的文本内容。
[0137] 其中,S301与图1实施例中的S101实现方式类似,本实施例此处不再赘述。
[0138] S302、电子设备根据第一预设规则,对待处理的文本内容进行筛选,得到第一筛选结果,第一预设规则用于筛选文本内容中的附图信息和/或表格信息。
[0139] 其中,S302与图1实施例中的S102实现方式类似,本实施例此处不再赘述。
[0140] S303、电子设备根据第二预设规则,对待处理的文本内容进行筛选,得到第二筛选结果,第二预设规则用于筛选文本内容中的附图和/或表格。
[0141] 其中,S303与图2实施例中的S203实现方式类似,本实施例此处不再赘述。
[0142] S304、电子设备将第一筛选结果中的表格信息与第二筛选结果中的表格进行匹配,确定表格与表格信息是否对应。
[0143] 在本实施例中,以现有的图书、期刊、稿件等文本内容为例,表格信息用于对表格进行简单的说明,以及方便在正文中引用表格。因此,表格信息通常情况下,出现在表格上方,且位置紧挨表格。因此,在本步骤中,电子设备根据第一筛选结果中的表格信息与第二筛选结果中的表格的位置,匹配表格以及紧挨着表格的表格信息。
[0144] 此外,在中文的文本内容中,表格信息为中文的表格信息。在英文的文本内容中,表格信息为英文的表格信息。
[0145] S305、若存在第一表格不存在对应的表格信息和/或第一表格信息不存在对应的表格,则电子设备显示第三提示信息,第三提示信息用于指示表格与表格信息不匹配。
[0146] 在本实施例中,在电子设备的匹配过程中,若表格上方紧挨着表格的位置存在表格信息,则表格与表格信息匹配成功。否则,若表格上方紧挨着表格的位置不存在表格信息,或者表格信息下方紧挨着表格信息的位置不存在表格,则匹配不成功,电子设备显示第三提示信息。
[0147] 其中,电子设备显示的第三提示信息用于指示表格与表格信息不匹配。该第三提示信息与表格或者表格信息同时显示,用于提示用户注意,该表格缺失表格信息,或者表格信息可能为多余的表格信息。
[0148] S306、电子设备将第一筛选结果中与第二筛选结果中的表格匹配成功的表格信息作为第四筛选结果。
[0149] 在本实施例中,在电子设备的匹配过程中,若表格与表格信息匹配成功,则该匹配成功的表格与表格信息中的表格信息作为第四筛选结果。
[0150] S307、电子设备确定第四筛选结果中的表格信息是否满足第二预设条件;若不满足,则显示第四提示信息,第四提示信息用于提示表格信息有误。
[0151] 在本实施例中,第四筛选结果的表格信息为与表格匹配成功的表格信息,为了方便用户,电子设备对该表格信息进行进一步的判断,用于分析该表格信息的表题和表序是否有误。若该表格信息的表题或者表序存在错误,则显示第四提示信息。
[0152] 其中,第二预设条件用于判断表格信息的表题或者表序是否正确,该第二预设条件,具体可以是表题的内容正确、表序的编号正确、表序的编码规则一致、或者上述一种或者多种的组合。
[0153] 当第二预设条件用于判断表格信息中的表题的内容是否正确时,该第二预设条件包括但不限于以下条件:表题内容不超过50个字符,表题的结束位置不能是分号、逗号或者问号,中文文本内容必须有中文表题,以及英文文本内容必须有英文表题。
[0154] 如果,表格信息不符合第二预设条件,则电子设备显示第四提示信息。
[0155] 其中,第四提示信息用于提示表格信息的表题有误。该第四提示信息与表格信息同时显示,用于提示用户注意,该表格信息的表题不符合要求,需要修改。
[0156] 当第二预设条件用于判断表格信息中表序的编号是否正确时,该第二预设条件包括但不限于如下条件:编号方式是否一致和编号是否连续。
[0157] 其中,编号方式有全篇编号和分章编号两种。在全篇编号中,表序的编号从1开始,依次递增。如,表1,表2,表3,……,表n。在分章编号中,表序的编号为章节号+连接符+编号。在每一个章节中,编号从1开始,依次递增,章节号同样从1开始,依次递增。连接符包括但不限于“.”或者“-”。如,表1-1,表1-2,……,表1-n,表2-1,表2-2,……,表2-m。
[0158] 如果,文本内容中同时出现全篇编号和分章编号,或者分章编号的连接符号不一致,则电子设备显示第四提示信息。
[0159] 其中,第四提示信息用于提示表格信息的表序编号方式有误。该第四提示信息与表格信息同时显示,用于提示用户注意,该表格信息中存在编号方式不一致的表序。
[0160] 如果,文本内容中表序的编号不是从1开始,且依次递增,或者在每一个章节中,编号不是从1开始,且依次递增,则电子设备显示第四提示信息。
[0161] 其中,第四提示信息用于提示表格信息的表序编号连续性错误。该第四提示信息与表格信息同时显示,用于提示用户注意,该表格信息中编号不连续。
[0162] 当第二预设条件用于判断表格信息中表序的编码规则是否一致时,该第一预设条件包括但不限于如下条件:表题的文字部分不一致或者表题的数字类型不一致[0163] 其中,表序的编码可以分成表序的文字部分和表序的数字部分,编码规则一致,则要求表序的文字部分的文字内容一致,以及表序的数字部分的数字类型一致。表序的文字内容一致,可以是表序的文字为表+数字、表格+数字、Table+数字、Tab+数字等形式中的一种。表序的数字类型一致,可以是表序的数字类型为中文数字、英文数字或者罗马数字等类型中的一种,如表序的数字类型为一、贰、3或者IV等类型中的一种。
[0164] 如果,文本内容中表序的文字部分不一致或者数字类型不一致,则显示第四提示信息。
[0165] 其中,第四提示信息用于提示表格信息中,表序的编码规则有误。该第四提示信息与表格信息同时显示,用于提示用户注意,该表格信息中存在编码规则不一致的表序。
[0166] 当第二预设条件用于判断上诉一个或者多个条件时,第二预设条件可以是表题的内容是否正确、表序的编号是否正确、表序的编码规则是否一致。如果,文本内容中,表题或者表序不符合上诉一个或者多个条件,则电子设备显示的第二提示信息中,包括上述一个或者多个条件对应的一个或多个提示信息。
[0167] S308、电子设备将第一筛选结果进行显示。
[0168] 其中,S308与图1实施例中的S102实现方式类似,本实施例此处不再赘述。
[0169] 本申请提供的文本内容的处理方法,通过电子设备获取文本内容。电子设备根据第四筛选规则,筛选文本内容中的表格,并将表格与根据第一筛选规则筛选得到的表格信息进行匹配。电子设备根据第二预设条件对匹配成功的表格信息进行判断。电子设备根据匹配结果和判断结果分别生成第三提示信息和第四提示信息,并进行显示。本申请中,电子设备以表格的形式,显示表格信息,第三提示信息和第四提示信息,以及根据第三提示信息、第四提示信息和表格信息对应生成修改建议。电子设备显示的信息,可以辅助用户整理文本内容中的表格和表格信息,避免因为文本内容的篇幅、排版等原因导致的遗漏或者忽视现象,从而,实现提高校对的准确率的效果。
[0170] 图4示出了本申请一实施例提供的文本内容的处理装置的结构示意图,如图4所示,本实施例的文本内容的处理装置10用于实现上述任一方法实施例中对应于电子设备的操作,本实施例的文本内容的处理装置10可以包括:
[0171] 获取模块11,用于获取待处理的文本内容。
[0172] 处理模块12,用于根据第一预设规则,对待处理的文本内容进行筛选,得到第一筛选结果,第一预设规则用于筛选文本内容中的附图信息和/或表格信息。
[0173] 可选地,处理模块12,还用于根据第二预设规则,对待处理的文本内容进行筛选,得到第二筛选结果,第二预设规则用于筛选文本内容中的附图和/或表格。
[0174] 可选地,处理模块12,还用于将第一筛选结果中的附图信息与第二筛选结果中的附图进行匹配,确定附图与附图信息是否对应。若存在第一附图不存在对应的附图信息和/或第一附图信息不存在对应的附图,则显示第一提示信息,第一提示信息用于指示附图与附图信息不匹配。
[0175] 可选地,附图信息包括图序和图题,处理模块12,还用于将第一筛选结果中与第二筛选结果中的附图匹配成功的附图信息作为第三筛选结果。确定第三筛选结果中的附图信息是否满足第一预设条件。若不满足,则显示第二提示信息,第二提示信息用于提示附图信息有误。其中,第一预设条件包括以下至少一个:图题满足图题命名规则,图序连续,图序编码规则一致。
[0176] 可选地,处理模块12,还用于将第一筛选结果中的表格信息与第二筛选结果中的表格进行匹配,确定表格与表格信息是否对应。若存在第一表格不存在对应的表格信息和/或第一表格信息不存在对应的表格,则显示第三提示信息,第三提示信息用于指示表格与表格信息不匹配。
[0177] 可选地,表格信息包括表序和表题,处理模块12,还用于将第一筛选结果中与第二筛选结果中的表格匹配成功的表格信息作为第四筛选结果。确定第四筛选结果中的表格信息是否满足第二预设条件。若不满足,则显示第四提示信息,第四提示信息用于提示表格信息有误。其中,第二预设条件包括以下至少一个:表格满足表题命名规则,表序连续,表序编码规则一致。
[0178] 显示模块13,用于将第一筛选结果进行显示。
[0179] 本申请实施例提供的文本内容的处理装置10,可执行上述方法实施例,其具体实现原理和技术效果,可参见上述方法实施例,本实施例此处不再赘述。
[0180] 本申请中可以根据上述方法示例对文本内容的处理装置进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请各实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
[0181] 图5示出了本申请一实施例提供的电子设备的硬件结构示意图。如图5所示,该电子设备20,用于实现上述任一方法实施例中对应于电子设备的操作,本实施例的电子设备20可以包括:存储器21、处理器22、显示器24和接口25。
[0182] 显示器24与处理器22连接,用于显示处理器22的处理结果。显示器24为电子设备20中的显示设备,用于显示信息。
[0183] 处理器22与显示器24连接,用于向显示器24发送处理结果。处理器22与存储器21连接,用向存储器21发送需要存储的信息,或者从存储器21中读取需要使用的信息。处理器22与接口25连接,用于通过接口25获取输入信息。处理器22为电子设备20上的数据处理设备,用于执行存储器存储的计算机程序,以实现上述实施例中的文本内容的处理方法。具体可以参见前述方法实施例中的相关描述。
[0184] 存储器21与处理器22连接,用于接收处理器22发送的需要保存的数据,或者用于发送处理器22请求读取的数据,还用于存储算机程序。存储器21为电子设备20上的存储设备,用于读写数据和算机程序。
[0185] 接口25与处理器22连接,用于向处理器22发送需要处理的信息。
[0186] 可选地,存储器21和/或显示器24既可以是独立的,也可以跟处理器22集成在一起。
[0187] 当存储器21和/或显示器24是独立于处理器22之外的器件时,电子设备20还可以包括:
[0188] 总线23,用于连接存储器21和/或显示器24与处理器22。
[0189] 可以理解,图5所示的结构仅为示意,电子设备20还可以包括比图5中所示更多或者更少的组件,或者具有与图5所示不同配置的电子设备。图5中所示的各组件可以采用硬件、软件或其组合实现。
[0190] 本实施例提供的电子设备可用于执行上述的文本内容的处理方法,其实现方式和技术效果类似,本实施例此处不再赘述。
[0191] 本申请还提供一种计算机可读存储介质,计算机可读存储介质包括计算机程序,计算机程序用于实现如上实施例中的文本内容的处理方法。
[0192] 在本申请所提供的几个实施例中,应该理解到,所揭露的设备和方法,可以通过其它的方式实现。例如,以上所描述的设备实施例仅是示意性的,例如,模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0193] 作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0194] 另外,在本申请各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个单元中。上述模块成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能单元的形式实现。
[0195] 上述以软件功能模块的形式实现的集成的模块,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(英文:processor)执行本申请各个实施例方法的部分步骤。
[0196] 应理解,上述处理器可以是中央处理单元(英文:CentralProcessingUnit,简称:CPU),还可以是其他通用处理器、数字信号处理器(英文:DigitalSignalProcessor,简称:
DSP)、专用集成电路(英文:ApplicationSpecificIntegratedCircuit,简称:ASIC)等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合发明所公开的方法的步骤可以直接体现为硬件处理器执行完成,或者用处理器中的硬件及软件模块组合执行完成。
[0197] 存储器可能包含高速RAM存储器,也可能还包括非易失性存储NVM,例如至少一个磁盘存储器,还可以为U盘、移动硬盘只读存储器、磁盘或光盘等。
[0198] 总线可以是工业标准体系结构(IndustryStandardArchitecture,ISA)总线、外部设备互连(PeripheralComponent,PCI)总线或扩展工业标准体系结构(ExtendedIndustryStandardArchitecture,EISA)总线等。总线可以分为地址总线数据总线、控制总线等。为便于表示,本申请附图中的总线并不限定仅有一根总线或一种类型的总线。
[0199] 上述计算机可读存储介质可以是由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM),电可擦除可编程只读存储器(EEPROM),可擦除可编程只读存储器(EPROM),可编程只读存储器(PROM),只读存储器(ROM),磁存储器,快闪存储器,磁盘或光盘。存储介质可以是通用或专用计算机能够存取的任何可用介质。
[0200] 本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤。而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
[0201] 最后应说明的是:以上各实施例仅用以说明本申请的技术方案,而非对其限制。尽管参照前述各实施例对本申请进行了详细的说明,本领域的技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的范围。应当理解的是,本申请并不局限于上面已经描述并在附图中示出的结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求书来限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈