首页 / 专利库 / 专利权 / 第I章 / 国际申请 / 附图 / 文献解析装置、文献解析方法、文献解析程序以及文献解析系统

文献解析装置、文献解析方法、文献解析程序以及文献解析系统

阅读:1071发布:2020-05-12

专利汇可以提供文献解析装置、文献解析方法、文献解析程序以及文献解析系统专利检索,专利查询,专利分析的服务。并且本 发明 能够在用户可以读取 附图 标记的方向上配置文献附图。本发明的一个实施方式所涉及的文献解析装置(1)具有:附图标记提取部(112),其提取文献所含的文字;朝向确定部(114),其基于附图标记提取部(112)提取的文字,来确定配置文献所含的附图的方向;以及输出部(115),其在朝向确定部(114)确定的方向与预定方向不同的情况下,输出用于将附图配置在预定方向上的信息。,下面是文献解析装置、文献解析方法、文献解析程序以及文献解析系统专利的具体信息内容。

1.一种文献解析装置,其中,具有:
提取部,其提取文献所含的文字;
确定部,其基于所述提取部提取的所述文字,来确定配置所述文献所含的附图的方向;
以及
输出部,其在所述确定部确定的所述方向与预定方向不同的情况下,输出用于将所述附图配置在所述预定方向上的信息。
2.根据权利要求1所述的文献解析装置,其中,
所述提取部一边沿着第1方向扫描所述文献中的附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面,一边比较表示提取对象的文字的基准文字和所述附图的像素,由此来提取与所述基准文字对应的一个以上的第1文字,并且一边沿着与所述第1方向正交的第2方向扫描所述文献中的附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面,一边比较所述基准文字和所述附图的像素,由此来提取与所述基准文字对应的一个以上的第2文字,
所述确定部比较通过所述第1方向的扫描提取的所述一个以上的第1文字和通过所述第2方向的扫描提取的所述一个以上的第2文字,由此来确定所述方向。
3.根据权利要求1或2所述的文献解析装置,其中,
所述提取部一边扫描所述文献中的附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面,一边比较提取对象的文字以及表示旋转后的所述提取对象的文字的基准文字和所述附图的像素,由此来提取与所述提取对象的文字对应的一个以上的第1文字和与旋转后的所述提取对象的文字对应的一个以上的第2文字,
所述确定部比较通过所述扫描提取的所述一个以上的第1文字和通过所述扫描提取的所述一个以上的第2文字,由此来确定所述方向。
4.根据权利要求2或3所述的文献解析装置,其中,
还具有第2提取部,所述第2提取部从所述文献所含的文章提取与预定文字对应的一个以上的第3文字,
所述确定部比较所述一个以上的第1文字以及所述一个以上的第3文字的一致程度和所述一个以上的第2文字以及所述一个以上的第3文字的一致程度,由此来确定所述方向。
5.根据权利要求4所述的文献解析装置,其中,
所述第2提取部从所述文章提取与所述第3文字建立关联的名称,
所述输出部输出用于将所述附图配置在所述预定方向上的信息和用于在所述附图上显示与所述第3文字建立关联的所述名称的信息。
6.根据权利要求5所述的文献解析装置,其中,
在所述附图中选择出了所述第3文字以及所述名称中的至少一方的情况下,所述输出部输出用于在所述文章中改变被选择出的所述第3文字以及所述名称中的至少一方的显示方式的信息。
7.根据权利要求5或6所述的文献解析装置,其中,
在所述文章中选择出了所述第3文字以及所述名称中的至少一方的情况下,所述输出部输出用于在所述附图中改变被选择出的所述第3文字以及所述名称中的至少一方的显示方式的信息。
8.一种文献解析方法,其中,处理器执行:
提取文献所含的文字的步骤;
基于所述提取步骤提取的所述文字,来确定配置所述文献所含的附图的方向的步骤;
以及
在所述确定步骤确定的所述方向与预定方向不同的情况下,输出用于将所述附图配置在所述预定方向上的信息的步骤。
9.一种文献解析程序,使计算机执行:
提取文献所含的文字的步骤;
基于所述提取步骤提取的所述文字,来确定配置所述文献所含的附图的方向的步骤;
以及
在所述确定步骤确定的所述方向与预定方向不同的情况下,输出用于将所述附图配置在所述预定方向上的信息的步骤。
10.一种文献解析系统,其中,具备文献管理装置和文献解析装置,
所述文献管理装置具有:
存储部,其存储文献;以及
提供部,其将所述存储部存储的所述文献提供给所述文献解析装置,
所述文献解析装置具有:
提取部,其提取从所述文献管理装置提供的所述文献所含的文字;
确定部,其基于所述提取部提取的所述文字,来确定配置所述文献所含的附图的方向;
以及
输出部,其在所述确定部确定的所述方向与预定方向不同的情况下,对所述文献管理装置输出用于将所述附图配置在所述预定方向上的信息。

说明书全文

文献解析装置、文献解析方法、文献解析程序以及文献解析

系统

技术领域

背景技术

[0002] 专利公报等文献包括在技术上对物或方法进行说明的文章以及附图。用户因为需要一边对比一边阅读文献的文章以及附图,所以为了理解文献内容需要花费大量辛劳。专利文献1中记载了一种装置,关联显示从附图提取出的附图标记和从文章提取出的附图标记的名称,来辅助文献阅览。
[0003] 日本特开2013-92916号公报
[0004] 文献可能包含沿着不同方向配置的附图。即,文献中存在沿着用户保持状态不变就可以读取附图标记的方向配置的附图和沿着该保持不变的状态就无法读取附图标记的方向配置的附图。用户当阅览在无法读取附图标记的方向上配置的附图时,因为需要手动旋转附图,所以不方便。专利文献1中记载的装置无法在用户可以读取附图标记的方向自动地配置附图。

发明内容

[0005] 本发明是鉴于上述问题而完成的,其目的在于提供一种能够在用户可以读取附图标记的方向配置文献附图的文献解析装置、文献解析方法、文献解析程序以及文献解析系统。
[0006] 本发明的第1方式的文献解析装置具有:提取部,其提取文献所含的文字;确定部,其基于所述提取部提取的所述文字,来确定配置所述文献所含的附图的方向;以及输出部,其在所述确定部确定的所述方向与预定方向不同的情况下,输出用于将所述附图配置在所述预定方向上的信息。
[0007] 也可以是,所述提取部一边沿着第1方向扫描所述文献中的附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面,一边比较表示提取对象的文字的基准文字和所述附图的像素,由此来提取与所述基准文字对应的一个以上的第1文字,并且一边沿着与所述第1方向正交的第2方向扫描所述文献中的附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面,一边比较所述基准文字和所述附图的像素,由此来提取与所述基准文字对应的一个以上的第2文字,所述确定部比较通过所述第1方向的扫描提取的所述一个以上的第1文字和通过所述第2方向的扫描提取的所述一个以上的第2文字,由此来确定所述方向。
[0008] 也可以是,所述提取部一边扫描所述文献中的附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面,一边比较提取对象的文字以及表示旋转后的所述提取对象的文字的基准文字和所述附图的像素,由此来提取与所述提取对象的文字对应的一个以上的第1文字和与旋转后的所述提取对象的文字对应的一个以上的第2文字,所述确定部比较通过所述扫描提取的所述一个以上的第1文字和通过所述扫描提取的所述一个以上的第2文字,由此来确定所述方向。
[0009] 也可以是,所述文献解析装置还具有第2提取部,所述第2提取部从所述文献所含的文章提取与预定文字对应的一个以上的第3文字,所述确定部比较所述一个以上的第1文字以及所述一个以上的第3文字的一致程度和所述一个以上的第2文字以及所述一个以上的第3文字的一致程度,由此来确定所述方向。
[0010] 也可以是,所述第2提取部从所述文章提取与所述第3文字建立关联的名称,所述输出部输出用于将所述附图配置在所述预定方向上的信息和用于在所述附图上显示与所述第3文字建立关联的所述名称的信息。
[0011] 本发明的第2方式的文献解析方法中,处理器执行:提取文献所含的文字的步骤;基于所述提取步骤提取的所述文字,来确定配置所述文献所含的附图的方向的步骤;以及在所述确定步骤确定的所述方向与预定方向不同的情况下,输出用于将所述附图配置在所述预定方向上的信息的步骤。
[0012] 本发明的第3方式的文献解析程序使计算机执行:提取文献所含的文字的步骤;基于所述提取步骤提取的所述文字,来确定配置所述文献所含的附图的方向的步骤;以及在所述确定步骤确定的所述方向与预定方向不同的情况下,输出用于将所述附图配置在所述预定方向上的信息步骤。
[0013] 本发明的第4方式的文献解析系统具备文献管理装置和文献解析装置,所述文献管理装置具有:存储部,其存储文献;以及提供部,其用于将所述存储部存储的所述文献提供给所述文献解析装置,所述文献解析装置具有:提取部,其提取从所述文献管理装置提供的所述文献所含的文字;确定部,其基于所述提取部提取的所述文字,来确定配置所述文献所含的附图的方向;以及输出部,其在所述确定部确定的所述方向与预定方向不同的情况下,对所述文献管理装置输出用于将所述附图配置在所述预定方向上的信息。
[0014] 根据本发明,发挥能够在用户可以读取附图标记的方向上配置文献附图的效果。

附图说明

[0015] 图1是实施方式所涉及的文献解析系统的示意图。图2是实施方式所涉及的文献解析系统的框图
图3是表示文献信息所含的例示性附图的图。
图4是附图标记提取部所执行的第1附图标记提取方法的示意图。
图5是附图标记提取部所执行的第2附图标记提取方法的示意图。
图6是附图标记名称提取部从文章提取附图标记以及附图标记的名称的方法的示意图。
图7是朝向信息存储部所存储的例示性朝向信息以及附图标记信息存储部所存储的例示性附图标记信息的示意图。
图8是将附图配置在预定朝向的方法的示意图。
图9是重叠附图标记标签的附图的示意图。
图10是实施方式所涉及的文献解析方法的时序图。
图11是用于说明突出显示附图标记或者附图标记的名称的方法的示意图。
图12是用于说明突出显示附图标记或者附图标记的名称的方法的示意图。
附图标记说明
S文献解析系统;1文献解析装置;11控制部;112附图标记提取部;113附图标记名称提取部;114朝向确定部;115输出部;2文献管理装置;21控制部;212文献信息提供部;22存储部;221文献信息存储部。

具体实施方式

[0016] [文献解析系统S的概要]图1是本实施方式所涉及的文献解析系统S的示意图。文献解析系统S包含文献解析装置1、文献管理装置2以及用户终端3。文献解析系统S此外还可以服务器或终端等设备。
[0017] 用户终端3是具有显示部31以及操作部32的计算机。用户终端3经由因特网、局域网等网络N,与文献管理装置2进行通信。显示部31包括用于对专利公报等文献进行显示的液晶显示器等显示装置。操作部32包括用于接受用户操作的键盘鼠标等操作装置。也可以通过使用能够检测用户接触位置触摸屏作为显示部31,一体地构成显示部31和操作部32。
[0018] 文献管理装置2是存储文献的信息并且将用于显示文献的信息提供给用户终端3的计算机。文献管理装置2经由网络N,与文献解析装置1以及用户终端3通信。文献例如是专利公报、公开专利公报等专利文献,包含文章以及附图。并且,附图包含表示附图标记的文字,文章包含与附图的附图标记建立关联的附图标记的名称。由此,文献能够将附图内容和文章内容建立对应,在技术上说明物或方法。文献不限于专利文献,也可以是通过附图标记将附图内容和文章内容建立关联的其他文献。
[0019] 文献解析装置1是对从文献管理装置2接收的文献进行解析并将解析结果提供给文献管理装置2的计算机。文献解析装置1经由网络N,与文献管理装置2进行通信。
[0020] 下面,对文献解析系统S所执行的处理的概要进行说明。首先,用户利用用户终端3的操作部32,来指定显示对象的文献(a)。文献管理装置2从存储部读取在用户终端3中指定的显示对象的文献,作为文献信息发送给文献解析装置1(b)。
[0021] 文献解析装置1对从文献管理装置2接收的文献信息进行解析,将用于将文献的附图配置在预定朝向上的信息和在附图上表示与附图标记对应的名称的附图标记标签的信息,作为解析信息发送给文献管理装置2(c)。附图的预定朝向是人(用户)保持状态不变可以读取附图所含的附图标记的朝向。
[0022] 从而,文献管理装置2基于从文献解析装置1接收的解析信息,在配置在预定朝向上的附图上生成用于将附图标记标签重叠显示在文献上的显示信息,并发送给用户终端3(d)。用户终端3基于从文献管理装置2接收的显示信息,在显示部31上显示文献。
[0023] 这样,文献解析系统S能够沿着预定朝向配置文献附图,并且能够从附图提取附图标记。另外,文献解析系统S因为能够将表示与附图标记对应的名称的附图标记标签重叠显示在沿着预定朝向配置的附图上,所以用户对比观看文章和附图来解释附图的附图标记的含义就变得容易。
[0024] [文献解析系统S的结构]图2是本实施方式所涉及的文献解析系统S的框图。在图2中,箭头表示主要数据的流向,也可以是图2所示的数据以外的数据的流向。在图2中,各框不是表示硬件(装置)单位的结构,而是表示功能单位的结构。因此,图2所示的框可以在单一装置内安装,或者也可以在多个装置内分开安装。框之间的数据收发通过数据总线、网络、可移动存储介质等任意单元来进行。
[0025] 文献管理装置2具有控制部21、存储部22以及通信部23。控制部21具有用户输入受理部211、文献信息提供部212、解析信息受理部213以及显示控制部214。存储部22具有文献信息存储部221、朝向信息存储部222以及附图标记信息存储部223。
[0026] 通信部23是用于在文献解析装置1以及用户终端3之间进行通信的通信接口。通信部23包括用于进行通信的处理器、连接器以及天线等。通信部23对从文献解析装置1或者用户终端3接收到的通信信号进行预定处理来取得数据。另外,通信部23对要对外部发送的数据进行预定处理来生成通信信号,将生成的通信信号发送给文献解析装置1或者用户终端3。
[0027] 存储部22是包含ROM(Read Only Memory)、RAM(Random Access Memory)、硬盘驱动器等的存储介质。存储部22预先存储控制部21执行的程序。文献信息存储部221、朝向信息存储部222以及附图标记信息存储部223可以分别是存储部22上的存储区域,或者也可以是在存储部22上构成的数据库
[0028] 文献信息存储部221预先将表示专利公报等文献的文献信息和用于对文献进行识别的识别信息(例如文献编号)建立关联地存储。文献包含1个或者多个文章页面以及1个或者多个附图页面。文章页面是记载有文献的上朝向的文字并列而成的文章的页面。附图页面是记载有附图的页面。附图也可以是化学式等构造图。附图页面也可以是仅含有1个附图的页面。附图页面也可以是含有相同朝向的多个附图的页面。附图页面也可以是分别在不同朝向上配置文字的、分别混合存在不同朝向的多个附图的页面。
[0029] 对文献的各个附图分配用于识别附图的识别信息(例如附图编号)。文献信息存储部221可以将1个文献的文章以及附图作为单独的文件存储,也可以作为1个文件存储。朝向信息存储部222存储表示文献附图朝向的朝向信息。附图标记信息存储部223存储表示文献附图所含的附图标记的名称以及位置的附图标记信息。
[0030] 控制部21例如是CPU(Central Processing Unit)等处理器,通过执行存储部22所存储的程序,作为用户输入受理部211、文献信息提供部212、解析信息受理部213以及显示控制部214发挥功能。控制部21的功能的至少一部分可以通过电路来执行。另外,控制部21的功能的至少一部分也可以通过经由网络执行的程序来执行。
[0031] 文献解析装置1具有控制部11、存储部12以及通信部13。控制部11具有文献信息取得部111、附图标记提取部112、附图标记名称提取部113、朝向确定部114以及输出部115。
[0032] 通信部13是用于在与文献管理装置2之间进行通信的通信接口。通信部13包括用于进行通信的处理器、连接器以及天线等。通信部13对从文献管理装置2接收的通信信号进行预定处理来取得数据。另外,通信部13对要发送给外部的数据进行预定处理来生成通信信号,将生成的通信信号发送给文献管理装置2。
[0033] 存储部12是包括ROM、RAM、硬盘驱动器等的存储介质。存储部12预先存储控制部11执行的程序。控制部11例如是CPU等处理器,通过执行在存储部12中存储的程序,作为文献信息取得部111、附图标记提取部112、附图标记名称提取部113、朝向确定部114以及输出部115发挥功能。控制部11的功能的至少一部分也可以通过电路执行。另外,控制部11的功能的至少一部分也可以通过经由网络执行的程序来执行。
[0034] 本实施方式所涉及的文献解析系统S不限于图2所示的具体结构。例如文献解析装置1以及文献管理装置2可以一体化地构成为1个装置。
[0035] [文献解析方法的说明]在下面,对文献解析系统S执行的文献解析方法进行说明。首先用户利用用户终端3的操作部32来指定显示对象的文献。用户终端3将用户指定为显示对象的文献的识别信息发送给文献管理装置2。文献的识别信息是例如分配给文献的唯一编号。
[0036] 在文献管理装置2中,用户输入受理部211经由通信部23从用户终端3接受作为显示对象指定的文献的识别信息。在朝向信息存储部222以及附图标记信息存储部223中已经存储与显示对象的文献的识别信息建立关联的朝向信息以及附图标记信息的情况(即不是第一次显示的情况)下,显示控制部214执行后述的显示控制方法。
[0037] 在朝向信息存储部222以及附图标记信息存储部223中尚未存储与显示对象的文献的识别信息建立关联的朝向信息以及附图标记信息的情况(即是第一次显示的情况)下,文献信息提供部212从文献信息存储部221取得与用户输入受理部211受理的识别信息建立关联的文献信息。从而,文献信息提供部212将取得的文献信息与文献识别信息一起经由通信部23提供给文献解析装置1。在文献解析装置1中,文献信息取得部111经由通信部13从文献管理装置2取得作为显示对象指定的文献的识别信息以及文献信息。
[0038] 下面,附图标记提取部112从文献信息取得部111取得的文献信息所含的附图中提取表示附图标记的文字。在文献信息取得部111取得的文献信息所含的附图是多个的情况下,附图标记提取部112基于各个附图提取附图标记,与附图的识别信息建立关联。图3的(a)以及图3的(b)是表示文献信息所含的例示附图页面F上的附图的图。图3的(a)以及图3的(b)所表示的“A1”、“A2”是附图中例示的附图标记。
[0039] 如上述那样,附图的预定朝向是人(用户)保持不变状态就可以读取附图所含的附图标记的朝向。图3的(a)所示的附图因为配置在预定朝向上,所以用户保持该状态不变可以读取附图标记“A1”、“A2”。另一方面,图3的(b)所示的附图因为配置在预定朝向朝向左朝向旋转90度的朝向,所以用户保持该状态不变无法读取附图标记“A1”、“A2”。
[0040] 附图标记提取部112为了判定图3的(a)或者图3的(b)的状态的附图朝向来高精度地提取附图中的附图标记,而执行图4所示的第1附图标记提取方法和图5所示的第2附图标记提取方法中的至少一个。
[0041] 图4是附图标记提取部112执行的第1附图标记提取方法的示意图。文献解析装置1的存储部12中预先存储基准文字4。基准文字4包含作为提取对象的一组文字,例如数字、字母、记号或者它们的组合。
[0042] 附图标记提取部112作为第1扫描,一边沿着第1方向(例如附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面的横向)扫描附图,一边比较纵朝向的基准文字4和附图像素,从附图提取与基准文字4对应的文字(第1文字)。即,附图标记提取部112扫描附图的区域、构造图的区域或者包含附图或构造图的页面中的任一个来提取文字。
下面,附图标记提取部112作为第2扫描,一边沿着第2方向(例如附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面的纵向)扫描附图,一边比较基准文字4和附图的像素,从附图提取与基准文字4对应的文字(第2文字)。第2扫描时,附图标记提取部112从附图提取与使基准文字4左朝向旋转90度的文字对应的文字。或者,第2扫描时,附图标记提取部112也可以扫描沿着右朝向旋转90度的附图,从附图提取与基准文字4对应的文字。
[0043] 附图标记提取部112为了从附图提取与基准文字4对应的文字而例如利用OCR(Optical Character Recognition)技术。附图标记提取部112也可以利用能够从附图提取与基准文字4对应的文字的其他方法。
[0044] 这样,根据第1附图标记提取方法,附图标记提取部112通过第1扫描以及第2扫描提取文字。因此,即便在附图配置在保持状态不变就无法读取附图标记的朝向上的情况下,也可以仅仅进行两次以往的OCR等文字提取处理就能够提取文字。
[0045] 图5是附图标记提取部112所执行的第2附图标记提取方法的示意图。在文献解析装置1的存储部12中预先存储基准文字5。基准文字5包含作为提取对象的一组文字(例如纵朝向的文字以及左朝向的文字),例如是数字、字母、记号或者它们的组合。
[0046] 附图标记提取部112一边沿着某方向(例如附图的区域、构造图的区域或者包含附图或构造图中的至少一个的页面的横向)扫描附图,一边比较基准文字5和附图的像素,从附图提取基准文字5中的纵朝向的文字(第1文字)和基准文字5中的左朝向的文字(第2文字)。即,附图标记提取部112扫描附图的区域、构造图的区域或者包含附图构造图的页面,提取文字。附图标记提取部112为了从附图提取与基准文字5对应的文字而例如利用OCR技术。附图标记提取部112也可以利用能够从附图提取与基准文字5对应的文字的其他方法。
[0047] 这样,根据第2附图标记提取方法,附图标记提取部112通过1个方向的扫描来提取文字。因此,即便附图被配置在保持状态不变就无法读取附图标记的朝向上的情况下,仅1次扫描就能够提取文字。
[0048] 在上述第1附图标记提取方法以及第2附图标记提取方法中,例示了附图配置在预定朝向,或者预定朝向左朝向旋转90度的朝向的某一个的情况,但是也可以配置在除此之外的朝向。例如,附图也可以配置在预定朝向左朝向旋转180度或者270度的朝向。另外,附图也可以配置在以预定朝向为基准而旋转多个预定度中任一个的朝向。
[0049] 附图标记名称提取部113从文献信息取得部111取得的文献信息所含的文章,提取附图标记和附图标记的名称。附图标记名称提取部113在附图标记提取部112从附图提取附图标记的处理之后、该处理之前或者与该处理并行地从文章提取附图标记的名称。
[0050] 图6是附图标记名称提取部113从文章提取附图标记以及附图标记的名称的方法的示意图。首先,附图标记名称提取部113在文章页面W的文章中搜索作为与预定文字对应的文字(第3文字)的附图标记61。预定文字包含可以作为附图标记使用的一组文字,例如是数字、字母、记号或者它们的组合。
[0051] 从而,附图标记名称提取部113将与通过搜索找到的附图标记61之间相邻的单词确定为附图标记的名称62。例如附图标记名称提取部113也可以为了将日语的文章分割为单词,而将汉字、平假名、平假名以及记号交替的位置识别为单词的区分。例如附图标记名称提取部113为了将英语的文章分割为单词,可以将冠词的位置识别为单词的区分。例如附图标记名称提取部113为了将韩语的文章分割为单词,而将空格(空白文字)的位置识别为单词的区分。附图标记名称提取部113不限于这里所示的具体方法,可以根据与语言对应的方法,来将文章分割为单词。另外,附图标记名称提取部113可以利用已知方式素解析方法,来将文章分割为单词。
[0052] 附图标记名称提取部113在发现了多个附图标记61的情况下,针对各个附图标记61提取附图标记的名称62。附图标记名称提取部113在与1个附图标记61对应的名称被提取到多个的情况下,将提取到最多的名称作为附图标记的名称62。附图标记名称提取部113不限于上述具体方法,也可以通过其他方法提取与附图标记建立关联的附图标记的名称。
[0053] 朝向确定部114基于附图标记提取部112从附图提取的文字和附图标记名称提取部113从文章提取的附图标记,来确定附图朝向。朝向确定部114通过确定附图朝向,还确定了附图方向。具体地,附图标记提取部112执行第1附图标记提取方法的情况下,朝向确定部114算出通过第1扫描提取的文字和从文章提取的附图标记之间的一致程度(例如一致率或者一致数),并且算出通过第2扫描提取的文字和从文章提取的附图标记之间的一致程度。
从而,朝向确定部114在通过第1扫描提取的文字的一致程度在通过第2扫描提取的文字的一致程度以上的情况下,判定为附图被配置在预定朝向上。朝向确定部114在通过第1扫描提取的文字的一致程度小于通过第2扫描提取的文字的一致程度的情况下,判定为附图未被配置在预定朝向上,而配置在预定朝向左朝向旋转90度的朝向上。
[0054] 在附图标记提取部112执行第2附图标记提取方法的情况下,朝向确定部114算出基于纵朝向的文字提取的文字和从文章提取的附图标记之间的一致程度,并且算出基于左朝向的文字提取的文字和从文章提取的附图标记之间的一致程度。从而,朝向确定部114在基于纵朝向的文字提取的文字的一致程度在基于左朝向的文字提取的文字的一致程度以上的情况下,判定为附图被配置在预定朝向上。朝向确定部114在基于纵朝向的文字提取的文字的一致程度小于基于左朝向的文字提取的文字的一致程度的情况下,判定为附图未配置在预定朝向上,而配置在预定朝向左朝向旋转90度的朝向。
[0055] 附图标记提取部112将与朝向确定部114确定的附图朝向一致的朝向的文字确定为附图标记。在附图标记提取部112利用第1附图标记提取方法的情况下,附图标记提取部112将通过第1扫描以及第2扫描中的从文章提取的附图标记之间的一致程度大的方向的扫描提取的文字决定为附图标记。在附图标记提取部112利用第2附图标记提取方法的情况下,附图标记提取部112将与从文章提取的附图标记之间的一致程度大的朝向的文字决定为附图标记。
[0056] 并且,附图标记提取部112决定附图中的附图标记的位置。附图标记的位置是例如附图标记所含的各文字的位置的重心。附图标记的位置通过例如附图中的坐标(即将附图配置在x-y平面的情况的x坐标以及y坐标)来表示。
[0057] 这样,文献解析装置1能够同时进行从附图提取文字和确定附图朝向,因此能够缩短对附图进行解析的处理所花费的时间。
[0058] 输出部115将文献的识别信息、附图的识别信息、朝向确定部114确定的附图朝向、附图标记提取部112从附图提取的附图标记以及附图标记的位置、附图标记名称提取部113从文章提取的附图标记的名称建立关联,作为解析信息输出给文献管理装置2。
[0059] 在文献管理装置2中,解析信息受理部213接收文献解析装置1发送的解析信息。从而解析信息受理部213基于接收的解析信息,来使表示文献附图朝向的朝向信息存储在朝向信息存储部222中,并且使表示文献附图所含的附图标记的名称以及位置的附图标记信息存储在附图标记信息存储部223中。
[0060] 图7的(a)是朝向信息存储部222存储的例示性朝向信息7的示意图。朝向信息7是将文献的识别信息71(文献编号)、附图的识别信息72(附图编号)以及附图的朝向73建立关联的信息。
[0061] 文献的识别信息71是从文献解析装置1接收的解析信息所示的文献的识别信息。附图的识别信息72是从文献解析装置1接收的解析信息所示的附图的识别信息。
[0062] 附图的朝向73是从文献解析装置1接收的解析信息所示的附图的朝向,例如通过左朝向的角度来表示。因此,通过使附图旋转到附图朝向73(例如左朝向90度)的相反朝向(例如右朝向90度),附图就沿着预定朝向配置。附图的朝向73也可以表示将附图配置到预定朝向上所需的旋转的角度。
[0063] 图7的(b)是附图标记信息存储部223存储的例示性附图标记信息8的示意图。附图标记信息8是将文献的识别信息81(文献编号)、附图的识别信息82(附图编号)、附图标记83、附图标记的名称84以及附图标记的位置85建立关联的信息。
[0064] 文献的识别信息81是从文献解析装置1接收的解析信息所示的文献的识别信息。附图的识别信息82是从文献解析装置1接收的解析信息所示的附图的识别信息。附图标记
83是从文献解析装置1接收的解析信息所示的附图标记。附图标记的名称84是从文献解析装置1接收的解析信息所示的附图标记的名称。附图标记的位置85是从文献解析装置1接收的解析信息所示的附图标记的位置。
[0065] 在图7的(a)、图7的(b)中朝向信息7以及附图标记信息8为了识别性而以文字列的表来表示,但是各数据也可以以文字列数据、数值数据、二进制数据等任意形式记录。朝向信息7以及附图标记信息8可以作为数据库记录或者也可以以列举数据的列表来记录。
[0066] 在下面,对显示控制部214执行的显示控制方法进行说明。首先,显示控制部214从文献信息存储部221取得与用户输入受理部211所受理的识别信息建立关联的文献信息。另外,显示控制部214从朝向信息存储部222取得与用户输入受理部211受理的识别信息建立关联的朝向信息。另外,显示控制部214从附图标记信息存储部223取得与用户输入受理部211所受理的识别信息建立关联的附图标记信息。
[0067] 显示控制部214利用朝向信息所示的附图的朝向,来将文献信息所含的各附图配置在预定朝向上。图8是将附图沿着预定朝向配置的方法的示意图。具体地,显示控制部214使附图旋转到朝向信息所示的附图朝向的相反朝向。由此,显示控制部214能够利用基于从附图提取的文字确定的朝向,将附图配置在预定朝向上。
[0068] 下面,显示控制部214在预定朝向上配置的附图上,重叠附图标记标签。图9的(a)、图9的(b)是重叠附图标记标签9的附图的示意图。附图标记标签9包含附图标记信息所示的附图标记以及附图标记的名称。
[0069] 在图9的(a)的例中,显示控制部214在附图标记信息所示的附图标记的位置的附近,显示附图标记标签9。由此,用户易于观察与附图中附图标记对应的附图标记标签。在图的9(b)的例中,显示控制部214使附图标记标签9整列显示到附图的任意端。由此能够抑制附图标记标签9挡住附图的一部分。
[0070] 这样,显示控制部214在从用户指定了显示对象的文献时,基于附图标记信息在附图上重叠了附图标记标签,因此无需为了包含附图标记标签而变更附图自身并预先存储在存储部中。因此,能够削减附图存储所需的存储部容量。
[0071] 从而,显示控制部214经由通信部23向用户终端3输出显示信息和从文献信息存储部221取得的文献信息所包含的文章,所述显示信息用于显示在该文献信息所包含的附图被配置在预定朝向的基础上重叠了附图标记标签而成的附图。
[0072] 用户终端3按照从文献管理装置2接收的显示信息,将包含沿着预定的朝向配置,并且重叠附图标记标签的附图的文献显示在显示部31上。由此,用户因为能够看到沿着预定朝向配置的状态的附图,因此能够削减手动作业旋转附图的辛劳。另外,用户能够将从文章中提取的附图标记的名称作为附图标记标签在附图上识别,因此对比观察文章和附图来解釈附图的附图标记的含义变得容易。
[0073] [文献解析方法的时序]图10是本实施方式所涉及的文献解析方法的时序图。首先,用户终端3将用户指定为显示对象的文献的识别信息,发送给文献管理装置2。在文献管理装置2中,用户输入受理部
211从用户终端3受理作为显示对象指定的文献的识别信息。
[0074] 在朝向信息存储部222以及附图标记信息存储部223已经存储了与显示对象的文献的识别信息建立关联的朝向信息以及附图标记信息的情况(即不是第一次显示的情况下)(S11的否),文献管理装置2进入步骤S17。
[0075] 在朝向信息存储部222以及附图标记信息存储部223中尚未存储与显示对象的文献的识别信息建立关联的朝向信息以及附图标记信息的情况(即第一次显示的情况)下(S11的是),文献信息提供部212从文献信息存储部221取得与用户输入受理部211受理的识别信息建立关联的文献信息。从而,文献信息提供部212将取得的文献信息与文献的识别信息一起提供给文献解析装置1(S12)。
[0076] 在文献解析装置1中,文献信息取得部111从文献管理装置2取得作为显示对象指定的文献的识别信息以及文献信息。附图标记提取部112从文献信息取得部111取得的文献信息所含的附图提取表示附图标记的文字(S13)。
[0077] 附图标记名称提取部113从文献信息取得部111取得的文献信息所含的文章,提取与预定文字对应的附图标记以及与附图标记建立关联的附图标记的名称(S14)。朝向确定部114基于在步骤S13中附图标记提取部112提取的文字以及在步骤S14中附图标记名称提取部113提取的附图标记,来确定附图的朝向(S15)。附图标记提取部112、附图标记名称提取部113以及朝向确定部114所进行的具体方法利用图4~图6如上述那样。
[0078] 输出部115将文献的识别信息、附图的识别信息、在步骤S14朝向确定部114确定的附图的朝向、在步骤S13中附图标记提取部112从附图提取的附图标记以及附图标记的位置、在步骤S15中附图标记名称提取部113从文章提取的附图标记的名称建立关联,作为解析信息输出给文献管理装置2(S16)。
[0079] 在文献管理装置2中,解析信息受理部213接收文献解析装置1发送的解析信息。从而,解析信息受理部213基于接收的解析信息,来使朝向信息存储部222存储表示文献附图朝向的朝向信息中,并且使附图标记信息存储部223存储表示文献附图所含的附图标记的名称以及位置的附图标记信息。
[0080] 显示控制部214从文献信息存储部221取得与用户输入受理部211受理的识别信息建立关联的文献信息。另外,显示控制部214从朝向信息存储部222取得与用户输入受理部211受理的识别信息建立关联的朝向信息。另外,显示控制部214从附图标记信息存储部223取得与用户输入受理部211受理的识别信息建立关联的附图标记信息。
[0081] 显示控制部214利用朝向信息所示的附图朝向,来将文献信息所含的各附图配置在预定朝向上(S17)。显示控制部214在步骤S17在配置在预定朝向的附图上,重叠附图标记信息所示的附图标记以及包含附图标记名称的附图标记标签(S18)。显示控制部214在预定朝向上配置附图并重叠附图标记标签的方法利用图8、图9如上述那样。
[0082] 显示控制部214对用户终端3输出从文献信息存储部221取得的文献信息所包含的文章和在将该文献信息所包含的附图配置在预定朝向上的基础上用于显示重叠附图标记标签的附图的显示信息(S19)。用户终端3按照从文献管理装置2接收的显示信息,在显示部31上显示在预定朝向上配置并且包含重叠附图标记标签的附图的文献。
[0083] [第1变形例]在文献解析装置1未能从文章提取与附图标记对应的附图标记的名称的情况下,文献管理装置2也可以在显示包含该附图标记的附图标记标签时从用户终端3受理与该附图标记对应的附图标记的名称的输入。
[0084] 该情况下,文献管理装置2当显示附图标记的名称包含未能被提取的附图标记的附图标记标签时,在用户终端3的显示部31上,显示受理与该附图标记对应的附图标记的名称的输入的画面。用户利用用户终端3的操作部32,输入与该附图标记对应的附图标记的名称。用户终端3将用户输入的附图标记的名称发送给文献管理装置2。
[0085] 文献管理装置2的用户输入受理部211从用户终端3受理用户输入的附图标记的名称。从而,用户输入受理部211在附图标记信息存储部223中,将与该附图标记建立关联的附图标记信息所含的附图标记的名称设定到用户输入的附图标记的名称。由此,文献管理装置2能够对附图标记的名称未被提取的附图标记显示用户输入的附图标记的名称。另外,用户输入的附图标记的名称被存储在附图标记信息存储部223中,因此在未能从文章提取附图标记名称的情况下,将某一个用户输入的附图标记的名称为其他用户所共有。
[0086] 同样地,在文献解析装置1无法从附图中提取至少一部分附图标记的情况下,文献管理装置2也可以在显示该附图时,从用户终端3受理附图标记的输入。该情况下,文献管理装置2在显示附图时在用户终端3的显示部31上,显示受理该附图所含的附图标记的输入的画面。用户利用用户终端3的操作部32在该附图中指定附图标记的位置,并且输入该附图标记。用户终端3将用户输入的附图标记以及附图标记的位置发送给文献管理装置2。
[0087] 文献管理装置2的用户输入受理部211受理用户从用户终端3输入的附图标记以及附图标记的位置。从而,用户输入受理部211使附图标记信息存储部223存储包括用户输入的附图标记以及附图标记的位置的附图标记信息。由此,文献管理装置2能够基于用户的输入来显示未从附图提取到的附图标记。另外,因为用户输入的附图标记被存储在附图标记信息存储部223中,因此在无法从附图提取出附图标记的情况下,能够与其他用户共享某一个用户输入的附图标记。
[0088] [第2变形例]存在显示附图上的附图标记标签盖住附图一部分的情况。在此,文献管理装置2也可以从用户终端3受理用于移动附图标记标签的指示。
[0089] 该情况下,文献管理装置2当在用户终端3的显示部31上显示重叠了附图标记标签的附图时,能够移动附图标记标签。用户利用用户终端3的操作部32来移动附图标记标签。用户终端3将移动后的附图标记标签的位置(例如附图上的坐标)发送给文献管理装置2。
[0090] 文献管理装置2的用户输入受理部211从用户终端3受理用户移动后的附图标记标签的位置。从而,用户输入受理部211在附图标记信息存储部223中,将与用户移动的附图标记标签对应的附图标记信息所含的附图标记的位置设定到用户移动后的位置。由此,文献管理装置2能够将附图标记标签显示在用户移动后的位置。另外,因为移动后的位置存储在附图标记信息存储部223中,所以在附图标记标签挡住附图一部分的情况等下,能够使得某一个用户移动的附图标记标签的位置为其他用户所共有。
[0091] [第3变形例]文献解析装置1即便不提取附图所含的全部文字,也存在能够确定附图的朝向的情况。
因此,附图标记提取部112也可以不是附图所含的全部文字,而是提取一部分的文字。因此,附图标记提取部112在从附图提取的文字的数量为预定阈值以上的情况下,停止从附图提取文字。朝向确定部114基于附图标记提取部112从附图提取的一部分文字和附图标记名称提取部113从文章提取的附图标记,来确定附图朝向。由此,文献解析装置1能够缩短从附图提取文字来确定附图朝向所花费的时间。
[0092] 文献解析装置1如果能够在得到确定附图朝向所需的充分信息之前就停止文字提取,存在无法正确地确定附图朝向的可能性。在此,文献解析装置1也可以在提取附图所含的一部分文字时,利用人工智能(AI;Artificial Intelligence)。例如文献解析装置1利用人工智能,预先对多个附图进行机械学习。此时,人工智能对沿着各个朝向配置的附图所含的文字特征进行学习,并作为学习数据存储在存储部12中。
[0093] 从而,附图标记提取部112一边利用人工智能从附图提取文字,一边基于存储部12中存储的学习数据来判定附图朝向。从而,附图标记提取部112在能够利用人工智能来判定附图朝向的情况下,停止从附图提取文字。从而,朝向确定部114将通过人工智能判定的附图朝向确定为附图朝向。由此,文献解析装置1能够通过人工智能在附图朝向确定出的阶段停止从附图提取文字,因此能够提前并且高精度地确定附图朝向。
[0094] [第4变形例]在以上的说明中,说明了朝向确定部114确定附图朝向的情况,但是朝向确定部114还可以确定附图方向(即沿着1个轴的两个朝向)。附图方向被例如表示为上下方向(纵向)或者左右方向(横向)。例如文献中附图的朝向被限定为上朝向或者左朝向中的任意朝向的情况下,朝向确定部114确定附图是上下方向还是左右方向,输出部115可以将表示确定出的方向的解析信息发送给文献管理装置2。由此,文献管理装置2在解析信息是表示上下方向的情况下能够将附图朝向确定为上朝向,在解析信息表示左右方向的情况下能够将附图朝向确定为左朝向。
[0095] [第5变形例]文献解析装置1在用户从附图以及文章中的一方选择了附图标记或者附图标记的名称的情况下,也可以在附图以及文章中的另一方中突出显示选择出的附图标记或者附图标记的名称。
[0096] 图11和图12是用于说明突出显示附图标记或者附图标记的名称的方法的示意图。图11表示在文章中突出显示附图中选择出的附图标记或者附图标记的名称的示例。图12表示在附图中突出显示文章中选择出的附图标记或者附图标记的名称的示例。
[0097] 文献管理装置2在用户终端3的显示部31上显示附图以及文章。如上述那样,在附图上重叠附图标记以及含有附图标记的名称的附图标记标签。用户利用用户终端3的操作部32在附图或者文章中,选择附图标记或者附图标记的名称。例如,如图11和图12所示,用户对应于附图标记或者附图标记的名称按下光标91,由此来选择光标91的位置附图标记或者附图标记的名称。或者,用户也可以以包括附图标记或者附图标记的名称的方式拖拽光标91,来选择指定范围所含的一个或者多个附图标记或者附图标记的名称。或者,用户也可以通过在画面上进行规定操作(例如按下全选按钮),来选择附图或者文章所含的全部附图标记以及附图标记的名称。
[0098] 在文献管理装置2中,用户输入受理部211经由通信部23从用户终端3受理用户对一个或者多个附图标记或者附图标记的名称的选择。从而,文献信息提供部212将表示选择出的一个或者多个附图标记或者附图标记的名称的选择信息提供给文献解析装置1。
[0099] 在文献解析装置1中,文献信息取得部111经由通信部13从文献管理装置2取得选择信息。在文献信息取得部111取得的选择信息表示在附图中附图标记以及附图标记的名称中的至少一方被选择出的情况下,输出部115将用于在文章中改变选择出的附图标记以及附图标记的名称中的至少一方的显示方式的显示控制信息输出给文献管理装置2。在文章中改变显示方式是指,例如对选择出的附图标记以及附图标记的名称中的至少一方改变文字种类、或改变文字颜色、或者附加边框或者改变背景色,来进行突出显示。
[0100] 在文献信息取得部111取得的选择信息表示在文章中选择出附图标记以及附图标记的名称的至少一方的情况下,输出部115将用于在附图中改变选择出的附图标记以及附图标记的名称的至少一方的显示方式的显示控制信息输出文献管理装置2。在附图中改变显示方式是指例如对包括选择出的附图标记以及附图标记的名称中的至少一方的附图标记标签改变文字种类、或改变文字的颜色、或者改变大小或者改变背景色,由此来进行突出显示。
[0101] 在文献信息取得部111取得的选择信息表示选择出多个附图标记以及附图标记的名称的至少一方的情况下,优选输出部115以使得多个附图标记以及附图标记的名称的至少一方的显示方式相互不同的方式(例如不同的背景色)来进行设定。由此,用户能够容易区分不同的附图标记以及附图标记的名称。
[0102] 在文献管理装置2中,解析信息受理部213接受文献解析装置1发送的显示控制信息。从而,显示控制部214经由通信部23对用户终端3输出显示信息,该显示信息用于显示从文献信息存储部221取得的文献信息所含的文章以及在规定朝向配置了该文献信息所含的附图上重叠附图标记标签后的附图。显示控制部214还按照显示控制信息,经由通信部23向用户终端3输出用于在附图或者文章的中改变选择出的附图标记以及附图标记的名称中的至少一方的显示方式的显示信息。
[0103] 用户终端3按照从文献管理装置2接受到的显示信息,在显示部31上显示包括在规定朝向配置并且重叠了附图标记标签的附图,并且在附图或者文章中改变了选择出的附图标记以及附图标记的名称中的至少一方的显示方式的文献。在图11和图12的示例中,对选择出的附图标记以及附图标记的名称,显示与其他部分不同的背景色的边框92。
[0104] 通过这样的结构,文献解析系统S在附图以及文章的一方中用户选择了附图标记或者附图标记的名称的情况下,在附图以及文章的另一方中突出显示选择出的附图标记或者附图标记的名称。由此,用户能够容易地识别在附图以及文章中的一方受到关注的附图标记或者附图标记的名称出现在附图以及文章中的另一方的部位。
[0105] [本实施方式的效果]本实施方式所涉及的文献解析系统S基于从附图提取的附图标记的文字,能够在可以读取附图标记的朝向上配置文献附图。因此,用户能够观察在预定朝向上配置的状态的附图,因此能够削减以手动作业旋转附图的辛劳。
[0106] 另外,文献解析系统S在将附图配置在预定朝向之后,能够显示重叠地表示了附图标记名称的附图标记标签的附图。因此,用户能够在附图上识别从文章中提取的附图标记的名称,因此对比文章和附图来解释附图的附图标记的含义就变得容易。
[0107] 以上,利用实施方式说明了本发明,但是本发明的技术范围不限于上述实施方式中记载的范围,在其主旨范围内能够进行各种变形以及变更。例如,装置的分散、统合的具体实施方式不限于以上实施方式,针对其全部或者一部分,能够以任意单位功能或者物理上的分散、统合地构成。另外,通过多个实施方式的任意组合产生的新实施方式也包含在本发明实施方式中。通过组合而产生的新实施方式的效果与原来的实施方式的效果相符。
[0108] 文献解析装置1、文献管理装置2以及用户终端3的处理器是图10所示方法所含的各步骤(工序)的主体。即,文献解析装置1、文献管理装置2以及用户终端3的处理器从存储部读取用于执行图10所示方法的程序,通过执行该程序控制文献解析系统S的各个部分,执行图10所示方法。图10所示的方法所含步骤可以省略一部分,可以改变步骤之间的顺序,也可以并行执行多个步骤。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈