首页 / 专利库 / 专利权 / 第I章 / 国际申请 / 说明书 / 药品说明书处理方法及装置

药品说明书处理方法及装置

阅读:282发布:2020-05-13

专利汇可以提供药品说明书处理方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种药品 说明书 处理方法,所述方法包括以下步骤:获取药品说明书,提取药品说明书中的原始字段名,获取字段名归类表,将原始字段名与字段名归类表中的标准字段名进行匹配,当字段名归类表中存在与原始字段名匹配的标准字段名时,获取匹配的标准字段名作为与原始字段名对应的明细字段名,根据预设规则提取药品说明书中与原始字段名对应的字段并将字段生成与明细字段名对应的药品说明书明细。此外,还对应提供了一种药品说明书处理装置。上述药品说明书处理方法及装置能够提高药品说明书 整理 工作的工作效率。,下面是药品说明书处理方法及装置专利的具体信息内容。

1.一种药品说明书处理方法,其特征在于,所述方法包括以下步骤:
获取药品说明书;
提取所述药品说明书中的原始字段名;
获取字段名归类表;
将所述原始字段名与所述字段名归类表中的标准字段名进行匹配;
当所述字段名归类表中存在与所述原始字段名匹配的标准字段名时,获取匹配的所述标准字段名作为与所述原始字段名对应的明细字段名;
根据预设规则提取所述药品说明书中与所述原始字段名对应的字段并将所述字段生成与所述明细字段名对应的药品说明书明细。
2.根据权利要求1所述的药品说明书处理方法,其特征在于,所述将所述原始字段名与所述字段名归类表中的标准字段名进行匹配的步骤之后还包括:
当所述字段名归类表中不存在与所述原始字段名匹配的标准字段名时,输出新增字段名处理选项;
通过所述新增字段名处理选项接收操作指令;
根据所述操作指令将所述原始字段名添加至所述字段名归类表以对所述字段名归类表进行更新。
3.根据权利要求1所述的药品说明书处理方法,其特征在于,所述将所述原始字段名与所述字段名归类表中的标准字段名进行匹配的步骤包括:
查找所述字段名归类表中是否存在与所述原始字段名一致的归类字段名;
当存在一致的所述归类字段名时,在所述字段名归类表中查找与所述归类字段名关联的标准字段名。
4.根据权利要求3所述的药品说明书处理方法,其特征在于,所述生成与所述明细字段名对应的药品说明书明细的步骤之后包括:
根据字段名归类表对所述药品说明书明细中的字段进行归类字段名识别;
判断所述字段中是否存在两个以上的归类字段名;
当所述字段中存在两个以上的归类字段名时,判断所述字段是否属于预设拆分字段;
当所述字段属于预设拆分字段时,将所述归类字段名作为起止符对所述字段进行拆分,将两个所述归类字段名之间的内容归属至两个所述归类字段名中的前一个所述归类字段名或将所述字段中位于最后的所述归类字段名后面的内容归属至最后的所述归类字段名;
在被拆分的所述字段所属明细中添加新增字段并将拆分后的所述内容对应填入所述新增字段。
5.根据权利要求4所述的药品说明书处理方法,其特征在于,所述在被拆分的所述字段所属明细中添加新增字段并将拆分后的所述内容对应填入所述新增字段的步骤包括:
对拆分后的所述内容的字符数进行校验;
当拆分后的所述内容的字符数符合校验值时,获取所述归类字段名关联的标准字段名作为在被拆分的所述字段所属明细中新增字段的明细字段名,将拆分后的所述内容填入与所述明细字段名对应的字段中。
6.根据权利要求1所述的药品说明书处理方法,其特征在于,所述提取所述药品说明书中的原始字段名的步骤之前还包括:
判断所述药品说明书是否为非标准格式;
当所述药品说明书为非标准格式时,将非标准格式的所述药品说明书进行备份后转化为标准格式;
所述生成与所述明细字段名对应的药品说明书明细的步骤之后还包括:
将备份的非标准格式的所述药品说明书链接至对应的药品说明书明细。
7.根据权利要求1所述的药品说明书处理方法,其特征在于,所述生成与所述明细字段名对应的药品说明书明细的步骤之后还包括:
判断所述药品说明书明细中的批准文号字段是否符合药品批准文号的标准格式;
当所述批准文号字段符合所述标准格式时,获取药品基本信息库中药品批准文号与所述批准文号字段一致的药品基本信息,根据所述药品基本信息对所述药品说明书明细中的基本信息字段进行引证修改
当所述批准文号字段不符合所述标准格式时,将所述批准文号字段所属的所述药品说明书明细进行删除。
8.根据权利要求7所述的药品说明书处理方法,其特征在于,所述根据所述药品基本信息对所述药品说明书明细中的基本信息字段进行引证修改的步骤包括:
提取所述药品基本信息中与所述基本信息字段相对应的内容;
将提取的所述内容与所述基本信息字段进行比对生成差异内容对比页面;
通过所述差异内容对比页面接收修改指令;
根据所述修改指令将与提取的所述内容有差异的基本信息字段替换为所述药品基本信息中对应的内容。
9.一种药品说明书处理装置,其特征在于,所述装置包括:
说明书获取模,用于获取药品说明书;
原始字段名提取模块,用于提取所述药品说明书中的原始字段名;
归类表获取模块,用于获取字段名归类表;
字段名匹配模块,用于将所述原始字段名与所述字段名归类表中的标准字段名进行匹配;
字段名转化模块,用于当所述字段名归类表中存在与所述原始字段名匹配的标准字段名时,获取匹配的所述标准字段名作为与所述原始字段名对应的明细字段名;
明细生成模块,用于根据预设规则提取所述药品说明书中与所述原始字段名对应的字段并将所述字段生成与所述明细字段名对应的药品说明书明细。
10.根据权利要求9所述的药品说明书处理装置,其特征在于,所述装置还包括:
处理选项输出模块,用于当所述字段名归类表中不存在与所述原始字段名匹配的标准字段名时,输出新增字段名处理选项;
操作指令接收模块,用于通过所述新增字段名处理选项接收操作指令;
归类表更新模块,用于根据所述操作指令将所述原始字段名添加至所述字段名归类表以对所述字段名归类表进行更新。

说明书全文

药品说明书处理方法及装置

技术领域

[0001] 本发明涉及数据处理领域,特别是涉及一种药品说明书处理方法及装置。

背景技术

[0002] 市面上存在着上万种药品,每种药品都附有药品说明书,药品说明书记录了药品的基本信息,是药品情况说明重要来源之一,也是医师、药师、护师和病人治疗用药时的科学依据,还是药品生产、供应部向医药卫生人员和人民群众宣传介绍药品特性、指导合理、安全用药和普及医药知识的主要媒介。
[0003] 但是,市面上不同厂家的说明书存在格式、内容分散,表述方式不统一的问题,不同药品说明书之间的同类药品信息的关联程度差,一般的,都是通过人工方式对药品说明书的内容进行整理和归类,工作效率低且费时耗

发明内容

[0004] 基于此,有必要针对上述药品说明书整理工作的工作效率低的问题,提供一种药品说明书处理方法及装置。
[0005] 一种药品说明书处理方法,所述方法包括以下步骤:
[0006] 获取药品说明书;
[0007] 提取药品说明书中的原始字段名;
[0008] 获取字段名归类表;
[0009] 将原始字段名与字段名归类表中的标准字段名进行匹配;
[0010] 当字段名归类表中存在与原始字段名匹配的标准字段名时,获取匹配的标准字段名作为与原始字段名对应的明细字段名;
[0011] 根据预设规则提取药品说明书中与原始字段名对应的字段并将字段生成与明细字段名对应的药品说明书明细。
[0012] 在其中一个实施例中,将原始字段名与字段名归类表中的标准字段名进行匹配的步骤之后还包括:
[0013] 当字段名归类表中不存在与原始字段名匹配的标准字段名时,输出新增字段名处理选项;
[0014] 通过新增字段名处理选项接收操作指令;
[0015] 根据操作指令将原始字段名添加至字段名归类表以对字段名归类表进行更新。
[0016] 在其中一个实施例中,将原始字段名与字段名归类表中的标准字段名进行匹配的步骤包括:
[0017] 查找字段名归类表中是否存在与原始字段名一致的归类字段名;
[0018] 当存在一致的归类字段名时,在字段名归类表中查找与归类字段名关联的标准字段名。
[0019] 在其中一个实施例中,生成与明细字段名对应的药品说明书明细的步骤之后包括:
[0020] 根据字段名归类表对药品说明书明细中的字段进行归类字段名识别;
[0021] 判断字段中是否存在两个以上的归类字段名;
[0022] 当字段中存在两个以上的归类字段名时,判断字段是否属于预设拆分字段;
[0023] 当字段属于预设拆分字段时,将归类字段名作为起止符对字段进行拆分,将两个归类字段名之间的内容归属至两个归类字段名中的前一个归类字段名或将字段中位于最后的归类字段名后面的内容归属至最后的归类字段名;
[0024] 在被拆分的字段所属明细中添加新增字段并将拆分后的内容对应填入新增字段。
[0025] 在其中一个实施例中,在被拆分的字段所属明细中添加新增字段并将拆分后的内容对应填入新增字段的步骤包括:
[0026] 对拆分后的内容的字符数进行校验;
[0027] 当拆分后的内容的字符数符合校验值时,获取归类字段名关联的标准字段名作为在被拆分的字段所属明细中新增字段的明细字段名,将拆分后的内容填入与明细字段名对应的字段中。
[0028] 在其中一个实施例中,提取药品说明书中的原始字段名的步骤之前还包括:
[0029] 判断药品说明书是否为非标准格式;
[0030] 当药品说明书为非标准格式时,将非标准格式的药品说明书进行备份后转化为标准格式;
[0031] 生成与明细字段名对应的药品说明书明细的步骤之后还包括:
[0032] 将备份的非标准格式说明书链接至对应的药品说明书明细。
[0033] 在其中一个实施例中,生成与明细字段名对应的药品说明书明细的步骤之后还包括:
[0034] 判断药品说明书明细中的批准文号字段是否符合药品批准文号的标准格式;
[0035] 当批准文号字段符合标准格式时,获取药品基本信息库中药品批准文号与批准文号字段一致的药品基本信息,根据药品基本信息对药品说明书明细中的基本信息字段进行引证修改
[0036] 当批准文号字段不符合标准格式时,将批准文号字段所属的药品说明书明细进行删除。
[0037] 在其中一个实施例中,根据药品基本信息对药品说明书明细中的基本信息字段进行引证修改的步骤包括:
[0038] 提取药品基本信息中与基本信息字段相对应的内容;
[0039] 将提取的内容与基本信息字段进行比对生成差异内容对比页面;
[0040] 通过差异内容对比页面接收修改指令;
[0041] 根据修改指令将与提取的内容有差异的基本信息字段替换为药品基本信息中对应的内容。
[0042] 一种药品说明书处理装置,所述装置包括:
[0043] 说明书获取模,用于获取药品说明书;
[0044] 原始字段名提取模块,用于提取药品说明书中的原始字段名;
[0045] 归类表获取模块,用于获取字段名归类表;
[0046] 字段名匹配模块,用于将原始字段名与字段名归类表中的标准字段名进行匹配;
[0047] 字段名转化模块,用于当字段名归类表中存在与原始字段名匹配的标准字段名时,获取匹配的标准字段名作为与原始字段名对应的明细字段名;
[0048] 明细生成模块,用于根据预设规则提取药品说明书中与原始字段名对应的字段并将字段生成与明细字段名对应的药品说明书明细。
[0049] 在其中一个实施例中,装置还包括:
[0050] 处理选项输出模块,用于当字段名归类表中不存在与原始字段名匹配的标准字段名时,输出新增字段名处理选项;
[0051] 操作指令接收模块,用于通过新增字段名处理选项接收操作指令;
[0052] 归类表更新模块,用于根据操作指令将原始字段名添加至字段名归类表以对字段名归类表进行更新。
[0053] 上述药品说明书处理方法及装置,通过对药品说明书中的原始字段名进行提取,将原始字段名与字段名归类表中的标准字段名进行匹配,并将标准字段名作为药品说明书的明细字段名,对药品说明书中原始字段名对应的说明书内容进行提取,生成字段与标准化的明细字段名一一对应药品说明书明细,通过上述方法可以将药品说明书批量自动生成具有相同字段结构的药品说明书明细,实现了对格式、内容分散的药品说明书结构的标准化,使得不同药品说明书中的同类药品信息经处理生成的说明书明细字段均与同一标准明细字段名相对应,从而提高了药品说明书中药品信息的关联性,并且提高了药品说明书整理工作的工作效率,节省人力。附图说明
[0054] 图1为一个实施例中用于执行药品说明书处理方法的终端的内部结构示意图;
[0055] 图2为一个实施例中药品说明书处理方法的流程图
[0056] 图3为一个实施例中药品说明书处理装置的结构示意图;
[0057] 图4为另一个实施例中药品说明书处理装置的结构示意图。

具体实施方式

[0058] 为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0059] 在一个实施例中,如图1所示,为一个终端的内部结构示意图。该终端包括通过系统总线连接的处理器、非易失性存储介质和内存储器。其中,终端的非易失性存储介质存储有操作系统数据库,还包括一种药品说明书处理装置。数据库用于存储于实现一种药品说明书处理方法相关的数据,包括存储预先建立的字段名归类表等,药品说明书处理装置用于实现一种药品说明书处理方法。该处理器用于提供计算和控制能力,支撑整个终端的运行。终端中的内存储器为非易失性存储介质中的药品说明书处理装置的运行提供环境,该内存储器中可储存有计算机可读指令,该计算机可读指令被处理器执行时,可使得处理器执行一种药品说明书处理方法。本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的终端的限定,具体的终端可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0060] 在一个实施例中,如图2所示,提供了一种药品说明书处理方法,该方法可应用于终端或服务器,以该方法应用于如图1所示的终端中为例进行说明,所述方法包括以下步骤:
[0061] 步骤210,获取药品说明书。
[0062] 在本实施例中,终端可以从预先设置好的一个或多个权威的医学网站中批量获取其所公布的药品说明书,用户也可以自行收集更新的药品说明书,将收集的药品说明书批量导入终端。其中,药品说明书包括化学药品说明书和中药药品说明书。
[0063] 步骤220,提取药品说明书中的原始字段名。
[0064] 药品说明书中包含有药品的名称、成分、用法、用量等多项内容,每项内容都对应有一个小标题,例如,药品名称、商品名、形状、成分、功能主治、用法用量等都是药品说明书中的小标题,将药品说明书中的每一个小标题称为字段名,直接从药品说明书中提取的字段名为原始字段名。
[0065] 药品说明书的原始字段名前后一般都有标题标识符,终端提取一对所述标识符对之间的字符作为原始字段名。例如,大多数说明书中原始字段名都位于“【】”中间,在进行原始字段名的提取时,终端首先识别说明书中的标题标识符,例如“【】”符号,然后将标题标识符中的字符提取出来作为原始字段名。在一个实施例中,在将原始字段名提取出来之后,终端将提取出的所述原始字段名进行标准化处理,终端将原始字段名中的无关字符去除,无关字符包括空格、顿号、单引号、分号、“”、“”、“.”、“ ”等字符。
[0066] 在一个实施例中,终端提取一对所述标识符对之间的字符作为原始字段名的步骤之前还包括:判断原始字段名是否为干扰字段名,具体的,终端判断标题标识符前的字符是否为干扰字符,若是,原始字段名为干扰字段名,将干扰字段名替换为修正值,干扰字符和对应的修正值见表1:
[0067] 表1:
[0068]干扰字段 修正值 干扰字段 修正值
见【*】 见[*] 究【*】 究[*]
照【*】 照[*] 量【*】 量[*]
阅【*】 阅[*] 痛【*】 痛[*]
在【*】 在[*] 折【*】 折[*]
和【*】 和[*] 度【*】 度[*]
及【*】 及[*] 症【*】 症[*]
考【*】 考[*] 加【*】 加[*]
按【*】 按[*] "【*】 "[*]
与【*】 与[*] “【*】 “[*]
间【*】 间[*] CI【*】 CI[*]
书【*】 书[*] 1【*】 1[*]
征【*】 征[*] (【*】 ([*]
读【*】 读[*] 、【*】 、[*]
点【*】 点[*]    
[0069] 当终端识别到原始字段名的标识符前有如表1所示的“见”、“阅”、“究”等干扰字符,则将原始字段名的标题标识符“【】”转化为普通字符“[]”。
[0070] 步骤230,获取字段名归类表。
[0071] 终端获取预先存储的字段名归类表。在实际处理过程中会存在不同药品说明书的同一内容取不同小标题的情况,即同一内容对应的原始字段名存在不同的表述,但是不同表述方式的原始字段名表达的语义相同。原始字段名的表述方式过多,会导致不同说明书的内容分散、不能进行统一和归类。
[0072] 字段名归类表中存储了不同表述方式的原始字段名所对应的统一标准化的标准字段名。例如,不同药品说明书中的药品禁忌项内容对应的原始字段名包括“禁忌”、“禁用”、“禁忌症”、“禁症”和“配伍禁忌”等多种表述,将这些表述统一为标准字段名“禁忌”。
[0073] 在一个实施例中,在制作字段名归类表时,参考药监局公布的《化学药品和治疗用生物制品说明书规范细则》、《预防用生物制品说明书规范细则》、《中药、天然药物处方药说明书格式》、《中药、天然药物处方药说明书内容书写要求》以及《中药、天然药物处方药说明书撰写指导原则》确定药品说明书各项内容的标准字段名。根据上述方法制定的标准字段名更加符合药监局等权威机构制定的规范,具有更好的通用性。
[0074] 步骤240,将原始字段名与字段名归类表中的标准字段名进行匹配。
[0075] 终端从药品说明书中提取原始字段名之后,将提取的原始字段名去重后与字段名归类表进行匹配,查找字段名归类表中是否存在与其对应的标准字段名,若存在,则匹配成功,若不存在,则匹配失败。
[0076] 在一个实施例中,终端采用精确匹配的方式将原始字段名与字段名归类表中的标准字段名进行匹配,具体包括以下步骤:
[0077] 查找所述字段名归类表中是否存在与所述原始字段名一致的归类字段名;
[0078] 当存在一致的所述归类字段名时,在所述字段名归类表中查找与所述归类字段名关联的标准字段名。
[0079] 在本实施例中,字段名归类表中存储了原始药品说明书数据积累阶段过程中提取出的所有字段名,其中,字段名分为归类字段名和标准字段名,字段名归类表中存储了归类字段名与标准字段名的对应归属关系,语义相同的归类字段名共同归属至同一标准字段名,即一个标准字段名及其下面归属的归类字段名所对应的说明书中的内容一致。表2列出了字段名归类表中的部分内容:
[0080] 表2:
[0081]
[0082] 表2列出了字段归类表中存储的药品说明书中部分内容对应的标准字段名和标准字段名下面归属的部分归类字段名。如表2中所列的“儿童用药”标准字段名,在不同的药品说明书中还存在如“儿童和青少年用药”、“儿童的用法”、“儿童患者用药”、“儿童的用法”等不同表述的原始字段名,将这些字段名都归属为“儿童用药”标准字段名的归类字段名。从表2还可以看出,每一个标准字段名也可以是其对应的归类字段名。
[0083] 在本实施例中,通过预先在归类字段名中存储归类字段名和标准字段名的对应归属关系,可以使提取出来的原始字段表通过首先匹配归类字段名实现与标准字段名的精确匹配,提高药品说明书原始字段名的标准化的准确性。
[0084] 在另一个实施例中,终端也可以采用模糊匹配的方式将原始字段名与标准字段名进行匹配。具体的,查找字段名归类表中是否存在与原始字段名一致的标准字段名,若存在则匹配成功,若不存在,则将原始字段名进行字符拆分,进一步的,采用语义分析法对原始字段名进行拆分,原始字段名拆分为具有独立语义的字符,将拆分后的具有独立语义的字符与标准字段名进行匹配,若存在包含拆分后字符的标准字段名,则匹配成功;若不存在,则匹配失败。
[0085] 步骤250,获取匹配的标准字段名作为与原始字段名对应的明细字段名。
[0086] 当字段名归类表中存在与原始字段名匹配的标准字段名时,终端从字段名归类表中获取匹配成功的标准字段名,作为与原始字段名对应的明细字段名。明细字段名为最终将药品说明书生成药品说明书明细中的字段名称。
[0087] 步骤260,根据预设规则提取药品说明书中与原始字段名对应的字段并将字段生成与明细字段名对应的药品说明书明细。
[0088] 预设规则为预先存储的药品说明书的字段内容的提取规则,根据预设规则将药品说明书中每个原始字段名所对应的字段提取出来,并将提取出来的字段放在相应的明细字段名对应的明细字段中,从而将每个药品说明书生成一条药品说明书明细。
[0089] 在一个实施例中,生成药品说明书明细之后,将明细字段名及药品说明书明细对应在显示界面进行展示。进一步的,当用户在展示界面上选择某一明细字段名或某几个明细字段名时,终端获取明细字段名选择指令,获取生成的每个药品说明书明细中用户所选择的明细字段名对应的字段并只将这些字段在显示界面进行展示。更进一步的,用户可以在显示界面上输入关键字进行搜索,终端获取关键字后,与明细字段名进行匹配,获取每个药品说明书明细中匹配成功的明细字段名对应的字段并将其在显示界面进行展示。
[0090] 在一个实施例中,预设规则为终端将识别到的原始字段名的标题标识符转化为普通字符,然后将从普通字符开始至下一个标题标识符前面的内容提取出来作为原始字段名对应的字段。例如,将原始字段名前后的“【】”符号变为[],然后将“[”至下一个“【”前的内容提取出来。在本实施例中,将说明书中出现的字段名进行统一标准化的同时也能够保留原始字段名信息,方便用户查看说明书记载的原始内容。
[0091] 上述实施方式中的药品说明书处理方法,通过对药品说明书中的原始字段名进行提取,将原始字段名与字段名归类表中的标准字段名进行匹配得到明细字段名,对药品说明书中原始字段名对应的说明书内容进行提取,可以将批量导入的药品说明书自动生成具有相同字段结构的药品说明书明细,实现了对格式、内容分散的药品说明书结构的标准化,使得不同药品说明书中的同类药品信息经处理生成的说明书明细字段均与同一标准明细字段名相对应,从而提高了药品说明书中药品信息的关联性,并且提高了药品说明书整理工作的工作效率,节省人力。并且用户通过查询调用明细中的字段可以便捷快速地对海量药品信息中感兴趣的内容进行查询、筛选和统计分析,从而提高工作效率。
[0092] 在一个实施例中,步骤240之后还包括以下步骤:
[0093] 当字段名归类表中不存在与原始字段名匹配的标准字段名时,输出新增字段名处理选项。
[0094] 通过新增字段名处理选项接收操作指令。
[0095] 根据操作指令将原始字段名添加至字段名归类表以对字段名归类表进行更新。
[0096] 在字段名归类表中未存储与原始字段名匹配的标准字段名时,提取的原始字段名为新增字段名,终端在显示界面输出新增字段名处理选项。新增字段名处理选项为至少包括新增标准字段名选项,用户通过新增标准字段名选项可以输入将未被标准化的原始字段名进行标准化的标准字段名,终端接收用户的操作指令,根据操作指令中的标准字段名信息在字段名归类表中添加与原始字段名匹配的标准字段名,以对字段名归类表进行实时更新。
[0097] 在一个实施例中,终端采用精确匹配的方式将原始字段名与字段名归类表中的标准字段名进行匹配,当在字段名归类表中查找不到与原始字段名一致的归类字段名时,终端在显示界面输出新增字段名处理选项,新增字段名处理选项包括新增归类字段名选项和新增标准字段名选项。当终端获取用户对新增归类字段名选项的操作指令时,根据操作指令中的标准字段名,将新增的原始字段名添加至字段名归类表中与操作指令中的标准字段名对应的归类字段名中。当终端获取用户对新增标准字段名选项的操作指令时,将操作指令中用户定义的新增标准字段名添加至字段名归类表中的标准字段名中,并将新增的原始字段名添加至新增标准字段名对应的归类字段名中。
[0098] 因为不断有新的药品经过研发、审批上市,药品说明书在不断更新,更新的药品说明书中可能存在未经标准化的原始字段名,在本实施例中,通过将新增的原始字段名进行标准化,并将新增的标准字段名添加至字段名归类表中,可以对字段名归类表进行实时扩充和更新,便于后续原始字段名的匹配。
[0099] 在一个实施例中,生成与明细字段名对应的药品说明书明细的步骤之后包括:
[0100] 根据字段名归类表对药品说明书明细中的字段进行归类字段名识别。
[0101] 在生成的药品说明书明细中,明细中的某些字段的内容可能会包含多个字段名对应的信息,但是因为在原始说明书记载的内容中字段名前后缺少标题标识符进行标识,在药品说明书明细生成的过程中无法对字段中包含的字段名进行识别,因此,需要对包含多个字段名的字段进一步再结构化。首先,根据字段名归类表中的归类字段名对说明书明细中字段的内容进行识别。
[0102] 判断字段中是否存在两个以上的归类字段名。
[0103] 根据识别结果判断识别出的归类字段名的数量是否大于两个。
[0104] 当字段中存在两个以上的归类字段名时,判断字段是否属于预设拆分字段。
[0105] 预设拆分字段是终端预先存储的需要进行拆分的字段名集合,当字段中存在两个以上的归类字段名时,获取字段所对应的明细字段名,并将明细字段名与字段名集合进行比较,当字段名集合中存在与明细字段名一致的字段名时,判定字段属于预设拆分字段,需对此字段进行进一步拆分。
[0106] 在一个实施例中,当字段名集合中不存在与明细字段名一致的字段名时,将字段的内容和其对应的明细字段名输出显示,由用户判断是否需要进行拆分,当终端获取用户的拆分指令时,需对此字段进行进一步拆分。否则,不对此字段进行处理。
[0107] 当字段属于预设拆分字段时,将归类字段名作为起止符对字段进行拆分,将两个归类字段名之间的内容归属至两个归类字段名中的前一个归类字段名或将字段中位于最后的归类字段名后面的内容归属至最后的归类字段名。
[0108] 在被拆分的字段所属明细中添加新增字段并将拆分后的内容对应填入新增字段。
[0109] 终端将从字段中识别出的归类字段名与字段名归类表进行匹配,获取匹配的标准字段名作为新增字段的明细字段名,将从识别出的归类字段名之后的字符至下一个识别出的归类字段名之前的字符提取出来作为新增字段内容并填入在新增明细字段名对应的新增字段中,若识别出的归类字段名为此字段中最后的归类字段名,则将此归类字段名之后的字符提取出来作为新增字段。
[0110] 在本实施例中,通过将生成的药品说明书明细中的字段进一步拆分进行再结构化,可以避免将几个字段的内容合并到一个字段中导致被合并的字段信息缺失,无法对被合并的字段信息进行查询的情况。
[0111] 在一个实施例中,在被拆分的字段所属明细中添加新增字段并将拆分后的内容对应填入新增字段的步骤包括:
[0112] 对拆分后的内容的字符数进行校验。
[0113] 不同的字段名对应提取的字段内容的字符数具有最低字符长度要求,因此,在对字段进行提取之前,需要对字段的字符数进行校验,判断其字符长度是否符合最低字符长度要求。终端获取预先存储的字段字符长度校验表,表3中示出了字段字符长度校验表中的部分内容:
[0114] 表3:
[0115]预设拆分字段名 识别字段名 对应标准字段名 字符长度校验值
药品名称 商品名称 商品名称 2
药品名称 商品名 商品名称 2
药品名称 英文或拉丁名 英文名称 3
药品名称 产品英文名称 英文名称 3
生产企业 生产企业 生产企业 5
生产企业 总部地址 生产地址 5
生产企业 注册地址 生产地址 5
生产企业 邮编 邮政编码 6
生产企业 联系电话 电话号码 7
生产企业 电话 电话号码 7
生产企业 传真 传真 7
[0116] 终端将拆分后的内容的字符数与表3中的字符长度校验值进行比较,当字符数小于校验值时,将拆分后的内容保留或删除,不进行提取。
[0117] 当拆分后的内容的字符数符合校验值时,获取归类字段名关联的标准字段名作为在被拆分的字段所属明细中新增字段的明细字段名,将拆分后的内容填入与明细字段名对应的字段中。
[0118] 如表3所示,“药品名称”和“生产企业”均为预设拆分字段名,以“药品名称”为例,其对应的明细字段中可能存在“商品名称”和“英文名称”等标准字段名对应的字段内容合并在一起的情况,当在明细字段中识别出“商品名称”、“商品名”、“英文或拉丁名”这些归类字段名时,先将这些归类字段名对应内容的字符长度进行比较,例如“英文或拉丁名”对应内容的字符长度为4,大于字符长度校验值3,字符数符合校验值,则获取其对应标准字段名“英文名称”作为新增明细字段名,并将其对应内容提取出来作为填入“英文名称”新增明细字段名对应的字段中。
[0119] 在被拆分的字段中经常会出现归属于同一标准字段名的多个归类字段名,如表3中所示的被拆分的字段“生产企业”中识别出的归类字段名“联系电话”和“电话”都归属于标准字段“电话号码”,这时无需提取出所有识别出的归类字段名对应的内容,提取出一个即可。若多个归类字段名对应的内容均符合校验值,则提取第一个出现的归类字段名对应的内容作为新增字段,若有部分归类字段名对应的内容符合校验值,则提取其中符合校验值的第一个出现的归类字段名对应的内容作为新增字段,若归类字段名对应的内容均不符合校验值,则将拆分后的内容保留或删除,不进行提取。
[0120] 在本实施例中,通过对字段进行拆分和进一步结构化之前对字符数进行校验,可以避免添加内容无效的字段,减少药品说明书明细中的冗余信息量。
[0121] 在一个实施例中,提取药品说明书中的原始字段名的步骤之前还包括:
[0122] 判断药品说明书是否为非标准格式。
[0123] 在本实施例中,药品说明书的标准格式为WORD格式,但是导入的药品说明书还可能为PDF格式或者各种图片格式,PDF格式或者各种图片格式的药品说明书为非标准格式,终端获取说明书后判断药品说明书是为标准格式。
[0124] 当药品说明书为非标准格式时,将非标准格式的药品说明书进行备份后转化为标准格式。
[0125] 具体的,可以通过格式转换工具对药品说明书进行格式转换,备份的非标准格式的药品说明书的文件名以药品说明书中的批准文号进行命名。
[0126] 生成与明细字段名对应的药品说明书明细的步骤之后还包括:将备份的非标准格式的药品说明书链接至对应的药品说明书明细。
[0127] 终端获取备份的非标准格式药品说明书的文件名,将文件名与生成的药品说明书明细中的“批准文号”字段名对应的字段进行匹配,当文件名与字段匹配成功时,将备份的非标准格式药品说明书连接至相应的药品说明书明细,并在显示界面的相应的药品说明书明细后面显示连接地址入口。用户点击连接地址入口可以打开非标准格式药品说明书,能够直观地与相应的药品说明书明细的字段内容进行比较。当用户发现非标准格式药品说明书中的内容与药品说明书明细的字段内容存在不一致的情况,可以对相应的药品说明书明细进行标注并提交审核人进行审核修正。
[0128] 在本实施例中,通过将非标准格式的药品说明书链接至对应的药品说明书明细可以方便用户对生成的药品说明书明细进行核对,减小药品说明书在格式转换过程中出现的错误。
[0129] 在一个实施例中,生成与明细字段名对应的药品说明书明细的步骤之后还包括:判断药品说明书明细中的批准文号字段是否符合药品批准文号的标准格式。
[0130] 药品的批准文号存在以下三种标准格式:
[0131] 格式1:一个字母(H/Z/S/F中的其中一个)+8位数字;
[0132] 格式2:两个字母(ZC/HC/SC中的其中一个)+8位数字;
[0133] 格式3:4个汉字(国药准字或国药试字)+一个字母(J/B/H/Z/S/F中的其中一个)+8位数字。
[0134] 判断批准文号字段是否符合药品批准文号的标准格式的具体方法为:
[0135] 判断批准文号字段中是否存在“国药准字”或“国药试字”四字中文字符,当存在“国药准字”或“国药试字”四字中文字符时,判断四字中文字符后是否存在“J/B/H/Z/S/F”字母,若有,则判断字母后是否为连续的8位数字,若是,则符合药品批准文号的标准格式;若中间过程中任一判断结果为否,则不符合药品批准文号的标准格式。
[0136] 当不存在“国药准字”或“国药试字”四字中文字符,则判断是否存在“Z/H/S”字母。当存在“Z/H/S”字母时,判断字母之后是否为“C”字母,若是,判断后面是否为连续的8位数字,若是,则符合药品批准文号的标准格式;若中间过程中任一判断结果为否,则不符合药品批准文号的标准格式。
[0137] 当不存在“Z/H/S”字母时,则判断是否存在“F”字母,若是,判断后面是否为连续的8位数字,若是,则符合药品批准文号的标准格式;若中间过程中任一判断结果为否,则不符合药品批准文号的标准格式。
[0138] 当批准文号字段符合标准格式时,获取药品基本信息库中药品批准文号与批准文号字段一致的药品基本信息,根据药品基本信息对药品说明书明细中的基本信息字段进行引证修改。
[0139] 药品基本信息库中的信息是由国家食品药品监督管理总局发布的权威信息,具有很高的置信度。而药品基本信息包括产品名称、英文名称、商品名、生产单位、规格等药品最基础的信息,基本信息字段包括“产品名称”、“英文名称”、“商品名”、“生产单位”、“规格”等字段。
[0140] 当批准文号字段不符合标准格式时,将批准文号字段所属的药品说明书明细进行删除。
[0141] 在本实施例中,通过批准文号将药品说明书明细与药品基本信息库进行关联,药品批准文号是同厂家同通用名药品的标识代码,也是药品最基础的信息,因此,若药品说明书中的批准文号不正确,则说该明药品说明书中的最基础信息的准确性都不能保证,该药品说明书中的信息内容及来源不可信,将不可信的药品说明书从生成的明细中删除可以起到初步的药品说明书筛选和质量把控作用。此外,根据药品基本信息对明细中的基本信息字段进行引证修改,可以对药品说明书明细的基本信息字段进行完善和补充,提高药品说明书明细中内容的准确性。
[0142] 在一个实施例中,根据药品基本信息对药品说明书明细中的基本信息字段进行引证修改的步骤包括:
[0143] 提取药品基本信息中与基本信息字段相对应的内容。
[0144] 将提取的内容与基本信息字段进行比对生成差异内容对比页面。
[0145] 终端将提取出的产品名称、英文名称、商品名、生产单位、规格等信息与药品说明书中的相应字段的内容进行一一比对,若出现内容不一致的情况,则将药品说明书明细中相应字段和药品基本信息中的差异内容提取出来生成差异内容对比页面供用户进行参考,差异内容对比页面上提供基本信息字段修改选项。
[0146] 通过差异内容对比页面接收修改指令。
[0147] 当用户对基本信息字段修改选项进行操作时,终端通过页面上的基本信息字段修改选项获取用户的修改指令。
[0148] 根据修改指令将与提取的内容有差异的基本信息字段替换为药品基本信息中对应的内容。
[0149] 在一个实施例中,生成差异内容对比页面后,终端获取药品审核人的审核进度信息,根据药品审核人的审核进度信息对药品审核人的工作量进行排序,并将差异内容的审核任务自动分配给目前工作量较少的一个或多个审核人。终端通过页面接收到审核人的修正指令后,将字段中的差异内容替换为药品基本信息中对应的内容。
[0150] 在一个实施例中,药品说明书明细中的基本信息字段和药品基本信息存在差异内容时,终端自动将字段中的差异内容替换为药品基本信息中对应的内容,并生成修改内容比对页面,在修改内容比对页面中展示替换后的基本信息字段,并对进行修改的内容进行标注,方便审核人进行审核。若审核人发现替换内容有错误,则可在修改内容比对页面对相应字段内容进行修改。
[0151] 在一个实施例中,如图3所示,提供了一种药品说明书处理装置,该装置包括:
[0152] 说明书获取模块310,用于获取药品说明书;
[0153] 原始字段名提取模块320,用于提取药品说明书中的原始字段名;
[0154] 归类表获取模块330,用于获取字段名归类表;
[0155] 字段名匹配模块340,用于将原始字段名与字段名归类表中的标准字段名进行匹配;
[0156] 字段名转化模块350,用于当字段名归类表中存在与原始字段名匹配的标准字段名时,获取匹配的标准字段名作为与原始字段名对应的明细字段名;
[0157] 明细生成模块360,用于根据预设规则提取药品说明书中与原始字段名对应的字段并将字段生成与明细字段名对应的药品说明书明细。
[0158] 在一个实施例中,如图4所示,装置还包括:
[0159] 处理选项输出模块342,用于当字段名归类表中不存在与原始字段名匹配的标准字段名时,输出新增字段名处理选项;
[0160] 操作指令接收模块344,用于通过新增字段名处理选项接收操作指令;
[0161] 归类表更新模块346,用于根据操作指令将原始字段名添加至字段名归类表以对字段名归类表进行更新。
[0162] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一非易失性计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)等。
[0163] 以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0164] 以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈