首页 / 专利库 / 专利权 / 第I章 / 国际申请 / 说明书 / 一种药品说明书的处理系统

一种药品说明书的处理系统

阅读:802发布:2020-05-13

专利汇可以提供一种药品说明书的处理系统专利检索,专利查询,专利分析的服务。并且本 发明 提供一种药品 说明书 的处理系统,用于通过药品说明书识别模型对输入的药品说明书进行识别并进行药品 数据库 的自动更新,其特征在于,包括:识别模型存储部存储有预先训练完成的药品说明书识别模型;识别关键词存储部存储有对应药品说明书的识别关键词;药品说明书获取部获取待处理的药品说明书的文本内容; 关键词识别 分段部根据识别关键词对文本内容进行识别,并根据识别关键词的所在 位置 对文本内容进行分段得到对应各个识别关键词的分段文本;药品关键词识别部将各个分段文本依次输入药品说明书识别模型进行识别从而获取对应各个识别关键词的药品关键词;关键词存储部,用于将药品关键词根据识别关键词存储至药品数据库中。,下面是一种药品说明书的处理系统专利的具体信息内容。

1.一种药品说明书的处理系统,用于通过药品说明书识别模型对输入的药品说明书进行识别并进行药品数据库的自动更新,其特征在于,包括:
识别模型存储部,存储有预先训练完成的药品说明书识别模型;
识别关键词存储部,存储有对应药品说明书的识别关键词;
药品说明书获取部,用于获取待处理的所述药品说明书的文本内容;
关键词识别分段部,用于根据所述识别关键词对所述文本内容进行识别,并根据所述识别关键词的所在位置对所述文本内容进行分段得到对应各个所述识别关键词的分段文本;
药品关键词识别部,用于将各个所述分段文本依次输入所述药品说明书识别模型进行识别从而获取对应各个所述识别关键词的药品关键词;
关键词存储部,用于将所述药品关键词根据所述识别关键词存储至预先设置的所述药品数据库中,
其中,所述药品说明书识别模型通过如下方法训练获得:
步骤S1,获取一定数量用于训练的药品说明书作为说明书样本;
步骤S2,对所述说明书样本的文本内容进行分词处理形成多个说明书分词;
步骤S3,获取各个所述说明书分词的分词词性;
步骤S4,对所述说明书分词中的停用词进行识别并去除所述停用词并将剩余的说明书分词作为待识别分词;
步骤S5,根据词袋模型统计所述待识别分词的词频并形成词频向量;
步骤S6,根据所述词频向量提取特征;
步骤S7,建立待训练模型并根据所述特征训练所述待训练模型直到训练完成,形成所述药品说明书识别模型。
2.根据权利要求1所述的药品说明书的处理系统,其特征在于,还包括:
画面存储部,存储有药品说明书输入画面;
输入显示部,用于显示所述药品说明书输入画面并让医护人员输入待处理的所述药品说明书的所述文本内容。
3.根据权利要求1所述的药品说明书的处理系统,其特征在于,还包括:
说明书扫描部,用于对纸质的药品说明书进行扫描从而获取相应的所述文本内容。
4.根据权利要求1所述的药品说明书的处理系统,其特征在于:
其中,所述药品数据库中具有多个药品数据表,
所述药品数据表包含多个分别对应所述识别关键词的数据项,
所述关键词存储部在存储所述药品关键词时,根据所述药品数据表的接口将所述药品关键词根据所述识别关键词存储至相应的所述数据项。
5.根据权利要求4所述的药品说明书的处理系统,其特征在于,还包括:
画面存储部,存储有药品数据表显示画面;
输入显示部,用于显示所述药品数据表显示画面并在该画面中显示所述药品数据库中的各个所述药品数据表让医护人员选择,并在医护人员选择一个药品数据表后显示该药品数据表的各个所述数据项以及所述药品关键词让所述医护人员查看。

说明书全文

一种药品说明书的处理系统

技术领域

[0001] 本发明属于医疗服务领域,具体涉及一种药品说明书的处理系统。

背景技术

[0002] 由于信息化时代的来临,越来越多的数据需要被电子化,从而便于系统对这些数据进行监控或是处理。在医疗服务领域,市面上存在上万种药品及其相应的说明书,若通过人工对这些说明书进行整理和录入,无疑是一种低效且费时耗的工作。
[0003] 因此现有的一些系统通过对药品说明书进行识别,从而进行药品说明书的自动录入,例如现有技术中公开的一种药品说明书处理方法及装置(201710233864.1):该药品说明书处理方法能够处理一些简单、规范的药品说明书。
[0004] 但是对于一些描述复杂的药品说明书(即通过自然语言描述的、不规则的药品说明书),上述处理方法就不能较好的进行识别。

发明内容

[0005] 为解决上述问题,提供一种能够识别复杂药品说明书、且能将识别信息针对性地录入各个数据表的药品说明书的处理系统,本发明采用了如下技术方案:
[0006] 本发明提供了一种药品说明书的处理系统,用于通过药品说明书识别模型对输入的药品说明书进行识别并进行药品数据库的自动更新,其特征在于,包括:识别模型存储部,存储有预先训练完成的药品说明书识别模型;识别关键词存储部,存储有对应药品说明书的识别关键词;药品说明书获取部,用于获取待处理的药品说明书的文本内容;关键词识别分段部,用于根据识别关键词对文本内容进行识别,并根据识别关键词的所在位置对文本内容进行分段得到对应各个识别关键词的分段文本;药品关键词识别部,用于将各个分段文本依次输入药品说明书识别模型进行识别从而获取对应各个识别关键词的药品关键词;关键词存储部,用于将药品关键词根据识别关键词存储至预先设置的药品数据库中,其中,药品说明书识别模型通过如下方法训练获得:步骤S1,获取一定数量用于训练的药品说明书作为说明书样本;步骤S2,对说明书样本的文本内容进行分词处理形成多个说明书分词;步骤S3,获取各个说明书分词的分词词性;步骤S4,对说明书分词中的停用词进行识别并去除停用词并将剩余的说明书分词作为待识别分词;步骤S5,根据词袋模型统计待识别分词的词频并形成词频向量;步骤S6,根据词频向量提取特征;步骤S7,建立待训练模型并根据特征训练待训练模型直到训练完成,形成药品说明书识别模型。
[0007] 本发明提供的药品说明书的处理系统,还可以具有这样的技术特征,还包括:画面存储部,存储有药品说明书输入画面;输入显示部,用于显示药品说明书输入画面并让医护人员输入待处理的药品说明书的文本内容。
[0008] 本发明提供的药品说明书的处理系统,还可以具有这样的技术特征,还包括:说明书扫描部,用于对纸质的药品说明书进行扫描从而获取相应的文本内容。
[0009] 本发明提供的药品说明书的处理系统,还可以具有这样的技术特征,其中,药品数据库中具有多个药品数据表,药品数据表包含多个分别对应识别关键词的数据项,关键词存储部在存储药品关键词时,根据药品数据表的接口将药品关键词根据识别关键词存储至相应的数据项。
[0010] 本发明提供的药品说明书的处理系统,还可以具有这样的技术特征,还包括:画面存储部,存储有药品数据表显示画面;输入显示部,用于显示药品数据表显示画面并在该画面中显示药品数据库中的各个药品数据表让医护人员选择,并在医护人员选择一个药品数据表后显示该药品数据表的各个数据项以及药品关键词让医护人员查看。
[0011] 发明作用与效果
[0012] 根据本发明的药品说明书的处理系统,由于具有药品说明书获取部对待检测的药品说明书的文字内容进行获取,并通过关键词识别分段部识别文字内容从而将文字内容根据各个识别关键词分段,进一步通过药品说明书识别模型识别各个分段中的药品关键词,最后由关键词存储部根据识别关键词将药品关键词存储至药品数据库中,因此实现了对药品说明书的自动识别以及自动存储。本发明能够对复杂的药品说明书进行识别,并从药品说明书的各个条目中读取关键的信息作为药品关键词,不仅降低了对药品说明书规则的要求、减少人工录入的工作,还简化了数据库中存储的药品信息,从而避免了数据库中存储大量的非必须信息,间接提高了数据的有效性。附图说明
[0013] 图1是本发明实施例中药品说明书处理系统的结构框图
[0014] 图2是本发明实施例中药品说明书识别模型训练过程的流程图;以及
[0015] 图3是本发明实施例中药品说明书识别存储过程的流程图。

具体实施方式

[0016] 为了使本发明实现的技术手段、创作特征、达成目的与功效易于明白了解,以下结合实施例及附图对本发明的药品说明书的处理系统作具体阐述。
[0017] <实施例>
[0018] 图1是本发明实施例中药品说明书处理系统的结构框图。
[0019] 如图1所示,药品说明书处理系统100包括:识别模型存储部1、识别关键词存储部2、说明书扫描部3、药品说明书获取部4、关键词识别分段部5、药品关键词识别部6、关键词存储部7、画面存储部8、输入显示部9、系统通信部10以及系统控制部11。
[0020] 其中,系统通信部10用于进行药品说明书处理系统100的各个构成部分之间以及药品说明书处理系统100与其他系统之间的数据通信;系统控制部11含有用于对药品说明书处理系统100的各个构成部分的工作进行控制的计算机程序
[0021] 识别模型存储部1用于存储有预先训练完成的药品说明书识别模型。
[0022] 本实施例中,药品说明书识别模型的初始模型结构采用常规的knn(k近邻)算法,通过训练使其适用于对药品说明书的识别,该训练过程如图2所示,具体见步骤S1至S7。
[0023] 步骤S1,获取一定数量用于训练的药品说明书作为说明书样本。
[0024] 本实施例中,药品说明书一般具有药品名称、成份、性状、适应症、规格、用法用量、不良反应、禁忌等条目以及相应的条目内容,该条目以及条目内容构成药品说明书的文本内容。
[0025] 步骤S2,对说明书样本的文本内容进行分词处理形成多个说明书分词,即,把说明书样本中各条目的条目内容分解成词或者词语。
[0026] 步骤S3,获取各个说明书分词的分词词性。
[0027] 本实施例的步骤S3中,分词词性由人工标注得到,该标注过程即给每个词或者词语标注上词类标签,如形容词、动词、名词等。这样做可以让文本在后面的处理中融入更多有用的语言信息。
[0028] 步骤S4,对说明书分词中的停用词进行识别并去除停用词并将剩余的说明书分词作为待识别分词。
[0029] 本实施例的步骤S4中,停用词的去除由人工进行,该停用词即说明书分词中的一些“啊、的、是的、你、我、……”以及标点符号等不具有实际含义的分词。
[0030] 本实施例中,步骤S3及S4通过如下方法进行:在步骤S2分解说明书分词后由输入显示部显示,并通过处理人员对各个说明书分词进行步骤S3的词性标注并进一步执行步骤S4去停用词。
[0031] 步骤S5,根据词袋模型统计待识别分词的词频并形成词频向量。
[0032] 本实施例的步骤S5中,词袋模型能够统计词汇从而生成一个包含所有词汇的清单,同时生成一个对应该清单且含有词汇出现次数的词频向量。
[0033] 步骤S6,根据词频向量提取特征;
[0034] 本实施例中,根据词频向量选取清单中词频的作为特征,例如,当词频向量中统计“成人”出现了100次、“一次1~~2g”出现了20次,而其他词汇的词频都低于20,则将“成人”以及“一次1~~2g”作为特征。最终对所有词频向量进行处理后,特征“一次1~~2g”的存在形式类似于[(“一”,99),("g",122)],其中,数值99、数值122为该字的词频数。
[0035] 步骤S7,建立待训练模型并根据特征训练待训练模型直到训练完成,形成药品说明书识别模型。
[0036] 本实施例的步骤S7中,Knn(k近邻)模型(药品说明书识别模型)在训练及使用时的具体步骤如下:
[0037] 1.计算测试数据(即输入的数据,为新的训练用说明书样本或是待检测的药品说明书)与各个样本数据之间的距离;
[0038] 2.按照距离的递增关系进行排序;
[0039] 3.选取距离最小的K个点;
[0040] 4.确定前K个点所在类别的出现频率
[0041] 5.返回前K个点中出现频率最高的类别作为测试数据的预测分类。
[0042] 具体地,以“头孢唑肟钠”的用法用量为例:
[0043] 【用法用量】1成人常用量:一次1~2g,每8~12小时1次;严重感染者的剂量可增至一次3~4g,每8小时1次。治疗非复杂性尿路感染时,一次0。5g,每12小时1次。2 6个月及6个月以上的婴儿和儿童常用量:按体重一次50mg/kg,每6~8小时1次。3肾功能损害者:肾功能损害的患者需根据其损害程度调整剂量。在给予0。5~1g的首次负荷剂量后,肾功能轻度损害的患者(内生肌酐清除率Clcr为50~79ml/分钟)常用剂量为一次0。
[0044] 假设已经有的样本数据如下(药品通用名需一致,即同为“头孢唑肟钠”的各种药品说明书):
[0045] 表1
[0046]
[0047] 假设现在来了一条测试数据,其说明书上用法用量的对应内容为:
[0048] 2至12岁儿童上呼吸道感染,每次7.5mg/kg体重,每天2次;皮肤或皮肤软组织感染,每次20mg/kg体重,每天1次。6个月婴儿至12岁儿童中炎,每次15mg/kg体重,每天2次;急性鼻窦炎,一般每次7.5mg/kg体重,每天2次;严重病例,每次15mg/kg体重,每天2次。疗程一般7~14天
[0049] 也即需要判定如下内容:
[0050] 表2
[0051]
[0052] 表2中第6,7,8,9,10条为需要判定的内容。
[0053] 以针对第6条为例:用7.5mg/kg和第一条的数据项相减,(这里单位不相容,无法计算)。然后依次和样本数据(2,3,4,5),做减法运算,由于这里只有第2条计算有意义,因此就判定第六条为“婴儿和儿童常用量”。
[0054] 如果有意义的样本数据有多条,比如有五条样本数据和测试数据的减法有意义,比如得出的结果分别如下:
[0055] a.和样本一相减得到-1
[0056] b.和样本二而相减得到3
[0057] c.和样本三而相减得到2
[0058] d.和样本四而相减得到-1.5
[0059] e.和样本五而相减得到4
[0060] 那么取上述5个结果的绝对值,则得(1,3,2,1.5,4)。排序后,取最小前一项(取前几项是根据实际情况自定义的,简单的就可以直接取第一项)。也就是测试数据最像第一条样本数据,那再根据表2中的数据查询第一项属于什么分类,那测试数据也属于该分类。
[0061] 在训练过程中,若识别出“测试药品说明书_用法用量1,每次7.5mg/kg,婴儿和儿童常用量”,那么这条数据将作为新的样本数据并入已有的样本数据中。在使用过程中,若识别出“测试药品说明书_用法用量1,每次7.5mg/kg,婴儿和儿童常用量”,那么这条数据就将作为对应识别关键词的药品关键词并用于进行后续的存储。
[0062] 识别关键词存储部2用于存储对应药品说明书的识别关键词。
[0063] 本实施例中,识别关键词为“药品名称”、“成份”、“用法用量”等关键词,即对应药品说明书中的各项条目。
[0064] 说明书扫描部3用于对纸质的药品说明书进行扫描从而获取相应的文本内容。
[0065] 本实施例中,说明书扫描部3为一个与药品说明书处理系统100相通信连接的扫描仪,医护人员可以通过该扫描仪将纸质的药品说明书扫描为文本形式的药品说明书。
[0066] 在其他实施例中,医护人员还可以通过其他方式输入药品说明书,例如,通过输入显示部手动输入药品说明书的文本内容、或是通过医疗机构中现有的药品信息数据库直接导入相应的药品说明书。
[0067] 药品说明书获取部4获取待处理的药品说明书的文本内容。
[0068] 本实施例中,药品说明书获取部4用于获取说明书扫描部3扫描获得的文本内容作为待处理的药品说明书的文本内容。在其他实施例中,药品说明书获取部4还能够获取医护人员手动输入或是通过药品信息数据库导入的文本内容作为待处理的药品说明书的文本内容。
[0069] 关键词识别分段部5用于根据识别关键词对文本内容进行识别并根据识别关键词的所在位置对文本内容进行分段得到对应各个识别关键词的分段文本。
[0070] 以药品说明书获取部4获取了“头孢唑肟钠”的药品说明书为例,关键词识别分段部5识别出该“头孢唑肟钠”中含有【用法用量】以及【不良反应】的识别关键词,进一步将该两者之间的文本内容分段为对应【用法用量】的分段文本,即:
[0071] 【用法用量】1成人常用量:一次1~2g,每8~12小时1次;严重感染者的剂量可增至一次3~4g,每8小时1次。治疗非复杂性尿路感染时,一次0.5g,每12小时1次。2 6个月及6个月以上的婴儿和儿童常用量:按体重一次50mg/kg,每6~8小时1次。3肾功能损害者:肾功能损害的患者需根据其损害程度调整剂量。在给予0。5~1g的首次负荷剂量后,肾功能轻度损害的患者(内生肌酐清除率Clcr为50~79ml/分钟)常用剂量为一次0。
[0072] 若识别到的识别关键词是药品说明书中的最后一个识别关键词,则将剩下的文本内容分段为对应该识别关键词的分段文本。
[0073] 药品关键词识别部6用于将各个分段文本依次输入药品说明书识别模型进行识别从而获取对应各个识别关键词的药品关键词。
[0074] 本实施例中,以上述“头孢唑肟钠”对应【用法用量】的分段内容为例,药品关键词识别部6通过药品说明书识别模型识别出的药品关键词为“成人”、“一次1~~2g”。
[0075] 关键词存储部7用于将药品关键词根据识别关键词存储至预先设置的药品数据库中。
[0076] 本实施例中,药品数据库中具有多个药品数据表,每个药品数据表都包含有多个分别对应识别关键词的数据项,例如,数据表1定义为“药品通用名,规格,性状,成份,有效期”,数据表2定义为“药品通用名,用法用量”,数据表3定义为“药品通用名,不良反应”,数据表4定义为“药品通用名,禁忌”等。
[0077] 若某个药品数据表为用量数据表,其具有数据项“药品通用名,用法用量”,此时,关键词识别分段部5识别出对应“药品名称”的药品关键词“头孢唑肟钠”、以及对应“用法用量”的药品关键词“成人”、“一次1~~2g”,则关键词存储部7将“头孢唑肟钠”存储至数据项“药品通用名”、将“成人”、“一次1~~2g”以分号分隔合并形成“成人;一次1~~2g”并存储至数据项“用法用量”。
[0078] 画面存储部8存储有操作选择画面、药品说明书输入画面以及药品数据表显示画面。
[0079] 操作选择画面用于在医护人员进入系统时显示从而让医护人员选择操作并进入相应的操作画面。
[0080] 药品说明书输入画面用户在医护人员选择输入操作时显示从而让医护人员进行药品说明书的输入操作。
[0081] 本实施例中,在进入药品说明书输入画面后,医护人员可以通过说明书扫描部3扫描多个药品说明书从而输入药品说明书的文本内容,进一步在医护人员确认输入后,药品说明书获取部4获取医护人员扫描的各个药品说明书的文本内容并开始相应的识别存储过程。
[0082] 在其他实施例中,药品说明书输入画面还可以显示有一个或多个的说明书输入框让医护人员手动输入药品说明书,或是显示有数据库操作部分让医护人员选择含有药品说明书的医护数据库并进行导入操作。类似地,在医护人员确认输入后,药品说明书获取部4获取医护人员输入或导入的各个药品说明书的文本内容并开始相应的识别存储过程。
[0083] 药品数据表显示画面用于在医护人员选择查看操作时显示并在该画面中显示药品数据库中的各个药品数据表让医护人员选择,并在医护人员选择一个药品数据表后显示该药品数据表的各个数据项以及药品关键词让医护人员查看。
[0084] 本实施例中,药品数据表显示画面初步显示的为各个药品数据表的表名称,在医护人员点选一个表名称后,进一步根据药品数据库中相应的药品数据表,显示该表的各个数据项以及表中存储的所有药品关键词,当药品关键词的项较多时,医护人员可以通过滚动画面查看更多的药品关键词。
[0085] 输入显示部9用于显示上述画面,从而让医护人员通过这些画面进行相应的人机交互
[0086] 图3是本发明实施例中药品说明书识别存储过程的流程图。
[0087] 如图3所示,药品说明书识别存储过程包括如下步骤:
[0088] 步骤T1,药品说明书获取部4获取待处理的药品说明书的文本内容,然后进入步骤T2,
[0089] 步骤T2,关键词识别分段部5根据识别关键词存储部2中存储的识别关键词对步骤T1中获取的文本内容进行识别,并根据识别关键词的所在位置对文本内容进行分段得到对应各个识别关键词的分段文本,然后进入步骤T3;
[0090] 步骤T3,药品关键词识别部6将各个分段文本依次输入识别模型存储部中存储的药品说明书识别模型进行识别从而获取对应各个识别关键词的药品关键词,然后进入步骤T4;
[0091] 步骤T4,关键词存储部7将药品关键词根据识别关键词存储至预先设置的药品数据库中,然后进入结束状态。
[0092] 本实施例中,每当医护人员通过输入显示部显示的药品数据表显示画面中确认输入时,药品说明书处理系统100就会执行上述步骤T1至T4从而完成药品说明书的自动识别及存储。若医护人员一次输入多份药品说明书时,药品说明书处理系统100也可以通过重复执行上述步骤T1至T4直至所有的药品说明书被识别及存储完成。
[0093] 实施例作用与效果
[0094] 根据本实施例提供的药品说明书的处理系统,由于具有药品说明书获取部对待检测的药品说明书的文字内容进行获取,并通过关键词识别分段部识别文字内容从而将文字内容根据各个识别关键词分段,进一步通过药品说明书识别模型识别各个分段中的药品关键词,最后由关键词存储部根据识别关键词将药品关键词存储至药品数据库中,因此实现了对药品说明书的自动识别以及自动存储。本发明能够对复杂的药品说明书进行识别,并从药品说明书的各个条目中读取关键的信息作为药品关键词,不仅降低了对药品说明书规则的要求、减少人工录入的工作,还简化了数据库中存储的药品信息,从而避免了数据库中存储大量的非必须信息,间接提高了数据的有效性。
[0095] 实施例中,由于药品数据库中存储有多个药品数据表,且各个药品数据表中具有对应不同识别关键词的数据项,因此,本发明能够根据药品说明书的各个条目分别存储至不同的药品数据表中,从而更有效地导入药品的各个信息,并且便于医护人员或是其他系统对药品数据库进行使用。
[0096] 上述实施例仅用于举例说明本发明的具体实施方式,而本发明不限于上述实施例的描述范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈