首页 / 专利库 / 企业组织 / 术语学家 / 一种疾病编码转换的方法

一种疾病编码转换的方法

阅读:164发布:2020-05-16

专利汇可以提供一种疾病编码转换的方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种 疾病 编码转换的方法,包括以下步骤:S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库;S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;S03:根据所述标准字典库和所述测试集,形成术语向量;S04:提取需要进行转换的所述疾病编码的前N位编码值,获取初选疾病编码;S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。本发明的有益效果是:确保转换的疾病编码的准确度,实现各个版本疾病编码之间的转换。,下面是一种疾病编码转换的方法专利的具体信息内容。

1.一种疾病编码转换的方法,其特征在于,包括以下步骤:
S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库,并按照不同版本编码进行分类;
S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;
S03:根据所述标准字典库和所述测试集,形成术语向量,建立向量空间模型;
S04:提取需要进行转换的所述疾病编码的前N位编码值,与所述标准字典库中的各版本所述标准疾病编码进行比对,获取与所述前N位编码值一致的多个版本的初选疾病编码;
S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;
S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。
2.根据权利要求1所述一种疾病编码转换的方法,其特征在于:所述标准诊断描述包括标准手术与操作描述。
3.根据权利要求1所述一种疾病编码转换的方法,其特征在于:所述测试集包括疾病编码测试集和诊断文字测试集,其中,所述疾病编码测试集与需要进行转换的疾病编码相对应,所述诊断文字测试集与所述诊断描述相对应。
4.根据权利要求1所述一种疾病编码转换的方法,其特征在于:所述步骤S03具体包括以下步骤:
S03.1:根据所述标准字典库,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,生成标准字典库词包;
S03.2:根据所述测试集,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,按照预先配置的同义词库,对出现的同义词进行一致化处理,生成测试库词包;
S03.3:将所述标准字典库词包和所述测试库词包中所涉及到的不重复词汇制作为术语词包;
S03.4:根据所述术语词包形成术语向量,建立向量空间模型。
5.根据权利要求4所述一种疾病编码转换的方法,其特征在于:计算相似度值的公式为,
其中, 表示第i个标准字典术语的术语向量, 表示第j个测试集术语的术语向量。
6.根据权利要求1所述一种疾病编码转换的方法,其特征在于:所述临床规则包括部位规则、病因规则、术式规则。
7.根据权利要求1所述一种疾病编码转换的方法,其特征在于:所述步骤S04中,N为大于3或者等于3的自然数,且N位值包括所述疾病编码的小数点在内。
8.根据权利要求1所述一种疾病编码转换的方法,其特征在于:在确定转换的疾病编码之后,还包括,
将所述转换的疾病编码发送到医学专家端进行审核。

说明书全文

一种疾病编码转换的方法

技术领域

[0001] 本发明涉及医学、计算机应用技术领域,尤其涉及一种疾病编码转换的方法。

背景技术

[0002] 疾病和有关健康问题的国际统计分类(International Classification of diseases,ICD),是WHO(World Health Organization,世界卫生组织)制定的国际统一的疾病分类方法,它根据疾病的病因、病理、临床表现和解剖位置等特性,将疾病分别类,使其成为一个有序的组合,并用编码的方法来表示的系统,它是记录医学信息的载体,是开展医疗数据挖掘、疾病诊断分组以及绩效评价、医保DRG收付费的基础
[0003] 在国内医疗机构实践中,各地根据临床疾病的特点对编码进行了不同的拓展,同时,对于相同疾病,也存在版本上的描述性差异。例如,GB-2016 ICD-10版中,“A00.100霍乱,由于O1群霍乱弧菌,埃尔托生物型所致”,与BJ-V6.01版中的“A00.101埃尔托生物型霍乱”,两者在编码及术语描述上均存在差异;由此出现了多个版本不统一问题,严重影响着行业内的数据互联互通和医疗数据的挖掘应用。

发明内容

[0004] 本发明所要解决的技术问题是针对现有技术缺陷,提供一种疾病编码转换的方法。
[0005] 本发明解决上述技术问题的技术方案如下:一种疾病编码转换的方法,包括以下步骤:
[0006] S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库,并按照不同版本编码进行分类;
[0007] S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;
[0008] S03:根据所述标准字典库和所述测试集,形成术语向量,建立向量空间模型;
[0009] S04:提取需要进行转换的所述疾病编码的前N位编码值,与所述标准字典库中的各版本所述标准疾病编码进行比对,获取与所述前N位编码值一致的多个版本的初选疾病编码;
[0010] S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;
[0011] S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。
[0012] 本发明的有益效果是:通过建立标准字典库和测试集,形成术语向量,建立向量空间模型,然后通过计算相似度值,获取与相似度最大值对应的特定版本的初选疾病编码,初步确定转换的疾病编码;通过根据临床规则,校验映射关系,确保转换的疾病编码的准确度,实现各个版本疾病编码之间的转换。
[0013] 在上述技术方案的基础上,本发明还可以做如下改进。
[0014] 进一步:所述标准诊断描述包括标准手术与操作描述。
[0015] 进一步:所述测试集包括疾病编码测试集和诊断文字测试集,其中,所述疾病编码测试集与需要进行转换的疾病编码相对应,所述诊断文字测试集与所述诊断描述相对应。
[0016] 进一步:所述步骤S03具体包括以下步骤:
[0017] S03.1:根据所述标准字典库,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,生成标准字典库词包;
[0018] S03.2:根据所述测试集,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,按照预先配置的同义词库,对出现的同义词进行一致化处理,生成测试库词包;
[0019] S03.3:将所述标准字典库词包和所述测试库词包中所涉及到的不重复词汇制作为术语词包;
[0020] S03.4:根据所述术语词包形成术语向量,建立向量空间模型。
[0021] 进一步:计算相似度值的公式为,
[0022]
[0023] 其中, 表示第i个标准字典术语的术语向量, 表示第j个测试集术语的术语向量。
[0024] 上述进一步方案的有益效果是:利用余弦相似性等算法,实现了不同ICD(国际疾病分类)编码版本间自动转换,大大提升了编码转换的效率和准确性。
[0025] 进一步:所述临床规则包括部位规则、病因规则、术式规则。
[0026] 上述进一步方案的有益效果是:提高获取的特定版本的初选疾病编码与需要进行转换的疾病编码之间的映射关系校验的准确度。
[0027] 进一步:所述步骤S04中,N为大于3或者等于3的自然数,且N位值包括所述疾病编码的小数点在内。
[0028] 上述进一步方案的有益效果是:提高匹配度及匹配准确率。
[0029] 进一步:在确定转换的疾病编码之后,还包括,
[0030] 将所述转换的疾病编码发送到医学专家端进行审核。
[0031] 上述进一步方案的有益效果是:优化编码转换效果。附图说明
[0032] 图1为本发明一种疾病编码转换的方法的流程图

具体实施方式

[0033] 以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
[0034] 如图1所示,一种疾病编码转换的方法,其包括以下步骤:
[0035] S01:采集标准疾病编码和标准诊断描述相对应的各编码版本,建立标准字典库,并按照不同版本编码进行分类;
[0036] S02:根据需要进行转换的疾病编码和诊断描述,建立测试集;
[0037] S03:根据所述标准字典库和所述测试集,形成术语向量,建立向量空间模型;
[0038] S04:提取需要进行转换的所述疾病编码的前N位编码值,与所述标准字典库中的各版本所述标准疾病编码进行比对,获取与所述前N位编码值一致的多个版本的初选疾病编码;
[0039] S05:针对所述术语向量,计算相似度值,获取与相似度最大值对应的特定版本的所述初选疾病编码;
[0040] S06:根据临床规则,校验获取的特定版本的所述初选疾病编码与需要进行转换的所述疾病编码的映射关系,确定转换的疾病编码。
[0041] 所述临床规则包括部位规则、病因规则、术式规则。
[0042] 优选的,所述步骤S01中,所述标准诊断描述包括标准手术与操作描述,为医生对病人写的主要诊断文字描述。
[0043] 所述步骤S02中,所述测试集包括疾病编码测试集和诊断文字测试集,其中,所述疾病编码测试集与需要进行转换的疾病编码相对应,所述诊断文字测试集与所述诊断描述相对应。
[0044] 所述步骤S03具体包括以下步骤:
[0045] S03.1:根据所述标准字典库,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,生成标准字典库词包;
[0046] S03.2:根据所述测试集,按照医学规则进行预处理,并对预处理后的数据按照汉语词性规则进行分词操作,去除停用词和重复词,按照预先配置的同义词库,对出现的同义词进行一致化处理,生成测试库词包;
[0047] S03.3:将所述标准字典库词包和所述测试库词包中所涉及到的不重复词汇制作为术语词包;
[0048] 其中,所述术语词包中包含多条标准字典库术语和多条测试术语;
[0049] S03.4:根据所述术语词包形成术语向量,建立向量空间模型。
[0050] 所述步骤S04中,N为大于3或者等于3的自然数,且N位值包括所述疾病编码的小数点在内。
[0051] 其中,每一条所述标准字典库术语均对应有标准字典库术语向量,每一条所述测试术语均对应有测试术语向量。
[0052] 形成术语向量的方式为,采用one-hot-encoding(独热码)的方式为每一条所述标准字典库术语和每一条所述测试术语分别形成对应的标准字典库术语向量和测试术语向量,以便建立向量空间模型。
[0053] 优选的,所述步骤S05中,计算相似度值的公式为,
[0054]
[0055] 其中, 表示第i个标准字典术语的术语向量, 表示第j个测试集术语的术语向量。
[0056] 本发明在ICD编码识别转换中创新应用了自然语言识别(NLP)技术,利用one-hot-encoding构建文本向量空间模型,同时结合余弦相似性等算法,实现了不同编码版本间转换,提升了编码转换的效率,为医疗数据应用(如医学研究、疾病控费管理)奠定了基础。
[0057] 具体地是依据领域专家配置的转换规则及相似度算法构建转换器,当需要对新来的文字诊断进行编码转换时,使用这一转换器,即可输出待转换的术语的目标版本疾病编码,实现一键转码,简单方便,准确度高。
[0058] 优选的,在确定转换的疾病编码之后,还包括,
[0059] 将所述转换的疾病编码发送到医学专家端进行审核,优化编码转换效果。
[0060] 具体的,将所述转换的疾病编码发送到医学专家端进行审核,将其中有明显问题的数据,修正后,重复上述步骤S03至S06,进而不断优化编码转换的转换效果,提高工作的准确性。
[0061] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈