专利汇可以提供基于深度学习的疾病分类编码方法、系统、设备及介质专利检索,专利查询,专利分析的服务。并且本公开公开了基于 深度学习 的 疾病 分类编码方法、系统、设备及介质,构建ICD编码 知识库 ;获取待进行疾病分类编码的患者出院记录,从患者出院记录中获取疾病诊断名称,判断当前疾病诊断名称是否是ICD编码知识库中的ICD标准疾病诊断名称;如果否,则针对当前疾病诊断名称,从全部的ICD标准疾病诊断名称中提取最相似的t个ICD标准疾病诊断名称;进入分类步骤;分类步骤:从t个ICD标准疾病诊断名称中找到概率最大值对应的ICD标准疾病诊断名称输出;根据模型M输出的ICD标准疾病诊断名称,从ICD编码知识库中查找到对应的ICD标准疾病编码作为最终编码结果输出。,下面是基于深度学习的疾病分类编码方法、系统、设备及介质专利的具体信息内容。
1.基于深度学习的疾病分类编码方法,其特征是,包括:
构建ICD编码知识库,所述ICD编码知识库,包括:ICD标准疾病诊断名称和对应的ICD标准疾病编码;
获取待进行疾病分类编码的患者出院记录,从患者出院记录中获取疾病诊断名称,判断当前疾病诊断名称是否是ICD编码知识库中的ICD标准疾病诊断名称,如果是,则直接输出对应的ICD标准疾病编码;
如果否,则针对当前疾病诊断名称,从全部的ICD标准疾病诊断名称中提取最相似的t个ICD标准疾病诊断名称;进入分类步骤;
分类步骤:从t个ICD标准疾病诊断名称中找到概率最大值对应的ICD标准疾病诊断名称输出;
根据模型M输出的ICD标准疾病诊断名称,从ICD编码知识库中查找到对应的ICD标准疾病编码作为最终编码结果输出。
2.如权利要求1所述的方法,其特征是,所述分类步骤,具体包括:
从患者出院记录中获取入院情况和诊疗经过,将入院情况和诊疗经过进行合并处理,得到待分类病历u;
对t个ICD标准疾病诊断名称,获取每个ICD标准疾病诊断名称对应的标准病历;
将待分类病历u和t个标准病历均输入到预先训练的深度学习模型M中,模型M从t个ICD标准疾病诊断名称中找到概率最大值对应的ICD标准疾病诊断名称输出。
3.如权利要求1所述的方法,其特征是,从全部的ICD标准疾病诊断名称中提取最相似的t个ICD标准疾病诊断名称,是通过文本相似度算法来计算相似性的。
4.如权利要求1所述的方法,其特征是,对t个ICD标准疾病诊断名称,获取每个ICD标准疾病诊断名称对应的标准病历,其中,标准病历的生成步骤为:
对某个ICD标准疾病诊断名称,选择n份均包含当前ICD标准疾病诊断名称的出院记录;
对每一份出院记录,将其中的入院情况和诊疗经过提取出来,形成一份标准病历;
同理,n份出院记录,对应得到n份标准病历;即某个ICD标准疾病诊断名称,对应得到n份标准病历。
5.如权利要求1所述的方法,其特征是,深度学习模型M,包括:
输入层,用于输入待分类病历和t个标准病历;
向量化表示层,用于对输入的待分类病历和t个标准病历进行粗粒度向量化表示;
基于注意力机制的双向LSTM网络,用于对粗粒度向量化表示的结果进行特征提取,提取出每个病历的细粒度向量化表示结果;
池化层,用于基于每个病历的细粒度向量化表示结果,获取待分类病历的疾病诊断名称与每份标准病历对应的疾病诊断名称之间的互向量V;
线性回归层,用于利用线性回归算法将互相量V映射出待分类病历与每份标准病历之间的相似关系指数ρ;
Softmax层,用于通过softmax函数将相似关系指数ρ转化为概率p;
交叉熵层,用于将p与真实结果的0-1概率分布q的交叉熵作为模型M的损失函数;
输出层,用于输出概率p最大值对应的ICD标准疾病诊断名称。
6.如权利要求1所述的方法,其特征是,深度学习模型M的训练过程包括:
构建训练集;
将训练集输入到深度学习模型M中,对深度学习模型M进行训练,当达到设定的训练次数时,训练结束,输出训练好的深度学习模型M。
7.如权利要求6所述的方法,其特征是,构建训练集的具体步骤包括:
步骤(31):建立标准病历库:
步骤(311):对ICD编码知识库中的每个标准疾病诊断名称,选择n份包含该疾病诊断名称的有差异的出院记录;所述有差异的出院记录是指每两份出院记录之间利用Levenshtein距离计算出的相似度小于某个阈值,如0.5;
步骤(312):对步骤(311)中选择的每份出院记录,将其中的入院情况和诊疗经过提取出来,形成一份标准病历;
步骤(313):对ICD编码知识库中的每个标准疾病诊断名称,通过步骤(311)和步骤(312)得到标准病历以形成所有标准疾病诊断名称的标准病历库;
步骤(32):建立待训练病历库;
步骤(321):对ICD编码知识库中的每个标准疾病诊断名称,从标准病历库之外选择m份包含该疾病诊断名称的有差异的出院记录;所述有差异的出院记录,是指每两份记录之间利用Levenshtein距离计算出的相似度小于某个阈值,如0.5;
步骤(322):对步骤(321)中选择的每份出院记录,将其中的入院情况和诊疗经过提取出来,形成一份待训练病历;
步骤(323):对ICD编码知识库中的每个标准疾病诊断名称,通过步骤(321)和步骤(322)得到待训练病历以形成所有标准疾病诊断名称的待训练病历库;
步骤(33):建立训练集、验证集和检验集:
步骤(331):对待训练病历库中的每份待训练病历r,对医生在该待训练病历中写出的每个疾病诊断名称d,在对应的n份标准病历中随机找一份作为训练用正确病历;
再从待训练病历库中随机选择与疾病诊断名称d不同的t-1个诊断,对t-1个诊断中的每个诊断,在其对应的n份标准病历中随机找一份作为训练用对照病历,这t-1份训练用对照病历形成训练用对照病历集合;
将疾病诊断名称d所对应的待训练病历r、训练用正确病历和训练用对照病历集合,合并称为对待训练病历r中疾病诊断名称d的训练用病历集合,即待训练病历r中疾病诊断名称d的训练用病历集合共有1+t份病历;
步骤(332):对待训练病历库中的每份待训练病历以及它们的每个疾病诊断名称,通过步骤(331)得到的训练用病历集合以形成待训练病历库中所有病历中的疾病诊断名称的训练用病历库;
步骤(333):将训练用病历库中的设定比例的训练用病历集合分别划入训练集、验证集和测试集。
8.基于深度学习的疾病分类编码系统,其特征是,包括:
知识库构建模块,被配置为构建ICD编码知识库,所述ICD编码知识库,包括:ICD标准疾病诊断名称和对应的ICD标准疾病编码;
获取模块,被配置为获取待进行疾病分类编码的患者出院记录,从患者出院记录中获取疾病诊断名称,判断当前疾病诊断名称是否是ICD编码知识库中的ICD标准疾病诊断名称,如果是,则直接输出对应的ICD标准疾病编码;
如果否,则针对当前疾病诊断名称,从全部的ICD标准疾病诊断名称中提取最相似的t个ICD标准疾病诊断名称;进入分类模块;
分类模块,被配置为从t个ICD标准疾病诊断名称中找到概率最大值对应的ICD标准疾病诊断名称输出;
输出模块,被配置为根据模型M输出的ICD标准疾病诊断名称,从ICD编码知识库中查找到对应的ICD标准疾病编码作为最终编码结果输出。
9.一种电子设备,其特征是,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项方法所述的步骤。
10.一种计算机可读存储介质,其特征是,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项方法所述的步骤。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种人眼虹膜检测方法和装置 | 2020-05-08 | 507 |
一种基于机器学习的适用于径流资料缺乏流域的洪水预报方法 | 2020-05-11 | 982 |
一种航空器地面指挥信号训练系统及其操作方法 | 2020-05-12 | 993 |
一种基于知识图谱的组合错题推荐方法 | 2020-05-13 | 350 |
一种用于5G系统的智慧组网方法 | 2020-05-08 | 116 |
一种组合深度学习和概念图谱的电力故障事件抽取方法 | 2020-05-08 | 674 |
一种基于深度学习的多组学智能诊断系统 | 2020-05-11 | 923 |
一种基于非局部网络的视频压缩失真复原方法及系统 | 2020-05-13 | 529 |
一种交直流电网运行数据的属性标定方法及系统 | 2020-05-12 | 806 |
一种迭代的神经网络批量规范化系统 | 2020-05-12 | 705 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。