首页 / 专利库 / 资料储存系统 / 数据库 / 一种医疗数据脱敏、关联系统及方法

一种医疗数据脱敏、关联系统及方法

阅读:4发布:2020-05-08

专利汇可以提供一种医疗数据脱敏、关联系统及方法专利检索,专利查询,专利分析的服务。并且本 发明 属于数据信息技术领域,公开了一种医疗数据脱敏、关联系统及方法,该系统包括:原始医疗 数据库 ,用于存储医疗原始数据;识别码生成模 块 ,用于对医疗原始数据进行处理得到与该医疗原始数据相关联的识别码;脱敏处理模块,用于对医疗原始数据进行脱敏处理,得到医疗脱敏数据;数据写入模块,用于将识别码生成模块得到的识别码写入医疗脱敏数据中;识别码查询模块,用于对输入的识别码进行处理,并从原始医疗数据库中查询与该识别码相关联的医疗原始数据。本发明能够对医疗原始数据进行脱敏处理,避免了数据的 泄漏 ,保障了数据的安全;脱敏后的医疗数据中带有识别码,根据识别码可追溯到医疗原始数据,实现了脱敏数据关联的目的。,下面是一种医疗数据脱敏、关联系统及方法专利的具体信息内容。

1.一种医疗数据脱敏、关联系统,其特征在于,包括:
原始医疗数据库,用于存储医疗原始数据;
识别码生成模,用于对医疗原始数据进行处理得到与该医疗原始数据相关联的识别码;
脱敏处理模块,用于对医疗原始数据进行脱敏处理,得到医疗脱敏数据;
数据写入模块,用于将所述识别码生成模块得到的识别码写入所述医疗脱敏数据中;
识别码查询模块,用于对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。
2.根据权利要求1所述的医疗数据脱敏、关联系统,其特征在于,所述识别码生成模块和识别码查询模块均包括哈希算法单元,所述识别码生成模块的哈希算法单元通过哈希算法对医疗原始数据进行计算得到与该医疗原始数据相关联的识别码;所述识别码查询模块的哈希算法单元通过哈希算法对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。
3.根据权利要求1所述的医疗数据脱敏、关联系统,其特征在于,还包括识别码写入单元,所述识别码写入单元用于将所述识别码生成模块得到的识别码写入所述原始医疗数据库中。
4.根据权利要求3所述的医疗数据脱敏、关联系统,其特征在于,所述识别码生成模块包括预处理单元、加盐单元和运算单元,所述预处理单元用于对医疗原始数据进行预处理得到第一数据;所述加盐单元用于对所述第一数据进行加盐处理得到第二数据,所述运算单元用于对所述第二数据进行哈希运算得到识别码。
5.根据权利要求1所述的医疗数据脱敏、关联系统,其特征在于,所述数据写入模块将所述识别码生成模块得到的识别码写入所述医疗脱敏数据的元数据中。
6.一种医疗数据脱敏、关联方法,应用于权利要求1所述的医疗数据脱敏、关联系统,其特征在于,所述方法包括医疗数据脱敏和数据关联查询,其中,所述医疗数据脱敏包括:
识别码生成模块对原始医疗数据库中的医疗原始数据进行处理得到与该医疗原始数据相关联的识别码;
脱敏处理模块对医疗原始数据进行脱敏处理,得到医疗脱敏数据;
医疗数据写入模块将所述识别码写入所述医疗脱敏数据中;
所述医疗数据关联查询包括:
识别码查询模块对输入的识别码进行处理,并从数据库中查询与该识别码相关联的医疗原始数据。
7.根据权利要求6所述的医疗数据脱敏、关联方法,其特征在于,所述医疗数据脱敏还包括:识别码写入单元将识别码生成模块得到的识别码写入所述原始医疗数据库中。
8.根据权利要求7所述的医疗数据脱敏、关联方法,其特征在于,所述医疗数据关联查询还包括:识别码查询模块将输入的识别码与所述原始医疗数据库中的识别码进行匹配查询,得到与输入的识别码相关联的医疗原始数据。
9.根据权利要求7所述的医疗数据脱敏、关联方法,其特征在于,所述识别码生成模块对原始医疗数据库中的医疗原始数据进行处理得到与该医疗原始数据相关联的识别码包括以下步骤:预处理单元对医疗原始数据进行预处理得到第一数据,加盐单元对所述第一数据进行加盐处理得到第二数据,运算单元对所述第二数据进行哈希运算得到识别码。
10.根据权利要求6所述的医疗数据脱敏、关联方法,其特征在于,识别码生成模块和识别码查询模块均包括哈希算法单元,在所述医疗数据脱敏中,所述识别码生成模块的哈希算法单元通过哈希算法对医疗原始数据进行计算得到与该医疗原始数据相关联的识别码;
在所述数据关联查询中,所述识别码查询模块的哈希算法单元通过哈希算法对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。

说明书全文

一种医疗数据脱敏、关联系统及方法

技术领域

[0001] 本发明属于数据信息技术领域,具体涉及一种医疗数据脱敏、关联系统及方法。

背景技术

[0002] 随着网络的迅速发展,数据已经成为了我们一切信息应用的基石。基于科研和大数据分析等目的,数据一般需要授权给第三方使用,这些数据一方面为人们带来极大的便利,同时也带来了潜在的隐私泄漏险。
[0003] 在医疗健康领域,目前基本上都已经实现了以电子病历为基础的数字化医院时代。医院信息化已形成以电子病历为基础、以病人信息为中心的高度集成化的医院信息管理系统。电子病历是现代医疗机构开展高效、优质的临床诊疗、科研以及医疗管理工作所必需的重要临床信息资源,也是居民健康档案的主要信息来源。标准化电子病历及以其为核心的新一代医院信息系统建设是实现区域范围以居民个人为主线的临床信息共享和医疗机构互联互通、协同服务的前提基础,不仅能保证居民健康档案“数出有源、数出有据”,还能有助于落实、规范临床路径,实现医疗过程监管,提高医疗救治平与应急指挥能。一个标准的电子病历系统或者类似的医疗信息化系统,包括了非常多的用户信息,包括:(1)患者基本信息,如人口信息、社会经济信息、亲属信息、社会保障信息以及生物学信息等;(2)基本健康信息,如现病史、既往病史、免疫史、过敏史、月经史、家族史、残疾情况等;(3)卫生事件摘要,如患者历次医疗机构就诊所发生的服务活动;(4)费用记录,如患者产生的医疗费用;(5)急诊诊疗记录,如门急诊病历、门急诊处方、检查检验记录等;(6)住院记录,如病程记录、医嘱、处置记录、护理记录等;(7)健康体检记录,如健康监测、预防保健等常规健康体检记录。
[0004] 这些医疗数据一般由相关的机构采集后,以数据库等方式存入相关的数据中心,为用户日后的治疗、预防保健等提供强大的支撑,同时也为医院的科研、决策支持等提供数据的支持,这些数据一旦泄漏,将会对用户造成非常大的影响。

发明内容

[0005] 为了解决现有技术存在的上述问题,本发明目的在于提供一种医疗数据脱敏、关联系统及方法,可以对医疗数据进行脱敏处理从而避免数据的泄漏,还可以对脱敏的医疗数据进行关联从而找到医疗原始数据。
[0006] 本发明所采用的技术方案为:一种医疗数据脱敏、关联系统,包括:
[0007] 原始医疗数据库,用于存储医疗原始数据;
[0008] 识别码生成模,用于对医疗原始数据进行处理得到与该医疗原始数据相关联的识别码;
[0009] 脱敏处理模块,用于对医疗原始数据进行脱敏处理,得到医疗脱敏数据,医疗脱敏数据存储在脱敏医疗数据库中;
[0010] 数据写入模块,用于将所述识别码生成模块得到的识别码写入所述医疗脱敏数据中;
[0011] 识别码查询模块,用于对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。
[0012] 作为优选方式,还包括识别码写入单元,所述识别码写入单元用于将所述识别码生成模块得到的识别码写入所述原始医疗数据库中。
[0013] 作为优选方式,所述识别码生成模块和识别码查询模块均包括哈希算法单元,所述识别码生成模块的哈希算法单元通过哈希算法对医疗原始数据进行计算得到与该医疗原始数据相关联的识别码;所述识别码查询模块的哈希算法单元通过哈希算法对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。
[0014] 作为优选方式,所述识别码生成模块包括预处理单元、加盐单元和运算单元,所述预处理单元用于对医疗原始数据进行预处理得到第一数据;所述加盐单元用于对所述第一数据进行加盐处理得到第二数据,所述运算单元用于对所述第二数据进行哈希运算得到识别码。
[0015] 作为优选方式,所述数据写入模块将所述识别码生成模块得到的识别码写入所述医疗脱敏数据的元数据中。
[0016] 本发明所采用的另一技术方案为:一种医疗数据脱敏、关联方法,应用于上述的医疗数据脱敏、关联系统,所述方法包括医疗数据脱敏和数据关联查询,其中,所述医疗数据脱敏包括:
[0017] 识别码生成模块对原始医疗数据库中的医疗原始数据进行处理得到与该医疗原始数据相关联的识别码;
[0018] 脱敏处理模块对医疗原始数据进行脱敏处理,得到医疗脱敏数据;
[0019] 数据写入模块将所述识别码写入所述医疗脱敏数据中;
[0020] 所述数据关联查询包括:
[0021] 识别码查询模块对输入的识别码进行处理,并从原始医疗数据库中查询与该识别码相关联的医疗原始数据。
[0022] 作为优选方式,所述医疗数据脱敏还包括:识别码写入单元将识别码生成模块得到的识别码写入所述原始医疗数据库中。
[0023] 作为优选方式,所述数据关联查询还包括:所述识别码查询模块将输入的识别码与所述原始医疗数据库中的识别码进行匹配查询,得到与输入的识别码相关联的医疗原始数据。
[0024] 作为优选方式,所述识别码生成模块对原始医疗数据库中的医疗原始数据进行处理得到与该医疗原始数据相关联的识别码包括以下步骤:预处理单元对医疗原始数据进行预处理得到第一数据,加盐单元对所述第一数据进行加盐处理得到第二数据,运算单元对所述第二数据进行哈希运算得到识别码。
[0025] 作为优选方式,所述识别码生成模块和识别码查询模块均包括哈希算法单元,在所述医疗数据脱敏中,所述识别码生成模块的哈希算法单元通过哈希算法对医疗原始数据进行计算得到与该医疗原始数据相关联的识别码;在所述数据关联查询中,所述识别码查询模块的哈希算法单元通过哈希算法对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。
[0026] 本发明的有益效果为:
[0027] 本发明提供了一种医疗数据脱敏、关联系统及方法,通过识别码生成模块对医疗原始数据进行处理得到与该医疗原始数据相关联的识别码,脱敏处理模块对医疗原始数据进行脱敏处理得到脱敏数据,数据写入模块将识别码写入医疗脱敏数据中。医疗原始数据经过脱敏处理,避免了数据的泄漏,保障了数据的安全;脱敏后的医疗数据中带有识别码,从而保留了数据的关联性,根据识别码可追溯到医疗原始数据,实现了医疗脱敏数据关联的目的。附图说明
[0028] 图1是本发明的实施例1中医疗数据脱敏的流程图
[0029] 图2是本发明的实施例1中医疗数据关联查询的流程图;
[0030] 图3是本发明的实施例2中医疗数据脱敏的流程图;
[0031] 图4是本发明的实施例2中医疗数据关联查询的流程图。

具体实施方式

[0032] 实施例1
[0033] 本实施例提供了一种医疗数据脱敏、关联系统,包括:
[0034] 原始医疗数据库,用于存储医疗患者的医疗原始数据,如患者的电子病历、电子处方等。在原始医疗数据库中只需要输入患者的身份证号或者患者编号,即可在原始医疗数据库中查询到该患者的所有医疗信息。
[0035] 识别码生成模块,用于对医疗原始数据进行处理得到与该医疗原始数据相关联的识别码。识别码生成模块对医疗原始数据进行处理产生一固定长度的字符串,该字符串作为识别码在数据关联时使用,同一患者的不同数据通过识别码生成模块产生的识别码不同,不同患者的同一数据通过识别码生成模块产生的识别码也不同,即使外界获取到了识别码,也无法通过解码、编码等手段从识别码推导出医疗原始数据,也无法判断两条识别码是否属于同一患者。具体地,所述识别码生成模块设有哈希算法单元,该哈希算法单元通过哈希算法对医疗原始数据进行计算得到与该医疗原始数据相关联的识别码,如选用患者的身份证号或者患者编号通过哈希算法得到一个识别码。为保证数据不冲突,哈希算法单元的哈希算法可以选择SHA-256或要求更高的算法来计算哈希值从而得到识别码。识别码的长度应足够长,优选为64位,避免数据的冲突。
[0036] 脱敏处理模块,用于对医疗原始数据进行脱敏处理,得到医疗脱敏数据,医疗脱敏数据存储在脱敏医疗数据库中,脱敏医疗数据库可供外界使用。如患者的电子病历和电子处方像经过脱敏处理模块的脱敏处理后,无法判断电子病历和电子处方是否与患者之间存在关联。
[0037] 数据写入模块,用于将所述识别码生成模块得到的识别码写入所述脱敏数据中。对于文本类的数据,可以直接指定其某一特定字段用于存放识别码,而对于图像、音频等多媒体数据,可以通过技术手段将识别码存放在多媒体数据的元数据中,防止识别码在传输、存储过程中丢失。多媒体数据的元数据往往用于存储多媒体文件的作者、标题、所属机构乃至安全签名等信息,因此将识别码写入多媒体数据的元数据中以便于传输和读取。
[0038] 对于科研和大数据分析机构,从脱敏医疗数据库中获取数据,获取的数据都是脱敏后的医疗数据,这些数据之间没有任何相关性,既无法判断他们是否属于同一个人,也无法从某一数据追溯到特定的患者。
[0039] 识别码查询模块,用于对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。所述识别码查询模块均设有哈希算法单元,哈希算法单元通过哈希算法对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。
[0040] 在某些场合中,医院在保证医疗数据脱敏的同时,还需要将医疗脱敏数据与自身数据库中的医疗数据进行匹配,达到医疗脱敏数据关联的目的,便于查询到患者的所有数据。对于科研和大数据分析机构提供的脱敏后的医疗数据,识别码查询模块接收脱敏后的医疗数据并识别到脱敏数据的识别码,并将识别码通过哈希解码得到患者的身份证号或者患者编号,再通过患者的身份证号或者患者编号在原始医疗数据库中查询患者的所有医疗原始数据。
[0041] 优选地,医疗数据脱敏、关联系统还包括识别码写入单元,所述识别码写入单元用于将所述识别码生成模块得到的识别码写入所述原始医疗数据库中。在原始医疗数据库中建立一张表,这张表里面记载所有患者的信息,每个患者的信息包括患者的身份证号、患者编号、登记日期、以及各种医疗原始数据的识别码。在识别码查询模块识别到医疗脱敏数据的识别码后,通过该识别码可以在原始医疗数据库中直接查询患者的所有医疗原始数据,减少哈希算法单元的计算时间,提高工作效率。
[0042] 如图1和图2所示,本实施例还提供了一种医疗数据脱敏、关联方法,应用于上述的医疗数据脱敏、关联系统,所述方法包括数据脱敏和数据关联查询,其中,所述数据脱敏包括:
[0043] 识别码生成模块对原始医疗数据库中的医疗原始数据进行处理得到与该医疗原始数据相关联的识别码;
[0044] 脱敏处理模块对医疗原始数据进行脱敏处理,得到医疗脱敏数据;
[0045] 数据写入模块将所述识别码写入所述医疗脱敏数据中;
[0046] 识别码写入单元将识别码生成模块得到的识别码写入所述原始医疗数据库中。
[0047] 所述数据关联查询包括:
[0048] 识别码查询模块对输入的识别码进行处理,并从原始医疗数据库中查询与该识别码相关联的医疗原始数据。识别码查询模块的哈希算法单元可以通过哈希算法对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。由于识别码写入单元将识别码存储在原始医疗数据库中,识别码查询模块也可以直接在原始医疗数据库中对该识别码进行匹配查询,得到与该识别码相关联的医疗原始数据。
[0049] 实施例2
[0050] 本实施例提供了一种医疗数据脱敏、关联系统,包括:
[0051] 原始医疗数据库,用于存储医疗患者的医疗原始数据,如患者的电子病历、电子处方等。在原始医疗数据库中只需要输入患者的身份证号或者患者编号,即可在原始医疗数据库中查询到该患者的所有医疗信息。
[0052] 识别码生成模块,用于对医疗原始数据进行处理得到与该医疗原始数据相关联的识别码。识别码生成模块对医疗原始数据进行处理产生一固定长度的字符串,该字符串作为识别码在数据关联时使用,同一患者的不同数据通过识别码生成模块产生的识别码不同,不同患者的同一数据通过识别码生成模块产生的识别码也不同,即使外界获取到了识别码,也无法通过解码、编码等手段从识别码推导出医疗原始数据,也无法判断两条识别码是否属于同一患者。
[0053] 具体地,所述识别码生成模块包括预处理单元、加盐单元和运算单元,所述预处理单元用于对医疗原始数据进行预处理得到第一数据;所述加盐单元用于对所述第一数据进行加盐处理得到第二数据,所述运算单元用于对所述第二数据进行哈希运算得到识别码。对于患者的电子病历,预处理单元获取患者的身份证号、患者编号和登记日期,加盐单元对患者的身份证号、患者编号和登记日期加上一个电子病历盐值,再经过哈希运算得到识别码。对于患者的电子处方,预处理单元获取患者的身份证号、患者编号和登记日期,加盐单元对患者的身份证号、患者编号和登记日期加上一个电子处方盐值,再经过哈希运算得到识别码。识别码的长度应足够长,优选为64位,避免数据的冲突。
[0054] 脱敏处理模块,用于对医疗原始数据进行脱敏处理,得到医疗脱敏数据,医疗脱敏数据存储在脱敏医疗数据库中,脱敏医疗数据库可供外界使用。如患者的电子处方和电子病历经过脱敏处理模块的脱敏处理后,无法判电子处方和电子病历是否与患者之间存在关联。
[0055] 数据写入模块,用于将所述识别码生成模块得到的识别码写入所述医疗脱敏数据中。对于文本类的数据,可以直接指定其某一特定字段用于存放识别码,而对于图像、音频等多媒体数据,可以通过技术手段将识别码存放在多媒体数据的元数据中,防止识别码在传输、存储过程中丢失。多媒体数据的元数据往往用于存储多媒体文件的作者、标题、所属机构乃至安全签名等信息,因此将识别码写入多媒体数据的元数据中以便于传输和读取。
[0056] 对于科研和大数据分析机构,从脱敏医疗数据库中获取数据,获取的医疗数据都是脱敏后的数据,这些数据之间没有任何相关性,既无法判断他们是否属于同一个人,也无法从某一数据追溯到特定的患者。
[0057] 识别码写入单元,用于将所述识别码生成模块得到的识别码写入所述原始医疗数据库中。识别码写入原始医疗数据库中后,可以通过识别码在原始医疗数据库中查询患者的所有信息。在原始医疗数据库中建立一张表,这张表里面记载所有患者的信息,每个患者的信息包括患者的身份证号、患者编号、登记日期、以及各种医疗原始数据的识别码。
[0058] 识别码查询模块,用于对输入的识别码进行处理,并从所述原始医疗数据库中查询与该识别码相关联的医疗原始数据。
[0059] 在某些场合中,医院在保证医疗数据脱敏的同时,还需要将脱敏数据与自身原始医疗数据库中的数据进行匹配,达到脱敏数据关联的目的,便于查询到患者的所有数据。对于科研和大数据分析机构提供的脱敏后的数据,识别码查询模块接收脱敏后的数据并识别到脱敏数据的识别码,通过该识别码可以在原始医疗数据库中直接查询患者的所有原始数据,提高工作效率。
[0060] 如图3和图4所示,本实施例还提供了一种医疗数据脱敏、关联方法,应用于上述的医疗数据脱敏、关联系统,所述方法包括医疗数据脱敏和数据关联查询,其中,所述医疗数据脱敏包括:
[0061] 识别码生成模块对原始医疗数据库中的医疗原始数据进行处理得到与该医疗原始数据相关联的识别码,具体包括以下步骤:预处理单元对医疗原始数据进行预处理得到第一数据,加盐单元对所述第一数据进行加盐处理得到第二数据,运算单元对所述第二数据进行哈希运算得到识别码。
[0062] 医疗脱敏处理模块对医疗原始数据进行脱敏处理,得到医疗脱敏数据;
[0063] 数据写入模块将所述识别码写入所述医疗脱敏数据中;
[0064] 识别码写入单元将识别码生成模块得到的识别码写入所述原始医疗数据库中。
[0065] 所述数据关联查询包括:
[0066] 识别码查询模块对输入的识别码进行处理,并从原始医疗数据库中查询与该识别码相关联的医疗原始数据。所述识别码查询模块将输入的识别码与所述原始医疗数据库中的识别码进行匹配查询,得到与输入的识别码相关联的医疗原始数据。
[0067] 本发明通过识别码生成模块对原始数据进行处理得到与该医疗原始数据相关联的识别码,脱敏处理模块对医疗原始数据进行脱敏处理得到医疗脱敏数据,数据写入模块将识别码写入医疗脱敏数据中。医疗原始数据经过脱敏处理,避免了数据的泄漏,保障了数据的安全;脱敏后的数据中带有识别码,从而保留了数据的关联性,根据识别码可追溯到医疗原始数据,实现了医疗脱敏数据关联的目的。
[0068] 本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈