首页 / 专利库 / 企业组织 / 术语学家 / 一种中西医医疗大数据的数据质控方法及系统

一种中西医医疗大数据的数据质控方法及系统

阅读:99发布:2020-05-12

专利汇可以提供一种中西医医疗大数据的数据质控方法及系统专利检索,专利查询,专利分析的服务。并且本 发明 为一种中西医医疗 大数据 的数据质控方法及系统,其中的方法包括:由不同采集端收集医疗过程中患者的身体状况信息、医疗检测信息;对收集的数据进行质控处理: 质量 监控、错误提示、整合分类;将处理后的数据规范储存。本发明涉及医疗大数据方向,提高了医疗数据的质量与采集的效率,为数据的有效性与准确性提供了技术支持,为数据的后续应用提供了保障。,下面是一种中西医医疗大数据的数据质控方法及系统专利的具体信息内容。

1.一种中西医医疗大数据的数据质控系统,其特征在于包括:
采集端,
第一质控模
数据接口
后台控制系统,
术语库,
端存储系统,
第二质控模块,
其中:
采集端包括从移动采集端和手动采集端中选出的至少一种,移动采集端用于:
使用户进行注册和/或登录,
使用户录入个人信息,
使用户录入的基本疾病症状,
使用户录入个人疾病史、家族疾病史,
使用户录入生活习惯信息,
使用户录入医院诊断结果、血检结果,
使用户录入个人的中医四诊信息,
第一质控模块与采集端连接,第一质控模块包括:
无填充报错子模块,用于在重要的采集问题没有得到回答时及时报错和/或提示填写,延续性问题自动弹出子模块,用于在对当前问题的回答有追加问题时,自动弹出追加问题,
音频图片粗略质量判断子模块,用于在使用者上传音频和/或图片前实时粗略检测待上传的音频和/或图片是否符合标准,
文字联想自动推荐子模块,用于在文字填写问题中自动推荐可能的词,文字错误提示纠正子模块,用于在文字词组填写错误时自动提示纠正,后台控制系统用于衔接数据接口、术语库、云端存储系统、第二质控模块,进行信息交互管理,后台控制系统包括:
用户管理子模块,用于管理参与数据录入的用户信息,
数据管理子模块,用于管控数据的收发、新建和/或删除数据存储单元,同步管理子模块,其对应于客户端的升级管理模块,用于实现升级业务逻辑的判断,辅助质控子模块,用于与第二质控模块协同进行质控环节的操作,
术语库用于存储系统所用专业术语,与数据质控各个环节紧密联系,针对不同应用场景使用不同的术语库,用于为质控模块的功能提供数支持,
数据接口包括消息适配器、消息传输和管理模块、调度中心,用于实现移动采集端同服务器的统一通信功能,其中:
消息适配器用于进行消息模板管理,适配符合传输协议的命令,并实例化各类消息;
消息传输和管理模块用于管理、封装和传输消息;
调度中心用于实现消息的同步或者异步调用,云端存储系统用于托管或存储系统使用过程中产生的数据和术语库,第二质控模块包括:
采集项目的数据原子化子模块,用于对前端采集数据原子化至不能再细分,并在云端存储系统存储,
数据术语规范化子模块,用于规范原子化的数据的术语,使原子化的数据的术语全部取自国际或国内标准化术语库,
音频图片精准质量判断与反馈子模块,用于利用深度学习模型精确判断音频图片的质量,并在1秒内向使用者反馈音频图像是否合格的结果,
文字推荐及纠正匹配算法子模块,用于结合自然语言处理方法与云端存储术语库,反馈文字推荐结果,
数据术语层级命名规范化子模块,用于为有层级依赖关系的原子化的数据制定规范命名标准,
新建条目避免重复提示子模块,用于在新建数据条目时自动显示已有的类似数据名称,以避免重复命名与歧义。
2.根据权利要求1所述的中西医医疗大数据的数据质控系统,其特征在于:
移动采集端包括可下载的手机应用程序,
个人信息包括:年龄、性别、体重,
生活习惯信息包括饮食是否规律和是否吸烟。
3.根据权利要求1所述的中西医医疗大数据的数据质控系统,其特征在于:
移动采集端具有个性化用户备案、基本信息采集、中医信息采集、西医信息采集、生物分子信息采集等功能,云端存储系统包括第三方云端数据存储,并进一步包括:
自动推送部分,用于通过移动采集端向被采集用户自动推送消息,以进行随访调查,从而保证数据采集的时效性。
4.基于根据权利要求1所述的中西医医疗大数据的数据质控系统的中西医医疗大数据的数据质控方法,其特征在于包括:
利用采集端进行实现以下操作:
接收并处理用户的注册和/或登录信息,
接收并处理用户录入的个人信息,
接收并处理用户录入的基本疾病症状,
接收并处理用户录入的个人疾病史和/或家族疾病史,
接收并处理用户录入的生活习惯信息,
接收并处理用户录入的医院诊断结果和/或血检结果,
接收并处理用户录入的个人的中医四诊信息,
利用无填充报错子模块,在重要的采集问题没有得到回答时及时报错和/或提示填写,利用延续性问题自动弹出子模块,在对当前问题的回答有追加问题时,自动弹出追加问题,
利用音频图片粗略质量判断子模块,在用户上传音频和/或图片前实时粗略检测待上传的音频和/或图片是否符合标准,
利用文字联想自动推荐子模块,在文字填写问题中自动推荐可能的词,利用文字错误提示纠正子模块,在文字词组填写错误时自动提示纠正,利用用户管理子模块,管理参与数据录入的用户信息,
利用数据管理子模块,管控数据的收发、新建和/或删除数据存储单元,利用同步管理子模块,实现升级业务逻辑的判断,该同步管理子模块对应于客户端的升级管理模块,
利用辅助质控子模块,与第二质控模块协同进行质控环节的操作,
利用消息适配器,进行消息模板管理,适配符合传输协议的命令,并实例化各类消息,利用消息传输和管理模块,管理、封装和传输消息,
用调度中心实现消息的同步或者异步调用,
用术语库存储系统所用专业术语,与数据质控各个环节紧密联系,针对不同应用场景使用不同的术语库,为质控模块的功能提供数支持,
用云端存储系统托管或存储系统使用过程中产生的数据和术语库,
用采集项目的数据原子化子模块,对前端采集数据原子化至不能再细分,并在云端存储系统存储,
用数据术语规范化子模块,规范原子化的数据的术语,使原子化的数据的术语全部取自国际或国内标准化术语库,
用音频图片精准质量判断与反馈子模块,利用深度学习模型精确判断音频图片的质量,并向使用者反馈音频图像是否合格的结果,
文字推荐及纠正匹配算法子模块,用于结合自然语言处理方法与云端存储术语库,反馈文字推荐结果,
用数据术语层级命名规范化子模块,为有层级依赖关系的原子化的数据制定规范命名标准,
用新建条目避免重复提示子模块,在新建数据条目时自动显示已有的类似数据名称,以避免重复命名与歧义。
5.根据权利要求4所述的中西医医疗大数据的数据质控方法,其特征在于:
移动采集端包括可下载的手机应用程序,
个人信息包括:年龄、性别、体重,
生活习惯信息包括饮食是否规律和是否吸烟。
6.根据权利要求4所述的中西医医疗大数据的数据质控方法,其特征在于:
移动采集端具有个性化用户备案、基本信息采集、中医信息采集、西医(现代医学)信息采集、生物分子信息采集等功能,
云端存储系统包括第三方云端数据存储,
并进一步包括:
用于通过移动采集端向被采集用户自动推送消息,以进行随访调查,从而保证数据采集的时效性。
7.存储有计算机程序的存储介质,该计算机程序能使处理器执行根据权利要求4-6之一所述的方法。

说明书全文

一种中西医医疗大数据的数据质控方法及系统

技术领域

[0001] 本发明涉及一种中西医医疗大数据的数据质控方法及系统,属于医疗大数据领域。

背景技术

[0002] 随着“互联网+”的概念深入各个产业,大数据技术在医疗产业的应用正在急速普及,医疗大数据时代正在加速到来。这导致依托于移动端的医疗信息采集系统大量涌现,但由于专业平受限,采集的数据大都不符合医学规范标准,相较于专业医疗机构采集的信息质量较差,条目结构少,人口流动大,有数据丢失,没有完善的质量管理体系。而专业的医疗机构采集的信息目标人群较为固定,人工采集效率低,数据量体量小,后期管理模式落后,融合程度低,共享程度低。随着数据量的增大,数据的细化,数据库后台数据质量管理体系的重要性也逐渐增大。经验积累与实践对于医疗进步具有重要的作用,这其中从数据中发现的规律扮演了极其重要的色,无论是临床实践还是科学研究,数据都是重中之重。然而不同的数据来源,不同的录入规则,复杂的数据结构都使得医疗健康数据没有得到最充分的应用,这大大地阻碍了医疗事业的进步。
[0003] 因此在医疗大数据发展的大环境下,提高医疗大数据的有效性和准确性,亟待提出一种针对中西医医疗大数据的数据质控方法及系统。

发明内容

[0004] 根据本发明的一个方面,提供了一种中西医医疗大数据的数据质控系统,其特征在于包括:
[0005] 采集端,
[0006] 第一质控模
[0007] 数据接口
[0008] 后台控制系统,
[0009] 术语库,
[0010] 端存储系统,
[0011] 第二质控模块,
[0012] 其中:
[0013] 采集端包括从移动采集端和手动采集端中选出的至少一种,移动采集端用于:
[0014] 使用户进行注册和/或登录,
[0015] 使用户录入个人信息,
[0016] 使用户录入的基本疾病症状,
[0017] 使用户录入个人疾病史、家族疾病史,
[0018] 使用户录入生活习惯信息,
[0019] 使用户录入医院诊断结果、血检结果,
[0020] 使用户录入个人的中医四诊信息,
[0021] 第一质控模块与采集端连接,第一质控模块包括:
[0022] 无填充报错子模块,用于在重要的采集问题没有得到回答时及时报错和/或提示填写,
[0023] 延续性问题自动弹出子模块,用于在对当前问题的回答有追加问题时,自动弹出追加问题,
[0024] 音频图片粗略质量判断子模块,用于在使用者上传音频和/或图片前实时粗略检测待上传的音频和/或图片是否符合标准,
[0025] 文字联想自动推荐子模块,用于在文字填写问题中自动推荐可能的词,
[0026] 文字错误提示纠正子模块,用于在文字词组填写错误时自动提示纠正,
[0027] 后台控制系统用于衔接数据接口、术语库、云端存储系统、第二质控模块,进行信息交互管理,后台控制系统包括:
[0028] 用户管理子模块,用于管理参与数据录入的用户信息,
[0029] 数据管理子模块,用于管控数据的收发、新建和/或删除数据存储单元,
[0030] 同步管理子模块,其对应于客户端的升级管理模块,用于实现升级业务逻辑的判断,
[0031] 辅助质控子模块,用于与第二质控模块协同进行质控环节的操作,
[0032] 术语库用于存储系统所用专业术语,与数据质控各个环节紧密联系,针对不同应用场景使用不同的术语库,用于为质控模块的功能提供数支持,
[0033] 数据接口包括消息适配器、消息传输和管理模块、调度中心,用于实现移动采集端同服务器的统一通信功能,其中:
[0034] 消息适配器用于进行消息模板管理,适配符合传输协议的命令,并实例化各类消息;
[0035] 消息传输和管理模块用于管理、封装和传输消息;
[0036] 调度中心用于实现消息的同步或者异步调用,
[0037] 云端存储系统用于托管或存储系统使用过程中产生的数据和术语库,
[0038] 第二质控模块包括:
[0039] 采集项目的数据原子化子模块,用于对前端采集数据原子化至不能再细分,并在云端存储系统存储,
[0040] 数据术语规范化子模块,用于规范原子化的数据的术语,使原子化的数据的术语全部取自国际或国内标准化术语库,
[0041] 音频图片精准质量判断与反馈子模块,用于利用深度学习模型精确判断音频图片的质量,并在1秒内向使用者反馈音频图像是否合格的结果,
[0042] 文字推荐及纠正匹配算法子模块,用于结合自然语言处理方法与云端存储术语库,反馈文字推荐结果,
[0043] 数据术语层级命名规范化子模块,用于为有层级依赖关系的原子化的数据制定规范命名标准,
[0044] 新建条目避免重复提示子模块,用于在新建数据条目时自动显示已有的类似数据名称,以避免重复命名与歧义。
[0045] 根据本发明的另一个方面,提供了基于上述的中西医医疗大数据的数据质控系统的中西医医疗大数据的数据质控方法,其特征在于包括:
[0046] 利用采集端进行实现以下操作:
[0047] 接收并处理用户的注册和/或登录信息,
[0048] 接收并处理用户录入的个人信息,
[0049] 接收并处理用户录入的基本疾病症状,
[0050] 接收并处理用户录入的个人疾病史和/或家族疾病史,
[0051] 接收并处理用户录入的生活习惯信息,
[0052] 接收并处理用户录入的医院诊断结果和/或血检结果,
[0053] 接收并处理用户录入的个人的中医四诊信息,
[0054] 利用无填充报错子模块,在重要的采集问题没有得到回答时及时报错和/或提示填写,
[0055] 利用延续性问题自动弹出子模块,在对当前问题的回答有追加问题时,自动弹出追加问题,
[0056] 利用音频图片粗略质量判断子模块,在用户上传音频和/或图片前实时粗略检测待上传的音频和/或图片是否符合标准,
[0057] 利用文字联想自动推荐子模块,在文字填写问题中自动推荐可能的词,
[0058] 利用文字错误提示纠正子模块,在文字词组填写错误时自动提示纠正。附图说明
[0059] 图1为本发明一种中西医医疗大数据的数据质控方法及系统总体结构示意图。
[0060] 图2为本发明一种中西医医疗大数据的数据质控方法及系统功能模块示意图。
[0061] 图3为本发明一种中西医医疗大数据的数据质控方法及系统具体实施例示意图。
[0062] 图4为本发明一种中西医医疗大数据的数据质控方法及系统具体实施例采集端示意图。
[0063] 图5为根据本发明的一个实施例的数据接口的示意图。
[0064] 图6为根据本发明的一个实施例的后台控制系统的示意图。

具体实施方式

[0065] 针对现有国内医疗数据平台建设出现的诸多问题,本数据质控方法在数据采集、处理、存储等各方面提供了新的思路。其中涉及数据处理和存储的数据后台指标体系建设形成了诸多创新点。本发明的目的在于提供一种提高中西医医疗大数据有效性和准确性的数据质控方法及系统。
[0066] 为实现上述目的,本发明采用以下技术方案:一种中西医医疗大数据的数据质控方法及系统,所述方法包括:
[0067] 多种数据采集端的实时数据质量检测;
[0068] 基于深度学习模型的图片音频数据质量检测及反馈;
[0069] 基于自然语言处理的术语判断模型;
[0070] 数据存储时的原子化处理;
[0071] 数据命名的国际标准规范化处理;
[0072] 新建数据条目避免重复提示。
[0073] 多种数据采集端的实时数据质量检测包括移动采集端与手动采集端。
[0074] 移动采集端包括手机应用程序中对于个人基本信息的采集、对于疾病程度与病史的采集、对于疾病症状的信息采集、对于临床检测数据的采集、对于舌象图片的采集、对于基于外部扩展设备的脉象采集。
[0075] 手动采集端包括一种针对特定疾病的追踪调查问卷表格,其中内容与移动采集端相同,区别在于增加了唾液信息采集,且舌象采集模块采用专业的舌象仪以采集更加标准的舌象信息。
[0076] 多种数据采集端的实时数据质量检测中的移动端信息采集采用智能化模块。根据已填写问题信息的结果自动确定其他问题的重要性程度,以排列问题顺序,确定必填信息,并在依据当前结果需要进行补充询问的情况下自动弹出延续性问题,以避免问题不详细、逻辑性差。
[0077] 基于深度学习模型的图片音频数据质量检测及反馈,具体步骤如下:
[0078] 采用符合质量体系要求和不符合质量体系要求的图片音频作为训练数据
[0079] 确定图片音频质量体系深度模型;
[0080] 对用户上传的图片音频信息进行质量检测;
[0081] 对于不符合质量体系标准的信息给出改进意见。
[0082] 音频图片质量判定深度学习模型包括独立建立的音频图片数据库、训练方法、训练模型结果。能够在移动端实现毫秒级自动识别音频图片数据质量,。收集的音频主要为肠鸣音信息、图片为舌象图片信息。采集依照临床采集标准进行,通过人工智能的方法自动判断音频图片是否满足质量标准。
[0083] 基于自然语言处理的术语判断模型包括:自主建立的医疗术语数据库系统、自然语言处理框架、术语判断模型。其中医疗术语数据库系统采用国际标准,包含中医、西医(现代医学)两种术语数据。
[0084] 术语判断模型包括术语自动纠错模型、术语自动推荐模型:
[0085] 所述术语自动纠错模型,用于对移动端填写的文字数据信息自动纠错,以避免专业术语错误造成的数据质量问题。具体操作是,在用户使用文字录入信息时,系统自动检索其中医学术语关键词。区别于一般输入法输入时的智能错误提示,此操作不涉及语法问题,只提示具体医学术语错误,采用国际国内中西医多重数据库的组合术语库,实现针对医学术语的自动纠错功能。
[0086] 所述术语自动推荐模型,用于根据已有信息,对移动端欲填写的信息做出自动推荐,以达到数据信息规范化、提高信息录入效率的目的。该模型以术语库为主要训练数据,并纳入已收集的文字数据信息,为其中医疗术语频率排序,通过非监督机器学习方法,准确识别用户所处的文字录入环境,实现医学术语的精确推荐。
[0087] 数据存储时的原子化处理包括数据信息原子化规范、原子化数据逻辑关系的命名规则。
[0088] 所述数据信息原子化规范指,将前端采集信息在后端数据库存储阶段原子化拆分为不可再分数据的规范方法,其作用在于规范数据存储格式,避免数据重复与歧义,降低后期处理难度;
[0089] 所诉原子化数据逻辑关系的命名规则指,对于相互间有继承、因果关系的原子化数据作规范化命名,以提示其关系信息。
[0090] 数据命名的国际标准规范化处理指,后台命名原子化数据规范体系采用国际标准术语库体系,以避免数据歧义、重叠、重复、矛盾等问题,提高数据质量。
[0091] 新建数据条目避免重复提示为后台数据管理层面功能,创建新数据条目时自动显示可能与其发生重复、矛盾的数据条目信息作为参考。其目的在于使新创建的数据条目更加准确。
[0092] 上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明技术手段,可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征及优点能够更明显易懂,以下特举较佳实施例,详细说明如下。
[0093] 为了使本发明的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本发明做进一步说明。
[0094] 本发明的一个主要应用是健康管理。如图3所示,其中涉及不同的用户角色、应用平台、数据管理平台。本发明有效的实现了数据的有效质控,提高了录入与管理效率。
[0095] 如图1所示,是根据本发明的一个实施例的一种中西医医疗大数据的数据质控方法及系统的实施例工作流程图。该系统包括:
[0096] 采集端、数据接口、后台控制系统、质控模块、术语库、云端存储系统。其中数据接口、后台控制系统、术语库、云端存储系统为可选择部分。
[0097] 具体的,采集端包括移动采集端与手动采集端。根据本发明的一个实施例,如图4,移动采集端包括手机应用程序,可以由用户在各大应用商店自行下载。操作时,用户使用手机号注册登录,并可自行录入:个人年龄、性别、体重等基本信息;望诊图像、闻诊音频、问诊表型(嗳气、反酸、口干、口苦等)、切诊波形等中医信息;内镜图像、西医(现代医学)表型、临床诊断、血检指标、尿检指标等西医(现代医学)信息;基因检测信息、生物分子浓度、蛋白质表达信息等生物分子信息。
[0098] 移动采集端具备了个性化用户备案、基本信息采集、中医信息采集、西医(现代医学)信息采集、生物分子信息采集等功能。同时,为了数据采集具有时效性,系统根据被采集用户情况自动推送消息进行随访调查。
[0099] 根据本发明的一个实施例,与采集端连接的第一质控模块主要实现图2左侧的采集端的功能,包括:
[0100] 无填充报错子模块,用于在重要采集问题没有回答时及时报错并提示填写;
[0101] 延续性问题自动弹出子模块,用于在对当前问题的回答有追问时,自动弹出追问问题;
[0102] 音频图片粗略质量判断子模块,用于在上传前实时粗略检测采集的音频图片是否符合标准;
[0103] 文字联想自动推荐子模块,用于在文字填写问题中自动推荐可能的词;
[0104] 文字错误提示纠正子模块,在文字词组填写错误时自动提示纠正。
[0105] 在更具体的实施例中,上述各子模块的操作包括:
[0106] 无填充报错子模块,操作时,例如:在移动采集端采集数据时,被采集者在填写基本调查问题时,根据问题的重要性有不同的提示内容。被采集者未填写性别、年龄等重要信息,系统会自动提示被采集者进行填写,且如果不填写则无法进行其他操作。被采集者未填写病史、症状信息时,系统自动提示被采集者进行填写,但如果仍不进行填写可继续进行其它操作。此质控方法作用是避免被采集者的重要信息缺失,造成数据失效的结果。
[0107] 延续性问题自动弹出子模块,操作时,例如:在移动采集端采集数据时,被采集者在填写疾病信息、症状信息、生活习惯信息时,系统会根据填写数据自动弹出延续性问题。被采集者在“是否吸烟”问题后选择“是”后,系统会自动弹出“烟龄”与“日均吸烟量”等问题。如果,被采集者在“是否吸烟”问题后选择“否”后,后续问题即不会弹出。另外,被采集者在“大便是否正常”问题后选择“否”后,系统会自动弹出“大便形态”与“每周频率”等问题。
如果,被采集者在“大便是否正常”问题后选择“是”后,后续问题即不会弹出。此质控方法作用是提高数据采集效率。
[0108] 音频图片粗略质量判断子模块,操作时,例如:在移动采集端采集数据时,被采集者被要求拍摄或上传舌象图片,录制或上传音频文件时,移动采集端会进行自动的简单判断数据质量。如,出现图片较小、格式不符合标准、音频质量不佳等问题时,系统会自动提示被采集者重新上传或重新拍摄(录制)。
[0109] 文字联想自动推荐子模块,操作时,例如:在移动采集端采集数据时,被采集者填写备注描述时,涉及到术语库中的术语时,系统会根据当前语境自动推荐术语词汇作为备选项,以备被测试者选择。当被测试者填写胃炎的语境下,系统会自动提示“胃胀”、“胃酸”、“反酸”、“嗳气”等症状术语。此质控方法用于帮助被采集者更加准确的描述自身的状况。
[0110] 文字错误提示纠正子模块,操作时,例如:在移动采集端采集数据时,被采集者填写备注描述时,填写“经常打嗝”。此时,系统会自动将“打嗝”更改为“嗳气”,并令被采集者确认。
[0111] 手动采集端的采集方式为调查表与专业人员问询相结合,调查结束后由专用手动采集接口上传被采集数据。手动采集端针对具体采集方向针对性的设置了信息采集模板,由专业人员手动操作,主要采集基本信息、中医信息、西医(现代医学)信息、生物分子信息。为避免手动采集过程的采集工作人员的主观性,特在表型问答过程加入离散化程度参考标准,例如,根据世界卫生组织的划分,对于胃痛疼痛程度的等级分为五级,并为被采集者描述世界卫生组织对于疼痛等级划分的依据,让被采集者自行选择自己的疼痛程度。
[0112] 对于不同的采集方式,采用相同的后台数据管理系统。移动端数据通过录入模块、统一接收模块、后台数据转换系统、统一数据库存储模块的流程储存。手动采集端的信息通过手动录入的方式录入信息,再通过自动的数据转换系统,转换为固定格式的json文件,上传至云端数据库存储。
[0113] 可选择的,与采集端相连的为数据接口。如图5所示,数据接口的主要功能是:实现移动采集端同服务器的统一通信功能;包括:消息适配器、消息传输和管理模块、调度中心。具体地:
[0114] 消息适配器用于进行消息模板管理,适配符合传输协议的命令,并实例化各类消息;
[0115] 消息传输和管理模块用于管理、封装和传输消息;
[0116] 调度中心用于实现消息的同步或者异步调用。
[0117] 可选择的,后台控制系统与数据接口连接,如图6所示,其包括:
[0118] 用户管理子模块:用于管理参与数据录入的用户的信息,包括名称、密码等。
[0119] 数据管理子模块:用于管控数据的收发、新建或删除数据存储单元。
[0120] 同步管理子模块:对应于客户端的升级管理模块,用于实现升级业务逻辑的判断。
[0121] 辅助质控子模块:用于与后台连接的第二质控模块协同进行质控环节的操作。
[0122] 后台控制系统在系统中起到衔接数据接口、术语库、云端存储系统、第二质控模块,进行信息交互管理的作用。
[0123] 在更具体的实施例中:
[0124] 用户管理子模块:在操作时,例如:为了避免数据的错误匹配,为每一组数据进行编码管理。以系统分配的唯一身份ID号码+时间的方式对用户进行管理。此种方式能够以新颖的方式有效的避免同一ID不同时间上传数据所导致的数据覆盖,同时也能对同一ID不同时间或者同一时间不同ID的数据进行统一管理和操作。
[0125] 数据管理子模块:在操作时,例如:由于数据采集时的格式与存储格式有差异,需要对存储和导出过程进行管理。此子模块可以自动完成此存储、导出过程,无需人工转换。同时,在后台数据库进行更新过程中,对于数据存储单元的增删、修改、拆分、组合等操作,本子模块细化了规范流程。
[0126] 同步管理子模块:在操作时,例如:系统版本更迭时,对前端与数据库后端进行逻辑匹配判断,确定版本号是否一致,并进行升级提示。
[0127] 辅助质控子模块:在操作时,例如:协同前后端两部分质控模块的工作,进行数据、命令传输,以及闭环反馈。
[0128] 与后台控制系统连接的为第二质控模块,其包括:
[0129] 采集项目的数据原子化子模块:用于对前端采集数据原子化至不能再细分,并在后台存储。
[0130] 数据术语规范化子模块:用于规范原子化数据术语,使其全部取自国际或国内标准化术语库。
[0131] 音频图片精准质量判断与反馈子模块:用于利用深度学习模型精确判断音频图片的质量,并在1秒内向使用者反馈音频图像是否合格的结果。
[0132] 文字推荐及纠正匹配算法子模块:用于结合自然语言处理模块与医学用语术语库,反馈文字推荐结果。
[0133] 数据术语层级命名规范化子模块:用于为有层级依赖关系的原子化数据制定规范命名标准。
[0134] 新建条目避免重复提示子模块:用于在新建数据条目时自动显示已有的类似数据名称,以避免重复命名与歧义。
[0135] 在更具体的实施例中:
[0136] 采集项目的数据原子化子模块,在操作时,例如:在前端调查被采集者的现病史时,提出多个待选项:糖尿病、高血压、冠心病、胃炎、炎等等,被采集者可以自行在此多个待选项中自行选择任意个数的符合自身实际的选项。当数据上传后,将此问题拆分为“是否患有糖尿病”、“是否患有高血压”、“是否患有冠心病”、“是否患有胃炎”等等。这样做的好处是储存和调用时简单方便。在版本更迭时,原问题的待选项发生删除、更换、增添时,只需要在后端存储单元删除、更换、增添被涉及到的数据项,而不需要更改其他未被影响到的数据信息。
[0137] 数据术语规范化子模块,操作时,例如:后台命名原子化数据规范体系采用国际标准术语库体系,以避免数据歧义、重叠、重复、矛盾等问题,提高数据质量。目前指标体系中采取的可信accession来源主要包括UMLS(美国国立医学图书馆建立的统一医学用语系统,用于定义和规范基本信息和西医(现代医学)指标等)和ISTTM(国际卫生组织建立的西太平洋地区传统医学国际术语标准,用于规范中医指标等)。
[0138] 音频图片精准质量判断与反馈子模块,操作时,例如:对于任何一张上传的舌象图片,后台服务器接受前都会进行质量检测。通过实时更新的深度学习模型,系统判断图片是否拍摄了完整的舌象,对焦是否精准,图片像素是否达到要求,舌头是否完全伸出,光照是否均匀等等。满足质量要求后,舌象图片会被保存,不满足要求,前端会提示问题原因,并重新拍摄。
[0139] 文字推荐及纠正匹配算法子模块,操作时,例如:在后台数据库管理系统中,为前端文字推荐及纠错算法提供后台运算功能。使用医学术语库作为训练集,采用自然语言处理的处理理念,建立专用的机器学习模型,为前端功能提供支持。
[0140] 数据术语层级命名规范化子模块,操作时,例如:在后台数据库管理系统中,由于数据项的原子化致使所有数据项信息量较低。为了令数据使用者对于各个数据项的意义有更加清晰的认识,且在数据项关键词检索时简单清晰,特在命名时加入逻辑命名规范。在命名“胃胀痛”数据项时,在“胃胀痛”名称前加入“胃痛”数据项名称,即“胃痛-胃胀痛”。意为,胃胀痛是下属于胃痛的分支结构。在“疼痛程度”前加入“胃痛”或“头痛”等信息,代表“疼痛程度的上一级结构。”
[0141] 新建条目避免重复提示子模块,操作时,例如:在后台数据库管理系统中,管理员加入新的数据项’“胃痛不愈”时,系统会自动提示已有数据项“胃痛”、“胃胀痛”、“胃刺痛”的详细信息。为管理员提示,避免出现重复数据项、歧义、语义覆盖等问题。
[0142] 术语库与后台控制系统连接,用于存储系统所用专业术语。此术语库与数据质控各个环节紧密联系,针对不同应用场景,所使用的术语库不同。针对于上述应用案例,所用指标体系中采取的术语来源主要包括UMLS(美国国立医学图书馆建立的统一医学用语系统,用于定义和规范基本信息和西医(现代医学)指标等)和ISTTM(国际卫生组织建立的西太平洋地区传统医学国际术语标准,用于规范中医指标等)。
[0143] 可选地,云端存储系统与后台控制系统连接,用于托管存储系统使用过程中产生的数据、术语库,使用市场上常见的第三方云端数据存储服务。
[0144] 上述实施例仅代表本发明的一种技术应用案例,以便于清晰明了的解释本发明,但不代表本发明的实施方式仅限于此,任何依本发明所做的技术延伸或再创造,均受本发明的保护。本发明的保护范围以权利要求书为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈