结构化医学数据的发送方法、存储方法及相关装置

申请号 CN202311507367.8 申请日 2023-11-14 公开(公告)号 CN117240916B 公开(公告)日 2024-02-13
申请人 阿里健康科技(中国)有限公司; 发明人 孙麒傲; 吴海滨; 王家辉; 周永来; 张正;
摘要 本 说明书 实施方式提供了一种结构化医学数据的发送方法、存储方法及相关装置。所述方法应用于边缘计算 节点 ,边缘计算节点部署于医疗科研机构的私网中,且部署有大语言模型;所述方法包括:从医疗科研机构的私网中的私网 电子 设备获取医学数据;其中,医学数据包括患者在医疗科研机构就医过程中产生的诊疗数据;将医学数据结合 指定 提示指令模板,输入大语言模型,以使大语言模型输出对应医学数据的结构化医学数据;将结构化医学数据发送给位于公网中的结构化医学数据平台。通过本说明书中实施方式,突破了医疗科研机构私网与公网的数据隔离,提高了对医学数据的统计分析价值的利用效率。
权利要求

1.一种结构化医学数据的发送方法,其特征在于,应用于边缘计算节点,所述边缘计算节点部署于医疗科研机构的私网中,所述边缘计算节点部署有大语言模型;其中,承载所述边缘计算节点的边缘节点设备部署于与公网数据隔离的医疗科研机构的私网中,所述边缘节点设备具有与位于公网中的结构化医学数据平台进行数据交互的权限;所述方法包括:
从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据;
将所述医学数据结合指定提示指令模板,输入所述大语言模型,以使所述大语言模型输出对应所述医学数据的结构化医学数据;
将所述结构化医学数据发送给位于公网中的结构化医学数据平台;其中,所述边缘计算节点去除所述结构化医学数据中的隐私数据,以使发送给所述结构化医学数据平台的结构化医学数据中不包含所述隐私数据;
所述方法还包括:
在接收到所述医疗科研机构的私网中的私网电子设备发出的结构化医学数据分析请求的情况下,向位于公网的结构化医学数据平台发送所述结构化医学数据分析请求,以用于所述结构化医学数据平台响应于所述结构化医学数据分析请求对所述结构化医学数据进行数据分析,得到分析结果数据;其中,所述结构化医学数据平台用于响应来自部署于不同医疗科研机构的私网的边缘计算节点的结构化医学数据分析请求;
将从所述结构化医学数据平台接收的分析结果数据,反馈给发出所述结构化医学数据分析请求的私网电子设备。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到所述医疗科研机构的私网中的私网电子设备发出的结构化医学数据分析请求的情况下,依照所述结构化医学数据分析请求指示的分析要求,对所述结构化医学数据进行医学数据分析,得到分析结果数据;
向发出所述结构化医学数据分析请求的私网电子设备反馈所述分析结果数据。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
从位于公网的结构化医学数据平台获取样本医学数据;
基于所述样本医学数据对部署的大语言模型进行训练。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
在接收到位于公网的结构化医学数据平台发出的大模型更新提示信息的情况下,向所述结构化医学数据平台发送大模型更新请求,以用于所述结构化医学数据平台响应于所述大模型更新请求,向所述边缘计算节点发送大模型更新数据,并记录与所述大模型更新数据对应的大模型版本数据;
在接收到所述大模型更新数据的情况下,加载所述大模型更新数据,以更新部署的大语言模型。
5.一种结构化医学数据的存储方法,其特征在于,应用于位于公网的结构化医学数据平台,所述方法包括:
接收位于医疗科研机构的私网中的边缘计算节点发送的结构化医学数据;其中,承载所述边缘计算节点的边缘节点设备部署于与公网数据隔离的医疗科研机构的私网中,所述边缘节点设备具有与位于公网中的结构化医学数据平台进行数据交互的权限;所述边缘计算节点部署有大语言模型,并且所述边缘计算节点从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据;所述大语言模型用于结合指定提示指令模板输出对应所述医学数据的结构化医学数据;所述边缘计算节点去除所述结构化医学数据中的隐私数据,以使发送给所述结构化医学数据平台的结构化医学数据中不包含所述隐私数据;
存储所述结构化医学数据;
其中,所述结构化医学数据平台能用于响应来自部署于不同医疗科研机构的私网的边缘计算节点的结构化医学数据分析请求;所述方法还包括:
在接收到位于医疗科研机构的私网中的边缘计算节点发出的结构化医学数据分析请求的情况下,响应于所述结构化医学数据分析请求对所述结构化医学数据进行数据分析,得到分析结果数据;其中,所述边缘计算节点在接收到相应医疗科研机构的私网中的私网电子设备发出的结构化医学数据分析请求后,向所述结构化医学数据平台发送所述结构化医学数据分析请求;
将所述分析结果数据发送给发出所述结构化医学数据分析请求的边缘计算节点。
6.根据权利要求5所述的方法,其特征在于,所述结构化医学数据包括多个医疗属性以及对应的医疗属性值;所述方法还包括:
接收部署于不同医疗科研机构的私网的边缘计算节点发送的结构化医学数据;其中,所述结构化医学数据通过以下步骤获取:所述边缘计算节点针对每个医疗属性分别设置相应的提示问题,形成指定提示指令模板,将所述医学数据结合指定提示指令模板输入所述大语言模型,接收所述大语言模型的输出;部署于不同医疗科研机构的私网的边缘计算节点发送的结构化医学数据具有相同的医疗属性。
7.一种结构化医学数据的发送装置,其特征在于,应用于边缘计算节点,所述边缘计算节点部署于医疗科研机构的私网中,所述边缘计算节点部署有大语言模型;其中,承载所述边缘计算节点的边缘节点设备部署于与公网数据隔离的医疗科研机构的私网中,所述边缘节点设备具有与位于公网中的结构化医学数据平台进行数据交互的权限;所述装置包括:
获取模,用于从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据;
结构化处理模块,用于将所述医学数据结合指定提示指令模板,输入所述大语言模型,以使所述大语言模型输出对应所述医学数据的结构化医学数据;
发送模块,用于将所述结构化医学数据发送至位于公网中的结构化医学数据平台;其中,所述边缘计算节点去除所述结构化医学数据中的隐私数据,以使发送给所述结构化医学数据平台的结构化医学数据中不包含所述隐私数据;在接收到所述医疗科研机构的私网中的私网电子设备发出的结构化医学数据分析请求的情况下,向位于公网的结构化医学数据平台发送所述结构化医学数据分析请求,以用于所述结构化医学数据平台响应于所述结构化医学数据分析请求对所述结构化医学数据进行数据分析,得到分析结果数据;其中,所述结构化医学数据平台用于响应来自部署于不同医疗科研机构的私网的边缘计算节点的结构化医学数据分析请求;将从所述结构化医学数据平台接收的分析结果数据,反馈给发出所述结构化医学数据分析请求的私网电子设备。
8.一种结构化医学数据的存储装置,其特征在于,应用于位于公网的结构化医学数据平台;所述装置包括:
接收模块,用于接收位于医疗科研机构的私网中的边缘计算节点发送的结构化医学数据;其中,承载所述边缘计算节点的边缘节点设备部署于与公网数据隔离的医疗科研机构的私网中,所述边缘节点设备具有与位于公网中的结构化医学数据平台进行数据交互的权限;所述边缘计算节点去除所述结构化医学数据中的隐私数据,以使发送给所述结构化医学数据平台的结构化医学数据中不包含所述隐私数据;所述边缘计算节点部署有大语言模型,并且所述边缘计算节点从所述医疗科研机构的私网中的私网电子设备获取医学数据;
其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据;所述大语言模型用于结合指定提示指令模板输出对应所述医学数据的结构化医学数据;
存储模块,用于存储所述结构化医学数据;
所述存储装置还用于在接收到位于医疗科研机构的私网中的边缘计算节点发出的结构化医学数据分析请求的情况下,响应于所述结构化医学数据分析请求对所述结构化医学数据进行数据分析,得到分析结果数据;其中,所述边缘计算节点在接收到所述医疗科研机构的私网中的私网电子设备发出的结构化医学数据分析请求的情况下,向位于公网的结构化医学数据平台发送所述结构化医学数据分析请求;所述结构化医学数据分析请求来自部署于不同医疗科研机构的私网的边缘计算节点;将所述分析结果数据发送给发出所述结构化医学数据分析请求的边缘计算节点。
9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法。
10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法。

说明书全文

结构化医学数据的发送方法、存储方法及相关装置

技术领域

[0001] 本说明书中实施方式关于人工智能技术领域,具体关于一种结构化医学数据的发送方法、存储方法及相关装置。

背景技术

[0002] 大数据分析可以简单理解为,通过搜集海量的数据,结合统计学原理,进行数据分析,以从数据变化趋势上得出客观世界中事务的发展变化情况。当然,也可以通过大数据分析得出客观世界中存在的问题,以便于发现潜在问题等。
[0003] 目前,大数据分析已经在很多领域都有较为广泛且深入的应用,推动了社会进步和经济发展。
[0004] 在医疗领域针对医疗数据进行大数据分析,会对疾病预防治疗等,都有着较为积极的作用。使得,医疗行业也开始重视针对医疗数据的分析。具体的,医疗大数据分析的基础是海量的医疗数据,通过对海量医疗数据进行统计和分析,实现医疗服务质量的提升、医疗管理能的改善和疾病险的预测。
[0005] 现实世界中,医疗科研机构通常在机构私网内部对患者诊疗过程中产生的医疗数据进行存储和维护,各个医疗科研机构形成了“数据孤岛”。每个医疗科研机构可以针对各自存储和维护的医疗数据进行大数据分析,但是,单一医疗科研机构的医疗数据量可能会偏少,使得每个医疗科研机构针对医疗数据进行大数据分析时存在较大的局限性,对于医疗工作的帮助也较小。发明内容
[0006] 有鉴于此,本说明书多个实施方式致力于提供一种结构化医学数据的发送方法、存储方法及相关装置,可以为医疗大数据分析构建一个较为全面的医学数据平台,为进行医疗大数据分析提供较为全面的医学数据。
[0007] 本说明书中一个实施方式提供一种结构化医学数据的发送方法,应用于边缘计算节点,所述边缘计算节点部署于医疗科研机构的私网中,所述边缘计算节点部署有大语言模型;所述方法包括:从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据;将所述医学数据结合指定提示指令模板,输入所述大语言模型,以使所述大语言模型输出对应所述医学数据的结构化医学数据;将所述结构化医学数据发送给位于公网中的结构化医学数据平台。
[0008] 本说明书中一个实施方式提供一种结构化医学数据的存储方法,应用于处于公网的结构化医学数据平台,所述方法包括:接收位于医疗科研机构的私网中的边缘计算节点发送的结构化医学数据;其中,所述边缘计算节点部署有大语言模型,并且所述边缘计算节点从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据;存储所述结构化医学数据。
[0009] 本说明书的一个实施方式提供一种结构化医学数据的发送装置,应用于边缘计算节点,所述边缘计算节点部署于医疗科研机构的私网中,所述边缘计算节点部署有大语言模型;所述装置包括:获取模,用于从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据;结构化处理模块,用于将所述医学数据结合指定提示指令模板,输入所述大语言模型,以使所述大语言模型输出对应所述医学数据的结构化医学数据;发送模块,用于将所述结构化医学数据发送至位于公网中的指定电子设备。
[0010] 本说明书的一个实施方式提供一种结构化医学数据的存储装置,应用于处于公网的结构化医学数据平台;所述装置包括:接收模块,用于接收位于医疗科研机构的私网中的边缘计算节点发送的结构化医学数据;其中,所述边缘计算节点部署有大语言模型,并且所述边缘计算节点从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据;存储模块,用于存储所述结构化医学数据。
[0011] 本说明书实施方式提出一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述实施方式所述的方法。
[0012] 本说明书实施方式提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序被处理器执行时实现上述实施方式所述的方法。
[0013] 在本说明书提供的多个实施方式中,部署于医疗科研机构私网中的边缘计算节点通过从位于医疗科研机构私网中的私网电子设备获取医学数据,并将获取到的医学数据结合指定提示指令模板输入部署于边缘计算节点的大语言模型,使大语言模型输出对应医学数据的结构化医学数据,再将结构化医学数据发送给位于公网中的结构化医学数据平台,从而突破了医疗科研机构私网与公网的数据隔离,使得存储于医疗科研机构私网内部的医学数据能够汇聚于位于公网的结构化医学数据平台,为医疗领域进行大数据分析提供了较为全面的数据基础,也提高了对医学数据的统计分析价值的利用效率。附图说明
[0014] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0015] 图1为本说明书的一个实施方式提供的结构化医学数据的发送系统的多端交互示意图。
[0016] 图2为本说明书的一个实施方式提供的结构化医学数据的发送系统的架构示意图。
[0017] 图3为本说明书的一个实施方式提供的结构化医学数据平台的平台架构示意图。
[0018] 图4为本说明书的一个实施方式提供的结构化医学数据的发送方法的流程示意图。
[0019] 图5为本说明书的一个实施方式提供的结构化医学数据的存储方法的流程示意图。
[0020] 图6为本说明书的一个实施方式提供的结构化医学数据平台的数据存储模型图。
[0021] 图7为本说明书的一个实施方式提供的结构化医学数据的发送装置的示意图。
[0022] 图8为本说明书的一个实施方式提供的结构化医学数据的存储装置的示意图。
[0023] 图9为本说明书的一个实施方式提供的计算机设备的示意图。

具体实施方式

[0024] 下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0025] 在本申请实施例的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个所述特征。在本申请实施例的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
[0026] 在相关技术中,由于医疗数据包含涉及患者隐私的敏感信息,为降低数据泄露风险,提升医疗数据安全程度,患者在医疗科研机构就医过程中产生的医疗数据通常存储于与公网存在数据隔离的医疗科研机构私网中。相应的,医疗科研机构通常仅利用机构私网中的运算资源对医疗数据进行维护及统计分析,统计分析结果可以在医疗科研机构内部使用。
[0027] 通常,医疗科研机构私网与公网的数据隔离主要通过物理隔离和虚拟隔离两种方式实现。具体的,两种数据隔离方式对应不同的网络架构。在私网与公网以物理隔离实现数据隔离的情况下,私网主要承载医疗科研机构的核心网络工作,如医院信息系统(Hospital Information System,HIS)、医学影像存储与通信系统(Picture Archiving and Communication System,PACS)等,公网主要承载办公、对外发布消息、互联网医学资料查询等非核心网络工作,对公网的稳定性保密性的要求低于私网,且向公网接入终端以及公网的数据流特点相对于私网也更为复杂。在私网与公网以虚拟隔离实现数据隔离的情况下,可以将由一个网络承载所有功能,即机构私网与公网在物理上联通,通过防火墙、三层设备访问控制列表、二层设备虚拟局域网(Virtual Local Area Network,VLAN)划分、多协议标签交换(Multi‑Protocol Label Switching,MPLS)、安全域划分以及虚拟专用网络(Virtual Private Network,VPN)等技术,实现机构私网与公网的逻辑隔离,使得两个网络各自的网络服务可以互不影响,或者,进行一些不涉及隐私数据或敏感数据的数据交互。
[0028] 随着大数据和人工智能技术的发展,医疗大数据分析在医疗领域的价值逐渐凸显。通过对海量医疗数据的统计分析,能够为疾病诊疗、医疗资源配置、疾病风险防控等多方面提供辅助。然而,进行大数据分析需要海量的医疗数据作为数据基础。使得,每个医疗科研机构都只能基于自身存储和维护的医疗数据进行分析,由于数据量相对有限,使得每个医疗科研机构进行数据分析得出的结论,都会存在一定的局限性,对于医疗行业的指导或推动相对有限。
[0029] 因此,构建一个较为全面的医疗数据平台作为医疗大数据分析的数据基础,成为了亟待解决的技术问题。
[0030] 从事医疗领域的研究人员在研发工作的过程中发现,科研机构私网中的医疗数据可以被划分为隐私数据和医学数据。并且,进行大数据分析主要是要利用医学数据。医疗数据中的隐私数据多数是指涉及患者身份的信息。比如,隐私数据可以包括患者的姓名、联系方式和医保缴纳信息等等。医学数据可以是指除去隐私数据之外的医疗数据。医学数据可以更多的表示诊疗信息。具体的,例如,医学数据可以包括:性别、年龄、疾病、症状、过敏史等等。使得,合理使用医学数据不会引起患者的隐私被侵犯,并可以基于大数据分析技术,对医学数据进行分析,以推动医疗事业发展。
[0031] 如此,可以通过在每个科研机构的机构私网中设置边缘计算节点,通过边缘计算节点手机科研机构产生的医学数据,并进行汇总,如此汇总后的海量医学数据,便可以作为大数据分析的数据基础。具体的,可以为边缘计算节点开放从医疗科研机构的机构私网中电子设备获取医学数据以及与位于公网的医学数据平台进行数据交互的权限。从而,可以通过边缘计算节点实现医学数据的流出和医学数据分析结果的流入。
[0032] 医学数据主要以长文本、图像等非结构化形式或XML、JSON等半结构化格式存储于医疗科研机构私网的私网电子设备中。由于不同医疗科研机构存储医学数据的数据格式、数据类型等不同,再者,不同医生出具的诊断信息也存在一定的个人语言风格,或者,每个医疗科研机构会有自己约定俗成的表达习惯等。为提升数据分析的效率和准确性,在接收到位于各个医疗科研机构私网的边缘计算节点传输的非结构化或半结构化医学数据后,医学数据平台需要消耗大量运算资源对这些非结构化或半结构化医学数据进行结构化处理,以将来自不同医疗科研机构私网的非结构化或半结构化的医学数据转化为相同结构的结构化医学数据。
[0033] 研发人员此时发现,处于医疗科研机构中作为边缘计算节点的电子设备,没有得到充分的利用,当医疗科研机构的数量很多时,作为边缘计算节点的大量电子设备会存在一定程度上算力浪费的情况。此时,研究人员进一步的采取了先利用边缘计算节点对医学数据进行结构化处理,再将结构化医学数据发送给结构化医学数据平台的方法,以提升运算资源的利用效率。
[0034] 因此,有必要提供一种结构化医学数据的发送方法,部署于医疗科研机构私网中的边缘计算节点通过从位于医疗科研机构私网中的私网电子设备获取医学数据,并将获取到的医学数据结合指定提示指令模板输入部署于边缘计算节点的大语言模型,使大语言模型输出对应医学数据的结构化医学数据,再将结构化医学数据发送给位于公网中的结构化医学数据平台,利用通用大语言模型的语义理解能力对非结构化或半结构化医学数据进行结构化处理,从而突破了医疗科研机构私网与公网的数据隔离,使得存储于医疗科研机构私网内部的医学数据能够汇聚于位于公网的结构化医学数据平台,为进一步进行大数据分析构建了数据基础。再者,提高了对医学数据的统计分析价值的利用效率,同时实现了向结构化医学数据平台发送的结构化医学数据具有较高的准确性,进而提升了后续基于结构化医学数据的医学数据分析的准确性。
[0035] 本说明书中提供一种结构化医学数据的发送系统的应用场景示例。
[0036] 请参阅图1。该结构化医学数据的发送系统可以包括私网电子设备、边缘计算节点、大语言模型以及结构化医学数据平台。私网电子设备可以用于存储医学数据,边缘计算节点可以用于执行结构化医学数据的发送方法,大语言模型可以用于输出对应医学数据的结构化医学数据。
[0037] 响应于边缘计算节点的医学数据获取请求,私网电子设备可以向边缘计算节点发送患者就医过程中产生的非结构化或半结构化的医学数据。例如,私网电子设备发送的非结构化医学数据可以为长文本数据,长文本原文如下:
[0038] 患者多于劳累及情绪激动后出现心前区疼痛,呈闷痛,伴有咽部紧缩感,无后背部放散,一般休息3‑5分钟左右可自行缓解,未在意。此后上述症状间断出现,性质同前,未予系统治疗。2018年3月份开始,患者自觉步行300米左右即出现上述症状,发作较前频繁,性质较前加重,一般休息5分钟左右可缓解。后为进一步治疗于2018年09月07日就诊于我院,完善冠脉CT检查提示"LAD闭塞病变,余血管轻中度狭窄",2018‑09‑14于我院行冠脉造影检查示:LM(左主干)正常,LCX(回旋支)大致正常,LAD(前降支)中段100%闭塞,RCA(右冠)中段30‑40%狭窄。PCI:OCT指导下于LAD(前降支)中段正向开通后植入XienceXpedition 3.0×
38mm支架1枚。术后复查OCT示:支架贴壁良好。术后规律服用“阿司匹林、氯吡格雷”等药物,现为进一步治疗入院。
[0039] 边缘计算节点在接收到私网电子设备发送的非结构化或半结构化的医学数据后,可以将非结构化或半结构化的医学数据与指定提示指令模板结合,形成结构化处理提示指令,并将结构化处理提示指令输入给部署在边缘计算节点的大语言模型。其中,指定提示指令模板可以包括提示词和填充模板。例如,指定提示指令模板可以为“请从对应素材原文中提取如下信息,并将相应信息填充至以下模板返回:本次住院是否急诊入院:{00};入院途径:{01};入院时间:{02};首诊科室:{03};首诊时间:{04};到院时间:{05};心内科总住院次数:{06}……。”
[0040] 大语言模型在接收到结构化处理提示指令后,可以结合其预先学习的语料与知识库,对非结构化或半结构化医学数据进行理解、分析和推理,生成与非结构化或半结构化医学数据对应的结构化医学数据,并向边缘计算节点输出该结构化医学数据。
[0041] 边缘计算节点在接收到该结构化医学数据后,可以将该结构化医学数据发送给结构化医学数据平台,使得结构化医学数据平台可以基于结构化医学数据进行医学大数据分析等。
[0042] 结构化医学数据平台可以接收来自部署于多个医疗科研机构私网的边缘计算节点的结构化医学数据并存储,并基于存储的结构化医学数据提供多种服务。具体的,例如,结构化医学数据平台可以根据医疗科研机构的数据分析请求,利用丰富的运算资源对存储的大量结构化医学数据进行大数据分析,并向医疗科研机构提供统计分析结果。同时,结构化医学数据平台也可以利用存储的大量结构化医学数据对通用大语言模型进行训练,即,将通用大语言模型训练为医疗大语言模型,并向医疗科研机构提供该医疗大语言模型。
[0043] 请参阅图2。本说明书实施方式提供一种结构化医学数据管理系统。所述结构化医学数据管理系统可以包括私网电子设备、边缘计算节点、大语言模型以及结构化医学数据平台。其中,私网电子设备和边缘计算节点部署于医疗科研机构私网内部,大语言模型部署于边缘计算节点,结构化医学数据平台位于公网。本说明书实施方式对私网电子设备、边缘计算节点的数量不作具体限制。私网电子设备和边缘计算节点之间可以通过有线或无线网络相互连接。边缘计算节点和结构化医学数据平台之间可以通过有线或无线网络相互连接。
[0044] 私网电子设备可以是具有数据存储功能、数据传输功能和显示功能的电子设备。具体的,例如,私网电子设备可以是台式电脑、平板电脑笔记本电脑、智能手机、数字助理、智能可穿戴设备、智能电视等。其中,智能可穿戴设备包括但不限于智能手环、智能手表、智能眼镜、智能头盔等。
[0045] 边缘计算节点可以是具有一定运算处理能力和数据传输能力的电子设备。具体的,边缘计算节点可以具有网络通信模块、处理器和存储器等。或者,边缘计算节点也可以是运行于所述电子设备中的计算机程序。边缘计算节点可以与医疗科研机构私网内部的实验室信息管理系统(Laboratory Information  System,LIS)、独立软件开发商(Independent Software Vendor,ISV)、HIS等多系统进行对接,边缘计算节点包括以下几个关键模块。
[0046] 数据加密模块:用于对敏感数据进行数据加密、数据脱敏。
[0047] 数据标准化模块:用于根据统一的结构化处理标准,针对疾病、诊断、患者表述等数据进行标准化和归一化处理。
[0048] 大模型加载、执行模块:用于加载和管理大模型。能够从位于公网的结构化医学数据平台或本地存储中下载和加载大模型,并提供灵活接口供其他模块调用。可以提供高效的计算资源和算法运行环境,以支持执行大模型的推理或训练任务过程中复杂的算法计算。
[0049] 数据传输和通信模块:用于与位于公网的结构化医学数据平台或其他边缘节点进行数据传输和通信。可以支持高速、可靠的数据传输,以及与其他节点的协同计算和通信。
[0050] 数据处理和预处理模块:用于对获取到的非结构化或半结构化医学数据进行处理和预处理。可以提供数据解析、清洗、归一化等功能,以提高结构化医学数据的质量和可用性。
[0051] 基础设施管理模块:用于管理边缘计算节点的基础设施。例如,可以管理承载边缘计算节点的边缘节点设备的网络、本地数据、本地程序版本,大模型版本等。
[0052] 大语言模型可以是具有深度学习能力和自然语言处理能力的机器学习模型。具体的,通用大语言模型可以具有语义理解、分析、推理、自然语言生成能力。
[0053] 结构化医学数据平台可以具有数据存储能力、数据处理能力和数据传输能力。具体的,结构化医学数据平台可以部署于位于公网的服务器上。其中,服务器可以是具有一定运算处理能力和数据传输能力的电子设备。服务器还可以为分布式服务器,可以为具有多个处理器、存储器、网络通信模块等协同运作的系统。或者,服务器还可以为若干服务器形成的服务器集群。或者,随着科学技术的发展,服务器还可以是能够实现说明书实施方式相应功能的新的技术手段。例如,可以是基于量子计算实现的新形态的“服务器”。
[0054] 请参阅图3。结构化医学数据平台可以具有平台设备层、平台中心层、平台应用层三层架构。其中,平台设备层可以为结构化医学数据平台提供底层设备支持。平台中心层是平台设备层和平台应用层之间的抽象层,可以为平台应用层服务的开发、部署和运行提供功能支持。平台应用层可以面向医疗科研机构提供多种应用服务。
[0055] 平台设备层可以包括用于存储结构化医学数据的医学数据存储设备、用于与边缘计算节点进行数据传输的医学数据传输设备以及用于对结构化医学数据进行统计分析的医学数据处理设备。
[0056] 平台中心层可以包括用于管理结构化医学数据的医学数据中心、用于训练和管理大语言模型的大模型管理中心以及用于对结构化医学数据进行运算和处理的运算中心。
[0057] 医学数据中心提供的功能包括结构化医学数据的采集、存储、清洗和预处理等。通过定义数据标准和数据仓库模型,将数据划分为病例、患者、检验、药品、医嘱等多个数据区域,针对来自不同医疗科研机构私网的结构化医学数据,进行统计标准处理。其中,针对不同类型数据可以采用不同的处理方式。具体的,例如,针对文本型数据,可以采用分词后处理;针对部分数值型数据,可以采用归一化处理。同时,医学数据中心需要具备数据安全保护能力,以控制结构化医学数据的合规性和机密性。
[0058] 大模型管理中心提供了一个集中化的管理界面,用于上传大模型、部署和监控大模型运行以及对大模型进行版本控制。具体的,大模型管理中心包含以下几个关键组件。
[0059] 医疗算法仓库:用于存储和管理大模型,包括基于模型底座仓库、病例模型仓库等。
[0060] 大模型部署:用于将训练好的大模型部署到实际应用环境中。可以提供一个简单的界面,使用户能够选择要部署的模型,并将其绑定到特定的数据源或应用程序上。
[0061] 大模型监控:用于监控已部署模型的性能和健康状况。可以提供实时的性能指标和错误日志,以便用户及时发现和解决问题。除此之外,还可以提供警报功能,以便在模型性能下降或出现异常时及时通知用户。
[0062] 大模型评估和版本控制:用于评估和比较不同模型的性能。可以提供用于评估模型的准确性、精度和效率的指标和图表。
[0063] 运算中心提供的功能包括结构化医学数据管理、标注、大模型训练和大模型评估和优化。具体的,运算中心包括以下几个关键模块:
[0064] 数据管理模块:用于对接医学数据中心以获取结构化医学数据,并将获取到的结构化医学数据拆分为训练数据集和预测数据集。同时,针对医药数据和患者数据提供特定的Embedding算法,针对疾病数据提供One‑hot,Muti‑Hot等处理模型。除此之外,数据管理模块也可以用于去除异常数据。例如,血压、血脂不合理数据,药品用法用量异常数据,患者年龄异常数据,病历异常数据等。
[0065] 标注模块:用于针对医疗领域专有数据进行标注。例如,患者类型标注,病例标注,疾病诊断标注等。
[0066] 训练模块:用于训练大模型。可以提供强大的计算能力和分布式计算的支持,以处理复杂的机器学习算法和海量的结构化医学数据。需要与数据管理模块紧密集成,以便从中获取训练数据集。需要集成Python开发环境,可以支持Conda,Viruralenv等多套虚拟环境管理,可以支持Pytorch,Tensflow,sklean,numpy等科学算法计算包。
[0067] 模型评估和优化模块:用于评估已部署大模型的准确性、精度和效率,并进行大模型的优化和改进。可以提供评估指标和工具,以帮助数据科学家和医疗专业人员改进大模型的性能和适应性。
[0068] 平台应用层可以提供包括医疗科研服务、大语言模型服务以及与医疗科研机构内部LIS、HIS对接服务等多种服务。
[0069] 请参阅图4。本说明书的一个实施方式提供一种结构化医学数据的发送方法。该结构化医学数据的发送方法可以应用于边缘计算节点,该边缘计算节点可以部署于医疗科研机构的私网中,该边缘计算节点可以部署有大语言模型。该结构化医学数据的发送方法可以包括以下步骤。
[0070] 步骤S110:从所述医疗科研机构的私网中的私网电子设备获取医学数据。
[0071] 出于保护患者个人隐私的要求,患者在医疗科研机构就医过程中产生的医疗数据通常仅在与公网数据隔离的医疗科研机构私网内部进行存储和维护。为突破医疗科研机构私网与公网之间的数据隔离,可以在医疗科研机构私网中部署具有公网访问权限的边缘计算节点,将边缘计算节点作为医疗科研机构私网内部数据流出的数据通道。
[0072] 在本实施方式中,私网电子设备可以具有数据存储能力、数据处理能力以及仅在医疗科研机构内部进行数据传输的能力。具体的,例如,私网电子设备可以包括部署于医疗科研机构私网中的检验设备、患者生命体征监控设备、处方和药品使用监控设备等。
[0073] 在一些实施方式中,承载所述边缘计算节点的边缘节点设备部署于医疗科研机构的私网中,所述边缘节点设备具有与位于公网中的结构化医学数据平台进行数据交互的权限。
[0074] 为发挥边缘计算节点的数据通道作用,突破医疗科研机构私网与公网的数据隔离,提升医学数据的统计分析价值的利用效率,可以由部署于医疗科研机构私网中的边缘节点设备承载边缘计算节点,并为边缘节点设备开放与公网进行数据交互的权限。
[0075] 在本实施方式中,边缘节点设备可以是客户端或服务器等实体电子设备,也可以是部署于医疗科研机构私网中的虚拟机
[0076] 在本实施方式中,可以为边缘节点设备开放指定端口实现边缘节点设备与位于公网中的结构化医学数据平台的数据交互。具体的,例如,在医疗科研机构私网内部仅有边缘节点设备具有访问指定端口的权限,医疗科研机构私网内的其他私网电子设备无法访问该指定端口。
[0077] 在本实施方式中,医学数据可以包括患者在所述医疗科研机构就医过程中产生的诊疗数据。具体的,例如,医学数据可以包括问诊阶段产生的记录患者病情和医生初步诊断的长文本数据,诊断阶段产生的检验图像数据等非结构化数据,以及诊断阶段产生的XML格式的检验报告数据,治疗阶段产生的记录患者病程变化的日志文件等半结构化数据。
[0078] 在本实施方式中,医学数据可以分散存储于医疗科研机构私网内的多个私网电子设备中。在一些实施方式中,医学数据也可以经数据聚集后集中存储于医疗科研机构私网内的一个私网电子设备中。
[0079] 在本实施方式中,从所述医疗科研机构的私网中的私网电子设备获取医学数据,可以通过直接接收私网电子设备发送的医学数据。具体的,例如,可以为存储有医学数据的私网电子设备设置定时发送指令,以使上述私网电子设备在指定时间自动将医学数据发送给承载边缘计算节点的边缘节点设备。
[0080] 在一些实施方式中,从所述医疗科研机构的私网中的私网电子设备获取医学数据,可以通过边缘计算节点向私网电子设备发送医学数据获取请求,私网电子设备响应于该医学数据获取请求向承载边缘计算节点的边缘节点设备发送医学数据。
[0081] 步骤S120:将所述医学数据结合指定提示指令模板,输入所述大语言模型,以使所述大语言模型输出对应所述医学数据的结构化医学数据。
[0082] 为了提升数据统计分析效率和公网运算资源利用效率,边缘计算节点可以对获取到的医学数据进行结构化处理,得到与医学数据对应的结构化医学数据,再将结构化医学数据传输至公网。然而,受边缘计算节点运算性能的限制,边缘计算节点对医学数据的结构化处理能力较低,导致结构化处理得到的结构化医学数据准确性较低,进而可能影响后续数据统计分析的准确性。为解决这一技术问题,可以通过将大语言模型部署至边缘计算节点本地,利用大语言模型的自然语言处理能力和推理能力,对以长文本格式存储的非结构化医学数据进行结构化处理,以提高边缘计算节点的结构化处理能力,进而提高结构化医学数据的准确性。
[0083] 在本实施方式中,指定提示指令模板可以包括用于为大语言模型提供明确指示的规则提示词和用于利用医学数据填充的填充模板。具体的,规则提示词可以用于指示大语言模型按照指定结构化处理规则从非结构化医学数据中抽取结构化信息,并指示大语言模型输出的格式和信息。填充模板可以用于表示医学数据的填充格式。例如,规则提示词可以为“请根据已知信息,回答下列问题。最终返回上述问题的回答的JSON格式。问题1:患者的入院前的症状是什么?问题2:患者手术后服用了哪些药物?”。填充模板可以为“已知信息:{0}”。另外,由于提示指令模板的设置对大语言模型的输出具有重要影响,指定提示指令模板可以为预设提示指令模板。
[0084] 在本实施方式中,将所述医学数据结合指定提示指令模板,输入所述大语言模型,可以通过将医学数据填充至指定提示指令模板的指定位置,形成信息完整的结构化处理提示指令,将结构化处理提示指令输入大语言模型。具体的,例如,在填充模板为“已知信息:{0}”的情况下,可以将医学数据填充至{0}。由于指定提示指令模板中包括规则提示词,结构化处理提示指令也可以包括针对大语言模型的规则提示词。
[0085] 在一些实施方式中,指定提示指令模板可以包括用于指示大语言模型反馈内容的数据格式的反馈要求提示词。可以将结构化处理提示指令输入大语言模型,以用于指示大语言模型反馈符合反馈要求提示词要求的数据格式的结果数据。具体的,例如,反馈要求提示词可以为“最终返回上述问题的回答的JSON格式”,此时,大语言模型会反馈JSON格式的结果数据,以使大语言模型输出的结构化医学数据符合后续的数据处理要求。
[0086] 在一些情况下,私网电子设备可能会直接提供医疗数据给边缘计算节点。在该些医疗数据中可能包括了患者的隐私数据和医学数据。边缘计算节点可以直接删除接收到的隐私数据。在一些实施方式中,为提升隐私数据的安全性,降低患者隐私泄露的风险的同时,也为了降低医学数据的数据冗余。边缘计算节点可以针对医学数据中的隐私数据进行不可逆加密,存储加密后的加密数据,并销毁接收到的隐私数据。如此,再次接收到同一个患者的医疗数据时,可以基于加密数据进行比较,确定是同一个患者的信息,不再重复生成结构化医学数据,或者不再重复保存结构化医学数据。
[0087] 步骤S130:将所述结构化医学数据发送给位于公网中的结构化医学数据平台。
[0088] 在接收到大语言模型输出的结构化医学数据后,位于医疗科研机构私网内部的边缘计算节点可以将结构化医学数据发送给位于公网的结构化医学数据平台,从而实现了医疗科研机构私网与公网数据隔离的突破,使得结构化医学数据经由边缘计算节点流向公网,提高了对医学数据统计分析价值的利用效率。
[0089] 在本实施方式中,将所述结构化医学数据发送给位于公网中的结构化医学数据平台,可以通过将结构化医学数据直接发送给结构化医学数据平台中用于与边缘计算节点进行数据互传的医学数据传输设备。
[0090] 在一些实施方式中,将所述结构化医学数据发送给位于公网中的结构化医学数据平台,也可以通过将结构化医学数据直接发送给位于公网的中台服务器,由中台服务器对来自多个医疗科研机构的医学数据进行数据归集,再将归集后的医学数据发送给结构化医学数据平台。
[0091] 在本说明书实施方式中,部署于医疗科研机构私网中的边缘计算节点通过从位于医疗科研机构私网中的私网电子设备获取医学数据,并将获取到的医学数据结合指定提示指令模板输入部署于边缘计算节点的大语言模型,使大语言模型输出对应医学数据的结构化医学数据,再将结构化医学数据发送给位于公网中的结构化医学数据平台,利用通用大语言模型的语义理解能力对非结构化或半结构化医学数据进行结构化处理,从而突破了医疗科研机构私网与公网的数据隔离,使得存储于医疗科研机构私网内部的医学数据能够汇聚于位于公网的结构化医学数据平台,为进行医学领域的大数据分析构建了数据基础。再者,提高了对医学数据的统计分析价值的利用效率,同时实现了向结构化医学数据平台发送的结构化医学数据具有较高的准确性,进而提升了后续基于结构化医学数据的医学数据分析的准确性。
[0092] 在一些实施方式中,所述结构化医学数据的发送方法还可以包括:在接收到所述医疗科研机构的私网中的私网电子设备发出的结构化医学数据分析请求的情况下,依照所述结构化医学数据分析请求指示的分析要求,对所述结构化医学数据进行医学数据分析,得到分析结果数据;向发出所述结构化医学数据分析请求的私网电子设备反馈所述分析结果数据。
[0093] 在一些情况下,医疗科研机构可能会存在一些针对自身的医学数据进行数据分析的需求,如此,可以针对边缘计算节点生成的结构化医学数据进行充分利用。由边缘计算节点基于生成的结构化医学数据直接响应医疗科研机构私网中的医学数据分析请求,反馈分析结果。如此,也实现减少了医疗科研机构的研发投入,医疗科研机构自身可以不再关注医学数据的结构化处理等工作,而专注于医学领域的研究。
[0094] 在本实施方式中,结构化医学数据分析请求可以用于指示边缘计算节点基于指定的结构化医学数据执行医学数据分析。具体的,结构化医学数据分析请求可以包括用于标识分析请求类型的类型标识数据,用于指示分析对象的对象指示数据和用于指示分析要求的要求指示数据。例如,在私网电子设备发出的结构化医学数据分析请求为针对某位患者进行疾病诊断分析的情况下,类型标识数据可以为“患者病情分析”,对象指示数据可以为与该患者对应的结构化医学数据的唯一标识,要求指示数据可以为“结合该患者的年龄、性别、临床表现等信息,分析该患者患糖尿病的概率”。在私网电子设备发出的结构化医学数据分析请求为针对某类传染病进行疾病分布分析的情况下,类型标识数据可以为“疾病分布分析”,对象指示数据可以为“诊断结果为支原体感染”,要求指示数据可以为“结合该传染病患者的年龄、性别、所在区域等信息,分析该传染病的流行趋势和易感人群”。
[0095] 在本实施方式中,依照所述结构化医学数据分析请求指示的分析要求,对所述结构化医学数据进行医学数据分析,得到分析结果数据,可以借助部署在边缘计算节点本地的预训练的机器学习模型实现。具体的,例如,可以在边缘计算节点本地部署针对不同类型的结构化医学数据分析请求的预训练机器学习模型,在边缘计算节点接收到结构化医学数据分析请求的情况下,可以先根据结构化医学数据分析请求中的类型标识数据确定对应的预训练机器学习模型,再根据结构化医学数据分析请求中对象指示数据确定对应的结构化医学数据,最后将对应的结构化医学数据和要求指示数据输入预训练机器学习模型,将预训练机器学习模型的输出作为分析结果数据。
[0096] 在一些实施方式中,依照所述结构化医学数据分析请求指示的分析要求,对所述结构化医学数据进行医学数据分析,得到分析结果数据,也可以借助部署在边缘计算节点本地的大语言模型实现。具体的,例如,在边缘计算节点接收到结构化医学数据分析请求的情况下,可以先根据结构化医学数据分析请求中对象指示数据确定对应的结构化医学数据,再将对应的结构化医学数据和结构化医学数据分析请求共同输入大语言模型,将大语言模型的输出作为分析结果数据。
[0097] 在本实施方式中,边缘计算节点可以通过医疗科研机构私网的网络通信或与私网电子设备间的有线通信连接,将分析结果数据反馈给发出结构化医学数据分析请求的私网电子设备。
[0098] 在一些实施方式中,所述结构化医学数据的发送方法还可以包括:在接收到所述医疗科研机构的私网中的私网电子设备发出的结构化医学数据分析请求的情况下,向位于公网的结构化医学数据平台发送所述结构化医学数据分析请求,以用于所述结构化医学数据平台响应于所述结构化医学数据分析请求对所述结构化医学数据进行数据分析,得到分析结果数据;将从所述结构化医学数据平台接收的分析结果数据,反馈给发出所述结构化医学数据分析请求的私网电子设备。
[0099] 在一些情况下,边缘计算节点在接收到结构化医学数据分析请求后,可以响应该结构化医学数据分析请求生成数据分析任务,并对执行该数据分析任务的运算复杂度和所需数据量进行预测。在边缘计算节点的运算性能和边缘计算节点能够获取的结构化医学数据的数据量难以支撑其执行该数据分析任务的情况下,边缘计算节点可以将该结构化医学数据分析请求转发给位于公网的结构化医学数据平台,以利用公网运算资源和海量结构化医学数据完成该数据分析任务。
[0100] 在本实施方式中,结构化医学数据平台可以用于响应来自部署于不同医疗科研机构的私网的边缘计算节点的结构化医学数据分析请求。具体的,例如,结构化医学数据平台可以为部署于不同医疗科研机构私网的边缘计算节点提供不同通信端口。
[0101] 在本实施方式中,结构化医学数据平台响应于结构化医学数据分析请求对结构化医学数据进行数据分析,得到分析结果数据所采取的方法,与上述实施方式中边缘计算节点响应于结构化医学数据分析请求对结构化医学数据进行数据分析,得到分析结果数据所采取的方法类似,此处不再赘述。值得注意的是,由于结构化医学数据平台可以利用海量结构化医学数据对大语言模型进行训练,相对于边缘计算节点调用大语言模型输出的分析结果数据,结构化医学数据平台调用大语言模型输出的分析结果数据知识准确性可能较高。
[0102] 在本实施方式中,将从所述结构化医学数据平台接收的分析结果数据,反馈给发出所述结构化医学数据分析请求的私网电子设备,与上述实施方式中的实现方法相同,此处不再赘述。
[0103] 在一些实施方式中,所述结构化医学数据的发送方法还可以包括:从位于公网的结构化医学数据平台获取样本医学数据;基于所述样本医学数据对部署的大语言模型进行训练。
[0104] 为提高对非结构化或半结构化医学数据的结构化处理能力,边缘计算节点可以对其部署的大语言模型进行训练。然而,由于边缘计算节点仅能从其部署的医疗科研机构私网获取医学数据,训练样本数据有限,训练后的大语言模型的性能可能仅有较小程度的提升。为解决这一技术问题,突破训练样本数据量的限制,有效提升训练后的大语言模型的自然语言处理能力和推理能力,边缘计算节点可以从公网获取大量训练样本数据。
[0105] 在本实施方式中,样本医学数据可以用于训练和评估部署于边缘计算节点的大语言模型。具体的,例如,结构化医学数据平台在接收到来自不同医疗科研机构的结构化医学数据后,可以对这些结构化医学数据进行数据分类和清洗,从中筛选出适用于训练和评估大语言模型的结构化医学数据,作为样本医学数据。
[0106] 在本实施方式中,从位于公网的结构化医学数据平台获取样本医学数据,可以通过向结构化医学数据平台发送样本医学数据获取请求,并接收结构化医学数据平台响应于样本医学数据获取请求发送的样本医学数据。
[0107] 在本实施方式中,基于所述样本医学数据对部署的大语言模型进行训练,可以先将样本医学数据分为训练样本医学数据集和测试样本医学数据集,再将训练样本医学数据集中的训练样本医学数据输入部署的大语言模型,执行训练过程并调整大语言模型参数,在完成训练后,利用测试样本医学数据集中的测试样本医学数据对训练后的大语言模型进行评估。重复执行上述过程以对大语言模型进行优化。
[0108] 在一些实施方式中,所述结构化医学数据的发送方法还可以包括:在接收到位于公网的结构化医学数据平台发出的大模型更新提示信息的情况下,向所述结构化医学数据平台发送大模型更新请求,以用于所述结构化医学数据平台响应于所述大模型更新请求,向所述边缘计算节点发送大模型更新数据,并记录与所述大模型更新数据对应的大模型版本数据;在接收到所述大模型更新数据的情况下,加载所述大模型更新数据,以更新部署的大语言模型。
[0109] 为优化部署在边缘计算节点本地的大语言模型的性能,边缘计算节点通常需要从结构化医学数据平台获取大量样本医学数据,然而,受到边缘计算节点的数据传输资源、运算资源和存储资源的限制,边缘计算节点可能难以支持在本地训练大语言模型。为节约边缘计算节点的数据传输资源、运算资源和存储资源,大语言模型的训练过程可以在结构化医学数据平台进行。具体的,结构化医学数据平台可以基于监督微调(Supervised Fine‑tuning,SFT)技术训练大语言模型。边缘计算节点仅需从结构化医学数据平台获取大语言模型的更新数据并加载,就可以提升部署在本地的大语言模型的性能。
[0110] 在本实施方式中,大模型更新提示信息可以用于向边缘计算节点提示结构化医学数据平台管理的大语言模型发生了版本更新。具体的,例如,在完成一次大语言模型的模型优化后,结构化医学数据平台可以向边缘计算节点发送大模型更新提示信息。
[0111] 在本实施方式中,大模型更新请求可以用于向结构化医学数据平台获取大模型更新数据。具体的,例如,由于在不同医疗科研机构内承载边缘计算节点的边缘计算设备的运算性能不同,可能存在边缘计算设备无法支持结构化医学数据平台管理的最新版本大语言模型的情况下。在这种情况下,大模型更新请求可以包括边缘计算节点当前部署的大语言模型版本数据以及边缘计算节点期望获取的大语言模型版本数据。大模型更新数据可以为由当前部署的大语言模型版本与期望获取的大语言模型版本之间的区别数据组成的更新数据包。
[0112] 在本实施方式中,记录与所述大模型更新数据对应的大模型版本数据,可以通过结构化医学数据平台对应记录边缘计算节点和边缘计算节点获取的大模型版本数据。具体的,例如,边缘计算节点可以具有唯一标识,在向边缘计算节点发送大模型更新数据后,结构化医学数据平台可以对应存储边缘计算节点标识和该边缘计算节点此次获取的大模型更新数据对应的大模型版本数据。
[0113] 请参阅图5。本说明书的一个实施方式提供一种结构化医学数据的存储方法,应用于位于公网的结构化医学数据平台,所述结构化医学数据的存储方法包括以下步骤。
[0114] 步骤S210:接收位于医疗科研机构的私网中的边缘计算节点发送的结构化医学数据;其中,所述边缘计算节点部署有大语言模型,并且所述边缘计算节点从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据。
[0115] 步骤S220:存储所述结构化医学数据。
[0116] 在本实施方式中,结构化医学数据平台可以以数据湖形式存储来自多个医疗科研机构的结构化医学数据,其中,来自同一个医疗科研机构的结构化医学数据可以按照指定数据存储结构存储于一个数据仓库中。请参阅图6。图6提供了一种数据仓库的数据存储结构示例。具体的,在数据仓库中,数据可以整体按照分析型数据存储(Analytical Data Store,ADS)层、概念数据模型(Conceptual Data Model,CDM)层和操作型数据存储(Operational Data Store,ODS)三层存储。其中,ADS层可以包括分析型数据基础设施(Analytical Data Infrastr‑ucture,ADI)层和分析型数据集市(Analytical Data Mart,ADM)层两个子存储层。CDM层可以包括事实表和维度表的物理存储层(Data Warehouse Schema,DWS)层、详细数据(Data  Warehouse Detailed Data,DWD)层以及维度(Dimensional Data,DIM)层三个子存储层。
[0117] 在本说明书实施方式中,位于公网的结构化医学数据平台通过接收位于医疗科研机构的私网中的边缘计算节点发送的结构化医学数据,并存储该结构化医学数据,突破了医疗科研机构私网与公网的数据隔离,使得存储于医疗科研机构私网内部的医学数据能够汇聚于位于公网的结构化医学数据平台,提高了对医学数据的统计分析价值的利用效率,同时由于边缘计算节点发送的结构化医学数据利用通用大语言模型的语义理解能力对非结构化或半结构化医学数据进行结构化处理获取,使得结构化医学数据平台接收到的结构化医学数据具有较高的准确性,进而提升了后续基于结构化医学数据的医学数据分析的准确性。
[0118] 在一些实施方式中,所述结构化医学数据的存储方法还可以包括:接收部署于不同医疗科研机构的私网的边缘计算节点发送的结构化医学数据。
[0119] 在一些情况下,为节约结构化医学数据平台对接收到的结构化医学数据进行数据对齐处理所占用的运算资源,提升对来自不同医疗科研机构私网的结构化医学数据的处理效率,可以对应医疗属性设置指定提示指令模板,使得来自不同医疗科研机构私网的结构化医学数据具有相同的医疗属性。
[0120] 在本实施方式中,所述结构化医学数据可以包括多个医疗属性以及对应的医疗属性值。具体的,医疗属性可以用于描述患者的就医过程、临床症状、病程发展、诊断结果以及治疗方案等。例如,医疗属性可以包括患者的入院时间、入院途径、首诊科室、首诊时间、患者入院前症状、首诊诊断结果、对应首诊诊断结果的初始治疗方案等。
[0121] 在本实施方式中,结构化医学数据可以通过边缘计算节点针对每个医疗属性分别设置相应的提示问题,形成指定提示指令模板,再将医学数据结合指定提示指令模板,输入大语言模型,并接收大语言模型的输出获取。具体的,例如,针对医疗属性“患者症状”,可以设置对应的提示问题为“患者的入院前的症状是什么?”。
[0122] 在本实施方式中,部署于不同医疗科研机构的私网的边缘计算节点发送的结构化医学数据可以具有相同的医疗属性。
[0123] 在一些实施方式中,结构化数据的发送方法和存储方法可以不限于应用在医学领域,还可以应用于金融领域,或者,其他对于数据安全性和数据准确性要求较高的领域。相应的,结构化数据平台可以不限于医学领域,还可以为金融领域,或其他科研领域。关于相应实现的功能和效果,可以参照本说明书前述内容进行参照解释。
[0124] 请参阅图7。本说明书的一个实施方式提供一种结构化医学数据的发送装置。所述结构化医学数据的发送装置应用于边缘计算节点,所述边缘计算节点部署于医疗科研机构的私网中,所述边缘计算节点部署有大语言模型。所述结构化医学数据的发送装置可以包括:获取模块、结构化处理模块和发送模块。
[0125] 获取模块,用于从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据。
[0126] 结构化处理模块,用于将所述医学数据结合指定提示指令模板,输入所述大语言模型,以使所述大语言模型输出对应所述医学数据的结构化医学数据。
[0127] 发送模块,用于将所述结构化医学数据发送至位于公网中的指定电子设备。
[0128] 请参阅图8。本说明书的一个实施方式提供一种结构化医学数据的存储装置。所述结构化医学数据的发送装置应用于位于公网的结构化医学数据平台。所述结构化医学数据的存储装置可以包括:接收模块和存储模块。
[0129] 接收模块,用于接收位于医疗科研机构的私网中的边缘计算节点发送的结构化医学数据;其中,所述边缘计算节点部署有大语言模型,并且所述边缘计算节点从所述医疗科研机构的私网中的私网电子设备获取医学数据;其中,所述医学数据包括患者在所述医疗科研机构就医过程中产生的诊疗数据。
[0130] 存储模块,用于存储所述结构化医学数据。
[0131] 关于结构化医学数据的发送装置和存储装置实现的具体功能和效果,可以参照本说明书其他实施方式对照解释,在此不再赘述。所述结构化医学数据的发送装置和存储装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。所述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0132] 请参阅图9。本说明书实施方式还提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述任一实施方式中的结构化医学数据的发送方法和存储方法。
[0133] 所述计算机设备可以包括被系统总线连接的处理器、非易失性存储介质、内存储器、通信接口、显示装置和输入装置。所述非易失性存储介质可以存储有操作系统和相关的计算机程序指令。
[0134] 本说明书实施方式还提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被计算机执行时使得,该计算机执行上述任一实施方式中的结构化医学数据的发送方法和存储方法。
[0135] 本说明书实施方式还提供一种包含指令的计算机程序产品,该指令被计算机执行时使得计算机执行上述任一实施方式中的结构化医学数据的发送方法和存储方法。
[0136] 本说明书多个实施方式中所涉及的数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经过用户授权或者经过各方充分授权的信息和数据,并且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律规定和标准,并提供有相应的操作入口,供用户选择授权或者拒绝。
[0137] 可以理解,本文中的具体的例子只是为了帮助本领域技术人员更好地理解本说明书实施方式,而非限制本发明的范围。
[0138] 可以理解,在本说明书中的各种实施方式中,各过程的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本说明书实施方式的实施过程构成任何限定。
[0139] 可以理解,本说明书中描述的各种实施方式,既可以单独实施,也可以组合实施,本说明书实施方式对此并不限定。
[0140] 除非另有说明,本说明书实施方式所使用的所有技术和科学术语与本说明书的技术领域的技术人员通常理解的含义相同。本说明书中所使用的术语只是为了描述具体的实施方式的目的,不是旨在限制本说明书的范围。本说明书所使用的术语“和/或”包括一个或多个相关的所列项的任意的和所有的组合。在本说明书实施方式和所附权利要求书中所使用的单数形式的“一种”、“上述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。
[0141] 可以理解,本说明书实施方式的处理器可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施方式的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(Digital SignalProcessor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施方式中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施方式所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0142] 可以理解,本说明书实施方式中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(ROM)、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(EEPROM)或闪存。易失性存储器可以是随机存取存储器(RAM)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
[0143] 本领域普通技术人员可以意识到,结合本文中所公开的实施方式描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本说明书的范围。
[0144] 所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施方式中的对应过程,在此不再赘述。
[0145] 在本说明书所提供的几个实施方式中,应所述理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施方式仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0146] 所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施方式方案的目的。
[0147] 另外,在本说明书各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0148] 所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分或者所述技术方案的部分可以以软件产品的形式体现出来,所述计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施方式所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM)、随机存取存储器(RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
[0149] 以上所述,仅为本说明书的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本说明书揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本说明书的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
QQ群二维码
意见反馈