首页 / 专利库 / 图形技术 / 可视化 / 一种胸部疾病检测模型的构建方法及应用

一种胸部疾病检测模型的构建方法及应用

阅读:1发布:2022-08-06

专利汇可以提供一种胸部疾病检测模型的构建方法及应用专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种胸部 疾病 检测模型的构建方法及应用,包括:A、获取 指定 数量的胸部疾病患者的胸部X光图像;B、对所述X光图像进行图像预处理,以获取预处理后的图像数据;C、将所述预处理后的图像数据输入至 卷积神经网络 模型进行训练,以获取训练后的用于胸部疾病检测的模型。由上,本 申请 通过上述模型能够准确地预测胸部疾病类型及区域 位置 ,大大减少医生的诊断时间,降低漏诊和误诊率。,下面是一种胸部疾病检测模型的构建方法及应用专利的具体信息内容。

1.一种胸部疾病检测模型的构建方法,其特征在于,包括:
A、获取指定数量的胸部疾病患者的胸部X光图像;
B、对所述X光图像进行图像预处理,以获取预处理后的图像数据;
C、将所述预处理后的图像数据输入至卷积神经网络模型进行训练,以获取训练后的用于胸部疾病检测的模型。
2.根据权利要求1所述的构建方法,其特征在于,所述步骤B包括:
B1、进行胸部X光图像分割,包括:使用Unet网络训练胸部分割模型,对全部胸部X光图像进行胸部分割,以获取分割后的胸部区域X光图像;
B2、将分割后的胸部区域X光图像与未分割的原始的胸部X光图像进行合并训练,以获取合并训练后的胸部X光图像;或者
将分割后的胸部区域X光图像与未分割的原始的胸部X光图像进行进行复合叠加处理,以产生3通道的复合胸部X光图像;
B3、将合并训练后的胸部X光图像或者复核处理后的复合胸部X光图像进行随机旋转以进行图像数据扩增。
3.根据权利要求1所述的方法,其特征在于,步骤C所述卷积神经网络模型为被修改为适应胸部X光图像的疾病类型的诊断的模型,包括:
将卷积神经网络模型的分类算法修改为激活函数为Sigmoid的二分类算法。
4.根据权利要求3所述的方法,其特征在于,所述二分类算法的优化目标函数为:
其中,k是指胸部疾病的类别;yik∈{0,1}表示元素i是否为类别k,其中;pik是由Sigmoid激活函数输出,表示类别为k时概率;αk为单疾病自身的样本不平衡系数;βk为疾病间的样本不平衡系数。
5.根据权利要求4所述的方法,其特征在于,所述步骤C之后还包括:
对所述用于胸部疾病检测的模型进行测试,通过获取AUC值及召回率测试该模型的检测准确度。
6.根据权利要求4所述的方法,其特征在于,所述步骤C之后还包括:
D、提取所述卷积神经网络的最后一层的数据,并将所述数据按疾病类别加权处理,得到与疾病对应的特征图;
E、根据所述特征图制作热图;并将所述热图与原始的胸部X光图像通过alpha透明度通道相加,以获取可视化的病灶区域。
7.根据权利要求2所述的方法,其特征在于,所述步骤B1包括:
B11、通过连通域分析,初步定位胸部区域;
B12、将所述胸部区域的边缘的非图像区域删除。
8.一种基于权利要求1-7任一项所述的胸部疾病检测模型的胸部疾病检测方法,其特征在于,包括如下步骤:
A’、输入患者的胸部X光图像;
B’、将所述胸部X光图像进行预处理,以获取预处理后的图像数据;
C’、将所述预处理后的图像数据输入至训练好的胸部疾病检测模型进行胸部疾病的检测。

说明书全文

一种胸部疾病检测模型的构建方法及应用

技术领域

[0001] 本发明涉及医学影像领域,特别是涉及一种胸部疾病检测模型的构建方法及应用。

背景技术

[0002] 胸部疾病直接关系到患者的身体健康,作为经济便捷的检测方法,X线胸片是胸部疾病筛查的主要手段,医生可以通过该X胸片来进行胸部疾病的诊断,诊断的效率和准确度都依赖于医生的经验平。但由于缺乏大量专业的医学影像医生,很难保证诊断的效率和准确度。
[0003] 因此,目前亟需一种胸部疾病检测模型,以快速准确地提供一胸部疾病检测结果,供用户参考,以减少医生的诊断时间,提高诊断地效率及精确度。

发明内容

[0004] 有鉴于此,本申请提供一种胸部疾病检测模型的构建方法及应用,以快速准确地提供一胸部疾病检测结果,供用户参考,以减少医生的诊断时间,提高诊断地效率及精确度。
[0005] 本申请提供一种胸部疾病检测模型的构建方法,包括:
[0006] A、获取指定数量的胸部疾病患者的胸部X光图像;
[0007] B、对所述X光图像进行图像预处理,以获取预处理后的图像数据;
[0008] C、将所述预处理后的图像数据输入至卷积神经网络模型进行训练,以获取训练后的用于胸部疾病检测的模型。
[0009] 由上,本申请的胸部疾病检测模型,可以实现快速准确地提供一胸部疾病检测结果,供用户参考,以减少医生的诊断时间,提高诊断地效率及精确度。
[0010] 优选地,所述步骤B包括:
[0011] B1、进行胸部X光图像分割,包括:使用Unet网络训练胸部分割模型,对全部胸部X光图像进行胸部分割,以获取分割后的胸部区域X光图像;
[0012] B2、将分割后的胸部区域X光图像与未分割的原始的胸部X光图像进行合并训练,以获取合并训练后的胸部X光图像;或者
[0013] 将分割后的胸部区域X光图像与未分割的原始的胸部X光图像进行进行复合叠加处理,以产生3通道的复合胸部X光图像;
[0014] B3、将合并训练后的胸部X光图像或者复核处理后的复合胸部X光图像进行随机旋转以进行图像数据扩增。
[0015] 由上,对于B1:如图2所示,右侧的图为用分割后的胸片(胸部X光图像)能使Unet网络准确定位到胸部,并提高网络的胸部区域输入尺寸,同时减少其他部位的干扰,经实验表明,使用分割后的胸片能使AUC提高1个点。对于B2:仅使用分割后的胸片,可能损失一些整体信息,且引入分割干扰,考虑整合整体和局部信息,将分割后的胸片集和原胸片集合并,即数据量扩大了一倍,这样既能提高增加信息量,也能减小过拟合险。另外,考虑到仅使用分割后胸片,会损失一些整体信息,且分割可能存在缺失,故在原始胸片上加上(原始胸片+原始胸片+分割后的胸部区域),产生3通道的复合胸片,如图3所示右侧的图片为复合胸片。对于B3:深度学习需要大量的数据,以防止过拟合,所有数据扩增是非常必要的。由于胸片的整体信息非常重要,缺失了某一部分就不能判断为某种疾病,这与普通物体分类识别不同,不能用随机裁剪来增广数据,所以使用了小度的随机旋转,±90°旋转及水平翻转来扩增数据。
[0016] 优选地,步骤C所述卷积神经网络模型为被修改为适应胸部X光图像的疾病类型的诊断的模型,包括:
[0017] 将卷积神经网络模型的分类算法修改为激活函数为Sigmoid的二分类算法。
[0018] 由上,如图4中Inception-ResNet-v2Network所示,为适应胸片的14类疾病的诊断,需对其进行适应性修改,即将图4中左边的虚线框所示模修改为右边的虚线框所示模块,由于一个病人可能患有多种胸部疾病,所以不能采用Softmax激活函数的多分类(类别间互斥),而应该为Sigmoid激活函数的多标签分类。
[0019] 优选地,所述二分类算法的优化目标函数为:
[0020]
[0021] 其中,k是指胸部疾病的类别;yik∈{0,1}表示元素i是否为类别k,其中;pik是由Sigmoid激活函数输出,表示类别为k时概率;αk为单疾病自身的样本不平衡系数;βk为疾病间的样本不平衡系数。
[0022] 由上,在二分类模型中常使用交叉熵损失函数为优化目标函数,对于胸片疾病检测的多标签模型,不能使用多分类模型的损失函数,因为类别的兼容性,导致每类的负类不能用其他类的正类表示;考虑不同疾病的独立性,将胸片多疾病检测分解为多个单疾病检测,每类疾病检测为一个二分类模型;考虑用卷积神经网络提取特征的相似性,不同疾病可用同一网络提取相似特征,并在最后一层区分不同疾病,即使用图4中修改后的网络模型,同时对于原有的函数进行了修改,以避免现有函数的缺陷(模型训练后期损失函数将会出现较大波动,且不同疾病间的预测效果差异很大,不能实现胸部多疾病的检测。这是由于疾病分布及数据采集存在样本不均衡,且模型为多疾病检测模型,单疾病的正负样本也必然不均衡)。本申请的该函数能较好的反映胸片多疾病检测情况。
[0023] 优选地,所述步骤C之后还包括:
[0024] 对所述用于胸部疾病检测的模型进行测试,通过获取AUC值及召回率测试该模型的检测准确度。
[0025] 由上,AUC(Area Under roc Curve)是一种用来度量分类效果好坏的一个标准。AUC越接近1说明分类效果越好,对应本申请为疾病的检测结果越好。召回率(Recall)为预测为正例的数据占实际为正例数据的比例,召回率越接近1说明检测结果越好。如表1所示,(若无特别说明,表中值代表AUC值)对比了使用公式(3)和公式(4)作为目标优化函数的测试结果,使用修改后公式(4)能使平均AUC值提升11.6个百分点,效果显著;在“ChestX-ray14”数据集上分别使用1.1和1.2的方法进行胸片预处理,经1.3的数据扩充后进行模型训练测试,结果显示,1.1和1.2方法测试结果非常接近,较直接使用胸片能提高约2个百分点,比Andrew Y.Ng论文结果提升约4个百分点;使用国内医院提供的测试数据(1000张,包含10种疾病),对模型进行测试,AUC值为0.938,召回率为0.907,结果显示模型能较准确预测疾病类别,能达经验丰富的专业医学影像医生水平。
[0026] 优选地,所述步骤C之后还包括:
[0027] D、提取所述卷积神经网络的最后一层的数据,并将所述数据按疾病类别加权处理,得到与疾病对应的特征图;
[0028] E、根据所述特征图制作热图;并将所述热图与原始的胸部X光图像通过alpha透明度通道相加,以获取可视化的病灶区域。
[0029] 由上,通过该可视化的病灶区域的显示,可以供用户参考(此处的用户一般指医生),以减少医生的诊断时间,提高诊断地效率及精确度。本申请还将获取得到的可视化的病灶区域与专业医生勾画的相应的疾病区域进行比对,可以通过二者的重合度判断该胸部疾病检测的模型的检测准确度;以图5所示Cardiomegaly(心影增大)为例,图5中的划线区域51为专业医生勾画的相应疾病区域,图5中的52为用CAMs制作的热图的热区;该热图中热区与勾画区域重合较好,能正确反映病灶区,实现疾病区域的定位及可视化。
[0030] 优选地,所述步骤B1包括:
[0031] B11、通过连通域分析,初步定位胸部区域;
[0032] B12、将所述胸部区域的边缘的非图像区域删除。
[0033] 由上,B11有利于初步定位胸部区域的同时可以缓解目标物体尺度过小问题。B12有利于减少对均值和方差的影响
[0034] 本申请还提供一种基于上述的胸部疾病检测模型的胸部疾病检测方法,包括如下步骤:
[0035] A’、输入患者的胸部X光图像;
[0036] B’、将所述胸部X光图像进行预处理,以获取预处理后的图像数据;
[0037] C’、将所述预处理后的图像数据输入至训练好的胸部疾病检测模型进行胸部疾病的检测。
[0038] 综上所述,本申请通过可以实现快速准确地提供一胸部疾病检测结果,供用户参考,以减少医生的诊断时间,提高诊断地效率及精确度。附图说明
[0039] 图1为本申请实施例提供的一种胸部疾病检测模型的构建方法的流程示意图;
[0040] 图2为本申请实施例提供的对胸部X光图像进行胸部分割的示意图;
[0041] 图3为本申请实施例提供的复合胸片的示意图;
[0042] 图4为本申请实施例提供的卷积神经网络Inception-ResNet-v2模型结构及适应性修改;
[0043] 图5为本申请实施例提供的心影增大病灶区域可视化示意图。

具体实施方式

[0044] 下面将结合本申请实施例中的附图对本申请进行说明。
[0045] 实施例一
[0046] 如图1所示,本申请提供一种胸部疾病检测模型的构建方法,包括:
[0047] S101,获取指定数量的胸部疾病患者的胸部X光图像;所述胸部X光图像可以使用已有的大量的胸部疾病患者的胸部X光图像。
[0048] 之后步骤S102-104,对所述X光图像进行图像预处理,以获取预处理后的图像数据。
[0049] S102,进行胸部X光图像分割,包括:使用Unet网络训练胸部分割模型,对全部胸部X光图像进行胸部分割,以获取分割后的胸部区域X光图像。具体的,包括:B11、通过连通域分析,初步定位胸部区域。B12、将所述胸部区域的边缘的非图像区域删除。如图2所示,右侧的图为用分割后的胸片(胸部X光图像)能使Unet网络准确定位到胸部,并提高网络的胸部区域输入尺寸,同时减少其他部位的干扰,经实验表明,使用分割后的胸片能使AUC提高1个点。
[0050] S103,将分割后的胸部区域X光图像与未分割的原始的胸部X光图像进行合并训练,以获取合并训练后的胸部X光图像;仅使用分割后的胸片,可能损失一些整体信息,且引入分割干扰,考虑整合整体和局部信息,将分割后的胸片集和原胸片集合并,即数据量扩大了一倍,这样既能提高增加信息量,也能减小过拟合风险。或者
[0051] S104,将分割后的胸部区域X光图像与未分割的原始的胸部X光图像进行进行复合叠加处理,以产生3通道的复合胸部X光图像;考虑到仅使用分割后胸片,会损失一些整体信息,且分割可能存在缺失,故在原始胸片上加上(原始胸片+原始胸片+分割后的胸部区域),产生3通道的复合胸片,如图3所示右侧的图片为复合胸片。
[0052] S105,将合并训练后的胸部X光图像或者复核处理后的复合胸部X光图像进行随机旋转以进行图像数据扩增。深度学习需要大量的数据,以防止过拟合,所有数据扩增是非常必要的。由于胸片的整体信息非常重要,缺失了某一部分就不能判断为某种疾病,这与普通物体分类识别不同,不能用随机裁剪来增广数据,所以使用了小角度的随机旋转,±90°旋转及水平翻转来扩增数据。
[0053] S106,将所述预处理后的图像数据输入至卷积神经网络模型进行训练,以获取训练后的用于胸部疾病检测的模型。其中,所述卷积神经网络模型为被修改为适应胸部X光图像的疾病类型的诊断的模型,包括:
[0054] 将卷积神经网络模型的分类算法修改为激活函数为Sigmoid的二分类算法。如图4中Inception-ResNet-v2Network所示,为适应胸片的14类疾病的诊断,需对其进行适应性修改,即将图4中左边的虚线框所示模块修改为右边的虚线框所示模块,由于一个病人可能患有多种胸部疾病,所以不能采用Softmax激活函数的多分类(类别间互斥),而应该为Sigmoid激活函数的多标签分类。
[0055] 在二分类模型中常使用交叉熵损失函数为优化目标函数,其方程式如式(1)所示,[0056]
[0057] 其中,yi∈{0,1}表示元素i的类别,pi表示元素i为1类时的概率,即Sigmoid激活函数的输出。
[0058] 对于多分类模型(类别间互斥),可直接对其推广,变为log-likelihood损失函数,如式(2)所示,k∈{0,1,...,c}表示类别,yik∈{0,1}表示元素i是否为类别k,pik由Softmax激活函数输出,表示为类别K时概率。
[0059]
[0060] 对于胸片疾病检测的多标签模型,不能使用多分类模型的损失函数,因为类别的兼容性,导致每类的负类不能用其他类的正类表示;考虑不同疾病的独立性,将胸片多疾病检测分解为多个单疾病检测,每类疾病检测为一个二分类模型,可以使用式(1)的损失函数;考虑用卷积神经网络提取特征的相似性,不同疾病可用同一网络提取相似特征,并在最后一层区分不同疾病,即使用图3种修改后的网络模型,相应的损失函数如式(3)所示,k∈{0,1,...,c}表示类别,yik∈{0,1}表示元素i是否为类别k,pik由Sigmoid激活函数输出,表示为类别K时概率。
[0061]
[0062] 若直接使用式(3)作为优化目标函数进行模型训练,模型训练后期损失函数将会出现较大波动,且不同疾病间的预测效果差异很大,不能实现胸部多疾病的检测。这是由于疾病分布及数据采集存在样本不均衡,且模型为多疾病检测模型,单疾病的正负样本也必然不均衡,所以需要对损失函数进行修改,修改后如式(4)所示,
[0063]
[0064] 其中,k是指胸部疾病的类别;yik∈{0,1}表示元素i是否为类别k,其中;pik是由Sigmoid激活函数输出,表示类别为k时概率;αk为单疾病自身的样本不平衡系数;βk为疾病间的样本不平衡系数。即在式(3)中加入两个不平衡参数αk、βk,αk为单疾病自身的样本不平衡系数,由疾病内的正负样本比例决定,βk为疾病间的样本不平衡系数,由疾病间正类的比例决定,这样,修改后的损失函数能较好的反映胸片多疾病检测情况。
[0065] S107,对所述用于胸部疾病检测的模型进行测试,通过获取AUC值及召回率对该模型的检测准确度进行判断。其中,AUC(Area Under roc Curve)是一种用来度量分类效果好坏的一个标准。AUC越接近1说明分类效果越好,对应本申请为疾病的检测结果越好。召回率(Recall)为预测为正例的数据占实际为正例数据的比例,召回率越接近1说明检测结果越好。如表1所示,(表中数值代表AUC值,该表的最左列代表14中胸部疾病的名称)对比了使用公式(3)和公式(4)作为目标优化函数的测试结果,使用修改后公式(4)能使平均AUC值提升11.6个百分点,效果显著;在“ChestX-ray14”数据集上分别使用1.1和1.2的方法进行胸片预处理,经1.3的数据扩充后进行模型训练测试,结果显示,1.1和1.2方法测试结果非常接近,较直接使用胸片能提高约2个百分点,比Andrew Y.Ng论文结果提升约4个百分点;使用国内医院提供的测试数据(1000张,包含10种疾病),对模型进行测试,AUC值为0.938,召回率为0.907,结果显示模型能较准确预测疾病类别,能力达经验丰富的专业医学影像医生水平。
[0066]
[0067] 表1模型测试结果
[0068] S108,提取所述卷积神经网络的最后一层的数据,并将所述数据按疾病类别加权处理,得到与疾病对应的特征图。
[0069] S109,根据所述特征图制作热图;并将所述热图与原始的胸部X光图像通过alpha透明度通道相加,以获取可视化的病灶区域。通过该可视化的病灶区域的显示,可以供用户参考(此处的用户一般指医生),以减少医生的诊断时间,提高诊断地效率及精确度。本申请还将获取得到的可视化的病灶区域与专业医生勾画的相应的疾病区域进行比对,可以通过二者的重合度判断该胸部疾病检测的模型的检测准确度;以图5所示Cardiomegaly(心影增大)为例,图5中的划线区域51为专业医生勾画的相应疾病区域,图5中的52为用CAMs制作的热图的热区;该热图中热区与勾画区域重合较好,能正确反映病灶区,实现疾病区域的定位及可视化。
[0070] 实施例二
[0071] 本申请还提供一种基于上述的胸部疾病检测模型的胸部疾病检测方法,包括如下步骤:
[0072] A’、输入患者的胸部X光图像;
[0073] B’、将所述胸部X光图像进行预处理,以获取预处理后的图像数据;
[0074] C’、将所述预处理后的图像数据输入至训练好的胸部疾病检测模型进行胸部疾病的检测。
[0075] 综上所述,本申请通过可以实现快速准确地提供一胸部疾病检测结果,供用户参考,以减少医生的诊断时间,提高诊断地效率及精确度。
[0076] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈