首页 / 专利库 / 电脑编程 / K最近邻算法 / 从数字乳房X射线照片中自动检测成簇的微钙化的方法和系统

从数字乳房X射线照片中自动检测成簇的微化的方法和系统

阅读:667发布:2022-01-16

专利汇可以提供从数字乳房X射线照片中自动检测成簇的微化的方法和系统专利检索,专利查询,专利分析的服务。并且本 发明 所提出的检测和显示数字乳房 X射线 照片内的成簇的微 钙 化的方法和系统首先自地动将单个数字乳房X射线照片(100)自动剪切(200)成一个乳房区子图像,再由最佳化的高斯差值 滤波器 处理,以增强子图像中可能的微钙化表现。对可能的微钙化进行 阈值 处理后,检测出微钙化簇(300),根据检测到的簇的特征由神经网络将这些簇分为可疑类和非可疑类(400)。对可疑的检测到的成簇的微钙化在原数字乳房X射线照片内的 位置 予以指示。通过将放射科医师对原始乳房X射线照片的观察与他接受或排斥的系统所报告的个别检测结果相结合,将系统得出的结果与放射科医师的观察结果很好地结合起来。,下面是从数字乳房X射线照片中自动检测成簇的微化的方法和系统专利的具体信息内容。

1.一种根据数字乳房X射线照片自动检测成簇的微化的方法, 所述方法包括下列步骤:
获取数字乳房X射线照片;
使用于剪切所述数字乳房X射线照片的一些第一参数最佳化;
根据所述最佳化第一参数剪切所述数字乳房X射线照片,产生一 个表示所述数字乳房X射线照片内乳房组织的剪取图像;
使用于检测所述剪取图像内的成簇的微钙化的一些第二参数最佳 化;
根据所述最佳化第二参数检测所述剪取图像内的成簇的微钙化; 以及
指示所述检测到的成簇的微钙化在所述数字乳房X射线照片内的 位置
2.一种将一幅数字乳房X射线照片图像中与乳房组织相对应的 区域与其他区域分开的方法,所述方法包括下列步骤:
存储所述数字乳房X射线照片图像的数字表示;
增强所述数字表示的直方图,产生一个与乳房X射线照片图像中 与乳房组织相对应的区域的反差得到增强的增强图像;
对所述增强图像进行二进制阈值处理,产生一个包括一个种子像 素的二进制图像;
区域生长所述二进制图像内的所述种子像素,产生一个掩模;
闭合所述掩模内的孔;
侵蚀所述掩模;
扩张所述掩模;以及
将所述数字表示剪切成所述掩模内最大目标的大小。
3.一种检测数字乳房X射线照片图像内的成簇的微钙化的方法, 所述方法包括下列步骤:
对所述数字乳房X射线照片图像进行第一滤波,以降低所述图像 内的噪声,产生一个经过降噪的图像;
用高斯差值滤波器对所述经过降噪的图像进行第二滤波,以产生 一幅经过DoG滤波的图像,在其中,可能的微钙化的表现已增强;
对所述经DoG滤波的图像进行全局阈值处理,从所述经DoG滤 波的图像中截取出可能是微钙化的部分;
对所述经DoG滤波的图像进行局部阈值处理,从所述经DoG滤 波的图像中截取出可能是微钙化的部分;
对全局和局部阈值处理得到的可能是微钙化的部分进行逻辑与处 理;
将逻辑与处理得到的可能是的微钙化的部分变换成单像素坐标表 示;
除去处在数字乳房X射线照片图像中与乳房组织相对应的区域以 外的那些单像素座标表示;
将经上一步骤处理后剩下的单像素座标表示聚合成簇,以识别可 能的成簇的微钙化;
计算每个可能的成簇的微钙化的特征;
根据所计算的每个可能的成簇的微钙化的特征删去一些可能的成 簇的微钙化;以及
在所述数字乳房X射线照片图像内指示在上一步骤未删去的那些 可能的成簇的微钙化。
4.一种在普查乳房X射线照片中通过数字图像处理自动检测成 簇的微钙化的方法,所述方法包括下列步骤:
存储乳房X射线照片的数字表示;
将一个包括高斯差方程的滤波器核与所述数字表示进行卷积,从 而抑制图像内与微钙化的大小、形状特征不一致的信息,而将可疑的 微钙化在所得图像内显示为相应的亮斑;以及
对所述得出的图像进行局部和全局阈值处理,从而得到一幅基本 上只包括可疑微钙化部分的第二所得图像。
5.一种在普查乳房X射线照片中通过数字图像处理自动检测成 簇的微钙化的方法,所述方法包括下列步骤:
存储乳房X射线照片的数字表示;
利用最佳化算法和训练图像数据库得出最佳化参数值;以及
对所述数字表示执行采用所述最佳化参数的滤波算法,得到一幅 基本上只包括可疑微钙化区域的经过滤波的图像;
收缩所述经过滤波的图像,得到一个基本上只包括所述可疑微钙 化区域的单像素表示的图像;
利用所述最佳化参数将所述这些单像素表示聚合成簇。
6.按权利要求5所述的方法,其中所述利用最佳化算法的步骤 包括下列步骤:
利用一种遗传算法
7.按权利要求6所述的方法,其中:
所述利用遗传算法的步骤包括得出一个dnn值和一个μCsmin值, 其中dnn表示最靠近的近邻的距离,而μCsmin表示检测到的微钙化区域 的数目,以及
所述聚簇的步骤将单像素表示聚合成表示处于μCsmin个其他微钙 化区域的距离dnn内的微钙化的簇。
8.按权利要求7所述的方法,其中所述利用遗传算法的步骤还 包括下列步骤:
对一个含有dnn和μCsmin的可能值的解空间进行迭代搜索,以识 别这样的诸数值集,在其中至少有一个适应性函数得以最大化。
9.按权利要求8所述的方法,其中所述利用遗传算法的步骤还 包括以下步骤:
利用一种简化方法去识别至少一个所述的数值集,在其中,一个 代价函数得以最小化。
10.一种在普查乳房X射线照片中通过数字图像处理自动检测成 簇的微钙化的方法,所述方法包括下列步骤:
存储乳房X射线照片的数字表示;
确定所述数字表示中可能的微钙化簇的位置;
提取所述可能的微钙化簇的特征;
将所述已提取的特征用作多层感觉器人工神经网络的输入;以及
利用所述多层感觉器人工神经网络将所述微钙化簇分成可疑类和 非可疑类。
11.按权利要求10所述的方法,其中所述利用所述多层感觉器 人工神经网络将所述微钙化簇分为可疑类和非可疑类的步骤包括下列 步骤:
将所述多层感觉器人工神经网络的输出用于一个平滑改变的输出 函数,以获得一系列的结果数值;以及
将与所述这些结果数值中大于或等于一个阈值值的结果数值有关 的簇归入可疑类,而将与小于所述阈值值的结果数值有关的簇归于非 可疑类。
12.按权利要求11所述的方法,其中所述平滑改变的输出函数 包括双曲正切函数。
13.按权利要求11所述的方法,其中所述平滑改变的输出函数 包括线性函数。
14.按权利要求11所述的方法,其中这平滑改变的输出函数包 括S形函数。
15.按权利要求11所述的方法,其中所述利用所述多层感觉器 人工神经网络将所述微钙化簇分为可疑类和非可疑类的步骤包括下列 步骤:
将所述特征中的至少一个特征乘以权系数wi,j,其中i为表示一个 具有N个元素的特征向量x的第i个特征向量元素的下标,而j为表 示第j个第一层节点的下标;以及
利用所述多层感觉器人工神经网络计算第一层输出fj,所述第一 层输出fj,按式 f j = tanh { Σ i = 1 N ( W i , j × x i ) } 计算,其中xi包括一个已计算的特征向量元素。
16.按权利要求15所述的方法,其中所述利用所述多层感觉器 人工神经网络将所述微钙化簇分为可疑类和非可疑类的步骤还包括下 列步骤:
将所述第一层输出fj中的至少一个输出乘以第二权系数uj,k;以 及
利用所述相乘步骤的结果作为送往至少一个输出节点的输入,所 述至少一个输出节点的输出按式 z k ( y ) = tanh [ Σ j = 1 J ( u j , k × y i ) ] 计算,其中yj=fj(x),k为表示第k个输出节点的下标,而J为需乘 的第一层输出的数目。
17.一种将检测乳房X射线照片内的成簇的微钙化的计算机辅助 检测系统的输出检测结果与同一乳房X射线照片人工判读的观察检测 结果相结合而不降低灵敏度的方法,所述方法包括下列步骤:
获取所述观察检测结果,形成一个第一检测结果集;
获取所述输出检测结果,形成一个第二检测结果集;
接受这第二检测结果集内的一些输出检测结果,形成一个第三检 测结果集;
合并所述第一检测结果集和所述第三检测结果集,形成一个第四 检测结果集;以及
根据所述第四检测结果集提供输出结果。
18.一种在普查乳腺X射线照片中通过数字图像处理自动检测成 簇的微钙化的方法,包括下列步骤:
存储乳房X射线照片的数字表示;
对所述数字表示进行滤波,得到一个包括可疑微钙化部分的经过 滤波的图像;以及
用一个倾斜局部阈值对所述经过滤波的图像进行阈值处理,得到 一个基本上只包括可疑微钙化区域的图像。
19.按权利要求18所述的方法,其中所述阈值处理步骤包括下 列步骤:
将一个窗口的中心定位于一个感兴趣的像素上,所述像素在所述 数字表示中具有坐标(x,y);
计算所述窗口内诸像素的均值(x,y)和标准差(x,y);
按下式计算所述感兴趣像素的局部阈值值T(x,y)
T(x,y)=A+Bμ(x,y)+Cσ(x,y) 其中A为预定的偏置量,而B和C为预定的系数;
将所述经滤波的图像内感兴趣的相应像素的灰度值与所述局部阈 值值进行比较;以及
通过将所述灰度值大于或等于所述局部阈值的相应像素设置为1 而将所述灰度值小于所述局部阈值的相应像素设置为0,来产生一个 二进制图像。
20.一种根据数字乳房X射线照片自动检测成簇的微钙化的设 备,所述设备包括:
获取数字乳房X射线照片的装置;
使用于剪切所述数字乳房X射线照片的一些第一参数最佳化的装 置;
剪切所述数字乳房X射线照片的装置,所述装置利用所述最佳化 第一参数进行剪切,产生一个所述数字乳房X射线照片内乳房组织的 剪取图像;
使用于检测所述剪取图像内的成簇的微钙化部分的一些第二参数 最佳化的装置;
利用所述最佳化第二参数检测所述剪取图像内的成簇的微钙化部 分的装置;以及
指示所述检测到的成簇的微钙化部分在所述数字乳房X射线照片 内的位置的装置。
21.一种检测数字乳房X射线照片图像内的成簇的微钙化的设 备,所述设备包括:
一个高斯差值滤波器,用以产生一幅经过DoG滤波的图像,在 其中,可能的微钙化的表现已被增强;
从所述经DoG滤波的图像中截取出可能的微钙化部分的阈值装 置;
产生所述可能的微钙化部分的单像素座标表示的提取装置;以及
将所述单像素表示聚合成簇的成簇装置。
22.一种在普查乳房X光摄影中通过数字图像处理自动检测成簇 的微钙化的设备,所述设备包括:
存储乳房X射线照片的数字表示的装置;
将一个包括高斯差的滤波器核与所述数字表示进行卷积的装置, 用来抑制图像内与微钙化的大小和形状不一致的信息,将可疑的微钙 化部分在所得图像内显示为相应的亮斑;以及
对所述得出的图像进行局部和全局阈值处理的装置,用来获取一 个基本上只包括可疑微钙化区域的第二所得图像。
23.一种在普查乳房X射线摄影术中通过数字图像处理自动检测 成簇的微钙化的设备,所述设备包括:
存储乳房X射线照片的数字表示的装置;
利用最佳化算法和训练图像数据库使参数值最佳化的装置;
利用所述最佳化参数对所述数字表示执行滤波算法的装置,用来 得到一个基本上只包括可疑微钙化区域的经过滤波的图像;
收缩所述经过滤波的图像的装置,用来得到一个基本上只包括所 述可疑微钙化区域的单像素表示的图像;以及
利用所述最佳化参数将所述这些单像素表示聚合为诸簇的装置。
24.按权利要求23所述的设备,其中所述最佳化算法是一种遗 传算法。
25.按权利要求24所述的设备,其中所述使参数值最佳化的装 置包括:
得出一个dnn值和一个μCsmin值的装置,其中dnn表示最靠近的近 邻的距离,而μCsmin表示检测到的微钙化区域的数目;以及
其中所述聚簇装置将单像素表示聚合成表示处于μCsmin个其他微 钙化区域的距离dnn内的微钙化的簇。
26.按权利要求25所述的设备,其中所述使参数最佳化的装置 包括:
对一个含有dnn和μCsmin的可能值的解空间进行搜索的装置,用 来识别使至少一个适应性函数达到最大的值集。
27.按权利要求26所述的设备,其中所述使参数最佳化的装置 包括:
使用一种简单的方法来识别至少一个所述数值集的装置,在该数 值集中,一个代价函数得以最小化。
28.一种在普查乳房X射线摄影术中通过数字图像处理自动检测 成簇的微钙化的设备,所述设备包括:
存储乳房X射线照片的数字表示的装置;
确定所述数字表示内可能的微钙化簇的位置的装置;
提取所述可能的微钙化簇的特征的装置;
利用所述特征将所述可能的微钙化簇分为可疑类和非可疑类的装 置。
29.按权利要求28所述的设备,其中所述分类装置包括一个多 层感觉器人工神经网络。
30.按权利要求29所述的设备,其中所述多层感觉器人工神经 网络包括:
平滑改变的输出装置。
31.按权利要求30所述的设备,其中所述平滑改变的输出装置 包括:
对输入的加权和执行双曲正切变换的装置,用来提供一组输出信 号,它指示相应的成簇的微钙化应归入可疑类还是非可疑类。
32.按权利要求30所述的设备,其中所述平滑改变的输出装置 包括:
对输入的加权和执行S形变换的装置,用来提供一组输出信号, 它指示相应的成簇的微钙化应归入可疑类还是非可疑类。
33.按权利要求30所述的设备,其中所述平滑改变的输出装置 包括:
对输入的加权和执行线性变换的装置,用来提供一组输出信号, 它指示相应的成簇的微钙化应归入可疑类还是非可疑类。
34.按权利要求30所述的设备,其中所述多层感觉器人工神经 网络包括:
将所述诸特征中的至少一个特征乘以权系数wi,j的装置,其中i 为表示一个具有N个元素的特征向量x的第i个特征向量元素的下标, 而j为表示第j个第一层节点的下标,以及
按下式计算第一层输出fj的第一层节点 f j = tanh { Σ i = 1 N ( W i , j × x i ) } 其中xi包括一个已计算的特征向量元素。
35.按权利要求34所述的设备,其中所述多层感觉器人工神经 网络还包括:
将所述第一层输出fj中的至少一个输出乘以第二权系数uj,k的装 置,以及
按下式计算输出zk的至少一个输出节点: z k ( y ) = tanh [ Σ j = 1 J ( u j , k × y j ) ] 其中,k为表示第k个输出节点的下标,yj=fj(x),而j为需乘的第一 层输出的数目。
36.一种在普查乳房X射线照片中通过数字图像处理自动检测成 簇的微钙化和密度的方法,所述方法包括下列步骤:
存储乳房X射线照片的数字表示;
将一个包括高斯差的滤波器核与所述数字表示进行卷积,从而抑 制图像内与微钙化的大小、形状特征不一致的信息,而将可疑的微钙 化区域在所得图像内显示为相应的亮斑;
对所述第一所得图像进行阈值处理,从而得到一个基本上只包括 可疑微钙化区域的第二所得图像;
检测所述数字表示内的密度;以及
产生一个只包括可疑密度区域的第三所得图像。
37.一种在普查乳房X射线照片中通过数字图像处理自动剪切图 像的方法,所述方法包括下列步骤:
存储乳房X射线照片的第一数字表示;
扩张所述第一数字表示,产生一个经过扩张的数字表示;
按最大连续像素组剪切所述经过扩张的数字表示,从而产生一个 剪取的经过扩张的数字表示;以及
在所述第一数字表示内选取与所述剪取的经扩张的数字表示内的 像素相对应的像素,以备后续处理。
38.一种在普查乳房X射线照片中通过数字图像处理自动检测微 钙化的方法,所述方法包括下列步骤:
存储乳房X射线照片的数字表示;
将所述数字表示的亮度值归一化;
在一个区域生长算法中利用一个预定的对比度设置生成一个乳房 掩模,所述乳房掩模规定了所述数字表示中含有乳房组织的区域;以 及
对所述含有乳房组织的区域进行搜索,以寻找微钙化区域。
39.按权利要求38所述的方法,其中所述归一化的步骤包括一 个直方图均衡的步骤。
40.一种在审视乳房X光摄像中通过数字图像处理自动检测微钙 化的方法,所述方法包括下列步骤:
存储乳房X射线照片的数字表示;
搜索所述数字表示的一个区域,以便发现一个种子像素;
利用区域生长算法生成一个规定所述数字表示中含有乳房组织的 区域的乳房掩模,所述利用区域生长算法的步骤包括
利用一个开始于所述种子像素的区域生成函数逐渐将共享一个特 征的最靠近的近邻像素组合在一起,从而生成一个连续的像素组,
利用所述连续的像素组确定一个用以规定所述数字表示中含有乳 房组织的区域的乳房掩模;以及
搜索所述含有乳房组织的区域,以便发现微钙化。
41.按权利要求40所述的方法,其中所述搜索所述数字表示的 一个区域以便发现一个种子像素的步骤包括在所述区域内寻找一个具 有最大灰度值的像素。
42.按权利要求40所述的方法,其中所述将共享一个特征的最 靠近的近邻像素组合在一起的步骤确定每个最靠近的近邻像素是否具 有一个小于对比度阈值的对比度。
43.一种在普查乳房X射线摄影术中通过数字图像处理自动检测 微钙化的方法,所述方法包括下列步骤:
存储乳房X射线照片的数字表示;
根据所述数字表示中的像素计算局部阈值值;
利用高斯差值滤波器对所述数字表示进行滤波,生成一个经过滤 波的图像;
通过将所述经过滤波的图像中的像素与所述局部阈值值进行比 较,再按照所述比较结果调整像素的诸数值,生成一个经过阈值处理 的图像;以及
对所述经阈值处理的图像进行进一步处理,以发现微钙化。
44.一种在普查乳房X射线摄影术中通过数字图像处理自动检测 微钙化的方法,所述方法包括下列步骤:
存储乳房X射线照片的数字表示;
利用遗传算法和训练图像数据库得到至少一个参数的值;以及
在处理所述数字表示的函数内利用所述至少一个参数,以便发现 微钙化。
45.按权利要求44所述的方法,其中所述至少一个参数包括一 个dnn值和一个μCsmin值,其中dnn表示一个最靠近的近邻的距离,而 μCsmin表示检测到的微钙化区域的数目,其中所述函数包括将单像素 表示聚合成表示处于μCsmin个其他微钙化区域的距离dnn内的微钙化的 簇。
46.按权利要求44所述的方法,其中所述至少一个参数包括一 个用于高斯差值滤波器的目标大小。
47.按权利要求44所述方法,其中所述至少一个参数包括至少 一个阈值值。
48.按权利要求44所述的方法,其中所述至少一个参数包括一 个邻域大小。
49.按权利要求44所述的方法,其中所述函数包括一个倾斜局 部阈值函数。
50.按权利要求44所述的方法,其中所述至少一个参数包括直 方图的百分比。
51.按权利要求47所述的方法,其中所述至少一个阈值包括上、 下阈值。

说明书全文

发明涉及从数字乳房X射线照片自动检测成簇的微化 (clustered microcalcification)而不降低放射科医师判读灵敏度的方法 和系统。

乳房X射线摄影术结合其他物理检查是当前乳腺癌普查通常选用 的步骤。由于采用了乳房X射线摄影术普查,据估计降低了30-50% 的乳腺癌死亡率。然而,在1996年,诊断出有185,700左右的新乳腺癌 病例,而有44,300个妇女死于这种疾病。妇女有1/8的可能性被诊断为 患有乳腺癌,而有1/30的可能性会由于这种疾病而死亡。

虽然乳房X射线摄影术术是一种已得到很好研究和标准化的方法, 但仍有10-30%被诊断为患有乳腺癌的妇女,而她们的乳房X射线照 片却被判为阴性。此外,仅有10-20%的患者根据乳房X射线照片的 发现经活体检查证明是癌症。还有,一些评估指出,放射科医师所漏检 的恶性增长有三分之二可以追溯到是由于乳房X射线照片的审视。漏检 的原因有许多,包括:图像质量差,患者体位不合适,判读不精确,纤 维腺组织模糊,X射线照片检测的微妙性,眼睛疲劳,粗心,等等。

为了提高灵敏度,也已提出采用重复判读。然而,这种方法在普查 的X射线照片日益增多的情况下看来并不可取。也可以用计算机辅助诊 断(CAD或CADx)系统作为“第二判读者”,协助放射科医师检测和 诊断机体缺陷。有些研究人员已经用数字计算机来分析乳房X射线照 片上的异常情况。然而,可以认为,这些已知的研究可达到的真阳性检 测与伪阳性检测的比例相当低,不能满足要求。

由于在早期的、可治愈的各种乳腺癌中,敏感的微钙化通常是首先 的并且有时是唯一的X射线照片发现物,甚至在一个可疑的簇中,个别 的微钙化还具有X射线照片表现的一个清楚地限定的范围,所以微钙化 成为自动检测的一个理想目标。用X光检测到的乳腺癌中有30-50% 在乳房X射线照片上有微钙化,而乳腺癌中有60-80%根据显微检查 可看到有微钙化。通过乳房X射线摄影对微钙化的检出概率的任何提高 将导致进一步改善它在检测早期乳腺癌的效果。

虽然有希望用CAD系统来提高医师诊断癌症的能,但问题在于 所有的CAD系统无法检测出人工判读或许能发现的一些感兴趣的区域。 然而,人工判读也会漏检一些以后证明是癌的症兆的感兴趣的区域。漏 检与癌有关的区域称为伪阴性差错,而将正常区域认为是癌则称为伪阳 性差错。

现在还不清楚从业放射科医师怎样将CAD系统的输出纳入到他们 的乳房X射线照片分析之中。还没有任何一种现有的CAD系统可以称 得上能发现一个中等平的放射科医师检测到的所有可疑区域,它们往 往具有高得不能接受的伪阳性差错率。然而,CAD系统能够发现放射医 生可能会漏检的一些可疑区域。

因此,本发明的一个目的就是提供一种从数字乳房X射线照片自 动检测成簇的微钙化的方法和系统。

按照本发明,这个目的和其他一些目的是通过提供这样一种数字乳 房X射线照片自动检测成簇钙化的新颖方法和系统来实现的:首先获取 一个数字乳房X射线照片;然后使剪切数字乳房X射线照片图像所需 的参数最佳化;根据最佳化的剪切参数剪切数字乳房X射线照片,选取 供进一步分析的乳房组织;再使检测成簇的微钙化所需的参数最佳化; 根据最佳化成簇的微钙化检测参数检测成簇的微钙化。

然后,检测到的成簇的微钙化存储起来作为检测图像,加以处理后 显示,从而产生一幅计算机辅助检测图像,由放射科医师审视。

放射科医师首先检查原始的乳房X射线照片,报告一个感兴趣的 可疑区集合S1。再用CAD系统,具体地说是用本发明的CAD系统, 对原始的乳房X射线照片进行操作,报告一个可疑检测区或关注区的第 二集合S2。然后,放射科医师对集合S2进行检查,接受或摒弃集合S2 中的一些成员,形成一个可疑检测区的第三集合,它是集合S2的一个 子集。然后,放射科医师生成一个可疑检测区的第四集合S4,它是集合 S1和S2的交集,供以后诊断处理用。这样就将CAD系统的输出纳入 到放射科医师的乳房X射线照片分析之中,使得检测感兴趣的真阳性区 域的总灵敏度达到最佳。

本发明的其他目的和优点从以下结合附图所作的说明中可以清楚地 看出。

在本说明书的附图中:

图1为例示自动检测数字乳房X射线照片中的成簇的微钙化的系 统的流程图

图2和图3为例示本发明的自动剪切方法和系统的流程图;

图4-10为详细例示本发明的自动剪切方法和系统的流程图;

图11为详细例示本发明的成簇的微钙化检测器的流程图;

图12为例示本发明的3×3的十字形中值滤波器的原理图;

图13为高斯差(DoG)滤波器核的三维曲面图;

图14为图13的DoG滤波器核的通过中心的剖面图;

图15为示出微钙化检测系统的全局阈值处理部分的流程图;

图16为例示本发明的双向局部阈值的流程图;

图17为例示合并全局和双向局部阈值处理结果的流程图;

图18为例示本发明的倾斜局部阈值处理的流程图;

图19为例示本发明的成簇方法的流程图;

图20为例示本发明的成簇方法的原理图;

图21为例示本发明的特征比较过程的流程图;

图22为例示具有每类一个普查函数的分类器的流程图;

图23为例示用于二级分类器的多层感觉器神经网络的原理图;

图24为经过检测和分类后诸测试结果的直方图;

图25为例示本发明的参数最佳化方法的流程图;

图26为分类检测前本发明的自由响应接收机工作特性的曲线图;

图27为分类检测后本发明的自由响应接收和工作特性的曲线图;

图28为示出伪阴性和伪阳性检测的概率之间的关系的概率密度函 数的曲线图;

图29为示出真阴性和真阳性检测的概率之间的关系的概率密度函 数的曲线图;

图30为示出放射科医师和CAD系统检测之间的关系的文氐 (Venn)图;

图31为例示将计算机辅助诊断检测与人工判读相结合以获得最佳 灵敏度的方法的流程图;以及

图32为例示含有一个密度检测器的本发明另一实施例的流程图。

下面将参照这些附图进行说明,在这些附图中相同的标号标记的是 相同的或对应的部分。首先看图1,图中示出了为了检测在一个数字乳 房X射线照片内各微钙化簇的位置而执行的一连串步骤的流程图。

在第一个步骤100,利用诸如数字乳房X射线摄影术系统之类的硬 件,或者通过用激光或电荷耦合器件(CCD)数字化仪对乳房X射线照 片进行数字化,获取一个数字乳房X射线照片。在最佳化剪切步骤200, 从数字乳房X射线照片中截出一个含有乳房组织的矩形分析区,生成一 个与乳房组织相应的二进制掩模在以后各处理步骤中使用,以减少处理 乳房X光射线照片所需的时间。这个二进制掩模还用来将检测限制在图 像中含有乳房组织的一些区域。

在成簇的微钙化检测步骤300,对成簇的微钙化进行检测。先用一 个中值滤波器对剪取的图像进行滤波,以降低噪声,再用最佳高斯差 (DoG)滤波器对图像进行滤波,以增强微钙化。然后,对经DoG滤 波的图像进行最佳阈值检验,以检测可能的微钙化。检测到的这些微钙 化分别紧缩成用单个像素来表示,弃去在乳房区以外所检测到的,余下 的这些微钙化分成簇。然后对这些簇计算出各个特征。在分类步骤400, 将检测到的簇分为可疑类和非可疑类。

自动剪取、成簇的微钙化检测和分类步骤200、300、400所用的参 数在参数最佳化步骤500进行最佳化。这些参数由参数最佳化装置用遗 传算法(GA)最佳化,从而使真阳性检测率最大而使伪阳性检测率最 小。当然,也可采用其他的最佳化方案。

检测到的成簇的微钙化存储在一个图像坐标表内。这些检测结果在 处理步骤600进行处理,将每个微钙化坐标直接加上一个偏移量来补偿 由于剪取步骤所引起的坐标转换。检测到的成簇的微钙化在显示步骤700 用围在成簇的微钙化周围的小方框加以指示。当然也可以采用其他的指 示方式,如指向可疑微钙化的箭头或围在可疑微钙化周围的椭圆之类。

             获取乳房X射线照片的数字表示

获取数字乳房X射线照片的一种方法是用激光或电荷耦合器件 (CCD)扫描仪对X射线照片进行数字化。用这种方式得到的数字图像 通常具有每个像素100μm左右的采样间隔和每个像素10至12比特的 灰度分辨率。在本发明的一个实施例中,X射线照片用California的 Compton放射图像数字成像公司生产的CX812T数字化仪进行扫描, 产生像素间隔为50μm、像素灰度为12比特的数字图像。数字图像的另 一种可能的输入源就是康湼狄格州的Daburg的Trex医疗仪器公司的数 字乳腺X射线摄影机,它的空间分辨力约45μm左右,像素灰度分辨率 为14比特。

数字图像作为乳房X射线照片原像的数字表示存储在计算机可读 的存储介质上。在一个优选实施例中,数字表示或图像存储在一部通用 计算机的2GB硬盘上。通用计算机可以是一部个人计算机,具有以 200MHz运行的双奔腾II微处理器,512MB内存,ViewSonic PT813 监视器,指向装置,以及利盟Optra S1625打印机。系统在Windows NT 操作系统内运行。

                     自动剪取

如图2和3所示,首先对数字乳房X射线图像190进行剪切,从 中截取一个分析区296,产生一个与分析区内乳房组织相应的二进制掩 模298。最好剪取是自动执行的,虽然人工剪取也是可以的。作为一个 预备步骤,先剪切图像是因为乳房组织并没有覆盖整个X射线照片。将 图像处理仅集中在图像上的乳房组织部分可以减少处理图像所需的时 间。此外,在X射线照片上出现的其他项目,如标签和患者信息,也不 予考虑,从而消除了在乳房组织外的伪阴性指示。

下面结合图4至10详细说明自动剪取过程。首先在步骤202,对 图像进行二次采样,使分辨率从50μm降低到400μm,以减少需处理的 数据量。当然,也可将图像按需要降低到其他分辨率。为了可靠地从图 像中截取乳房组织部分并不需要全部的原始图像数据。二次采样从水平 和垂直两个方向每8个像素采集一个像素使数据量减少为1/64。为了从 图像中截取乳房组织部分,损失这点分辨率并不重要。

在步骤204,将一个宽为20个像素的白边界加到二次采样后的图 像各侧的四周。白色相应于用来表示每个像素的这些比特可能给出的最 大像素值。对于具有12比特灰度分辨率的图像来说,最大灰度值为4095。 然后在步骤206,用一个比较高的阈值对加了边界的图像进行二值化, 产生一幅二进制图像。这个阈值选成保证高于乳房组织部分的绝大多数 的像素值。在本发明的一个实施例中,阈值设置为等于图像中部顶端附 近一个像素的灰度值的某个预定百分比。在步骤208,将二进制图像倒 相,即将“1”变为“0”而将“0”变为“1”。在步骤210,将例相的 图像扩张。扩张是一种形态操作,将二进制图像中相邻像素有为“1” 的每个像素变为“1”,而已为“1”的像素保留为“1”。

在步骤212,将已扩张的图像剪切到最大团的大小。所谓团块是 指连续的值为“1”的像素组。这一步骤212从二次采样的乳房X射线 照片表示中除去了高亮度边界,而保证不减弱乳房区域。其他加阈值寻 找边界的技术在处理乳房与边界邻接处的高亮度区域(例如在图像中可 看到乳房的植入物时)上会有相当大的困难。从步骤202得到的、对应 于被剪切的团块中的诸像素位置的、来自原始图像的诸像素被选出,供 以后处理用。注意,这是一个由输入图像中的一些像素构成的简单子集。

在步骤214,对步骤212得出的图像进行直方图均衡。在不同的乳 房X射线照片之间,图像的平均亮度变化相当大。而且,具有不同光密 度特性的不同数字化仪也是乳房X射线照片数字表示中亮度不同的原 因。自动剪取器输出的乳房掩模主要用一个区域生长算法来定义,而这 个算法需要一个能正确起作用的单对比度设置。然而,经验表明,对于 图像输入范围很广的情况来说,单对比度设置不适于在一个宽的图像输 入范围内进行工作。因此,要利用一种自动的直方圆增强处理,将每一 幅图像映射到一个归一的图像空间,再用单对比度设置就没有问题了。

首先,获取图像的直方图。对分辨率为12比特的数据来说,通常, 乳房区域内的大多数数据都落在较低的直方图区间内(对应于灰度值为 0-1000),而边界和标签则落在较高的区间内(相于灰度值为4000-4095 左右)。确定含有典型的乳房数据的高区间值和低区间值。低区间值为 从最小灰度值朝最大灰度值方向移动时可遇到的第一个最高的峰值。高 区间为从最大灰度值朝最小灰度值方向移动时遇到的最后一个零值的区 间。然后,将数据缩减为8比特表示形式,在这个数据型的范围内呈线 性。例如,将落在低区间内的值设为零,将落在高区间内的值设为255, 而其余的数据按线性关系被映射为介于低区间到高区间之间的相应值。

将图像直方图的均衡后,可将经均衡后的图像看作一个矩阵。在步 骤216,将这个图像矩阵分成左、右两半,可以是等面积的,选择较亮 的那一侧。分别计算出处于左、右两半的所有像素的和,进行比较,和 值较大的那一半就是较亮侧。

在对较亮侧进行区域生长前,在步骤218,对算法变量进行初始化。 在步骤220,先检验区域生长成的掩模的大小。如果这是足够大,就接 受这个掩模。否则,就继续处理,寻求掩模。在步骤222,选择图像中 要进行区域生长的那一侧。在步骤224,对这个区域进行搜索,找出它 的最大灰度值。这个值被用来寻找一个像素,以启动一个区域生长算法。 区域生长算法是将共有某些相似特征的已连接的诸像素组合在一起的过 程。特征的选择将影响所得出的区域。区域生长函数的输入是一个灰度 图像和一个开始生长的起点,而输出是一个二进制图像,其中的“1” 表示在已生长区域(即团块)内的像素。区域生长将生成一个单团块, 但这个团块内部可以有一些内孔,也就是一些不属于团块的像素。为了 生长一个团块,要对一个感兴趣的像素的四个最邻近的像素进行考察。 为每一个最靠近的相邻像素计算出对比度。如果对比度低于一个对比度 阈值,就将这个相邻像素置为二进制掩模图像内的“1”。否则,就将 这个相邻像素置为“0”。这种区域生长算法盘旋地从起点或种子像素 向外渐进考察相邻像素直至完成。对于熟悉该技术领域的人员来说,显 然也可以采用其他的区域生长算法。

在步骤226,从上一步骤224标出的像素开始进行区域生长,产生 一个二进制掩模。在步骤228计算机出步骤226产生的掩模的大小,并 在步骤230加以检查。对于这种方法,可能有三种情况会有问题。第一, 搜索区内的最亮点可以是一个乳房外的伪差点。因此,如果所得的掩模 不够大(50个像素),则将搜索区域移动到更靠近图像的这一侧,再加 以搜索。这样重复三次,每次都降低对比度阈值。这相应于采取通过步 骤232和234的路径。第二,可能是半侧选取有错。因此,如果搜索第 一侧没有找到一个有效的乳房掩模,就对乳房图像的另一侧进行搜索。 这相应于采取通过步骤236和238的路径。第三,如果无论在哪一侧都 没有找到一个有效的乳房掩模,就在步骤240将整个乳房图像跟阈值进 行比较,取最大的目标作为乳房掩模。

由于在区域生长算法中采用一个固定不变的对比度值,因此某些掩 模会太大。通常,由于在将原始的乳房X射线照片数字化时有额外光漏 进来,使得在数字化的乳房X射线照片的边缘处形成“拖尾”。可以通 过对图像进行一系列的侵蚀后再进行一系列扩张来减少这些拖尾。侵蚀 是一种形态学的操作,在其中,在一幅二进制图像中的每一个像素都被 置“0”,除非它四邻的所有像素均为“1”。若该像素本来已经是“0”, 则保留该“0”值。但是,首先必需填满掩模内的孔,否则多次侵蚀可 能会将掩模分裂成一些不连接的部分。因此在步骤242用一个从众操作 闭合掩模内的孔。从众操作是一种形态学操作,在其中,在一幅二进制 图像中,若一个像素的多数的相邻像素均为“1”,则将该像素置“1”。 若该像素本来已经是“1”,则保留该“1”值。

然而,另一个问题是有些较小的掩模不像那些较大的掩模能经得住 那样多的侵蚀。因此,作为一个安全措施,在侵蚀和扩张前、后都求出 乳房掩模之和。如果大小减小得太多(即多于50%),就用这两个形态 操作前的原掩模。因此,先在步骤244对掩模进行拷贝,再在步骤246 和248进行侵蚀和扩张。然后在步骤250计算出所得掩模的大小,再在 步骤252与步骤244得到的掩模的大小相比较。如果新的大小小于原有 大小的一半,就在步骤254选择步骤244拷贝的掩模用于以后处理。否 则,就用步骤248得出的掩模。

然后在步骤256,按刚找到(由步骤242或248)的乳房掩模剪取 原始图像(由步骤202得出的)。在所得的掩模对于以后的处理来说太 小的情况下,通常在步骤258进行剪取调整。这种调整是以通过在剪取 的图像内再增添原始图像中的一些像素以增大乳房掩边模界方框的大小 的形式来实现的。

然后在步骤260,对剪取的图像进行自动直方圆增强,如前面结合 步骤214所述。经增强的图像通过一个松区域生长步骤262,产生一个 宽松的掩模。这意味着让图像跟一个较低的阈值进行比较,以产生更多 的取值为“1”的像素。这个掩模分别在步骤264、266和268受到闭孔、 侵蚀和扩张处理,情况与前面的相同,但程度较轻。

在步骤270至276最后一次重复上述同样操作,但剪切调整较小, 而在步骤276执行的是增加对比度值的紧区域生长。紧区域生长步骤276 可以提供较高的对比度值,因为这是刚才剪切过的图像内的区域生长。 这个步骤得出一个对乳房组织很节约的估计。在步骤278,将所得掩模 分割,找出最大的目标,再在步骤280将它的边界方框缩小到刚好围住 这个目标。在这个乳房掩模内仍然可能有一些孔。因此,在步骤282的 剪切调整后,在步骤284将掩模倒相,再在步骤286找出最大的目标。 然后,在步骤288,将这个最大目标剔除后再倒相,从而得到末前掩模。

在步骤290,通过用多次从众操作和扩张闭合末前掩模内的孔,得 到最终掩模。于是按所得掩模剪取图像,完成了自动剪取处理。这种自 动剪取器的一个重要问题是剪取的图像的偏移。这是在原始图像内与剪 取图像左上像素相对应的像素位置。跟踪所有的剪取和剪切调整可以确 定这个偏移量。

自动剪取过程的输出是一个矩形的像素阵列,表示一个二进制掩 模,其中与乳房组织相对应的像素赋予值“1”,而其余的像素赋予值 “0”。也就是说,这个二进制掩模是一个由“1”构成的乳房轮廓,而 背景由“0”构成。

可以将自动剪取器的参数最佳化,以获得更好的乳房掩模。这个过 程将在后面最佳化这一节内说明。

                  成簇的微钙化的检测

现在来看图11,其中详细示出了本发明的成簇的微钙化检测系统 300的流程图。

首先,在降低噪声步骤310,对与在剪取步骤200产生的分析区296 相对应的乳房X射线照片数字表示的那部分,标为剪取子图像302,进 行处理,降低会导致对微钙化不真实检测的数字化噪声。然后在步骤 320,用取决于目标大小的最佳高斯差(DoG)空间核对经降噪的图像 进行滤波,以增强目标与背景之间的差别,从而在经滤波的图像内产生 全局和局部峰。再在步骤340用阈值对经最佳DoG滤波的图像进行处 理,截取表示可能是对微钙化的检测峰。

在步骤350,将检测到的最大值变换成单像素坐标表示方式。在第 一伪阳性去除步骤360将检测到的峰的这种坐标表示与分析区的二进制 掩模相比较,除去处在乳房掩模区以外的伪检测结果。在成簇步骤370, 将分析区内剩下的坐标表示聚集成簇。在特征计算机步骤380计算出剩 下各簇的特征后,再在分类步骤400(图1)除去非可疑的检测。在输 出步骤600,以簇坐标的形式输出其余检测结果,作为检测到的成簇的 微钙化。

下面将详细说明成簇的微钙化过程中的各个步骤。首先是对数字乳 房X射线照片图像进行滤波,降低图像内的噪声。虽然决定图像质量的 主要应是胶片感光剂的颗粒度,但是在数字化的过程中产生了一种噪 声。这种噪声可能在以后被检测出来,成为不真实的检测。在这个系统 中,用的是十字形中值滤波器,因为众所周知它在除去单像素噪声上是 非常有效的。中值滤波器是一种非线性空间滤波器,将每个像素值用在 以感兴趣的一个像素为中心的具有所选大小和形状的核内的各像素的中 值代替。如图12所示,这个十字形是由包括中心像素和它的四个相邻 像素的像素组形成的。十字形保留了比典型的方框形中值滤波器好的线 和,将可能的替换限制在四个相邻的像素,从而减少了边缘发生位移 的可能性。

降低噪声后,图像用一个最佳化的DoG核滤波,以增强微钙化。 滤波是通过将经降噪的图像与DoG核卷积来实现的。在另一个实施例 中,滤波是通过首先求得经降噪的图像和DoG核的快速付立叶变换 (FFT),再将这两个FFT相乘后的积进行逆FFT来实现的。

选取DoG核是因为神经生理学经验表明人类的视觉通路包括一组 对空间频率有选择的“信道”。实际上,在视觉场内的每个点处,有一 些分析图像的由大小调谐的滤波器或掩模。这些空间感受滤波器的操作 可以用DoG很好近似。

二维高斯掩模为 G ( x , y ) = c e - ( x 2 + y 2 ) 2 σ 2 - - - ( 1 )

其中:c将各掩膜元素之和归一化为1,,x和y分别为水平和垂 直指标,而σ为标准差。利用式(1),可将具有不同σ的两个高斯函数 之差表示为: DoG ( x , y ) = c 1 e - ( x 2 + y 2 ) 2 σ 1 2 - c 2 e - ( x 2 + y 2 ) 2 σ 2 2 - - - ( 2 ) 已经证明,当σ2=1.6σ1时,DoG滤波器的响应就非常接近人类空间感 受滤波器的响应。因此,采用人类心理学的启示,将DoG标准离差常 数之比设为1∶1.6。于是,对一个大小(平均宽度)为七个像素的目标, 取σ2=t/2,而根据经验,取σ1=σ2/1.6。

由于微钙化的直径通常在100至300μm的范围内,对于以50μm 分辨率数字化的乳房X射线照片来说,可能的目标的大小相当于2至6 个像素。业已发现,采用一种选择目标大小参数的最佳化技术,诸如在 后面要详细说明的GA,所构成的DoG核具有一个最佳化的目标大小t= 6.01像素。这个目标大小t将取决于诸如需处理的图像的分辨力和规模 之类的因素。一个具有t=6.01像素并且σ2=1.6σ1的DoG波波器的脉冲 响应如图13和14所示。

一旦对经降噪的剪取图像执行了DoG滤波就增强了目标与背景之 差,DoG滤波所得的子图像含有可能的微钙化与背景之间的灰度差。虽 然微钙化大者处在DoG滤波所得的子图像内的高亮度目标之间,但它 们也可能存在于一些平均灰度较高的区域,因此很难可靠分割出来。在 本发明的一个实施例中所用的阈值处理在总体上探讨了这些有关问题, 涉及对全局直方图和局部自适应阈值处理的结果进行成对像素相与处 理。然而,本发明的优选实施例采用了特别关注局部的倾斜局部阈值处 理。

由于目标往往存在于图像的较高灰度区,因此全局阈值可以通过求 得这样一个灰度来近似,使得图像直方图内超过这个灰度的像素在预定 的百分比。全局阈值处理方法的一个实施例如图15所示。局部自适应 阈值处理可以通过根据局部像素灰度均值和标准差改变高、低阈值来实 现。双向局部阈值处理方法的一个实施例如图16所示。

计算出图像的直方图p(rk)后,用来划分出直方图内预定高灰度 像素比例f的灰度阈值g可用下式求得 f = 1 - Σ k = 1 g p ( r k ) - - - - ( 3 ) 其中:rk为第k个灰度,o≤g≤gmax,gmax为图像内的最大灰度。 局部自适应阈值tlo和thi用下式求得

         tlo=kloσNN(x,y)+μNN(x,y)                   (4)

         thi=khiσNN(x,y)+μNN(x,y)                   (5) 其中:klo和khi用来预选σNN(x,y)的倍数,而σNN(x,y)和μNN(x,y) 分别是经DoG滤波的图像内以处在(x,y)处的像素为中心N×N个邻近 像素的局部灰度标准差和局部灰度均值。其他邻域形状,如矩形、圆形、 椭圆形之类,也可使用。灰度落在阈值区间之内(即tlo<灰度<thi)的像 素设置为等于l。f、klo、khi和N的最佳化将在后面结合参数最佳化过程 说明。全局阈值处理的结果可以与局部阈值处理的结果通过相与操作加 以合并,如图17所示。或者也可单用其中的一个阈值处理方法。

图18示出了一种优选阈值处理措施,从中可见,一个N×N的窗口 被施加到输入图像P(x,y)的以像素x,y为中心的邻域上。然后求出 数字乳房X射线照片图像内这个窗所覆盖的那些像素的均值μ(x,y)和 标准差σ(x,y)。局部阈值T(x,y)按下式计算

           T(x,y)=A+Bμ(x,y)+Cσ(x,y)            (6) 其中,N、A、B、C的值在下面将要讨论的参数最佳化阶段计算。对于 图像内的每个x,y位置都计算出相应的T(x,y)值。

数字乳房X射线照片图像还经过DoG滤波,产生一个图像d(x,y)。 通过将经DoG滤波得到的图像d(x,y)的每个像素与相应的阈值值T (x,y)相比较,如果这个像素的灰度大于阈值值不设置为1,否则设置 为0,就得到一个经局部阈值处理的图像ls(x,y)。

与现有的阈值处理方法相比,这种有创造性的局部倾斜阈值处理方 法的优点是根据DoG滤波前的图像而不是根据DOG滤波后的图像来计 算阈值。这就不需要根据背景情况进行校正。在传统的局部阈值处理中, 根据DoG滤波后的图像的均值和标准离差下式计算阈值

                T(x,y)=Bμ(x,y)+Cσ(x,y)       (7)

采用根据DoG滤波的图像计算的局部阈值的问题是DoG滤波后的 图像通常均值接近于零,而标准差明显受目标存在的影响。

根据DoG滤波后的图像的统计特性计算局部阈值有着以下这些缺 点。首先,由于均值接近于零,因此在计算阈值中就失去了一个自由度, 使得阈值基本上是标准差的函数。第二,丧失了输入图像的绝对亮度。 为了防止检测到许多虚假的目标,希望高亮度区域的阈值也较高。然而, 在DoG滤波后的图像内得不到有关输入图像的局部均值的信息。最后, 经DoG滤波的图像的标准离差在有目标的情况下会增大。这是因为如 果原始图像内存在大小适当的局部亮斑,经DoG滤波的图像内就会产 生一些大灰度的值。所以,在一个区域内存在目标将增大局部的标准差, 从而使这个区域的阈值上升。较高的阈值降低了将一个亮斑送至以后各 级处理的概率。

上面刚说明的这种新颖的局部阈值处理方法通过根据输入图像计算 出阈值再用于经DoG滤波的图像解决了上述问题。此外,这里所计算 的阈值包括一个偏置项A,它与局部图像的均值无关。

经阈值处理后,检测结果通过计算阈值处理过程所发现的由连续像 素构成的组的形心或重心变成单像素表示方式。因此,检测结果被表示 为具有逻辑值为1的单像素,而其余的像素具有逻辑值为0。

乳房区以外的伪阳性检测通过将自动剪取器输出的二进制掩模与检 测结果的单像素表示方式进行逻辑与运算来除去。

与恶性生长有关的钙化通常是成簇发生和可扩散的。簇检测模块根 据图19所示的成簇算法来识别各簇。具体地说,在至少有μCsmin个或更 多个检测到的信号相隔小于一个最近相邻距离dnn时就标为一个簇。 μCsmin和dnn的最佳化将在后面结合参数最佳化过程加以说明。图20例 示了对于μCsmin=5和dnn=4情况的成簇过程。

用下面说明的分类器除去附加的伪阳性成簇的微钙化。为每个可能 的成簇的微钙化提取一些特征,如图21所示。在一个优选实施例中, 为每个可能的成簇的微钙化计算8个特征,如下:

1.一个簇内诸点的协方差矩阵的较大特征值(λ1);

2.一个簇内诸点的协方差矩阵的较小特征值(λ1);

3.一个簇内诸点的协方差矩阵的较小特征值与协方差矩阵的较大 特征值之比,相当于一个恰好覆盖一个簇内诸点的椭圆的短轴与长轴之 比;

4.按所检测到的微钙化数除以最大点间距离计算的线密度

5.一个簇内诸点间距离的标准差;

6.一个簇内诸点间距离的均值与最小值之间之差;

7.按最大点间距离与最小点间距离之差计算出簇内点的距离的变 化范围;以及

8.按所检测到的点数除以恰好围住所检测到的这些点的方框的面 积计算出其他一些特征,本发明并不局限于这里所列举的这些特征的数 目或类型。

                          分类检测

簇的各种特征作为输入提供给将可能是成簇的微钙化分为可疑或非 可疑的分类器。实际上,成簇的微钙化检测器只能对原乳房X射线照片 的数字表示内可以与癌关联的关注区域定位。在任何检测器中,总是要 在尽可能多地确定可疑区域位置与减少将正常区域虚报为可疑区域的数 目之间取折衷。CAD系统被设计成能提供可能的最大检出概率,但这是 以可能把很多实际上是正常的区域也虚拟为可疑区域为代价的。通过采 用模式识别技术可以去除许多这些不希望有的错误检测。

模式识别是根据测量结果进行判决的过程。在这种系统中,感兴趣 的区域或检测由检测器定位,再确定是否加以显示。这过程的第一个步 骤是表征检测到的区域。为此,根据每个检测到的区域计算出一些测量 结果。每个测量结果称为一个特征。一个检测到的区域的这些测量结果 的总体称为一个特征向量,向量中的每一个元各表示一个特征值。特征 向量被送到一个普查函数。

由图22可见,分类器使特征向量x加到一组普查函数g(x)上。 图22所示的分类器设计成每类一个普查函数。普查函数是输入特征向 量的单值函数。普查函数可以从训练数据得出,并以多种函数形式实现。 普查函数的输出称为检验统计量。分类过程就是根据具有最大输出值的 鉴别函数去选择一类。将检验统计量与一个阈值相比较,对于超过阈值 的检验统计量来说,与这个特征向量相关联的区域或检测就保留下来, 作为可能的可疑区加以显示。检验统计量低于阈值的,相应区域就不予 显示。

许多方法可用来设计普查函数。本发明所考虑的一种方法是人工神 经网络方法。人工神经网络需要训练,由此,借助于带标记的训练数据 来形成普查函数。

在一个优选实施例中,分类过程是通过一个多层感觉器(MLP) 神经网络(NN)来实现的。当然,也可以采用其他分类装置,例如统 计二次型分类器。只有归为可疑类的可能是成簇的微钙化的才保留下来 提供给放射科医师。或者,也可在个别的微钙化检测的MLP NN分析 和微钙化簇之间进行迭代循环运算。

图23示出了MLP NN的原理图。MLP NN包括一个由J个隐藏 层节点或感觉器410组成的第一层和每类一个的输出节点或感觉器420。 本发明的这个优选实施例用了两个输出节点,分别用于可疑检测类和非 可疑检测类。当然,也可以用多些或少些的类对微钙化的簇进行分类。 计算得的各个特征xi首先乘以相应权系数wij,其中i为表示第i个特征 向量元素的下标,而j为表示第j个第一层节点的下标。各第一层感觉 器410的输出yi分别为由 y j = f { Σ i = 1 d ( ω i , j × x i ) } - - - ( 8 ) 给出的输入加权和的非线性函数,其中d表示特征xi的总数,而f(*) 通常为饱和非线性函数。在这个实施例中,f(*)=tanh(*)。第一层 或隐藏层节点的输出yi乘以第二层相应权系数uj,k后送至输出层节点 420。输出层节点420的输出是输入加权和的非线性函数,表示为 z k ( y ) = f { Σ j = 1 J ( u j , k × y j ) } - - - - ( 9 ) 其中k为表示第k个输出节点的下标。

在这个系统的一个优选实施例中采用了双曲正切函数,因为与其他 函数相比,这个函数可使MLP NN较快得到训练。然而,双曲正切以 外的函数也可由感觉器用来提供输出。例如,可以用线性函数以及平滑 变化的非线性函数,如S形函数。

权系数的值通过对网络进行训练得出。训练包括反复向网络提供一 系列已知类的成员关系的特征向量作为输入。权系数的值用减小实际与 所要求的网络输出之间的均方误差的反向传播算法加以调整。一个可疑 输入的所要求的z1和z2的输出分别为+1和-1,而非可疑输入的所要 求的z1和z2的输出分别为-1和+1。其他误差度量和输出值也可以使 用。

在本系统的这个实施例中,MLP NN用在一个通用计算机上运行 的软件实现。或者,MLP NN也可以用硬件配置实现,对于原来就熟悉 该技术领域的人员来说这是显而易见的。

训练后,每个检测到的成簇的微钙化通过形成差z1-z2的值大于或 等于阈值Θ(即z1-z2≥Θ)的,分类器返回一个+1的值,表示是可疑 成簇微钙化,而对于z1-z2的值小于θ的,返回一个-1的值,表示是非 可疑成簇钙的。

为了使各权系数和第一层的节点数达到最佳,用从一个有978个乳 房X射线照片图像的数据库得出一组训练特征向量对MLP NN作了训 练。

为了开发和测试本发明的CAD系统,首先产生真实数据。真实数 据提供数字图像中作为位置的函数的组织的分类。真实数据由合格的放 射科医师产生,在与癌有关的图像区域上加上相应的真实框。除了乳房 X射线照片图像,放射科医师还可接触到病史和病理报告。

放射科医师用真实框标明了57个感兴趣的含有活体检查确认与成 簇的微钙化有关的癌的区域。然后,用本发明的微钙化检测器对所有的 978个图像进行处理,产生一系列特征向量,而其中的一个子集与57个 真实框有关。随机地选择一半子集特征向量和三倍那样多的与成簇的微 钙化无的特征向量,构成训练特征向量组。用这个训练组对具有预定数 目的隐藏节点的MLP NN进行了训练。其余特征向量用作一个检验数 据库,评估训练后的MLP NN的性能。对MLP NN的训练通过 Levenberg-Marguadt反向传播算法执行。

此外,MLP NN也可以用其他学习算法来进行训练,其中一个层 或者这两个层内具有不同于双曲正切的非线性。在另一个具有S型输出 节点的实施例中,可以得到将成簇的微钙化检测分为可疑的或非可疑的 问题的贝叶斯最佳解。

在检验测试期间对优选实施例的一次在运行中,用MLP NN分类 器消除伪阳性成簇的微钙化前,检测程序发现了在训练和检验两个数据 库内93%左右的真阳性成簇的微钙化,而每幅图像有大约10处伪阳性 成簇的微钙化。在一个具有25个第一层节点的MLP NN结合使用了在 训练期间得出的各最佳权系数后,发现保留了93%的真阳性检测,而成 功地除去了57%的伪阳性检测。图24示出了根据检验数据库进行检验 在经MLP NN分类后的结果的直方图。当然,本发明的MLP NN也可 以按照需要用多些或少些第一层节点来进行工作。

                         显示检测

成簇的微钙化的位置确定后,就在原来的数字化乳房X射线照片 图像上或原图像的拷贝上画出矩形方框,分别围住相应各处的微钙化加 以指示。也可以采用其他措施指示微钙化位置,例如在图像内设置指向 检测点的箭头或画出围住检测点的椭圆等。

这些成簇的微钙化的位置以列有分别界定各簇的左上和右下像素的 行、列坐标的一个表的形式送至显示检测程序。为每个簇计算出最小行、 列坐标和最大行、列坐标。按在该技术领域中众所周知的方式将由最小 和最大的行、列坐标定义的界定框添加到原数字化图像上。所得的图像 作为一个计算机可读文件存储起来,按需要在监视器上加以显示或打印 成一个硬拷贝图像。

在本系统的一个实施例中,所得到的图像保存在具有双奔腾II处 理器和运行Windows NT操作系统的通用计算机的硬盘上,可以在一个 诸如ViewSonic PT813那样的VGA或SVGA监视器上加以审视,或者 用一个诸如Lexmark Optra S1625那样的激光打印机打印出一幅硬拷贝 灰度图像。当然,熟悉该技术领域的人员也可以用其他的硬件设备。

                       参数的最佳化

遗传算法(GA)业已成功地用于许多不同的不易解决的最佳化问 题。本发明的一个优选实施例利用Houck等人开发的GA实现方式(“函 数最佳化的遗传算法”,见Tcch.Rep.,NCSU-IE TR 95-09,1995)寻求 可望的参数设置,该论文已作为参考文献被收入本文。本发明的参数最 佳化过程示于图25。与当前需要人工根据经验调整的计算机辅助诊断系 统相比,这是一种具有独创性的最佳化技术应用。

GA利用诸如变异和有性重组之类的仿真寻优算子对解空间进行搜 索,以使一个适应性(目标)函数达到最大。在这个实施例中,需最大 化的适应性函数反映了使真阳性检测数最大而使伪阳性检测数最小的目 标。使用GA需要确定以下几个问题:目标函数设计,参数集表示,总 体初始化,选择函数的选择,仿真寻优遗传算子(再生机制)的选择, 以及终止准则的标识。

目标函数设计是任何最佳化算法性能好坏的关键因素。检测成簇的 微钙化的功能最佳化问题可以描述为:给定某个有限域D,一个特定的 簇检测参数集合x={t,f,klo,khi,N,μCsmin,dnn},其中x∈D,以及一个目标 数fobj:D→R,其中R标记的是实数集,在D内寻求使fobj最大或最小的 x。在簇检测器采用倾斜局部阈值处理时,还需将参数N、A、B和C最 佳化。X射线成像系统可以最佳化成在保证FR率最小的情况下使TP 率最大。这个目标可以改写成下式那样的泛函形式:

在这里,最大化是目标。对于某个具体簇检测参数,如果超过最小 可接受的TP率TPmin,目标函数就返回FP率的负数,否则,如果TP 率低于TPmin,目标函数就返回一个常数数值FPpenaly=-10。也可以采 用其他目标函数。

由于实数的遗传算法是CPU占用时间方面比二进制遗传算法更为 有效的一种量值表示规则,并且在各复制品之间提供更高的精度和更加 一致的结果,所有本发明采用浮点表示方式表示遗传算法。

本实施例还播下带有一些事先知道会处于搜索空间一个所关注部分 的成员的初始总体,从而以迭代方式改善现有解。此外,成员数限制为 20,以降低评估目标函数的计算开销。

在本发明的一个实施例中,对于用于识别再生候选对象的概率选择 过程来说,采用了归一化几何分级,详细情况可参见前面所述的Houck 等人的著作。分级不易导致由于远高于平均值的一些个体所引起的过早 收敛。分级的基本思想是根据解之间的相对适应性为配对池选择诸解。 这个实施例还采用了在Houck等人的GA中所包括的算术交叉和非一致 变异的默认遗传操作方式。

这个实施例不断对解进行搜索,直至目标函数收敛为止。或者,也 可以在预定的几代后终止搜索。当在一个总体中交叉是主要的来源时, 虽然由于丧失总体分集和/或缺乏改善终止是经济的,但利用变异可以得 出一些均匀的总体,具有更好(更高)的适应性。交叉是指通过组合来 自几个最合适成员的元素产生一个总体的一些新的成员。这相当于使解 保持在搜索空间的最佳部分。变异是指随机改变来自最合适成员的元 素。这使算法退出搜索空间中可能恰好是局部最大值的区域。由于重新 启动可能已收敛的总体证明是有益的,因此进行几次GA的选代,直至 认为平均适应性一致不再增大。

一旦通过使用GA找到了可能的最佳解,就可以用局部搜索来进一 步使最适合的GA解最佳化。本发明的另一个实施例采用这种简化方法 进一步改善最佳化的GA解。

自动剪切系统也可以通过使它的参数,包括对比度、侵蚀数、扩张 数,最佳化而获得改善。使自动剪切器最佳化的方法包括根据训练数据 人工产生乳房掩模、选择一个初始总体以及根据训练数据自动产生乳房 掩模这些步骤。这种方法还包括测量人工产生与自动产生的掩模重叠的 百分比以及自动剪切的乳房组织处在人工产生的掩模外的百分比的步 骤。这种方法还包括以与上述的方式选择获胜成员、产生新成员和迭代 这些步骤,直至预定的目标函数收敛为止。

在图26和27中可以看到分别用最佳化的微钙化检测器和分类器的 输出表示的本发明的系统的自由接收机工作特性曲线。图26示出了检 测分类前最佳化的检测器的性能,而图27示出了检测分类后系统的性 能。

虽然以上结合优选实施例的参数最佳化部分对GA作了说明,但其 他最佳化技术,例如响应表面方法,也是适用的。当然,除了在这里所 说明的以外的处理系统也可以用这里所述的方法,包括GA,最佳化。

         为了获得最佳灵敏度而纳入CAD系统的诸输出

通常用灵敏度和特异性来表示检测与癌有关的可疑区的性能度量。 灵敏度用来度量系统发现可疑区的能力,它被定义为在所考察的病例的 这些可疑区的总数中所能检测到的可疑区的百分比。灵敏度定义为

其中,TP为CAD系统报告为可疑的真正与癌有关的区域的数目, 而FN为知道是癌而没有被报告为可疑的区域的数目。特异性 (Specificity)用来度量系统将正常区域报告为正常区域的能力。特异 性定义为:

其中,TN表示正确识别为非可疑的区域数,而FP表示将不是癌 的报告为可疑的区域数。

当前的CAD系统通过降低FP来增大特异性。然而,FP和TP是 两个耦合量。也就是说,降低FP会导致TP降低。这意味着当以保持 高的特异性为目标时,一些可能检测到的可疑区会被漏掉。

图28和29例示了量TP、FP、TN和FN之间的关系。从审视乳 房X光射线图像得出的度量示为检验统计量x。x的概率密度函数表示 为p(x),而判决阈值表示为θ。如果x大于θ,就报告是一个可疑 区。概率密度函数曲线下的面积表示事件的概率。由图28可见,增大 阈值将减小FP判决的概率。然而,由图29可见,增大阈值同时也减小 了TP判决的概率。

对CAD系统的另一种度量是阳性预测值(PPV),它被定义为, 当一个感举的区域被标记为可疑时,癌症确实存在的概率。PPV可由下 式计算 PPV = TP TP + FP - - - ( 13 )

可见,增大TP或减小FP部将使PPV增大。

放射科医师和计算机发现的可疑区往往有所不同。图30为一个言 文氐图,示出了人和机器检测到的可疑区的可能分布情况。有些可疑区 是由人工判读者或放射科医师单独发现的,有些是CAD系统单独发现 的,而有些是两者都发现的,有些是两者都没有发现的。

图31示出了利用一个CAD系统特别是本发明的CAD系统的输出 与对乳房X光射线图像10的人工判读观察相结合以获得最佳灵敏度的 一种优选方法。在步骤20,放射科医师审视乳房X光射线图像10,得 出一个由可疑区域30构成的集合S1。在步骤40,CAD系统对图像10 进行处理,得出一个由可疑区域50构成的集合S2。然后在步骤60,放 射科医师对集合S2的一些成员,进行考察,并对集合S2的各成员是否 属于可疑作出取舍,形成一个由可疑区域70构成的第三集合S3,它是 集合S2的一个子集。于是,放射科医师在步骤80建立一个由检查区域 90构成的集合S4,它是集合S1与S3的并集。然后建议对检查区域90 作进一步检查,如用更高的分辨率再拍摄一些乳房X射线照片,用超声 波检查乳房组织的检查区域相应的部位,或者对乳房组织进行活体检 查。

图32示出了本发明的另一个实施例,可以看到除了上述这些部分 外,这个实施例还包括密度检测器800、密度分类器900和检测结果合 并器100。密度检测器800对在一份普查的乳房X射线照片的数字表示 中出现的团块和病变进行检测。密度分类器900通过MLP NN将检测 到的密度分为可疑类和非可疑类,情况与前面结合微钙化分类器所述的 MLP NN类似。然后,检测到的归为可疑类的密度区域在检测结果合并 器1000内与检测到的可疑微钙化结果合并在一起。

虽然本发明是结合检测乳房X射线照片内的成簇的微钙化来说明 的,但应该理解这里所述的方法和系统也可用于其他医学图像,如胸部 X光透视。

虽然这里所描述的设备的形式构成本发明的优选实施例,但应当理 解本发明并不局限于设备的这种精确的形式,还应当理解,在不背离在 所附权利要求书中所规定的本发明的范围内,可以作出各种变更。

权利要求如下:

高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈