首页 / 专利库 / 诊断设备和程序 / 血细胞计数 / 白细胞计数 / 一种白细胞自动识别计数方法

一种白细胞自动识别计数方法

阅读:473发布:2020-05-12

专利汇可以提供一种白细胞自动识别计数方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种白细胞自动识别计数方法,包括预处理、色彩空间转换、粗分割、白细胞检出、细分割、特征参数提取、识别分类、结果输出等步骤。该方法通过提取一组细胞特征参数,利用 支持向量机 ,实现了对血液中白细胞的自动识别和分类,分类效率高、效果好、准确度高、 稳定性 好,具有较好的鲁棒性。,下面是一种白细胞自动识别计数方法专利的具体信息内容。

1.一种白细胞自动识别计数方法,其特征在于:包括以下步骤:
(1)预处理:对彩色血液显微图像预处理,得预处理图像;
(2)色彩空间转换:将预处理图像由RGB色彩空间映射到HLS色彩空间,得变换色调图像;
(3)粗分割:使用基于边界支持向量的灰度图像分割方法对变换色调图像粗分割,得粗分图像;
(4)白细胞检出:对粗分图像采用层层筛选策略和数学形态学方法检出所有白细胞,得一组单个白细胞局部色调图像;
(5)细分割:使用聚类分析法确定阈值,结合阈值分割和二值形态学方法对每个单个白细胞局部色调图像细分割,得与背景的分离的白细胞、细胞核和细胞浆图像;
(6)特征参数提取:对白细胞、细胞核和细胞浆图像提取特征参数;
(7)识别分类:由特征参数,利用支持向量机完成对白细胞的识别与分类;
(8)结果输出:统计各类白细胞在血液中所占百分比,显示或打印分析数据结果。
2.根据权利要求1所述的一种白细胞自动识别计数方法,其特征在于:步骤(1)中,预处理方法为图像平滑法或中值滤波法。
3.根据权利要求1所述的一种白细胞自动识别计数方法,其特征在于:步骤(3)中,所述粗分割方法包括以下步骤:于变换色调图像中构建一个紧致的直方图;将所述紧致直方图看作函数关系,利用支持向量回归找到边界支持向量集;在所述边界支持向量集中筛选阈值;利用所述阈值对所述变换色调图像进行阈值粗分割。
4.根据权利要求1所述的一种白细胞自动识别计数方法,其特征在于:步骤(6)中,所述特征参数包括:
(a)形态特征参数:为对白细胞、细胞核的叶数、形状、大小、轮廓的规则程度定量描述的特征参数;
(b)色彩特征参数:为对白细胞、细胞核和细胞浆的亮度、色调、饱和度定量描述的特征参数;
(c)纹理特征参数:为对所述细胞核的纹理特征定量描述的特征参数。
5.根据权利要求4所述的一种白细胞自动识别计数方法,其特征在于:所述形态特征参数及其获取方法,包括:
(1a)细胞面积G1=细胞内象素总数;
(1b)细胞浆与细胞面积比G2=细胞浆像素总数/细胞像素总数;
(1c)细胞圆形度G3=细胞轮廓像素数的平方/(4π×细胞内象素总数);
(1d)细胞的核叶数G4=核分叶的个数;
(1e)细胞核圆形度G5=细胞核轮廓像素数的平方/(4π×核内象素总数);
(1f)细胞核的伸长度:G6=Dmax/Dmin;式中Dmax、Dmin分别表示细胞核在各个方向上投影的最大值、最小值;
(1g)细胞核凹度:G7=1-ρimax(θ1,θ2),其中ρi=1/180°。
6.根据权利要求4所述的一种白细胞自动识别计数方法,其特征在于:所述色彩特征参数及其获取方法,包括:
细胞浆平均值 细胞浆方差 细胞核平均值
细胞核方差 细胞的平均值 细胞的
方差 核浆积分比 细胞与细胞核的变化范围之比
其中,p(i)是灰度值为i的象点在图像中出现的概率,即p(i)=h(i)/s;h(i)为图像中灰度为i的点数,s为图像的总点数;Tn是分割细胞核和细胞浆间的阈值;Tc是分割细胞浆和背景间的阈值;Tmax、Tmin分别是直方图中h(i)的最大和最小灰度级。
7.根据权利要求4所述的一种白细胞自动识别计数方法,其特征在于:所述纹理特征参数及其获取方法,包括:
(3a)灰度方差相关阵纹理特征参数:嗜性核粒细胞中有少而较大的蓝黑色颗粒,亦常掩盖胞核而呈粗纹理;对单核、淋巴细胞,区域灰度较均匀则表现为细纹理;嗜酸性核粒细胞胞浆中充满透明密集的小颗粒介于两者之间;为反映这些纹理上的差异,从归一化后矩阵中提取了度二阶矩、反差矩、熵、对比度和相关系数5个特征,如下:
角度二阶矩
反差矩

第一对比度
相关系数
其中,矩阵元素定义为图像中某象点的δ邻域局部方差u与在θ方向上距离为d的象点的δ邻域局部方差v在图像中共同出现的概率;参数d取2,δ邻域取3×3,θ=
0°,45°,90°,135°;
(3b)灰度方差梯度相关阵纹理特征参数:对于粗纹理的图像,如嗜碱性核粒细胞图像中的较大的颗粒,矩阵中的元素靠近灰度轴分布,而对细纹理时,如单核细胞和中性粒细胞图像,则离开灰度轴沿梯度轴方向散开分布;从归一化后的矩阵中提取了7种纹理特征,如下:
小梯度优势
大梯度优势
灰度分布不均匀性
梯度分布不均匀性
灰度熵
梯度熵
第二对比度
其中,矩阵元素定义为在归一化的灰度方差图像和归一化的梯度图像中,灰度方差值为i,梯度值为j的共同出现的象点对数,其中的梯度图像是采用梯度算子对归一化灰度方差图像作用得到;
(3c)近邻灰度相关阵纹理特征参数:从归一化的矩阵中纹理特征参数,如下:
小数加权量
大数加权量
数值均匀度
二阶矩
其中,矩阵元素定义为图像中灰度为k的、在距离小于d的所有邻近象素,其灰度值相差不超过a的像素个数在图像中出现的概率;参数a取6,d取2。

说明书全文

一种白细胞自动识别计数方法

技术领域

[0001] 本发明属于医疗器械技术领域中白细胞分析仪,特别涉及一种白细胞自动识别计数方法。

背景技术

[0002] 血液细胞大致分为三类:红细胞、白细胞和血小板,其中白细胞又由淋巴细胞、单核细胞、中性粒细胞(细分为中性杆状核粒细胞和中性分叶核粒细胞)、嗜酸性粒细胞、嗜性粒细胞五个亚类组成。在生物学分析领域,尤其是临床检验分析领域,针对不同亚类白细胞进行准确的分类对于诊断和研究有着非常重要的作用,而各个亚类白细胞含量的变化在临床上被用作诊断和治疗的重要指标。例如,急性细菌性感染会造成中性粒细胞增多,寄生虫感染和过敏性疾病等会造成嗜酸性粒细胞增多。
[0003] 目前,白细胞计数法通常可分为目测计数法和自动计数法两种。目测计数法是在计数板上用镜检进行计数的方法,可不经处理直接进行计数,也可先用染色剂将血细胞细胞核染色后再进行计数。目测计数法工作量大、效率低、结果不准确。而自动计数法是将血液稀释到一定浓度后,使其通过极细的流路,用电阻或散射光检测出血细胞,计算血细胞的方法。现有自动计数法通常需要加入溶血剂,红细胞碎片会对白细胞计数值和分类结果产生影响,导致白细胞直方图的左边有明显的边峰存在,从而导致结果不准确。

发明内容

[0004] 发明目的:本发明的目的是提供一种识别效率高、结果准确的白细胞自动识别计数方法。
[0005] 技术方案:本发明提供的一种白细胞自动识别计数方法,包括以下步骤:
[0006] (1)预处理:对彩色血液显微图像预处理,得预处理图像;
[0007] (2)色彩空间转换:将预处理图像由RGB色彩空间映射到HLS色彩空间,得变换色调图像;
[0008] (3)粗分割:使用基于边界支持向量的灰度图像分割方法对变换色调图像粗分割,得粗分图像;
[0009] (4)白细胞检出:对粗分图像采用层层筛选策略和数学形态学方法检出所有白细胞,得一组单个白细胞局部色调图像;
[0010] (5)细分割:使用聚类分析法确定阈值,结合阈值分割和二值形态学方法对每个单个白细胞局部色调图像细分割,得与背景分离的白细胞、细胞核和细胞浆图像;
[0011] (6)特征参数提取:对白细胞、细胞核和细胞浆图像提取特征参数;
[0012] (7)识别分类:由特征参数,利用支持向量机完成对白细胞的识别与分类;
[0013] (8)结果输出:统计各类白细胞在血液中所占百分比,显示或打印分析数据结果。
[0014] 其中,步骤(1)中,预处理方法为图像平滑法或中值滤波法。
[0015] 其中,步骤(3)中,所述粗分割方法包括以下步骤:于变换色调图像中构建一个紧致的直方图;将所述紧致直方图看作函数关系,利用支持向量回归找到边界支持向量集;在所述边界支持向量集中筛选阈值;利用所述阈值对所述变换色调图像进行阈值粗分割。
[0016] 其中,步骤(6)中,所述特征参数包括:
[0017] (a)形态特征参数:为对白细胞、细胞核的叶数、形状、大小、轮廓的规则程度定量描述的特征参数;
[0018] (b)色彩特征参数:为对白细胞、细胞核和细胞浆的亮度、色调、饱和度定量描述的特征参数;
[0019] (c)纹理特征参数:为对所述细胞核的纹理特征定量描述的特征参数。
[0020] 其中,所述形态特征参数包括:
[0021] (1a)细胞面积G1=细胞内象素总数;
[0022] (1b)细胞浆与细胞面积比G2=细胞浆像素总数/细胞像素总数;
[0023] (1c)细胞圆形度G3=细胞轮廓像素数的平方/(4π×细胞内象素总数);
[0024] (1d)细胞的核叶数G4=核分叶的个数;
[0025] (1e)细胞核圆形度G5=细胞核轮廓像素数的平方/(4π×核内象素总数);
[0026] (1f)细胞核的伸长度:G6=Dmax/Dmin;式中Dmax、Dmin分别表示细胞核在各个方向上投影的最大值、最小值;
[0027] (1g)细胞核凹度:G7=1-ρimax(θ1,θ2),其中ρi=1/180°。
[0028] 所述色彩特征参数包括:
[0029] 细胞浆平均值 细胞浆方差 细胞核平均值 细胞核方差 细胞的平均值 细胞
的方差 核浆积分比 细胞与细胞核的变化范围之比
[0030] 其中,p(i)是灰度值为i的象点在图像中出现的概率,即p(i)=h(i)/s;h(i)为图像中灰度为i的点数,s为图像的总点数;Tn是分割细胞核和细胞浆间的阈值;Tc是分割细胞浆和背景间的阈值;Tmax、Tmin分别是直方图中h(i)的最大和最小灰度级。
[0031] 所述纹理特征参数包括:
[0032] (3a)灰度方差相关阵纹理特征参数:嗜碱性核粒细胞中有少而较大的蓝黑色颗粒,亦常掩盖胞核而呈粗纹理;对单核、淋巴细胞,区域灰度较均匀则表现为细纹理;嗜酸性核粒细胞胞浆中充满透明密集的小颗粒介于两者之间;为反映这些纹理上的差异,从归一化后矩阵中提取了度二阶矩、反差矩、熵、对比度和相关系数5个特征,如下:
[0033] 角度二阶矩
[0034] 反差矩
[0035] 熵
[0036] 第一对比度
[0037] 相关系数
[0038] 其中,矩阵元素定义为图像中某象点的δ邻域局部方差u与在θ方向上距离为d的象点的δ邻域局部方差v在图像中共同出现的概率;参数d取2,δ邻域取3×3,θ=0°,45°,90°,135°;
[0039] (3b)灰度方差梯度相关阵纹理特征参数:对于粗纹理的图像,如嗜碱性核粒细胞图像中的较大的颗粒,矩阵中的元素靠近灰度轴分布,而对细纹理时,如单核细胞和中性粒细胞图像,则离开灰度轴沿梯度轴方向散开分布;从归一化后的矩阵中提取了7种纹理特征,如下:
[0040] 小梯度优势
[0041] 大梯度优势
[0042] 灰度分布不均匀性
[0043] 梯度分布不均匀性
[0044] 灰度熵
[0045] 梯度熵
[0046] 第二对比度
[0047] 其中,矩阵元素定义为在归一化的灰度方差图像和归一化的梯度图像中,灰度方差值为i,梯度值为j的共同出现的象点对数,其中的梯度图像是采用梯度算子对归一化灰度方差图像作用得到;
[0048] (3c)近邻灰度相关阵纹理特征参数:从归一化的矩阵中纹理特征参数,如下:
[0049] 小数加权量
[0050] 大数加权量
[0051] 数值均匀度
[0052] 二阶矩
[0053] 其中,矩阵元素定义为图像中灰度为k的、在距离小于d的所有邻近象素,其灰度值相差不超过a的像素个数在图像中出现的概率。例如,给定细胞图像有N级灰度,Nr是图像中一个象数可能邻近的数目,则图像的相邻灰度相关矩阵Q(k,s)是一个N×Nr维的矩阵。参数a取6,d取2。
[0054] 有益效果:本发明提供的白细胞识别方法通过提取一组细胞特征参数,利用支持向量机,实现了对血液中白细胞的自动识别和分类,分类效率高、效果好、准确度高、稳定性好,具有较好的鲁棒性。
[0055] 该方法采用基于边界支持向量的灰度图像分割方法完成色调图像的粗分割,然后筛选出所需的分割阈值,适用于彩色显微图像分割,能有效的克服光照、染色等客观因素的干扰,具有分割效果优、计算效率高、参数设置简便等优点,从而有利于特征参数提取与分类计数,从而保证了对血液中白细胞的自动识别和分类较高的准确度。附图说明
[0056] 图1为本发明的白细胞自动识别计数方法的流程图
[0057] 图2为粗分割方法的流程图;
[0058] 图3为特征参数提取方法的流程图;
[0059] 图4为细胞核凹度参数计算方法的流程图。
[0060] 图5为本发明方法及现有方法对白细胞的检出图。

具体实施方式

[0061] 根据下述实施例,可以更好地理解本发明。然而,本领域的技术人员容易理解,实施例所描述的具体的物料配比、工艺条件及其结果仅用于说明本发明,而不应当也不会限制权利要求书中所详细描述的本发明。
[0062] 白细胞自动识别计数方法,如图1所示,包括以下步骤:
[0063] 步骤101,在显微镜下将血涂片放大到合适的比例,采用扫描显微光密度计或电视摄像机等设备将显微细胞图像转换成数字化细胞图像输入计算机;
[0064] 步骤102,对输入图像进行预处理;
[0065] 步骤103,进行色彩空间转换;
[0066] 步骤104,接下来运用基于边界支持向量的灰度图像分割方法将白细胞从细胞色调图像中分割出来;
[0067] 步骤105,逐个检出白细胞;
[0068] 步骤106,将细胞核和细胞浆分离出来;
[0069] 步骤107,分别对已分割出的白细胞、细胞浆和细胞核抽取颜色、形状和纹理等特征;
[0070] 步骤108,运用支持向量机达到白细胞分类识别的目的;
[0071] 步骤109,待所有白细胞局部图像处理完毕输出统计结果。
[0072] 下面结合图2-4详细说明本发明白细胞自动识别计数方法。
[0073] 1.输入
[0074] 输入一幅彩色血液显微图像 n是图像中像素的数目,I(xi)是像素点xi的像素向量。
[0075] 2.预处理
[0076] 对输入的彩色血液显微图像预处理,以去除彩色血液显微图像中的噪声。可选地,处理方法可使用本领域任意常规方法,优选地包括图像平滑法和中值滤波法。
[0077] 3.色彩空间转换
[0078] 彩色图像的分割通常需要进行彩色空间变换,彩色空间是以数值方式描述色彩的模型,如RGB空间,YIQ空间,HIS空间,CY空间等。由于人眼不能直接感知红绿蓝三色的比例,所以在RGB空间进行图像分割不符合人眼视觉。视觉颜色模型以人眼的视觉特征为基础,用颜色的色调、饱和度和亮度来表示颜色,符合人眼的视觉特性。常用的视觉颜色模型较多,HLS(色调、亮度、饱和度)就是其中之一。HLS模型表示的颜色空间是一个双六棱锥体。色调用红色为起点的角度表示,光沿逆时针方向环绕HLS模型时,颜色将按照下面的顺序出现:红、黄、绿、青、蓝、紫。灰度光的饱和度为0,即S=0。当S=1,L=0.5时的颜色具有最大的饱和度。
[0079] 申请人通过大量的比较实验发现HLS中的色调分量对光照的变化不敏感,对用不同颜色的染色剂得到的细胞图能够保持良好的一致性,有助于后续处理。因此,将预处理图像由RGB色彩空间映射到HLS色彩空间,得变换色调图像。
[0080] 其中,色调分量的转换方法如下:
[0081] 设RGB空间的颜色值(r,g,b)的每个分量范围为[0,1,…,255],令[0082] v′=max(r,g,b),u′=min(r,g,b)及
[0083]
[0084]
[0085] h=60h′
[0086] 色调图像校正公式为:
[0087]
[0088] 其中,校正值h为色调图像的直方图中峰值的对应值。
[0089] 用下述公式对色调图像进行灰度线性变换,增强反差效果。
[0090]
[0091] 其中:(x1,y1)和(x2,y2)分别是线性变换两端点的坐标,f(i,j)是原始图像在点(i,j)处的灰度值,g(i,j)是变换后图像在点(i,j)处的灰度值。
[0092] 4.粗分割
[0093] 使用基于边界支持向量的灰度图像分割方法对变换色调图像粗分割,得粗分图像;
[0094] 具体而言,粗分割方法为:
[0095] (4.1)于变换色调图像中构建一个紧致的直方图;
[0096] (4.2)将所述紧致直方图看作函数关系,利用支持向量回归找到边界支持向量集;
[0097] (4.3)在所述边界支持向量集中筛选阈值,即根据拟合曲线的一阶导数信息,选择位于负值向正值过渡拐点附近的边界支持向量作为阈值;
[0098] (4.4)利用所述阈值对所述变换色调图像进行阈值粗分割。
[0099] 更具体的,如图2所示,设变换色调图像的大小为M*N(其中M为图像的宽度,N为图像的高度),图中每个像素的取值范围是[0,1,2,...,L-1],通常L=360。那么,直方图可以定义成概率分布p(i)=ni/n,ni是取值为i的像素的个数,n是图像中像素的总数,这里n=M*N。显然p(i)≥0且 这样在形成直方图的过程中,可得到一组有序的离散值p(0),p(1),...,p(L-1)。将其中取值为零的p(i)删除,剩余的m个非零p(i)就组成了紧致的直方图,即<p(i0),p(i1),...,p(im-1)>,0≤ij≤L-1,j=0,1,2,...,m-1,p(ij)≠0。
[0100] 将紧致直方图看作一个函数关系,借助支持向量回归找到边界支持向量集。对于支持向量回归,如式(4)所示, 的取值大部分为零。所有对应于 非零值的xi构成了所谓的支持向量集。而所有位于边界上的xi,即满足αi或 等于C的xi,构成了边界支持向量集。边界支持向量集有两点很好的特性:第一,它可以很好地刻画出原始直方图的特性。边界支持向量往往位于局部最大最小点附近,对于图像分割来说,适当选取它们中的若干个作为阈值足以满足分割要求;第二,边界支持向量集通常非常稀疏,仅占全部样本数N的一小部分。支持向量个数的这种稀疏性可仅从少量边界支持向量中选取分割阈值以保证分割的效率。
[0101] 有时边界支持向量集中的元素个数较多,所以还需作进一步筛选。具体地说,就是根据拟合曲线的一阶导数信息,选择位于负值向正值过渡拐点附近的边界支持向量作为阈值。
[0102] 最后,利用所述阈值对所述变换色调图像进行阈值粗分割,即得粗分图像。
[0103] 其中,使用支持向量机对图像直方图进行回归方法如下:
[0104] 假设训练集 输入 输出 N代表D中样本总数。借助非线性映射 x首先被映射成Hilbert空间中的点z=ψ(x)。空间F通常叫做
特征空间,它的维数一般非常高,甚至是无穷维。然后,在F中构建线性函数f(x)=+b,使得它根据某种损失函数偏离训练样本最小。这里采用的是Vapnik的ε-不敏感损失函数,其中ε≥0,它用于控制函数的不敏感度。该函数的具体定义如下:
[0105] 同时该函数应尽可能保持“平坦”(即w的模||w|||应尽可能的小)。在数学上,这意味着
[0106] 最小化
[0107] 约束条件为
[0108] 其中C是由用户事先定义的常数。众所周知,上述问题可转变为如下的二次规划问题:
[0109] 最大化
[0110] 约束条件为 且
[0111] 其中K(·,·)=<ψ(x),ψ(y)>是核函数。
[0112] 用解出的αi和 可以估计回归,具体如下:
[0113]
[0114] 通常图像分割还需利用数学形态学进行结果优化。数学形态学的基本运算有膨胀、腐蚀、开、闭等,其中膨胀和腐蚀是两种最基本的运算,有直观的几何背景,根据它们可定义其他运算。c
[0115] 设A为原始图像,B是对原始图像进行运算的结构元素,且Ab是A被b的平移,A表示A的补集,表示B的反射。
[0116] A被B膨胀的结果:
[0117] A被B腐蚀的结果:
[0118] 二值图像的开运算:
[0119] 开运算的处理效果常表现为使目标轮廓平滑,消除毛刺和孤立点。
[0120] 二值图像的闭运算:
[0121] 闭运算的处理效果常表现为使目标轮廓平滑,填平小沟,弥合空洞和裂缝。
[0122] 5.白细胞检出
[0123] 对于白细胞所在的粗分图像中,一般均存在背景、红细胞、凝血细胞或污渍的干扰,给识别白细胞造成困难,因此必须排除这些干扰,提取出边缘完整的白细胞。
[0124] 本发明对粗分图像采用层层筛选策略和数学形态学方法检出所有白细胞,即得一组单个白细胞局部色调图像。
[0125] 具体而言,层层筛选策略步骤为:先分离出背景,再消除红细胞、凝血细胞和小污渍等噪声点的干扰,最后区分白细胞和较大的污渍。采用该方法不易遗漏白细胞。
[0126] 白细胞区域的灰度值一般比红细胞区域的小,且由于白细胞胞核嵌于具有连通性的细胞浆区内,白细胞呈团状;红细胞经过象素级分类处理,一般只剩边缘部分,呈环状。基于白细胞的细胞核在图像中表现为灰度值最小这样一个事实,根据白细胞的形态参数一次性排除了图像中残余的红细胞、污渍和凝血细胞等的干扰,效果很好,自动快速地提取出白细胞区域子集图。即使在部分红细胞区域与白细胞胞浆区域灰度值相近的情况下,也依然能很好地得到白细胞区域子集图。
[0127] 对于白细胞区域子集图,以其为标识图像,像素级分类后的图像为原图像,用数学形态学进行灰度重构。对各细胞核区域分别计算等灰度值的一阶矩,定出各细胞坐标位置P0,并以之为中心,根据细胞核最大径向大小自适应设置窗口,恢复窗内原始色调图像灰度值,即得一组单个白细胞局部色调图像。
[0128] 6.细分割
[0129] 使用聚类分析法确定阈值,结合阈值分割和二值形态学方法对每个单个白细胞局部色调图像细分割,得与背景分离的白细胞、细胞核和细胞浆图像;
[0130] 对单个白细胞局部色调图像,采用聚类分析法确定阈值Tn和Tc以实现图像三值化。该方法的优点在于,判别准则SW在Tn及Tc取值范围内总是存在着最大值,即总能给出最佳阈值。
[0131] 方法如下:
[0132] 首先计算每类灰度值Mi及类内方差Si。
[0133] 在0-255之间设定阈值Tc,而在1-Tc之间设定阈值Tn;设每类出现概率为P(ki)(i=1,2,3)(k1、k2和k3分别代表细胞核、细胞浆和背景,则每类平均灰度值为:
[0134]
[0135]
[0136] 各类内方差分别为:
[0137]
[0138]
[0139]
[0140] 然后计算类内总方差SW;显然它是Tn和Tc的函数,即
[0141] 最后取SW作为选择最佳阈值的判据,使满足 得到的阈值Tn和Tc即为最佳阈值。此时细胞核、细胞浆和背景之间的灰度值的类间方差达到最大。
[0142] 对去除背景后的二值图像进行r次腐蚀,再以残余为幼芽进行d次扩张,这样可得到去除散状噪声干扰的二值图像;采用区域的形状因子(如面积和圆形度)构成特征函数进行判别排除,以检出细胞核区域;剩下即为细胞浆区域。背景、细胞核和细胞浆依次用0,1,2标记,得到相应与背景分离的白细胞、细胞核和细胞浆图像。
[0143] 7.特征参数提取:
[0144] 对白细胞、细胞核和细胞浆图像提取特征参数。
[0145] 特征抽取是对细胞的定量描述,在细胞的自动识别全过程中占有非常重要的地位,直接影响到分类系统的识别率。
[0146] 一般地,模式分类识别中可提取如下两类特征进行识别:数学模型特征和结构特征。对于以数学模型提取图像特征的方法,分类识别的关键是特征的提取和选择,特征选择是否恰当,将直接影响到分类识别的效果。对白细胞而言,能抽取的细胞特征很多,同时方式也可灵活多样,其关键是寻找以类别的可分离性为准则的最有效的不变特征参量。也就是说,应选择那些最有代表性的属性作为特征。本发明从众多的特征中有选择的提取了47个最有代表性的参数,建立了相应特征的数学模型以供计算机进行定量分析。参数提取方法,见图3,包括以下步骤:
[0147] 读入白细胞、细胞核和细胞浆图像即相应的HLS空间图像;分别提取白细胞、细胞核和细胞浆图像即相应的HLS空间图像的形态特征参数、色彩特征参数以及纹理特征参数,即得特征参数向量;
[0148] 具体而言,所述47个特征参数包括:
[0149] (1)形态特征参数
[0150] 它们是对细胞、细胞核的叶数、形状、大小、轮廓的规则程度的定量描述。
[0151] 包括以下参数:
[0152] (1a)细胞面积G1=细胞内象素总数。
[0153] (1b)细胞浆与细胞面积比G2=细胞浆像素总数/细胞像素总数,对淋巴细胞G2较小,而对单核细胞则较大。
[0154] (1c)细胞圆形度G3=细胞轮廓像素数的平方/(4π×细胞内象素总数)。它是淋巴细胞区分于其他几类细胞的重要的特征参数,对淋巴细胞该值接近1;而中性杆状核粒细胞、单核细胞则最小。
[0155] (1d)细胞的核叶数G4=核分叶的个数,这是中性分叶核粒细胞区分于其他几类细胞的重要的特征参数。对中性分叶核粒细胞G4在2~5之间;中性杆状核粒细胞、单核和淋巴细胞不分叶G4为1;而嗜酸性粒细胞和嗜碱性粒细胞G4小于3。
[0156] (1e)细胞核圆形度G5=细胞核轮廓像素数的平方/(4π×核内象素总数),意义同G3。淋巴细胞G5接近1;而对中性杆状核粒细胞、单核细胞则最小。
[0157] (1f)细胞核的伸长度。为描述中性杆状核粒细胞细胞核的长条性,定义了核伸长度来度量。
[0158] G6=Dmax/Dmin
[0159] 式中Dmax、Dmin分别表示细胞核在各个方向上投影的最大值、最小值。这是区分中性杆状核粒细胞、淋巴细胞、单核细胞的重要特征,对中性杆状核粒细胞G6为最大。
[0160] (1g)细胞核凹度。由于单核细胞的细胞核是呈肾形的,所以研究中给出凹度的度量方法。G7=1-ρimax(θ1,θ2),其中ρi=1/180°,结合图4说明算法如下:首先找出图形的对称轴AB。若对称轴不存在,则以对称差最小的轴作近似对称轴。接着找出C,D两点,使它们的切线与A点的切线垂直,如C不唯一,则取中值。然后定出点G、H,使它们的切线与A点的切线平行。接下来定出F、E,使 定出I、J,使最后求出E点的切线与F点的切线的夹角θ1,再求出I点的切线与J点的切线的夹角θ2。
[0161] 形态特征参数是比较接近于直观性的视觉特征,因而便于寻找和提取,对于区分形态差异较大的典型白细胞,比如分叶状粒细胞、杆状细胞、淋巴细胞效果最佳。
[0162] (2)色彩特征参数
[0163] 不同类型的白细胞的亮度不同,这反映在细胞亮度图像的直方图上所对应的模式不同,如灰度偏向、峰谷数多少、峰值大小等;色调和饱和度也有类似特点。因此,可以用色彩特征参数描述其特性。
[0164] 从细胞亮度图像、色调图像和饱和度图像的直方图中提取下述8大类、合计24个色彩特征参数:
[0165] 细胞浆平均值 细胞浆方差 细胞核平均值细胞核方差 细胞的平均值 细胞的方差
核浆积分比 细胞与细胞核的变化范围之比
[0166]
[0167] 其中,p(i)是灰度值为i的象点在图像中出现的概率。即p(i)=h(i)/s。其中,h(i)为图像中灰度为i的点数,s为图像的总点数;Tn是分割细胞核和细胞浆间的阈值;Tc是分割细胞浆和背景间的阈值;Tmax、Tmin分别是直方图中h(i)的最大和最小灰度级。
[0168] (3)纹理特征参数
[0169] 纹理特征因包含着细胞组织表面结构排列的重要信息,而在识别中起重要作用。与其他类特征相比,它能更好地反映细胞图像的宏观与微观结构性质。
[0170] 由图像变换矩阵提取了16个纹理特征参数,均为从核区域中提取的,包括:
[0171] (3a)灰度方差相关阵:矩阵元素定义为图像中某象点的δ邻域局部方差u与在θ方向上距离为d的象点的δ邻域局部方差v在图像中共同出现的概率。该阵优点是克服了特征对灰度敏感的缺点,它不受细胞染色深浅核图像输入光照条件的影响,只同图像的局部方差相关,与其灰度绝对值无关。局部方差反映了局部灰度变化率,如方差大表示局部灰度不均匀、纹理细;相反,方差小则说明是粗纹理。嗜碱性核粒细胞中有少而较大的蓝黑色颗粒,亦常掩盖胞核而呈粗纹理;对单核、淋巴细胞,区域灰度较均匀则表现为细纹理;嗜酸性核粒细胞胞浆中充满透明密集的小颗粒介于两者之间。为反映这些纹理上的差异,从归一化后矩阵中提取了角度二阶矩、反差矩、熵、对比度和相关系数5个特征,如下:
[0172] 角度二阶矩
[0173] 反差矩
[0174] 熵
[0175] 第一对比度
[0176] 相关系数
[0177] 参数d取2,δ邻域取3×3,为提取旋转不变量,我们取θ=0°,45°,90°,135°四个方向的特征值的均值来表示这5个纹理特征。
[0178] (3b)灰度方差梯度相关阵:矩阵元素定义为在归一化的灰度方差图像和归一化的梯度图像中,灰度方差值为i,梯度值为j的共同出现的象点对数。其中的梯度图像是采用梯度算子对归一化灰度方差图像作用而得到。灰度方差梯度相关阵特点是它集中反映了图像灰度与图像结构信息,又与其灰度绝对值无关。对于粗纹理的图像,如嗜碱性核粒细胞图像中的较大的颗粒,矩阵中的元素靠近灰度轴分布,而对细纹理时,如单核细胞和中性粒细胞图像,则离开灰度轴沿梯度轴方向散开分布。我们从归一化后的矩阵中提取了大(小)梯度优势、灰度(梯度)分布不均匀性、熵和对比度7种纹理特征,如下:
[0179] 小梯度优势
[0180] 大梯度优势
[0181] 灰度分布不均匀性
[0182] 梯度分布不均匀性
[0183] 灰度熵
[0184] 梯度熵
[0185] 第二对比度
[0186] (3c)近邻灰度相关阵:从该阵中提取的特征与图像的空间旋转和灰度值的线性变换无关,这在细胞的实际识别中非常有吸引。矩阵Q中元素定义为:图像中灰度为k的、在距离小于d的所有邻近象素,其灰度值相差不超过a的像素个数在图像中出现的概率。例如,给定细胞图像有N级灰度,Nr是图像中一个象数可能邻近的数目,则图像的相邻灰度相关矩阵Q(k,s)是一个N×Nr维的矩阵。从归一化的矩阵中提取了大、小数加权量、数值均匀度和二阶矩4个旋转不变量特征,如下:
[0187] 小数加权量
[0188] 大数加权量
[0189] 数值均匀度
[0190] 二阶矩
[0191] 参数a取6,d取2。
[0192] 纹理特征反映了细胞核中的颗粒性质,如颗粒的大小、分布密度及核染色结构等,白细胞中的嗜酸、嗜碱和中性类颗粒细胞的区分主要依靠这些特征。
[0193] 8.识别分类
[0194] 由特征参数,利用支持向量机完成对白细胞的识别与分类,对待识别白细胞做出类型判断。
[0195] 利用支持向量机分类方法如下:d
[0196] 设训练样本为xi,i=1,2,…,l,x∈R,对应的期望输出为yi∈{+1,-1},其中+1和-1代表两类的类别标识,l是样本数量,d是每个样本的维数。假定分类面方程为w·x+b=0,为了使得分类面为所有样本正确分类且具备分类间隔,就要满足下列约束条件:
[0197] yi(xi·w+b)-1≥0 (5)[0198] 可以计算出分类间隔为:
[0199]
[0200] 训练的目标是使得分类间隔 最大化,也即||w||2最小化。于是将最优分类问题转化为下列约束优化问题:
[0201] 最小化
[0202] 约束条件为yi(xi·w+b)-1≥0, (8)[0203] 采用拉格朗日乘子法,将问题转化为:
[0204]
[0205] 即目标转化为求L的最小值。分别对w和b求偏微分,令其为0,则转化为对αi求函数的最大值问题,即
[0206] 最大化
[0207] 约束条件为
[0208] αi≥0,i=1,2,…,l
[0209] 如果 为最优解,则: 为最优分类面的权系数向量,此权向量是训练样本的线性组合。对于多数样本, 取值为0,而对取值不为0的Lagrange乘子 必须使得yi(xi·w+b)-1≥0等号成立,这些样本称为支持向量。
[0210] 分类判别函数为:
[0211]
[0212] 对于线性不可分情况,需引入非负变量εi,则约束条件变为:
[0213] yi(xi·w+b)≥1-εi,i=1,2,…,l (13)
[0214] 同时对目标函数引入惩罚项C,得到的目标函数为:
[0215] 最小化
[0216] 在上面的约束条件下求解这个二次规划问题,最终推导所得的Wolf对偶问题与线性可分的情况(式10)类似,唯一的区别在于对αi加了一个上限限制。
[0217] 最小化
[0218] 约束条件为
[0219] C≥αi≥0,i=1,2,…,l (17)[0220] 根据以上条件求取最小值,求解得到的最优分类函数形式同式(12)。
[0221] 在线性不可分情况下得到的最优分类面,称作广义最优分类面。
[0222] 对于非线性问题,超平面的分类能力有时得到的结果不能令人满意,这时可以通过非线性变换将问题转化为在某个高维空间中可以解决的线性问题,在高维空间中求最优分类面。将特征数据映射到更高维的特征空间H中后,这些数据很可能变成线性可分,然后再在H中构造出能够进行区分开类别之间的最优或广义最优分类面。由于不管是分类函数还是优化函数都仅涉及样本间的内积运算,所以在映射变换后的高维空间中也只需进行内积运算 即可。假设有非线性映射 能够将输入空间的样本数据映射到高维(也可能是无穷维)的特征空间H中,假使能找到某个函数K使得那么就可以在高维空间中直接进行内积运算,实现这种内积运算可
以利用原空间中的函数得到的。根据泛函的相关理论知识,只要一种核函数K(xi,xj)满足Mercer条件,则它对应某一变换空间中的内积,即 因此利用核函数
作替换,能够实现在某一非线性变换的情况下得到线性分类,而又没增加计算复杂度,此时的目标函数(15)变为:
[0223]
[0224] 相应的分类判别函数变为:
[0225]
[0226] 9.输出结果
[0227] 统计各类白细胞在血液中所占百分比,显示或打印分析数据结果。
[0228] 下面给出利用上述方法自动识别白细胞的实例。
[0229] 白细胞识别计数,设置六组待检测白细胞,结果见图5,其中:
[0230] (a)为原始血液显微彩色图像;
[0231] (b)现有方法1得到的检出图;参见:杨晓敏,罗立民,韦钰.人体白细胞自动分类方法与系统实现[J].计算机学报,1994,17(2):130-136.
[0232] (c)现有方法2得到的检出图;参见:SOBREVILLA P,MONTSENY E,KELLER J.White blood cell detection in bone marrow images[C].Fuzzy Information Processing society18th Int.Conf.North American,10-12,403-407,June 1999.
[0233] (d)本发明方法得到的检出图。
[0234] 由图5可知:
[0235] 现有方法1基本能够将显微细胞彩图中的所有白细胞检出,即检全率较高;然而,该方法不能保证检出的白细胞边缘的完整性,即检准率较低,例如a3和a4中显微细胞图的检出结果图b1和b2中,有部分甚至全部细胞浆未被检出。此外,该方法受光照、染色等因素的影响较大,即适应性能较低。
[0236] 现有方法2得到的白细胞边缘比较完整;然而,由于染色层次的渐变性,该方法不可避免地受到了周围红细胞或背景的干扰;同时,该方法需要确定过多的参数和函数式,检验较困难。
[0237] 由检出图可以看出,本发明提出白细胞自动识别计数方法,不仅检全率高,能够将显微细胞彩图中的所有白细胞检出,同时检准率高,得到的白细胞边缘比较完整;此外,该方法适应性能高,受外界因素如光照、染色等因素影响小,同时,该方法操作简单、实时性能高。
[0238] 利用本发明提出白细胞自动识别计数方法采集到247幅细胞图像,其中165幅用于训练系统,其余的82幅用于测试系统性能。测试结果见表1。总体识别准确率达98.67%。
[0239] 表1本发明白细胞自动识别计数方法准确率
[0240]
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈