首页 / 专利库 / 人工智能 / 机器学习 / 人工神经网络 / 前馈神经网络 / 多层感知器 / 基于集成级联架构的生物显微图像分类方法

基于集成级联架构的生物显微图像分类方法

阅读:1004发布:2020-09-22

专利汇可以提供基于集成级联架构的生物显微图像分类方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于集成级联架构的 生物 显微图像分类系统,其特征在于所述系统包括若干层的集成分类器,所述集成分类器依层 串联 连接形成集成级联架构,每一层集成分类器由一个具有若干个基分类器的集成分类器构成,且每一层集成分类器对生物显微图像分类目标进行分类结果评判时,在当前层无法判定的分类目标将被拒绝分类而传递到下一层,由下一层的集成分类器进行分类处理,依次循环;当所有层的集成分类器均无法对生物显微图像分类目标进行自动分类时,交由人工 专家系统 进行分类。实验证实,在合理的拒分率范围内,此系统可显著提高生物 显微镜 图像分类的可靠性和准确率。,下面是基于集成级联架构的生物显微图像分类方法专利的具体信息内容。

1.一种基于集成级联架构的生物显微图像分类系统,其特征在于所述系统包括若干层的集成分类器,所述集成分类器依层串联连接形成集成级联架构,每一层集成分类器由一个具有若干个基分类器的集成分类器构成,且每一层集成分类器对生物显微图像分类目标进行分类结果评判时,在当前层无法判定的分类目标将被拒绝分类而传递到下一层,由下一层的集成分类器进行分类处理,依次循环;当所有层的集成分类器均无法对生物显微图像分类目标进行自动分类时,交由人工专家系统进行分类;
所述系统为两层的集成分类器串联连接而成,所述系统后端连接人工专家系统;
第一层集成分类器内构建有若干组分类专家,所述分类专家对导入的生物显微图像分类目标进行分类,并提交分类结果;每组分类专家内构建有若干个两类的支持向量机,此支持向量机只对所有分类对象分为正类和负类;每个支持向量机只根据生物显微图像分类目标的某种分类数据进行判别生物显微图像分类目标是否属于此类;
第一层集成分类器最终的分类结果由投票机制决定,投票结果应用拒绝分类判别函数,不满足判别条件的生物显微图像分类目标将不做分类而传递到下一层集成分类器;
第二层集成分类器由若干个多层感知器集合而成,每个多层感知器设置有1个隐藏层和1个含有K个输出节点输出层;所述隐藏层采用sigmoid函数,所述输出层采用线性函数作为激活函数;当一个待分类的生物显微图像分类目标进入时,所有的多层感知器均将对其分类,最终结果将会通过投票得到;最终的分类结果由投票机制决定,投票结果应用拒绝分类判别函数,不满足判别条件的生物显微图像分类目标将不做分类而传递到人工专家系统。
2.根据权利要求1所述的基于集成级联架构的生物显微图像分类系统,其特征在于所述支持向量机和多层感知器均使用随机子空间方法对训练特征向量进行随机抽取训练。
3.根据权利要求2所述的基于集成级联架构的生物显微图像分类系统,其特征在于所述特征向量通过选自曲线波变换、灰度共生矩阵、基于完整局部二值模式的至少一种进行特征抽取后组成特征向量。
4.一种采用权利要求1所述的基于集成级联架构的生物显微图像分类系统进行分类的方法,其特征在于所述方法包括先通过第一层集成分类器对生物显微图像分类目标进行分类;当第一层集成分类器无法判定生物显微图像分类目标的最终分类结果时,将被拒绝分类而传递到下一层,由下一层的集成分类器进行分类处理,依次循环直至最后一层集成分类器分类结束;当所有层的集成分类器均无法对生物显微图像分类目标进行自动分类时,交由人工专家系统进行分类的步骤。
5.根据权利要求4所述的方法,其特征在于所述方法中拒绝分类判别机制是通过阈值作为拒绝分类的判定规则。
6.根据权利要求4所述的方法,其特征在于所述方法中所述系统为两层的集成分类器串联连接而成,所述系统后端连接人工专家系统,对于具有M个基分类器的集成分类器,采用简单的阈值作为拒绝分类的判定规则,阈值t按照式(I)确定:
其中,M为多层感知器的个数,t为判定的阈值。

说明书全文

基于集成级联架构的生物显微图像分类方法

技术领域

[0001] 本发明属于智能图像分析领域,尤其是生物显微镜图像的高可靠性分类方法,具体涉及一种基于集成级联架构的生物显微图像分类方法。

背景技术

[0002] 真核细胞具有很多被称为细胞器的组成部件,每一个细胞器都含有一个特定的蛋白质位置,因此,他们具有不同的生化属性。对于理解细胞的功能以及构造方式以及捕捉细胞的激活行为而言,确定其蛋白质的位置是至关重要的。研究表明,蛋白质的错位和很多疾病如代谢紊乱、癌症有着紧密的联系。因此,细胞蛋白质的检测分类对于早期疾病的诊断甚至药物的疗效监测都是一个很有效的方法。
[0003] 目前广泛使用的亚细胞蛋白质位置检测方法是荧光显微法。近年来,有很多基于荧光显微镜图像的亚细胞蛋白质位置检测方法。以正确的细胞图像分割基础,显型检测问题就成为了一个多类的图像分类问题,包含两个主要的步骤:特征表示和分类。
[0004] 一般来说,大部分的基于图像的细胞结构分析使用多种图像特征的组合来表示图像,例如形态学、边缘、纹理、几何特征、矩以及小波特征。最近,图像特征描述方法的进步产生了一些“拿来即用”的特征提取方法,这些方法可以直接应用于生物图像分析领域。这里使用曲线波变换(Curvelet Transform)、灰度共生矩阵的统计特征和局部纹理特征组合的图像描述方法,得到了较好的图像分类效果。
[0005] 另一方面,大量的机器学习和智能计算方法已经进入到生物体图像分析领域,例如人工神经网络支持向量机(SVM)等。这些工具已经广泛地用于荧光显微镜图像的分类以及亚细胞蛋白质的分类中。然而,生物显微镜图像具有一个显著的特点:图像具有较大的类间相似性和类内相异性,这决定了使用常用的分类器难以达到很好的分类边界。此外,由于多种图像特征的组合使用,特征的维数不断增加,使得特征向量的维数超过了训练集的样本数。采用分类器集成机制(Classifier Ensemble)将解决单一分类器所存在的问题,提高分类的效果。针对特征维数问题,采用随机子空间(Random Subspace)方法可以有效地降低特征维数,同时,还可以提高集成分类器的多样性,进一步提升分类效果。
[0006] 以往的生物显微镜图像分类中,只把分类正确率作为唯一的评判标准,然而,在很多生物医学问题中,更为重要的是分类的结果的可靠性。例如,在癌症早期的诊断和药物药效研究中,应该将无法可靠评估和分类的案例拒绝分类,交给其他工具或专家处理,这样,可以大大降低错误分类造成的严重后果。因此,在计算机辅助诊断(Computer Aided Diagnosis)中引入拒绝分类机制,将可以大大提高系统的可靠性,使得系统误判的概率大大降低,避免由于误判所带来的险。

发明内容

[0007] 本发明目的在于提供一种基于集成级联架构的生物显微图像分类系统,解决了现有技术中图像分类效果差、系统误判概率较大等问题。
[0008] 为了解决现有技术中的这些问题,本发明提供的技术方案是:
[0009] 一种基于集成级联架构的生物显微图像分类系统,其特征在于所述系统包括若干层的集成分类器,所述集成分类器依层串联连接形成集成级联架构,每一层集成分类器由一个具有若干个基分类器的集成分类器构成,且每一层集成分类器对生物显微图像分类目标进行分类结果评判时,在当前层无法判定的分类目标将被拒绝分类而传递到下一层,由下一层的集成分类器进行分类处理,依次循环;当所有层的集成分类器均无法对生物显微图像分类目标进行自动分类时,交由人工专家系统进行分类。
[0010] 优选的,所述系统为两层的集成分类器串联连接而成,所述系统后端连接人工专家系统。
[0011] 优选的,第一层集成分类器内构建有若干组分类专家,所述分类专家对导入的生物显微图像分类目标进行分类,并提交分类结果;每组分类专家内构建有若干个两类的支持向量机;每个支持向量机只根据生物显微图像分类目标的某种分类数据进行判别生物显微图像分类目标是否属于此类。
[0012] 优选的,第一层集成分类器最终的分类结果由投票机制决定,投票结果应用拒绝分类判别函数,不满足判别条件的生物显微图像分类目标将不做分类而传递到下一层集成分类器。
[0013] 优选的,第二层集成分类器由若干个多层感知器集合而成,每个多层感知器设置有1个隐藏层和1个含有K个输出节点输出层;所述隐藏层采用sigmoid函数,所述输出层采用线性函数作为激活函数;当一个待分类的生物显微图像分类目标进入时,所有的多层感知器均将对其分类,最终结果将会通过投票得到;最终的分类结果由投票机制决定,投票结果应用拒绝分类判别函数,不满足判别条件的生物显微图像分类目标将不做分类而传递到人工专家系统。
[0014] 优选的,所述支持向量机和多层感知器均使用随机子空间方法对训练特征向量进行随机抽取训练。
[0015] 优选的,所述特征向量通过选自曲线波变换、灰度共生矩阵、基于完整局部二值模式的至少一种进行特征抽取后组成特征向量。
[0016] 本发明的另一目的在于提供一种采用所述的基于集成级联架构的生物显微图像分类系统进行分类的方法,其特征在于所述方法包括先通过第一层集成分类器对生物显微图像分类目标进行分类;当第一层集成分类器无法判定生物显微图像分类目标的最终分类结果时,将被拒绝分类而传递到下一层,由下一层的集成分类器进行分类处理,依次循环直至最后一层集成分类器分类结束;当当所有层的集成分类器均无法对生物显微图像分类目标进行自动分类时,交由人工专家系统进行分类的步骤。
[0017] 优选的,所述方法中拒绝分类判别机制是通过阈值作为拒绝分类的判定规则。
[0018] 优选的,所述方法中所述系统为两层的集成分类器串联连接而成,所述系统后端连接人工专家系统,阈值t按照式(I)确定:
[0019]
[0020] 其中,M为多层感知器的个数。
[0021] 本发明提供了一种基于集成级联架构的生物显微图像高可靠性分类方法,采用级联(Cascade)的若干层(优选两层)集成分类器的模型,在每一层分类器中加入拒绝分类评估模,可靠性评估低于设定标准的分类对象将会被当前层拒绝分类并传递到下一层继续处理,若计算机自动无法分类的,则交由人工专家决定。本发明技术方案获得的级联集成分类模式的生物显微镜图像分类系统,提高了生物显微镜图像的分类精度并保证了系统分类结果的可靠性。
[0022] 本发明技术方案中生物显微镜图像可以采用多种图像特征提取方法组合行特征提取。使用的特征提取方法包括但不限于:
[0023] (1)曲线波变换(Curvlet Transform):
[0024] 曲线波变换是最近提出的一种非自适应变换,和小波变换相比,曲线波变换具有提取图像方向性特征的能,例如图像中的边缘。曲线波变换将生物显微图像变换到不同的频率子带(Sub-band)中,然后对各个频率子带进行特征统计,均值、方差和熵用作子带的统计特征。当每幅图像变换后具有n个子带时,将得到一个3n维度的曲线波特征向量。
[0025] (2)灰度共生矩阵(Gray Level Co-occurrence Matrix)统计特征[0026] 生物显微图像的全局纹理特征使用灰度共生矩阵的多个统计特征组合得到。灰度共生概率提供了一种生成图像特征的二阶方法。
[0027] (3)局部纹理特征的提取
[0028] 基于完整局部二值模式(Completed Local Binary Pattern,CLBP)用于提取生物显微镜图像的局部纹理特征。将提取三个通道的LBP,分别为CLBP_S,CLBP_M和CLBP_C,三个通道的特征最终生成一个3维的交叉直方图用于描述图像局部纹理特征。
[0029] (4)多特征融合
[0030] 以上提取的多种特征将被规范化到[-11]范围内,并连接组成特征向量。
[0031] 为达到高可靠性分类,本发明采用级联两层集成分类器的架构形式,每一层分类器由一个具有多个基分类器的集成分类器(Ensemble)构成,并拥有对分类结果的评判机制——拒绝分类机制(reject option),在当前层无法判定的分类目标,将被拒绝分类(reject)而传递到下一层由下一层的集成分类器进行分类处理,而最终计算机无法自动分类的图像将交由人工专家进行分类。集成、级联架构和拒绝分类机制的使用可确保分类的可靠性。
[0032] 在对所有的分类器进行训练时,采用随机子空间方法(Random Subspace)随机抽取一定比例的特征向量进行训练,因此,每个SVM得到的训练数据都可能是不同的,这样可以加大集成分类器内部的多样性(diversity),而很多研究已经表明,当集成分类器内部的多样性增加时,往往可以得到更好的分类效果。
[0033] 第一层的集成分类器将由如下方式构成,对于一个K类的分类问题,首先为每一类分类图像构建一个两类的(binary)支持向量机(SVM),此支持向量机只对所有分类对象分为正类和负类,即,SVMi只针对第i类的分类数据进行判别是否属于此类,因此,对于K类的分类问题,将构建K个SVM用于分别响应每一类的分类对象。从SVM1到SVMk共K个SVM合称为一个分类专家(Expert),第一层的集成分类器集成M个分类专家,其中,M的大小可以由实验决定。当有一个待分类图像进入时,所有的分类专家都对此对象进行分类,提交分类结果,最终的分类结果将由投票机制决定(Majority Voting),此时,对于投票结果应用拒绝分类判别函数(reject option),不满足判别条件的对象将不做分类而传递到下一层。
[0034] 被第一层分类器拒绝的图像将会传递到第二层进行分类。第二层的分类器由多层感知器(Multi-Layer Perceptron,MLP)集合构成。每个MLP由一个隐藏层和K个输出节点,每一个对应一个类标签。MLP的隐藏层使用sigmoid函数,输出层用线性函数作为激活函数。同样,当一个待分类图像进入时,所有的MLP都将对其分类,最终结果将会通过投票得到,当分类结果达不到判别要求时,拒绝分类机制同样会把此对象传递到下一层(人工专家)进行分类。和第一层的SVM集合一样,MLP集成分类器同样使用随机子空间方法对训练特征向量进行随机抽取以增加MLP集合的多样性。
[0035] 对于具有M个基分类器的集成分类器,采用简单的阈值作为拒绝分类的判定规则,例如:
[0036] 其中,t为判定的阈值。
[0037] 在实际的分类应用中,阈值t的大小可以由实际问题环境而定,对于投票机制来说,投票的基分类器的一致性越高,得到的可靠性越高,然而,在一般的集成分类器中,较高的阈值一般会带来较高的拒绝分类比例,使用集成分类器级联的分类架构,可以在确保高可靠性的前提下,把拒绝分类的比例控制在低范围以内。
[0038] 相对于现有技术中的方案,本发明的优点是:
[0039] 本发明通过构建可靠准确的生物显微镜图像分类体系,解决了现有技术中图像分类效果差、系统误判概率较大等问题。本发明采用特定的图像特征提取方法用于提取生物显微镜图像特征,使用随机子空间方法用于训练两层集成分类器,在集成分类器中加入可靠性评判机制,可靠性不高的对象将被拒绝分类,交由下一层处理。实验表明,在合理的拒分率范围内,此设计体系可显著提高生物显微镜图像分类的可靠性和准确率。附图说明
[0040] 下面结合附图及实施例对本发明作进一步描述:
[0041] 图1为本发明基于集成级联架构的生物显微图像高可靠性分类系统的总体架构图。
[0042] 图2为第一层集成分类器结构的结构示意图。
[0043] 图3为第二层集成分类器的结构示意图。
[0044] 图4为生物显微镜图像示例;
[0045] 图5为用于提取图像局部纹理特征的LBP模型;
[0046] 图6为不同拒分率下的分类准确率与可靠性比较;
[0047] 图7为拒分率2.7%下的10类图像的分类结果。

具体实施方式

[0048] 以下结合具体实施例对上述方案做进一步说明。应理解,这些实施例是用于说明本发明而不限于限制本发明的范围。实施例中采用的实施条件可以根据具体厂家的条件做进一步调整,未注明的实施条件通常为常规实验中的条件。
[0049] 实施例
[0050] 本实施例中基于集成级联架构的生物显微图像高可靠性分类系统的总体架构图如图1所示,为达到高可靠性分类,采用级联两层集成分类器(classifier Ensemble)的架构形式,为用于生物显微图像(cell phenotype images)分类的集成级联总体分类架构。每一层分类器由一个具有多个基分类器的集成分类器(Ensemble)构成,并拥有对分类结果的评判机制—拒绝分类机制(reject option),在当前层无法判定的分类目标,将被拒绝分类(rejects)而传递到下一层由下一层的集成分类器进行分类处理,而最终计算机无法自动分类的图像将交由人工专家进行分类。在当前层判定的分类目标为容易的分类目标(easy objects classified),未在当前层判定的分类目标为容易的分类目标(more difficult objects classified)。集成、级联架构和拒绝分类机制的使用可确保分类的可靠性。
[0051] 本实施例采用2层集成分类器结构为例进行具体说明。如图2所示,为第一层集成分类器结构的结构示意图。第一层的集成分类器将由如下方式构成,对于一个K类的分类问题,首先为每一类分类图像构建一个两类的(binary)支持向量机(SVM),此支持向量机只对所有分类对象分为正类和负类,即,SVMi只针对第i类的分类数据进行判别是否属于此类,因此,对于K类的分类问题,将构建K个SVM用于分别响应每一类的分类对象。从SVM1到SVMk共K个SVM合称为一个分类专家(Expert),第一层的集成分类器集成M个分类专家,其中,M的大小可以由实验决定。当有一个待分类图像(image feature)进入时,所有的分类专家都对此对象进行分类,提交分类结果(decision),最终的分类结果将由投票机制决定(Majority Voting),此时,对于投票结果应用拒绝分类判别函数(reject option),不满足判别条件的对象将不做分类(rejected images)而传递到下一层;满足判别条件的对象作为已分类的对象(classified images)。
[0052] 如图3所示,为第二层集成分类器的结构示意图(多层感知器集合)。被第一层分类器(Stage 1)拒绝的图像将会传递到第二层进行分类。第二层的集成分类器由多层感知器(Multi-Layer Perceptron,MLP)集合(Ensemble)构成(示意图中为M个)。每个MLP由一个隐藏层和K个输出节点,每一个对应一个类标签。MLP的隐藏层使用sigmoid函数,输出层用线性函数作为激活函数。同样,当一个待分类图像进入时,所有的MLP都将对其分类,最终结果将会通过投票得到,当分类结果达不到判别要求时,拒绝分类机制同样会把此对象传递到下一层(人工专家)进行分类。和第一层的SVM集合一样,MLP集成分类器同样使用随机子空间方法(random subspace)对训练特征向量进行随机抽取以增加MLP集合的多样性。
[0053] 本实施例的拒绝分类判别机制对于具有M个基分类器的集成分类器,采简单的阈值作为拒绝分类的判定规则,例如:
[0054] 其中,t为判定的阈值。
[0055] 在实际的分类应用中,阈值t的大小可以由实际问题环境而定,对于投票机制来说,投票的基分类器的一致性越高,得到的可靠性越高,然而,在一般的集成分类器中,较高的阈值一般会带来较高的拒绝分类比例,使用集成分类器级联的分类架构,可以在确保高可靠性的前提下,把拒绝分类的比例控制在低范围以内。
[0056] 在对所有的分类器进行训练时,采用随机子空间方法(Random Subspace)随机抽取一定比例的特征向量进行训练,因此,每个SVM或多层感知器得到的训练数据都可能是不同的,这样可以加大集成分类器内部的多样性(diversity),而很多研究已经表明,当集成分类器内部的多样性增加时,往往可以得到更好的分类效果。
[0057] 这些特征向量可以通过生物显微图像特征抽取后获得。如图4所示为生物显微镜图像示例。对于如图4所示的生物显微镜图像,采用多种图像特征提取方法组合行特征提取。使用的特征提取方法包括:
[0058] (1)曲线波变换(Curvlet Transform)
[0059] 曲线波变换是最近提出的一种非自适应变换,和小波变换相比,曲线波变换具有提取图像方向性特征的能力,例如图像中的边缘。曲线波变换将生物显微图像变换到不同的频率子带(Sub-band)中,然后对各个频率子带进行特征统计,均值、方差和熵用作子带的统计特征。当每幅图像变换后具有n个子带时,将得到一个3n维度的曲线波特征向量。
[0060] (2)灰度共生矩阵(Gray Level Co-occurrence Matrix)统计特征[0061] 生物显微图像的全局纹理特征使用灰度共生矩阵的多个统计特征组合得到。灰度共生概率提供了一种生成图像特征的二阶方法。共提取22个基于灰度共生矩阵的统计特征用于描述生物显微图像的全局纹理特征,见表1。
[0062]
[0063] 表1用于描述生物显微镜图像的22个灰度共生矩阵统计特征
[0064] (3)局部纹理特征提取
[0065] 基于完整局部二值模式Completed Local Binary Pattern(CLBP)用于提取生物显微镜图像的局部纹理特征。LBP的工作流程见图5。将提取三个通道的LBP,分别为CLBP_S,CLBP_M和CLBP_C,三个通道的特征最终生成一个3维的交叉直方图用于描述图像局部纹理特征。
[0066] (4)多特征融合
[0067] 以上提取的多种特征将被规范化到[-11]范围内,并连接组成特征向量。
[0068] 本实施例应用于一个具有10个类别的生物显微图像开放测试图像库(2DHela)的参数设定如下:
[0069] 图像特征维数:666。其中,Curvelet采用5层分解,共82个子带,每个子带3个特征,共246;灰度共生矩阵共提取表1中22个特征,每个维度为10,共220;局部纹理特征CLBP直方图的维数为200。
[0070] 第一层的SVM集成分类器,SVM的γ参数设定为5.0,C参数设定为3.0。第二层的MLP集成分类器,采用3层的网络结构,输入节点数目等于特征维数,20个隐藏节点和1个输出节点表示类标签。MLP使用共轭梯度算法迭代训练500次。
[0071] 随机子空间每次随机抽取80%的特征用于分类器训练,集成分类器大小设定为25。
[0072] 图6为采用本发明技术方案的分类结果,可以看到,在合理的拒绝分类率下(2.7%),本发明的技术方案获得了较高的分类准确率以及较高的分类可靠性。图7给出了在此拒分率(2.7%),下的10类图像的平均分类准确率。
[0073] 上述实例只为说明本发明的技术构思及特点,其目的在于让熟悉此项技术的人是能够了解本发明的内容并据以实施,并不能以此限制本发明的保护范围。凡根据本发明精神实质所做的等效变换或修饰,都应涵盖在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈