首页 / 专利库 / 人工智能 / 机器学习 / 半监督学习 / 基于主动学习和半监督学习的多类图像分类方法

基于主动学习和半监督学习的多类图像分类方法

阅读:136发布:2020-10-18

专利汇可以提供基于主动学习和半监督学习的多类图像分类方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及图像信息处理技术领域,尤其涉及一种基于主动学习和半 监督学习 的多类图像分类方法。本发明包括初始样本选择及分类器模型训练、BvSB主动学习样本选择、CST 半监督学习 、训练样本集及分类器模型更新、分类过程 迭代 五个步骤。本发明通过执行BvSB主动学习样本选择、CST半监督学习和SVM分类三方面的操作,使其在较小的人工标注情况下具有高效的图像分类效果,不会增加过多的计算负担,能够快速提供分类结果,兼顾了分类系统对计算复杂度的要求。,下面是基于主动学习和半监督学习的多类图像分类方法专利的具体信息内容。

1.一种基于主动学习和半监督学习的多类图像分类方法,其特征在于,包括以下步骤:
①初始样本选择及分类器模型训练:从未标注样本集中随机选择一部分图像进行人工标注,以这一部分带有类别标号信息的样本作为训练样本,训练支持向量机分类器的分类模型;
②基于最优标号和次优标号的主动学习样本选择:根据支持向量机分类器的分类模型,利用基于最优标号和次优标号的主动学习准则选择分类不确定性最高的一部分样本,由用户对这一部分样本进行人工标注;实现方式如下,
根据当前的SVM分类器的分类模型,计算未标注样本集的样本属于每个可能的类别的概率p(yi|x),Y={yi,i=1,...,k}为所有可能的类别标号集合,x对应的所有p(yi|x)的最大值为其最优标号的概率p(yBest|x),第二大的值为其次优标号的概率p(ySecond-Best|x),BvSB主动学习样本选择准则表示为如下形式:
其中U为未标注样本集;选择KBvSB个差值最小的样本,并由用户对其进行人工标注;
③带约束条件的自训练半监督学习:对图像集中剩余的未标注样本,根据当前的分类器模型计算其最优标号的概率,并计算其余训练样本集中所有由用户人工标注的样本之间的距离,通过带约束条件的自训练半监督学习选择一部分样本,将这一部分样本的最优标号作为其类别标号;
④训练样本集及分类器模型更新:将步骤②和步骤③中选出的样本,连同已经获得的类别标号,加入到当前训练样本集,对训练样本集进行更新,用更新后的训练样本集重新训练支持向量机分类器模型;
⑤分类过程迭代:利用步骤④中所得支持向量机的分类模型,对测试图像集中的图像的类别标号进行预测,对输出分类结果进行迭代,直到测试图像集上的分类准确率满足分类精度要求。
2.根据权利要求1所述的基于主动学习和半监督学习的多类图像分类方法,其特征在于:
所述步骤②中,基于最优标号和次优标号的主动学习样本选择进一步包括以下子步骤:
根据当前支持向量机分类器的分类模型,对未标注样本集的每个样本的类别进行预测,得到其属于各个可能的类别的概率p(yi|x);
计算样本的最优标号的概率与次优标号的概率,利用基于最优标号和次优标号的主动学习准则选择两者差值最小的一部分样本,由用户对这一部分样本进行人工标注。
3.根据权利要求1或2所述的基于主动学习和半监督学习的多类图像分类方法,其特征在于:
所述步骤③中,带约束条件的自训练半监督学习进一步包括以下子步骤:
对图像集中剩余的未标注样本,根据当前的分类器模型计算其最优标号的概率,并计算其与训练样本集中所有由用户人工标注的样本之间的距离;
通过阈值约束和空间位置关系约束这两个约束,选择一部分满足条件的样本;
将上述样本按照其各自对应的最优标号的概率从小到大进行排列,选择一部分最靠前的样本,根据当前的分类器模型进行自动标注。

说明书全文

基于主动学习和半监督学习的多类图像分类方法

技术领域

[0001] 本发明涉及图像信息处理技术领域,尤其涉及一种基于主动学习和半监督学习的多类图像分类方法。

背景技术

[0002] 图像分类作为图像处理中的一个重要应用,一直是图像处理中一个非常活跃的领域。近年来,很多研究者都在图像分类上进行了大量的研究,也提出了很多分类算法,例如支持向量机(Support Vector Machines,SVMs)方法、人工神经网络(Artificial Neural Network,ANN)、遗传算法(Genetic Algorithm,GA)、AdaBoost、随机森林(Random Forest)等。大多数图像监督分类算法都是建立在统计模型的基础上,用户需要对大量图像样本进行人工标注,然后由带有类别标号的训练样本通过训练得到该模型。
[0003] 在实际应用中,对大量图像进行标注是比较困难的,首先,对整个图像集进行标注需要耗费大量的时间和精,用户往往没有足够的耐性来完成整个样本集的标注;其次,对于某些比较复杂的图像,例如合成孔径雷达(Synthetic Aperture Radar,SAR)图像,普通用户对其内容进行判读是比较困难的,通常需要借助同一场景的高分辨率遥感图像或者通过有经验的专家来完成。正是由于标注上的困难,使得在图像分类中能够获得的训练样本的数量是比较有限的。然而,在小训练样本情况下,分类器的性能可能受到很大影响。
[0004] 如何对尽量少的样本进行人工标注,并获得较好的分类性能也成为图像分类中的一个关键问题。为了解决标注困难带来的有限样本情况下的分类问题,主动学习(Active Learning)已经成为机器学习模式识别领域的研究热点。在主动学习中,学习器不再是被动地接受由用户提供的训练样本,而是主动要求用户对那些对于当前分类器模型最有价值的样本进行标注,并将这些带有类别标号的样本添加到训练样本集,对分类模型进行重新训练。通过迭代的方式,对分类器模型进行更新。理论上的结果表明,在获得相似的分类准确率的情况下,主动样本选择相对于随机选择可以显著地减少训练所需的样本数。截至目前,现有技术中关于主动学习方面的研究现状为:
[0005] 比较典型的有Tong等提出的Margin Sampling,在基于SVM的分类和检索中,根据样本到当前SVM分类面的距离对样本进行采样,最靠近分类面的样本被认为是最具信息量的,在下一次迭代中选择最靠近当前分类面的样本进行人工标注,并添加到现有训练样本集中,对分类器模型重新进行训练;基于委员会的采样也是比较常用的主动学习方法,在这种方法中,采用多个分类器对样本的类别进行判断,选择那些分类结果最不一致的样本加入到当前的训练样本集;另外一种常见的主动学习是基于熵的不确定性采样(Entropy based uncertaintysampling)方法,在该方法中,首先计算样本属于各个可能的类别的概率,根据得到的概率计算每个样本的熵,熵越大表示该样本的分类不确定性越高,在每次迭代中选择那些具有最大熵的样本添加到当前训练样本集。
[0006] Margin Sampling方法虽然计算简单,且具有较好的性能,但是该方法只适用于二类(two-class)SVM分类问题,对于多类(multi-class)SVM分类问题,由于分类器是由多个二分类器联合而成,每个二分类器都有各自的分类面,这时,Margin Sampling方法将不再适用。基于熵的不确定性采样主动学习方法虽然可以较好地用于多类分类问题中,但是当类别数量较多时,熵往往不能很好地代表样本的分类不确定性。因此,如何在多类分类问题中寻找一个合适的分类不确定性度量已经成为主动学习领域中一个较关键的问题。目前本领域有专家探讨了在多类分类主动学习中的分类不确定性度量问题,针对熵在多类问题中不能很好的描述样本的分类不确定性这一问题,提出了一种基于最优标号和次优标号(Best vsSecond-Best,BvSB)的主动学习样本选择准则。该方法较好地解决了多类分类问题中样本的分类不确定性度量问题,但是该方法没有考虑样本集中剩余的未标注样本所包含的信息,使得大量未标注样本包含的有用信息被浪费。

发明内容

[0007] 本发明的目的是提供一种针对现有主动学习多类图像分类技术存在的不足和缺陷,提出一种在较低人工标注负担情况下具有高效分类性能的基于BvSB主动学习和带约束条件的自训练(Constrained Self-Training,CST)半监督学习的多类图像SVM分类方法。
[0008] 为达到上述目的,本发明采用如下的技术方案:
[0009] ①初始样本选择及分类器模型训练:从未标注样本集中随机选择一部分图像进行人工标注,以这一部分带有类别标号信息的样本作为训练样本,训练支持向量机分类器的分类模型;
[0010] ②基于最优标号和次优标号的主动学习样本选择:根据支持向量机分类器的分类模型,利用基于最优标号和次优标号的主动学习准则选择分类不确定性最高的一部分样本,由用户对这一部分样本进行人工标注;
[0011] ③带约束条件的自训练半监督学习:对图像集中剩余的未标注样本,根据当前的分类器模型计算其最优标号的概率,并计算其余训练样本集中所有由用户人工标注的样本之间的距离,通过带约束条件的自训练半监督学习选择一部分样本,将这一部分样本的最优标号作为其类别标号;
[0012] ④训练样本集及分类器模型更新:将步骤②和步骤③中选出的样本,连同已经获得的类别标号,加入到当前训练样本集,对训练样本集进行更新,用更新后的训练样本集重新训练支持向量机分类器模型;
[0013] ⑤分类过程迭代:利用步骤④中所得支持向量机的分类模型,对测试图像集中的图像的类别标号进行预测,对输出分类结果进行迭代,直到测试图像集上的分类准确率满足分类精度要求。
[0014] 所述步骤②中,基于最优标号和次优标号的主动学习样本选择进一步包括以下子步骤:
[0015] 根据当前支持向量机分类器的分类模型,对未标注样本集的每个样本的类别进行预测,得到其属于各个可能的类别的概率p(yi|x);
[0016] 计算样本的最优标号的概率与次优标号的概率,利用基于最优标号和次优标号的主动学习准则选择两者差值最小的一部分样本,由用户对这一部分样本进行人工标注。
[0017] 所述步骤③中,带约束条件的自训练半监督学习进一步包括以下子步骤:
[0018] 对图像集中剩余的未标注样本,根据当前的分类器模型计算其最优标号的概率,并计算其与训练样本集中所有由用户人工标注的样本之间的距离;
[0019] 通过阈值约束和空间位置关系约束这两个约束,选择一部分满足条件的样本;
[0020] 将上述样本按照其各自对应的最优标号的概率从小到大进行排列,选择一部分最靠前的样本,根据当前的分类器模型进行自动标注。
[0021] 本发明具有以下优点和积极效果:
[0022] 1)通过执行BvSB主动学习样本选择、CST半监督学习和SVM分类三方面的操作,使其在较小的人工标注情况下具有高效的图像分类效果;
[0023] 2)不会增加过多的计算负担,能够快速提供分类结果,兼顾了分类系统对计算复杂度的要求。附图说明
[0024] 图1是BvSB主动学习基本框架图。
[0025] 图2是CST半监督学习基本框架图。
[0026] 图3是本发明提供的基于主动学习和半监督学习的多类图像分类方法的流程图
[0027] 图4是采用本发明提供的方法实现的图像分类系统和采用其他三种方法实现的图像分类系统在测试集上的分类准确率随迭代次数的变化曲线。
[0028] 图5是采用本发明提供的方法实现的图像分类系统和采用其他三种方法实现的图像分类系统在测试集中包含的每个类别的分类准确率比较图。

具体实施方式

[0029] 本发明提出的基于主动学习和半监督学习的多类图像分类方法的核心主要包括三个部分:基于最优标号和次优标号(BvSB)的主动学习、带约束条件的自训练(CST)半监督学习,以及支持向量机(SVM)分类器。
[0030] 支持向量机(SVM)分类器是本领域技术人员熟知的。
[0031] 基于最优标号和次优标号(BvSB)的主动学习方法属于不确定性采样方法中的一种。在多类分类任务中,通过它能有效地选出对于当前分类器而言分类不确定性最高的样本,使得通过较少的训练样本,可以获得较好的分类性能。BvSB主动学习基本框图参见附图1。
[0032] 自训练(Self-Training)是半监督学习中常用的一种技术,在自训练技术中,根据当前的分类器模型对未标注样本的类别标号进行预测,以预测得到的标号作为该样本的真实类别标号,并将这些样本添加到训练样本集中重新训练,对分类模型进行更新。在自训练中,样本的标号是由分类器自动判断得到的,因此在标注过程中不可避免会引入一部分错误标号。为了减少自训练中引入的错误,在本发明中提出了带约束条件的自训练(ConstrainedSelf-Training,CST),即,通过设置阈值约束和空间位置约束两个约束条件,对未标注样本进行初步筛选,对符合两个约束条件的样本进行自训练。本发明提出的CST半监督学习基本框图参见附图2。
[0033] 本发明提出的基于主动学习和半监督学习的多类图像分类方法,参见图3所示,具体包括以下步骤:
[0034] 1、初始样本选择及分类器模型训练:从未标注样本集中随机选择一部分图像进行人工标注,以这一部分带有类别标号信息的样本作为训练样本,训练支持向量机(SVM)分类器的分类模型。
[0035] 具体实施时,由于SVM只能处理二类分类问题,对于多类分类问题,通过1对1的方式,将多个二类SVM分类器联合起来,以完成多类分类任务。
[0036] 首先简单说明二类SVM分类器的基本原理及训练过程。根据支持向量机技术,训d练样本Strain:(xi,yi)1≤i≤N,xi∈R,yi∈{-1,1}由两部分组成,其中xi为反馈样本的底层视觉特征矢量,yi为类别标号,正反馈样本的类别标号为+1,负反馈样本的类别标号为-1,d
N为反馈样本总数,R 为实数域R上的d维向量空间。为了更好的解决非线性问题,在本发明中采用带有核函数的支持向量机,利用一个非线性映射将样本映射到高维空间中,将原始空间中求解非线性分类面的问题转化为高维空间中的求解线性分类面的问题。
[0037] 决策函数表示为以下形式:
[0038] g(x)=w·Φ(x)+b (1)
[0039] 相应地,支持向量机分类面可以写成:
[0040] w·Φ(x)+b=0(2)
[0041] 其中,Φ(·)为一个非线性映射,w为权值向量,b为偏移常量。
[0042] 落在w·Φ(x)+b=±1这两个超平面上的点称为支持向量(Support Vectors),支持向量到分类面的距离称为分类间隔(Margin),大小为1/||w||。分类间隔的大小代表了分类器的泛化能力。
[0043] 此支持向量机分类面的建立在保证分类准确率的同时,使得分类间隔最大化:
[0044]
[0045] subject to:(3)
[0046] yi(w·Φ(xi)+b)≥1,i=1,...,N
[0047] 根据对(3)式的求解即可得到支持向量机分类面。其中,φ(w)为该最优化问题的目标函数,min表示取最小值,subject to表示以…为条件。通过拉格朗日乘子法对(3)式中的二次规划问题进行求解,可以得到:
[0048] w=∑iαiyiΦ(xi)(4)
[0049] 其中,xi为支持向量,yi和αi分别为该支持向量对应的类别标号和拉格朗日系数。
[0050] 样本x通过二类SVM分类器得到的输出为:
[0051] f(x)=∑iαiyiΦ(xi)·Φ(x)+b (5)
[0052] 利用核函数避开非线性映射的显式表达,图像样本通过二类SVM分类器得到的输出可以改写为:
[0053] f(x)=∑iαiyiK(xi·x)+b (6)
[0054] 其中K(.)为核函数,且K(xi,x)=Φ(xi)T·Φ(x),上标T表示转置矩阵。
[0055] 样本x的类别属于+1和-1的概率可以分别表示为:
[0056]
[0057]
[0058] 其中A,B为参数,可以通过最大似然估计对其进行估计。
[0059] 对于多类分类,通过1对1的方式对多个二分类器进行联合,样本属于各个可能的类别的概率pi可以通过pairwise coupling方法求解获得。在pairwise coupling方法中,通过对下面的优化问题进行求解,可以得到样本属于各个类别的概率。
[0060] (9)
[0061]
[0062] 其中,k为类别数量,rij为由区分第i类和第j类的二分类器得到的样本的标号概率P(y=i|y=iorj,x)(通过式(7)、(8)得到)。
[0063] 2、BvSB主动学习样本选择:根据SVM分类器的分类模型,利用BvSB主动学习准则选择分类不确定性最高的一部分样本,由用户对这一部分样本进行人工标注。
[0064] 具体实施时,根据当前的SVM分类器的分类模型,计算未标注样本集的样本属于每个可能的类别的概率p(yi|x),Y={yi,i=1,...,k}为所有可能的类别标号集合,x对应的所有p(yi|x)的最大值为其最优标号的概率p(yBest|x),第二大的值为其次优标号的概率p(ySecond-Best|x),BvSB主动学习样本选择准则可以表示为如下形式:
[0065]
[0066] 选择KBvsB个差值最小的样本,并由用户对其进行人工标注。
[0067] 3、CST半监督学习:对图像集中剩余的未标注样本,根据当前的分类器模型计算其最优标号的概率,并计算这些样本与训练样本集中所有由用户人工标注的样本之间的距离,通过CST半监督学习选择一部分样本,将这一部分样本的最优标号作为其类别标号。
[0068] 具体实施时,为了在样本的信息性和预测标号的准确性两者之间获得较好的平衡,在本发明中,采用阈值约束和空间位置关系约束这两个约束条件对自学习中用于自动标注的样本进行筛选,以提高选出的样本的预测标号的准确性,并使得这些样本能带有一定的信息量,对于当前的每个未标注样本xu,CST半监督学习具体流程如下:
[0069] 1)计算xu属于各个类别的概率的最大值(最优标号的概率)
[0070]
[0071] 2)将训练样本集中所有由用户人工标注的样本子集记为Sm,计算xu到Sm中所有样本的距离,寻找xu的最近邻点 并将该最近邻点的类别标号记为ynn
[0072] 3)约束条件,
[0073] 阈值约束:
[0074] p(yBest|xu)≥threshold (12)
[0075] 其中0≤threshold≤1为设置的阈值。
[0076] 空间位置关系约束:
[0077] yBest=ynn (13)
[0078] 4)对当前未标注样本集中满足约束条件(12)和(13)的所有样本,按照各自最优标号的概率p(yBest|xu)进行排序,选择p(yBest|xu)最小的KCST个样本,用当前分类器对这一部分样本的类别标号进行预测,并用预测得到的类别标号对其进行自动标注。
[0079] 4、训练样本集及分类器模型更新:将步骤2和步骤3中选出的样本,连同已经获得的类别标号,加入到当前训练样本集,对训练样本集进行更新。用更新后的训练样本集重新训练SVM分类器模型。
[0080] 具体实施时,除了将步骤2和步骤3中获得的标注样本加入到当前的训练样本集,对训练样本进行更新外,同时也需要将这部分样本从未标注样本集中去除,即未标注样本集也需要做相应的更新。
[0081] 5、分类过程迭代:如果当前分类结果不满足分类精度要求,则重复步骤2~4,继续通过BvSB主动学习和CST半监督学习从未标注样本集中选择样本添加到训练样本集中,基于扩大后的训练样本集重新训练分类器模型,直到分类准确率满足精度要求。
[0082] 本发明提供的基于主动学习和半监督学习的图像分类方法,可以采用计算机技术自动执行。步骤1~5可以采用顺序执行方式,当执行到步骤5时再根据分类结果判断结束流程还是自动返回步骤2,若返回则继续顺序执行到步骤5继续判断。其中步骤2和步骤3因为互相无依赖关系,执行顺序可以调换,也可以同时进行,都属于本发明权利要求的等同替换方案,应当在保护范围内。当前分类结果是否满足分类准确率精度要求,可以利用人机交互界面确定,也可以设定分类准确率阈值由计算机自动判定。
[0083] 下面以具体实施例结合附图对本发明作进一步说明:
[0084] 本实施例将本发明所提供技术方案应用在美国邮政(USUP)手写体数字图像分类中。实施例中使用的图像数据库中共包括阿拉伯数字0~9共10个类别的光学图像样本,共11000幅,其中每个类别各1100幅,每幅图像的大小为16×16。在本实施例中,将其中6000幅图像样本作为未标注样本集,剩下的5000幅图像作为测试样本集。利用本发明的基于主动学习和半监督学习的多类图像分类方法,对测试样本集中的图像样本的类别进行划分。分类过程中采用以下方法提取未标注样本集和测试样本集中图像的底层特征:将每幅图像中的像素灰度值作为该像素对应的特征,并将图像上包含的所有像素的特征按行方向进行排列,构成一个长度为256的特征向量,并通过主成分分析(Principle Component Analysis,PCA),在保留90%能量的情况下,将原始的256维特征向量降维到65维。
[0085] 整个基于主动学习和半监督学习的多类图像分类过程实现如下:
[0086] 1、初始样本选择及分类器模型训练
[0087] 将训练样本集和未标注样本集分别记为L和U,在初始分类时,从U中随机选择100个样本,由用户对其进行人工标注,将该样本集合记为Sini.对训练样本集L和未标注样本集U进行更新:L=Sinit,U→U\Sinit.用训练集L训练SVM分类器,在本实施例中,训练
2
支持向量机分类器时采用的核函数是径向基核函数,K(xi,xj)=exp(-γ||xi-xj||),参数γ=0.01。其中,exp()为指数函数。然后,对未标注样本集U中的样本的类别进行预测,并计算其属于各个类别的概率p(yi|x),yi∈{0,...,9},x∈U.
[0088] 2、BvSB主动学习样本选择
[0089] 根据前面得到的未标注样本属于各个类别的概率p(yi|x),通过BvSB度量准则从U中选出5个样本,记为SBvSB,由用户对SBvSB中的样本进行人工标注.
[0090] 3、CST半监督学习
[0091] 对图像集中剩余的未标注样本,根据当前的分类器模型计算其最优标号的概率p(yBest|x),并计算其于训练样本集中所有由用户人工标注的样本之间的距离,寻找其在所有人工标注样本中的最近邻点,在本实施例中,阈值约束条件中的threshold取值为0.7,对于未标注样本集中所有同时满足约束条件(12)和(13)的样本,按照各自对应的最优标号的概率从小到大进行排序,选择前10个样本,记为SCST,以各自对应的最优标号作为其类别标号,进行自动标注。
[0092] 4、训练样本集及分类器模型更新
[0093] 将步骤2和步骤3中选出的样本,连同已经获得的类别标号,加入到当前训练样本集,对训练样本集进行更新,同时,将这些新选出的样本,从当前的未标注样本集中去除:L=L∪(SBvSB∪SCST),U→U\(SBvSB∪SCST)。用更新后的训练样本集重新训练SVM分类器模型。
[0094] 5、分类过程迭代
[0095] 在本实施例中,设置最大迭代次数为51(将初始随机样本选择及分类器训练作为第1次迭代),通过最大迭代次数来控制是否对分类过程进行迭代。若当前迭代次数小于最大迭代次数,则继续对2~4步进行迭代,当迭代次数达到最大迭代次数时,则停止迭代。
[0096] 实施例中共在USPS数据集上进行了10次分类实验。为重点评价按本发明技术方案实现的图像分类系统在分类性能以及所需人工标注数量,采用如下测试集整体分类准确率,每个类别各自的分类准确率,以及人工标注数量这3个评价指标,并与随机选择(Random),基于熵(Entropy)的主动学习,以及BvSB主动学习这3种方法结合SVM分类器的分类性能进行比较。
[0097] 图4给出了按本发明实现的图像分类系统和按上述3种方法实现的图像分类系统在测试集上的分类准确率随迭代次数的变化曲线,其中,每次迭代中的系统的分类准确率是10次实验的平均值。从图4曲线可以看出,采用本发明实现的图像分类系统的分类准确率始终高于按照其他3种方法实现的图像分类系统。这说明当进行同样次数的迭代时,本发明中的方法可以获得更高的分类准确率;从另外一个度说,当获得相似的分类性能时,本发明中的方法所需的迭代次数更少。在本实施例中,各种不同的方法在一次迭代中进行人工标注的数量是相同的,迭代次数与人工标注数量成正比,更少的迭代次数意味着所需的标注样本数量更少。
[0098] 表1给出了采用4种不同的方法(包括本发明中的方法和3种对比方法)实现的图像分类系统在获得相似的分类准确率时,所需的迭代次数的比较。在表1中,以本发明中的方法的性能作为基准,分别统计了其他3种方法在达到相似的分类性能时所需的迭代次数。例如,采用本发明中的方法迭代14次所能达到的分类准确率,采用Random方法需要迭代39次,采用Entropy方法需要迭代36次,采用BvSB方法需要迭代20次才能获得。表中的“-”表示采用Random方法即使达到实验中设定的最大迭代次数时,仍不能达到与本发明中的方法迭代18次相似的分类准确率。
[0099] 表1:4种方法获得相似的分类性能时所需的迭代次数
[0100]
[0101] 图5A给出了采用本发明中的方法实现的图像分类系统和采用Random方法实现的图像分类系统的性能比较。图中的柱状图代表采用本发明中的方法与采用Random方法在阿拉伯数字0~9这10个类别中的每个类别上的分类准确率的差,差值为正数代表本发明中的方法在该类别上的分类准确率高于Random方法。
[0102] 类似地,图5B给出了采用本发明中的方法实现的图像分类系统和采用Entropy方法实现的图像分类系统的性能比较;图5C给出了采用本发明中的方法实现的图像分类系统和采用BvSB方法实现的图像分类系统的性能比较。
[0103] 从图5A,图5B,和图5C中可以看出,本发明中的方法相对于Random,Entropy,BvSB三种方法在0~9这10个类别中的绝大多数类别上的分类准确率都有一定程度的提高。
[0104] 从实施例中的分类结果可以看出,在较低人工标注负担情况下,本发明中的方法可以获得良好的分类性能,同时,该方法没有引入过多额外的计算负担,较好地满足了实际应用中对图像分类系统计算复杂度方面的要求。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈