一种结合不同大小视觉词汇本的图像分类方法专利检索-模式识别机器学习人工智能人工智能专利检索查询-专利查询网

一种结合不同大小视觉词汇本的图像分类方法

阅读：1034发布：2020-12-17

专利汇可以提供一种结合不同大小视觉词汇本的图像分类方法专利检索，专利查询，专利分析的服务。并且本发明公开了一种基于视觉词汇本集体的图像分类方法，涉及模式识别、计算机视觉、图像理解技术领域。本发明利用多分辨率信息来量化图像，来自于不同综合层的多种可用线索并行用来分类图像。为了利用不同粒度的信息来分类图像，图像在基于不同大小的视觉词汇本上量化，这些不同大小的视觉词汇本可以捕获不同的图像特征。然后基于不同大小的视觉词汇本，训练图像集得到不同的量化矢量集，从而可以学习到不同的分类器，每种分类器根据图像不同粒度的信息得到物体不同的模型，集成这些分类器模型来分类新的图像时能产生更好的效果。实验结果表明本发明能显著提高单一大小的视觉词汇本的性能，具有很强的鲁棒性，对不同的图像都能得到好的分类效果。，下面是一种结合不同大小视觉词汇本的图像分类方法专利的具体信息内容。

权利要求

1.一种基于由不同大小视觉词汇本构成的视觉词汇本集体的图像分类方法，其特征在
于利用多分辨率信息来量化图像，来自于不同综合层的多种可用线索并行用来分类图像，
为了利用不同粒度的信息来分类图像，图像在基于不同大小的视觉词汇本上量化，这些不
同大小的视觉词汇本可以捕获不同的图像特征，包括如下步骤：
输入训练图像集，在所述训练图像集上用兴趣点检测子提取训练图像的兴趣点，然后
用描述子描述提取出来的兴趣点，得到所述训练图像集的描述特征集；
在所述训练图像描述特征集上随机选择18个子集，在其上分别运行设置了如下18
个不同簇个数的聚类算法：200，400，800，1200，1300，1500，1600，1700，1900，2000，2200，
2600，2800，3000，3600，4000，4500，和5000，从而得到18个大小分别如所述簇个数大小的
成员视觉词汇本；
将所述训练图像集，分别基于所述18个不同大小的成员视觉词汇本上进行直方图量
化，得到18个训练图像量化特征集，表达了所述训练图像集不同粒度信息；
在所述18个训练图像量化特征集上分别进行分类器训练，学习得到18个分类器，利用
来自于不同综合层的多种可用线索进行识别；
输入待分类图像，在提取并描述兴趣点后，利用所述18个视觉词汇本分别进行量化，
得到18个表达了不同分辨率信息的量化特征；
将所述待分类图像的18个量化特征分别输入所述学习得到的18个利用不同综合层的
多种可用线索进行识别的分类器，得到所述待分类图像的18个分类结果；
将所述18个待分类图像的分类结果进行集成，得到所述待分类图像的最终分类结果。
2.如权利要求1所述的图像分类方法，其特征在于，所述的将所述待分类图像的18个
量化特征分别输入所述学习得到的18个分类器，得到所述待分类图像的18个分类结果，包
括如下步骤：
所述待分类图像的描述特征集，分别基于相应的视觉词汇本进行直方图统计量化后再
输入相应的分类器得到相应的分类结果。
3.如权利要求1所述的图像分类方法，其特征在于，所述集成18个分类结果，为
了集成视觉词汇本集体和相应分类器集体分类图像，直接使用了SVM决策函数值的输
出，当分类所述待分类图像x时，首先将所述18个成员分类器的决策函数值进行平均：，是第i个成员分类器的输出值，通过设置不同的阈值，从而获得
precision-recall曲线。

说明书全文

一种结合不同大小视觉词汇本的图像分类方法

技术领域

[0001] 本发明属于模式识别、计算机视觉、图像理解技术领域，具体涉及一种图像分类方法。

背景技术

[0002] 图像分类的困难在于需要建立一个即能容纳类内的高度变化，又要能区分不同类的类模型。“Constellation”模型试图定位不同的物体局部并确定它们在空间上的关系。尽管这些方法可能表示能力强，但是这种空间约束模型无法处理或识别大的变形，比如不在一个平面内的旋转和遮挡，也没有考虑局部数目不确定的物体，比如建筑物和树。许多用于图像分类的流行方法使用独立块的集合来表示图像，这些独立块由局部视觉描述子描述，其中最典型的是“bag-of-words”模型。它确定每类中特定的局部比例，而忽略局部间的空间关系。在检测到图像的兴趣点（独立块）且用描述子描述兴趣点(也就是特征表示)后，必须为训练和测试图像表示它们的分布。一种流行的表示方法，也称为图像量化方法，是通过对描述后的兴趣点集进行聚类得到一个视觉词汇本。然后图像表示成视觉单词标签的直方图。但是几乎所有流行的聚类算法都需要用户输入簇个数。为了提供这个参数，用户必需要有一些图像的先验知识或者通过许多的验证实验来选择一个合适的参数。最近，许多基于“bag-of-words”模型的方法致力于融合多种特征来得到性能提升。计算机视觉领域中流行的结合多个特征的趋势是使用多核学习方法（Multiple Kernel Learning，MKL)。
从时间复杂性角度来说，MKL方法不能并行学习多个特征。

[0003] 本发明试图将集成学习技术的优势应用到图像分类中，集成学习的思想是应用多个学习器并结合他们的预测。图像分类对于传统的机器学习算法是非常困难的，因为描述图像的矢量的维度非常高。为了利用来自于不同信息综合层的线索来分类图像，不同大小的视觉词汇本成员用来构成视觉词汇本集体。当应用基于视觉词汇本集体上学习得到的分类器集体来分类新的图像时，可以得到性能的提升。而且，从时间复杂性角度来说，本发明可以并行学习成员视觉词汇本和相应的成员分类器，具有很好的并行性和可缩放性。

[0004] 本项发明的主要贡献在于提出了一种结合不同大小视觉词汇本的图像分类方法。本发明能有效减少图像分类的监督程度，综合利用多种有效信息，并行学习物体模型，有效提高图像分类的效率和准确度。

发明内容

[0005] 为了解决图像分类不能有效融合多种信息和由于描述图像的矢量的高维度，传统的机器学习方法趋向于产生非常不稳定且泛化能力差的模型的问题，本发明提供了一种结合不同大小视觉词汇本的图像分类方法。

[0006] 本发明将集成学习的优势应用到图像分类中，不同综合层次的特征用来形成视觉词汇本集体。基于视觉词汇本集体上，同一副图像能得到不同的量化矢量。所以，一个分类器集体能在同一训练图像集的不同表达矢量集上学习得到。既然每个成员利用一种图像信息，当用这个分类器集体来分类新的图像时，可以得到意想不到的满意结果。集成方法通过结合多个模型的预测来提高现存算法的性能。

[0007] 与分类器集体相似，使用视觉词汇本集体来提高视觉词汇本的质量和鲁棒性。词汇本一般是用标准的聚类算法从训练图像集中学习得到，所以使用词汇本集体也可以达到提高聚类算法质量的目的。视觉词汇本集体用来表达不同类型的图像信息。在构建了一个差异性视觉词汇本集体后，就可以得到高差异性的分类器集体，其中的每个成员分类器分别根据不同的图像特征来建立物体模型。所以使用此分类器集体去分类新的图像时，可以得到更好的、更鲁棒的结果。高差异性的集体对于减少建立一个准确模型所需要的监督程度也非常有效。

[0008] 本发明直接使用多分辨率信息来量化图像，并行使用来自于不同综合层的多种可用线索分类图像。为了利用不同粒度的信息来分类物体，图像在基于不同大小的视觉词汇本上量化，这些不同大小的视觉词汇本可以捕获不同粒度的图像特征。然后基于不同大小的视觉词汇本，训练图像集得到不同的量化矢量集，从而可以学习到不同的分类器，每种分类器根据图像不同粒度的信息得到物体不同的模型，集成这些分类器模型来分类新的图像，包括以下步骤：

[0009] 步骤1. 用兴趣点检测子提取训练图像的兴趣点，然后用描述子描述提取出来的兴趣点；

[0010] 步骤2. 随机选择一部分描述好的兴趣点，在其上运行聚类算法得到一个成员视觉词汇本，通过设置不同的簇个数作为聚类算法的参数，得到具有不同大小的成员视觉词汇本；

[0011] 步骤3. 基于这个成员视觉词汇本对训练图像集进行量化；

[0012] 步骤4. 在量化后的训练数据集上学习一个分类器；

[0013] 步骤5. 重复步骤2到步骤4，生成预设大小的视觉词汇本集体和分类器集体；

[0014] 步骤6. 基于一个成员视觉词汇本，对新图像进行量化；

[0015] 步骤7. 使用对应成员分类器分类新图像，得到分类结果；

[0016] 步骤8. 重复步骤6到步骤7，直到每个成员分类器得到了自己的分类结果；

[0017] 步骤9. 利用集成技术集成成员分类器的分类结果得到最终图像分类标签。

[0018] 实验结果表明本发明提出的方法能增加鲁棒性，因为在高维问题中很难评估分类器的好坏，所以用户通常不知道选择哪种方法好，集成方法可以使用许多的模型，然后结合它们产生稳定结果，集成方法能自动聚焦于最适合所给数据的信息。

[0019] 本发明有益效果是具有在不同领域图像上的平均性能更好，鲁棒性强的优点，且模型简单，非常适用于一般操作者，不需要复杂参数的调整，监督程度低，且对训练数据的要求低；利用集成学习固有的并行性，可以在多个处理器上利用少量训练数据并行学习，所以本发明的效率也相对较高。

具体实施方式

[0020] 本发明优选的具体实施例：

[0021] 一个描述子对应到与它在欧拉空间中最近的单词。在形成一个成员词汇本后，为了量化图像，所有检测出来的兴趣点都用来建立基于此成员词汇本上

标题	发布/更新时间	阅读量
一种基于改进PCA的带钢冷轧质量问题溯源及控制方法	2020-05-08	432
情景模式的控制方法、装置、智能手表及存储介质	2020-05-08	459
显示控制方法及装置、计算机可读介质、无线通信终端	2020-05-08	592
一种可自动粘贴海绵的钣金件智能生产系统	2020-05-08	111
基于激光位移传感器的植保无人机障碍物检测方法	2020-05-08	511
一种具有多种显示模式的一体化双屏显示器及其调节方法	2020-05-11	192
一种物联网信息的融合控制方法及其操作系统	2020-05-08	474
一种对图像型PDF财务数据关键表格信息的处理方法	2020-05-08	726
一种用于不同链长的控制图模式识别方法	2020-05-08	681
用于模式识别的方法、系统及装置	2020-05-08	981

一种结合不同大小视觉词汇本的图像分类方法

一种结合不同大小视觉词汇本的图像分类方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：