一种基于机器学习算法进行图像分析的方法专利检索-配对电脑零配件专利检索查询-专利查询网

一种基于 机器学习 算法进行图像分析的方法

阅读：696发布：2024-01-12

专利汇可以提供一种基于机器学习算法进行图像分析的方法专利检索，专利查询，专利分析的服务。并且本发明提出了一种基于机器学习算法进行图像分析的方法，其主要内容包括：包括属性学习、按尺度计量属性、集群方式的一致可视化，其过程为，根据分级器对数据集的深度学习给出图像中物品的属性特征。使用监督学习法，训练机器对图片注释进行学习，建立物品属性分类器，最大限度的提高测试性能标准，机器进行分类，再把其运用到更大的数据库，使其成为图片分析的有效工具，本发明使用两个新型视觉算法，通过图像聚类来检测相关属性集群，根据已识别的属性集群，进一步识别图片和物品集群，根据机器学习给出物品属性，为工业领域的新设计，以及工程领域的创新解决方案做了进一步贡献。，下面是一种基于机器学习算法进行图像分析的方法专利的具体信息内容。

权利要求

1.一种基于机器学习算法进行图像分析的方法，其特征在于，主要包括属性学习(一)；
按尺度计量属性(二)；集群方式的一致可视化(三)。
2.基于权利要求书1所述的属性学习(一),其特征在于，根据监督学习法，训练机器对图片注释进行学习，分析新图像里面的物品属性，其中创建卷积神经网络(CNN)的关键是网络结构和内影像图层，CNN次末级输出一个典型的特征向量，其维度为1024，其中由线性层输出预测评分，如所出现物品属性的概率，CNN在基于ImageNet数据集的基础上学习图像分类，对CNN进行数据上的调整，根据无监督聚类法，可以自动检测可视化相关数据，计算出图像的物品属性。
3.基于权利要求书2所述的在ImageNet数据集的基础上学习图像分类，其特征在于，在ImageNet学习之后，不考虑网络的最后一个线性层，其输出维度是1024，平行追加几个1024×Ni线性层，其中i类属性标签数量为Ni，其中在每张图像上运行两个新型视觉算法，一个负责检测和定位物品，另一个负责估算图像其余部分的可见性，在图像中给定一组物品图像以及其余可见部分，用基于距离的启发式算法对二者进行配对，根据检测到的物品位置和规模，计算出一个典型图像，其中超出包围盒的图像不检测。
4.基于权利要求书2所述的属性标签，其特征在于，每个属性，先采用分层抽样法选择一个属性标签，其次为该属性标签指定一个具体的图像，其中分层抽样法抵消了每个属性的隐形失衡，经过32次抽样后，建立一个小批量图集，通过CNN计算迷你图集相对于交叉熵误差的参数梯度，每个属性积累到一定梯度后，令梯度下降动量＝0.9，学习率＝10-2，重量衰变＝10-4，以此来更新CNN的参数，其中选取图像的属性注释组成新子集(SS)，其中已注释数据集包含大量图像，每个图像具有12种物品属性，其80％的SS负责培训，10％负责确认停止训练的时间以及进一步分析此部分，10％负责把测试出的属性分类并做出最终评价。
5.基于权利要求书4所述的SS，其特征在于，根据数据集里的每张图片提取出的物品信息，把物品属性相关的注释组成一个子集，运用机器学习其属性和分类，其学习结果推广运用到整个数据集，其中物品属性包括：物品种类，用途，颜色等。
6.基于权利要求书1所述的按尺度计量属性(二)，其特征在于，建立物品属性分类器，最大限度的提高测试性能标准，机器进行分类，再把其运用到更大的数据库，使其成为图片分析的有效工具，结果表明，根据图像中物品属性对应正确率小于50％，分类器预测该图像为NO的时候占99％，对于其存在的误差，使用后验概率模型校准分类器评分，校准方法包括分类器概率输出和保序回归。
7.基于权利要求书6所述的分类器概率输出和保序回归，其特征在于，保序回归算法加上注解之后，曲线的识别功能非常接近即x＝y,这意味着曲线符合标准，其中一半的测试集用来训练回归量，另外一半负责计算曲线的可靠性，其中保序回归通常需要大量的数据来避免过度拟合，且基于概率输出算法下，其中测试结果未发生过度拟合，故采用保序回归来校准分类器对测试集的评分。
8.基于权利要求书1所述的集群方式的一致可视化(三)，其特征在于，采用聚类识别重复出现的视觉主题，其中视觉主题存在于图像的嵌入式空间里，检索其网络的倒数第二层，其特征空间维度为1024，其中可以明显看到其物品属性是线性分离的，在维度1024的特征空间内，通过机器在SS数据集中的训练学习，图像按物品视觉属性分类陈列，其中在维度
1024嵌入式特征空间中，通过图像聚类来检测到以上所述的相关视觉主题，这个主题集群被称为属性集群，根据已识别的属性集群，进一步识别图片和物品集群，结果表明不同集群之间联系密切。
9.基于权利要求书8所述的风格集群，其特征在于，在所有的数据子集内运用一个聚类算法，达到不同时间之间图像的平衡，其中，按不同地区不同时间的划分法，把图像放进不同的接收器，其中每个接收器图像少于N，选择所有图片，令每个接收器图像超过N，随机抽取图像N，令N＝4000，从集群中抽取样本共5.4M，根据这一系列中每张被裁减好的图像，计算出其在CNN中维度为1024的特征向量，其中标准向量为L2，在标准向量中执行主成分分析(PCA)，在顶层的组成项目中，保留向量方差为90％。
10.基于权利要求书9所述的特征向量，其特征在于，根据400个高斯混合模型的组成部分和对角协方差矩阵，令向量集群，其中根据最大后验概率，每张图像指定一个物品集群，之后根据集群中心点按指令计算它们的欧几里得距离，集群后将会增加模型中数据的可能性或者令集群规模缩小，故采用400作为大型集群和最大化数据的折衷选择。

说明书全文

一种基于机器学习 算法进行图像分析的方法

技术领域

[0001] 本发明涉及图像分析领域，尤其是涉及了一种基于机器学习算法进行图像分析的方法。

背景技术

[0002] 图像分析常用于工业、检测、遥感、军事等领域，一般利用数学模型并结合图像处理的技术来分析底层特征和上层结构，从而提取具有一定智能性的信息。具体地，在工业领域，多用于工业自动化，如机器手抓取物体，自动操纵线焊机和切削刀具，对于油井现场或地震资料的大量数据进行监测和筛选，对自动装配和修理提供视觉反馈。在检测领域，图像分析可以检查印刷电路板上的尖角、短路和联接不良，检验铸件中的杂质和裂缝，筛选医学图像和断层图像，常规筛选工厂产品。在遥感领域，可以应用于制图学、交通监控、资源管理、矿物勘探。在军事领域，可用于跟踪运动物体、自动导航、目标搜索和测距等。虽然图像分析的研究已经取得不少成果，并在许多领域的具体对象上得到实际应用，但无监督聚类法在粒度识别上还有一定局限性。

[0003] 本发明提出了一种基于机器学习算法进行图像分析的方法，根据分级器对数据集的深度学习给出图像中物品的属性特征。使用监督学习法，训练机器对图片注释进行学习，建立物品属性分类器，最大限度的提高测试性能标准，机器进行分类，再把其运用到更大的数据库，使其成为图片分析的有效工具，本发明使用两个新型视觉算法，通过图像聚类来检测相关属性集群，根据已识别的属性集群，进一步识别图片和物品集群，根据机器学习给出物品属性，为工业领域的新设计，以及工程领域的创新解决方案做了进一步贡献。

发明内容

[0004] 针对图像分析，提出两个新型视觉算法，通过图像聚类来检测相关属性集群，根据已识别的属性集群，进一步识别图片和物品集群，根据机器学习给出物品属性，为工业领域的新设计，以及工程领域的创新解决方案做了进一步贡献。

[0005] 为解决上述问题，本发明提供一种基于机器学习算法进行图像分析的方法，其主要内容包括：

[0006] (一)属性学习；

[0007] (二)按尺度计量属性；

[0008] (三)集群方式的一致可视化。

[0009] 其中，所述的属性学习，其特征在于监督学习法，训练机器对图片注释进行学习，分析新图像里面的物品属性，其中创建卷积神经网络(CNN)的关键是网络结构和内影像图层，CNN次末级输出一个典型的特征向量，其维度为1024，其中由线性层输出预测评分，如所出现物品属性的概率，CNN在基于ImageNet数据集的基础上学习图像分类，对CNN进行数据上的调整，根据无监督聚类法，可以自动检测可视化相关数据，计算出图像的物品属性。

[0010] 进一步地，所述的在ImageNet数据集的基础上学习图像分类，其特征在于，在ImageNet学习之后，不考虑网络的最后一个线性层，其输出维度是1024，平行追加几个1024×Ni线性层，其中i类属性标签数量为Ni，其中在每张图像上运行两个新型视觉算法，一个负责检测和定位物品，另一个负责估算图像其余部分的可见性，在图像中给定一组物品图像以及其余可见部分，用基于距离的启发式算法对二者进行配对，根据检测到的物品位置和规模，计算出一个典型图像，其中超出包围盒的图像不检测。

[0011] 进一步地，所述的属性标签，每个属性，先采用分层抽样法选择一个属性标签，其次为该属性标签指定一个具体的图像，其中分层抽样法抵消了每个属性的隐形失衡，经过32次抽样后，建立一个小批量图集，通过CNN计算迷你图集相对于交叉熵误差的参数梯度，每个属性积累到一定梯度后，令梯度下降动量＝0.9，学习率＝10-2，重量衰变＝10-4，以此来更新CNN的参数，其中选取图像的属性注释组成新子集(SS)，其中已注释数据集包含大量图像，每个图像具有12种物品属性，其80％的SS负责培训，10％负责确认停止训练的时间以及进一步分析此部分，10％负责把测试出的属性分类并做出最终评价。

[0012] 进一步的，所述的SS，根据数据集里的每张图片提取出的物品信息，把物品属性相关的注释组成一个子集，运用机器学习其属性和分类，其学习结果推广运用到整个数据集，其中物品属性包括：物品种类，用途，颜色等。

[0013] 进一步地，所述的按尺度计量属性，其特征在于，建立物品属性分类器，最大限度的提高测试性能标准，机器进行分类，再把其运用到更大的数据库，使其成为图片搜索的有效工具，结果表明，根据图像中物品属性对应正确率小于50％，分类器预测该图像为NO的时候占99％，对于其存在的误差，使用后验概率模型校准分类器评分，校准方法包括分类器概率输出和保序回归。

[0014] 进一步地，所述的分类器概率输出和保序回归，保序回归算法加上注解之后，曲线的识别功能非常接近即x＝y,这意味着曲线符合标准，其中一半的测试集用来训练回归量，另外一半负责计算曲线的可靠性，其中保序回归通常需要大量的数据来避免过度拟合，且基于概率输出算法下，其中测试结果未发生过度拟合，故采用保序回归来校准分类器对测试集的评分。

[0015] 进一步地，所述的集群方式的一致可视化，采用聚类识别重复出现的视觉主题，其中视觉主题存在于图像的嵌入式空间里，检索其网络的倒数第二层，其特征空间维度为1024，其中可以明显看到其物品属性是线性分离的，在维度1024的特征空间内，通过机器在SS数据集中的训练学习，图像按物品视觉属性分类陈列，其中在维度1024嵌入式特征空间中，通过图像聚类来检测到以上所述的相关视觉主题，这个主题集群被称为风格集群，根据已识别的风格集群，进一步识别图片和物品集群，结果表明不同集群之间联系密切。

[0016] 进一步的，所述的风格集群，在所有的数据子集内运用一个聚类算法，达到不同时间之间图像的平衡，其中，按不同地区不同时间的划分法，把图像放进不同的接收器，其中每个接收器图像少于N，选择所有图片，令每个接收器图像超过N，随机抽取图像N，令N＝4000，从集群中抽取样本共5.4M，根据这一系列中每张被裁减好的图像，计算出其在CNN中维度为1024的特征向量，其中标准向量为为L2，在标准向量中执行主成分分析(PCA)，在顶层的组成项目中，保留向量方差为90％。

[0017] 进一步的，所述的特征向量，根据400个高斯混合模型的组成部分和对角协方差矩阵，令向量集群，其中根据最大后验概率，每张图像指定一个物品集群，之后根据集群中心点按指令计算它们的欧几里得距离，集群后将会增加模型中数据的可能性或者令集群规模缩小，故选择400作为大型集群和最大化数据可能性的折衷。附图说明

[0018] 图1是本发明一种基于机器学习算法进行图像分析的方法的系统流程图。

[0019] 图2是本发明一种基于机器学习算法进行图像分析的方法的图像定位检测图。

[0020] 图3是本发明一种基于机器学习算法进行图像分析的方法的数据集图。

具体实施方式

[0021] 需要说明的是，在不冲突的情况下，本申请中的实施例及实施例中的特征可以相互结合，下面结合附图和具体实施例对本发明作进一步详细说明。

[0022] 图1是本发明一种基于机器学习算法进行图像分析的方法的系统流程图。主要包括属性学习、按尺度计量属性、集群方式的一致可视化。

[0023] 其中，所述的属性学习，其特征在于监督学习法，训练机器对图片注释进行学习，分析新图像里面的物品属性，其中创建卷积神经网络(CNN)的关键是网络结构和内影像图层，CNN次末级输出一个典型的特征向量，其维度为1024，其中由线性层输出预测评分，如所出现物品属性的概率，CNN在基于ImageNet数据集的基础上学习图像分类，对CNN进行数据上的调整，根据无监督聚类法，可以自动检测可视化相关数据，计算出图像的物品属性。

[0024] 图2是本发明一种基于机器学习算法进行图像分析的方法的图像定位检测图。所述的在ImageNet数据集的基础上学习图像分类，在ImageNet学习之后，不考虑网络的最后一个线性层，其输出维度是1024，平行追加几个1024×Ni线性层，其中i类属性标签数量为Ni，其中在每张图像上运行两个新型视觉算法，一个负责检测和定位物品，另一个负责估算图像其余部分的可见性，在图像中给定一组物品图像以及其余可见部分，用基于距离的启发式算法对二者进行配对，根据检测到的物品位置和规模，计算出一个典型图像，其中超出包围盒的图像不检测。

[0025] 进一步地，所述的属性标签，每个属性，先采用分层抽样法选择一个属性标签，其次为该属性标签指定一个具体的图像，其中分层抽样法抵消了每个属性的隐形失衡，经过32次抽样后，建立一个小批量图集，通过CNN计算迷你图集相对于交叉熵误差的参数梯度，每个属性积累到一定梯度后，令梯度下降动量＝0.9，学习率＝10-2，重量衰变＝10-4，以此来更新CNN的参数，其中选取图像的属性注释组成新子集(SS)，其中已注释数据集包含大量图像，每个图像具有12种物品属性，其80％的SS负责培训，10％负责确认停止训练的时间以及进一步分析此部分，10％负责把测试出的属性分类并做出最终评价。

[0026] 图3是本发明一种基于机器学习算法进行图像分析的方法的数据集图。所述的SS，根据数据集里的每张图片提取出的物品信息，把物品属性相关的注释组成一个子集，运用机器学习其属性和分类，其学习结果推广运用到整个数据集，其中物品属性包括：物品种类，用途，颜色等。

[0027] 进一步地，所述的按尺度计量属性，其特征在于，建立物品属性分类器，最大限度的提高测试性能标准，机器进行分类，再把其运用到更大的数据库，使其成为图片搜索的有效工具，结果表明，根据图像中物品属性对应正确率小于50％，分类器预测该图像为NO的时候占99％，对于其存在的误差，使用后验概率模型校准分类器评分，校准方法包括分类器概率输出和保序回归。

[0028] 进一步地，所述的分类器概率输出和保序回归，保序回归算法加上注解之后，曲线的识别功能非常接近即,这意味着曲线符合标准，其中一半的测试集用来训练回归量，另外一半负责计算曲线的可靠性，其中保序回归通常需要大量的数据来避免过度拟合，且基于概率输出算法下，其中测试结果未发生过度拟合，故采用保序回归来校准分类器对测试集的评分。

[0029] 进一步地，所述的集群方式的一致可视化，采用聚类识别重复出现的视觉主题，其中视觉主题存在于图像的嵌入式空间里，检索其网络的倒数第二层，其特征空间维度为1024，其中可以明显看到其物品属性是线性分离的，在维度1024的特征空间内，通过机器在SS数据集中的训练学习，图像按物品视觉属性分类陈列，其中在维度1024嵌入式特征空间中，通过图像聚类来检测到以上所述的相关视觉主题，这个主题集群被称为风格集群，根据已识别的风格集群，进一步识别图片和物品集群，结果表明不同集群之间联系密切。

[0030] 进一步的，所述的风格集群，在所有的数据子集内运用一个聚类算法，达到不同时间之间图像的平衡，其中，按不同地区不同时间的划分法，把图像放进不同的接收器，其中每个接收器图像少于N，选择所有图片，令每个接收器图像超过N，随机抽取图像，令N＝4000，从集群中抽取样本共5.4M，根据这一系列中每张被裁减好的图像，计算出其在CNN中维度为1024的特征向量，其中标准向量为，在标准向量中执行主成分分析(PCA)，在顶层的组成项目中，保留向量方差为90％。

[0031] 进一步的，所述的特征向量，根据400个高斯混合模型的组成部分和对角协方差矩阵，令向量集群，其中根据最大后验概率，每张图像指定一个物品集群，之后根据集群中心点按指令计算它们的欧几里得距离，集群后将会增加模型中数据的可能性或者令集群规模缩小，故选择400作为大型集群和最大化数据可能性的折衷。

[0032] 对于本领域技术人员，本发明不限制于上述实施例的细节，在不背离本发明的精神和范围的情况下，能够以其他具体形式实现本发明。此外，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围，这些改进和变型也应视为本发明的保护范围。因此，所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

标题	发布/更新时间	阅读量
一种供电设备及供电方法	2020-05-08	410
上行传输方法、计算机可读存储介质和分布式多天线系统	2020-05-08	568
一种OFDMA跨载波同频全双工配对方法及应用	2020-05-08	63
临时解锁方法、系统、门锁、管理员终端和可读存储介质	2020-05-08	288
一种具有支撑装置的用于汽车零部件加工的大型冲床	2020-05-08	408
智能家电装置控制方法	2020-05-08	642
一种面向云负载测试的共享式资源分配方法	2020-05-08	360
一种设备切换方法及相关设备	2020-05-08	582
用于法兰孔板的孔位检测治具	2020-05-08	816
一种基于图像处理技术的交通管理装置	2020-05-08	695

一种基于机器学习算法进行图像分析的方法

一种基于机器学习算法进行图像分析的方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：