卷烟感官质量定性指标评估方法专利检索-K最近邻算法电脑编程专利检索查询-专利查询网

卷烟感官质量定性指标评估方法

阅读：379发布：2021-12-20

专利汇可以提供卷烟感官质量定性指标评估方法专利检索，专利查询，专利分析的服务。并且本发明提供了一种卷烟感官质量定性指标评估方法，以卷烟样本的理化指标为基础，采用自适应K近邻聚类算法，建立卷烟感官质量定性指标评估模型，以实现对待测卷烟感官质量定性指标的评估。本发明创造性地将K个近邻的选取过程更合理，首先通过传统K近邻聚类算法计算出每个样本的初始类别。然后依次从它的最近邻样本中组成矩阵，求它的协方差矩阵的迹，如果迹小于迹门限值，说明这几个近邻内聚性好；否则马上进行初始类别的融合。直至所有测试样本的具体类别所属关系确定。本发明具有减少人工评吸工作量，降低检测费用，提高工作效率的功能。，下面是卷烟感官质量定性指标评估方法专利的具体信息内容。

权利要求

1、一种卷烟感官质量定性指标评估方法，其特征在于，以卷烟样本的理化指标为基础，采用自适应K近邻聚类算法，建立卷烟感官质量定性指标评估模型，以实现对待测卷烟感官质量定性指标的评估。
2、如权利要求1所述卷烟感官质量定性指标评估方法，其特征在于，所述采用自适应K近邻聚类算法建立卷烟感官质量定性指标评估模型包括如下步骤：
1)、将卷烟的理化指标标样样本数据和对应的卷烟感官质量指标样本数据存储；
2)、在上一步的卷烟的标样样本数据中选出若干个作为参考点，同时确定这些参考点的相应的理化指标项为输入参数，并对其进行极差归一化处理；将上述卷烟样本对应的感官质量指标数据中的定性指标样本数据转换为离散的类别值，将该类别值作为输出参数；
3)、定义自适应K近邻聚类算法的初始化参数：协方差矩阵迹门限值为0.01，距离门限值为0.1；
4)、通过传统K近邻聚类算法求得初始类别，先计算所有卷烟测试数据与标样数据间的距离值；按照传统K近邻聚类算法，搜索出当前测试数据与标样数据距离最小者，来确定测试样本Xi的初始类别；
5)、循环判断上一步得到的初始类别中近邻内聚的情况，依次从测试样本Xi的K近邻样本中组成矩阵M，求其协方差矩阵的迹，如果迹小于迹门限值，说明这几个近邻内聚性好，如完成所有测试样本类别聚类则转到7)步结束；否则马上进行初始类别的融合，转到6)步；
6)、进行初始类别的融合，并循环完成每个初始类别最终的融合；
7)、建模成功，保存相应模型的参数：近邻数目值K，协方差矩阵迹门限值tr，距离门限值d0。
3、如权利要求2所述卷烟感官质量定性指标评估方法，其特征在于，步骤6)中初始类别的融合过程为：保存每个检测样本Xi最近邻样本名称Xj，取出Xi剩余的K-1个近邻样本和Xj的K-1个近邻样本进行距离计算Dmn＝min‖Xm-Xn‖2，获得距离矩阵[Dmn](k-1)*(k-1)；然后根据已经设定的距离门限值λ，将距离矩阵转换为二值矩阵[Tmn](k-1) *(k-1) ，原则为：当Dmn＜λ则为1，否则为0；根据二值矩阵，求出矩阵的秩，则为连通子图的数目，求矩阵行向量的线性相关组，则将每行中包含1值的列所代表的样本点连接起来，就是每个类的连通子图，它们是属于同一个类的样本点。
4、如权利要求1或2所述卷烟感官质量定性指标评估方法，其特征在于，通过自适应K近邻聚类算法建立的卷烟感官质量定性指标评估模型，对待测卷烟感官质量定性指标的评估的步骤如下：
1)、选定待测卷烟理化指标项和数据内容，并进行极差归一化处理，作为输入参数；
2)、将上一步获得的输入参数输入采用自适应K近邻聚类算法建立的卷烟感官质量定性指标评估模型；
3)、通过上一步卷烟感官质量定性指标评估模型计算，其输出值是待测样本的所属类别，代表了待测样本的卷烟感官质量定性指标属于的等级值。

说明书全文

技术领域

本发明涉及一种卷烟感官质量定性指标评估方法，特别涉及一种利用自适应K近邻聚类算法建立评估模型，实现对待测卷烟感官质量定性指标的评估的方法。

背景技术

在现今的烟草行业中，要评价烟叶质量的好坏，主要依靠人工评吸后的感官体验来判定。企业长期以来积累了很多标准样本数据和日常检测数据。卷烟的烟气成分数据是仪器检测的，具有连续值特征。而感官质量评定主要依靠专家通过评吸完成，数据是分等级的语言变量。感官质量定性指标主要包括：香型、香气质、香气量等。日常评吸结果往往因专家情绪、个人喜好等感性因素的影响，具有主观性和不确定性，无法得到最客观科学的评价结果。而且组织专家进行大量的评估，费用高，时间长。因此采用模式识别的聚类分析方法，很适合解决此类质量评估工业应用问题。现有对感官质量定性指标的研究成果表明，卷烟的理化指标对其感官质量的影响是非常重要的。因此模型的输入变量为卷烟样本数据中的理化指标，它们为连续值，输出变量为卷烟的感官质量定性指标，它们为语言值。
近年来，采用计算机辅助和数据分析理论结合来建立常规理化与感官质量指标间关系模型的研究非常多。一些是采用多元回归等传统统计方法来分析，这些模型只对使用的样本有适用性，不能自适应新样本的改变，经常需要重新建立回归模型。另一些则采用神经网络技术建立模型。但这两种方法在对输入输出参数是连续的情况是较理想的方法。一旦要建立的是一个离散型输出变量与多维输入变量的关系模型时，则显现的“力不从心”。目前在卷烟行业感官质量定性指标评估方面的方法主要有线性回归法、灰色关联法、模糊综合评判等方法。这些方法并不适合评估离散的定性指标值，这也是现有各种算法对这些定性指标的评估结果不理想的原因。
聚类分析是人们认识事务经常采用的方法。它需要对事务的某些特征综合考虑，按照约定的类别判定准则得到结果。K近邻方法是一个不需要特定训练集的简单方法，它通过判断测试样本周围K个参考样本的类别来确定此样本类别。验证时，仅需要给出样本的参考点集，在其中考虑测试样本的k个近邻大部分属于哪一类，则此样本就属于哪一类。设K是事先设定的近邻数目，一般取奇数。K1是测试样本点 K个近邻中属于A类的数目，K2是其中属于B类的数目。K1+K2＝K；决策准则是：K1-K2＞0则为A类，K1-K2＜＝0则为B类。算法简单易实现。但缺点是边界处样本类别的判断难。
传统的K近邻聚类算法中初始类别数K和连接损失值上限的设定对聚类结果带来的负面影响传统的K近邻聚类算法简单，但缺陷就在于受初始近邻值K的影响较大。如果数据集复杂，不是均匀分布时，K 值定太大会使初始类别出错，导致最后聚类也错误。K值太小会使单个类别中数目多，判定类别关系时计算非常复杂。

发明内容

本发明的目的在于克服现有技术中的缺陷，本发明提供了一种通过自适应K近邻聚类算法建立卷烟感官质量定性指标评估模型，对待测卷烟感官质量定性指标的评估，实现了适合于解决烟叶数据的非均匀分布现状下的数据分析方法。
为了达到上述目的，本发明提供了一种卷烟感官质量定性指标评估方法，以卷烟的理化指标为基础，通过自适应K近邻聚类算法，建立卷烟感官质量定性指标评估模型，从而实现对待测卷烟感官质量定性指标的评估。
所述通过自适应K近邻聚类算法建立卷烟感官质量定性指标评估模型包括如下步骤：
1)、将卷烟的理化指标样本数据和卷烟感官质量指标样本数据并存储；
2)、以上一步的卷烟标样样本数据作为参考点，确定其理化指标作为建模的输入参数，并对其进行极差化归一处理；将上述卷烟感官质量定性指标样本数据转换为离散的类别值；如将卷烟的香型清香对应为1，清偏中对应为2，直到浓香对应为7。而其他的卷烟检测数据中理化指标数据仍要进行归一化处理；卷烟感官质量定性指标数据为多人评定感官后的平均分值；如香气质会出现2.5；将这些感官值作为输出数据。
3)、定义自适应K近邻聚类算法的初始化参数：协方差矩阵迹门限值为0.01，距离门限值为0.1；
4)、通过传统K近邻聚类算法求得初始类别，先计算卷烟检测数据与标样数据间的距离值：Dij＝min||Xi-Xj||2；对每个测试样本Xi，其初始类别的判别原则是：找出与Xi距离最小的K个标样样本，按照传统K近邻聚类算法，通过比较K个标样样本中靠近K1类还是K2类的次数多，来确定测试样本Xi的初始类别；
5)、依次从测试样本Xi的K近邻样本中组成矩阵M，求它的协方差矩阵的迹Trace(M)，如果迹小于迹门限值α，说明这几个近邻内聚性好，即这K个标样样本属于同一类A类的比例占多数，因此可以认为Xi属于A类，则完成类别聚类，然后循环判断下一个初始类别中的近邻内聚情况，直到完成所有类别聚类则转到7)步结束；否则马上进行初始类别的融合，转到6)步。
6)、进行初始类别的融合，其过程为：保存每个测试样本Xi最近邻样本名称Xj，取出Xi剩余的K-1个近邻样本和Xj的K-1个近邻样本进行距离计算Dmn＝min||Xm-Xn||2，获得距离矩阵[Dmn](k-1)*(k-1)。然后根据已经设定的距离门限值λ，将距离矩阵转换为二值矩阵 [Tmn](k-1)*(k-1)，原则为：当Dmn＜λ则为1，否则为0。根据二值矩阵，求出矩阵的秩，则为连通子图的数目，求矩阵行向量的线性相关组，则将每行中包含1值的列所代表的样本点连接起来，就是每个类的连通子图，它们是属于同一个类的样本点，循环完成每个初始类别最终的融合。
7)、建模成功，并保存相应模型的参数：近邻数目值K，协方差矩阵迹门限值tr，距离门限值d0。
通过自适应K近邻聚类算法建立的卷烟感官质量定性指标评估模型，对待测卷烟感官质量定性指标的评估的步骤如下：
1)、选定待测卷烟理化指标项和数据内容，并进行极差归一化处理，然后作为模型的输入；
2)、将上一步获得的测试样本数据，要求必须具有相对应的理化指标项，输入到已采用自适应K近邻聚类算法建立的卷烟感官质量定性指标评估模型；
3)、通过上一步卷烟感官质量定性指标评估模型计算，其输出值是待测样本的所属类别，代表了待测样本的卷烟感官质量定性指标属于的等级值。
卷烟数据包括标样数据和日常检测数据。标样数据是组织国内著名专家评吸的具有代表性的卷烟样本相应数据，日常检测数据是平时为保证生产质量以及研究所采集的相应数据。
卷烟感官质量评价中香型、香气质等指标都以等级表示，非常适合用自适应K近邻聚类法来建立常规理化与这些感官指标的映射关系。
用K近邻聚类方法充分反映了输入变量对输出变量的综合影响。而且在类别内起到相似样本的连接作用。自适应的K近邻聚类算法是加入了类内协方差矩阵，调整类别个数。使之更与实际样本的空间分布更接近。初始类别建立后，根据样本与其他类别中心的距离建立的协方差矩阵，利用矩阵迹越小，类别关系越大，样本在类中的内聚性就越强的原理，判定样本最终类的归属情况。最终能实现更逼近真实类别中样本的分布情况。
本发明创造性地将K个近邻的选取过程更合理。首先通过传统K 近邻聚类算法计算出每个样本Xm的初始类别。然后依次从它的最近邻样本中组成矩阵M，求它的协方差矩阵的迹Trace(M)，如果迹小于迹门限值α，说明这几个近邻内聚性好。否则马上进行初始类别的融合。因为在K近邻聚类时存在如下情况：样本X1与Xm验证时发现它们两者为最近邻，但是各自又与其他不同的样本为K近邻，X1与X2、Xp， Xm与X5、Xq。这样需要将这些X2、Xp、X5、Xq等K近邻样本的初始类别间的距离矩阵Dij＝min||Xi-Xj||2计算出来。然后根据已经设定的距离门限值λ将距离矩阵转换为二值矩阵：当Dij＜λ则为1，否则为0。每个类的连通子图就是矩阵求其线性相关组后，得到新的矩阵每行中对应的所有为1的点连接的子图。它们是属于一个类的样本点。这样测试样本的具体类别所属关系就确定下来。
这个评估系统改善了过去采用BP神经网络评估定性指标性能差的缺陷。而且能减少人工评吸量，提高配方功效，逐步实现卷烟配方智能化；并能从常规理化与感官质量指标间相关性结论提供有力的证明。
附图说明
图1为本发明利用自适应K近邻聚类算法建立卷烟感官质量定性指标评估模型的流程图；
图2为本发明对待测卷烟感官质量定性指标的评估的流程图。

具体实施方式

下面结合附图对本发明进行详细的说明。
本发明提供的一种卷烟感官质量定性指标评估方法，以卷烟的理化指标为基础，通过自适应K近邻聚类算法，建立卷烟感官质量定性指标评估模型，从而实现对待测卷烟感官质量定性指标的评估。
如图1所示，通过如下步骤利用自适应K近邻聚类算法建立卷烟感官质量定性指标评估模型：
1)、将卷烟的理化指标样本数据和卷烟感官质量指标样本数据存储；单料烟理化指标包括总糖、总烟碱、还原糖、总氮、蛋白质、氯气、钾、施木克值、糖碱比、钾氯比。将测得的上述数据输入数据库；目前使用卷烟的感官质量定性指标有香型、香气质和香气量，香型包括清、清偏中、中偏清、中、中偏浓、浓偏中、浓、特异香型；香气质包括足、较足、较差；香气量包括好、较好、不足、较少。
2)、在上一步得到的理化指标样本数据中选择标样数据作为输入参数，选择的理化指示样本输入参数为总糖、总烟碱、还原糖、总氮、蛋白质、氯气、施木克值、糖碱比并对其进行归一化处理；可采用极差化归一，

x^{'} = \frac{(x - x_{\max})}{(x - x_{\min})} + 0.01,

xmax、xmin分别为参数x出现的最大、最小值。原始数据被归一化到(0，1]的范围。用于建立感官定性指标聚类评估模型的输出参数为：香型、香气质、香气量，将上述标样数据的卷烟感官质量指标数据中的定性指标样本数据转换为离散的类别值；如将卷烟的香型清香对应为1，清偏中对应为2，直到浓香对应为7。而日常卷烟检测数据中理化指标数据仍要进行归一化处理；其卷烟感官质量定性指标数据是经过多人评吸卷烟后的平均分值；如香气质会出现2.5；将这些感官值作为输出参数。
3)、定义自适应K近邻聚类算法的初始化参数：协方差矩阵迹门限值为0.01，距离门限值为0.1；
4)、通过传统K近邻聚类算法，先计算卷烟检测数据与标样数据间的距离值：Dij＝min||Xi-Xj||2；按照传统K近邻聚类算法，搜索出当前检测数据与标样数据，来确定测试样本Xi的初始类别；对每个测试样本Xi，其初始类别的判别原则是：找出与Xi距离最小的K个标样样本，按照传统K近邻聚类算法，通过比较K个标样样本中靠近K1类还是K2类的次数多，来确定测试样本Xi的初始类别；
5)、依次从它的K近邻样本中组成矩阵M，求它的协方差矩阵的迹Trace(M)，如果迹小于迹门限值α，说明这几个近邻内聚性好，则循环判断下一个初始类别中的近邻内聚情况，直到完成所有类别聚类则转到7)步结束，否则马上进行初始类别的融合，转到6)步。
整个算法思想如下：
计算测试样本X和参考样本集Y间的距离矩阵D： Dij＝min||Xi-Yj||2。
对每个测试样本Xi对应的D矩阵中第i行，将第i行的元素值进行从小到大排序。取出前K个最小距离的元素所对应的列，即得到Xi 和这K个标样靠近。比较K个标样输出值的不同的数目，若K1-K2＞0则 Xi属于K1个标样代表的类别，K1-K2＜＝0，则Xi属于K2个标样代表的类别。
依次从Xi的K近邻样本中组成矩阵M，求它的协方差矩阵的迹 Trace(M)，如果迹小于迹门限值α，说明这几个近邻内聚性好，则循环判断下一个初始类别中的近邻内聚情况，直到完成所有类别聚类则转到7)步结束。否则马上进行初始类别的融合，转到6)步。
6)、初始类别的融合过程为：保存每个测试样本Xi最近邻样本名称Yj，取出Xi剩余的K-1个近邻样本进行距离计算 Dmn＝min||Xm-Xn||2，获得距离矩阵[Dmn](k-1)*(k-1)。然后根据已经设定的距离门限值λ，将距离矩阵转换为二值矩阵[Tmn](k-1)*(k-1)，原则为：当Dmn＜λ则为1，否则为0。根据二值矩阵，求出矩阵的秩，则为连通子图的数目，求矩阵行向量的线性相关组，则将每行中包含1值的列所代表的样本点连接起来，就是每个类的连通子图，它们是属于同一个类的样本点。循环完成每个初始类别最终的融合。
7)建模成功，保存相应模型的参数：近邻数目值K，协方差矩阵迹门限值tr，距离门限值d0。
如图2所示，通过上述步骤建立的卷烟感官质量定性指标评估模型，对新的待测卷烟感官质量定性指标的评估的步骤如下：
1)、输入待测卷烟样本的理化指标数据，要求理化指标项与建模时采用的理化指标项要对应，确定具有这些理化指标项的测试样本数据作为输入；
2)、将上一步获得的输入参数输入自适应K近邻聚类算法建立的卷烟感官质量定性指标评估模型；计算待测样本数据与K个样本的近邻函数值，判断K个样本归属的类别，以最小近邻函数值出现在某个类别中来表示待测样本所属。例如，新检测了10个山东地区的烟叶10 个理化指标，可将其数据输入，并完成对数据的归一化处理过程。这 10个数据依次通过与每个类中样本计算其近邻函数值，找出最小近邻样本点属于哪类，则这个新的烟叶就属于这类。于是就预测出其感官定性指标用等级分值表示的类别概念，和其语言变量相对应。
3)、通过上一步卷烟感官质量定性指标评估模型计算，其输出值是待测样本的所属类别，代表了待测样本的卷烟感官质量定性指标属于的等级值。
最后将待测卷烟的理化指标与卷烟感官质量定性指标之间的对应关系转换为用户理解的数据或字符型描述形式，供用户参考。

标题	发布/更新时间	阅读量
一种基于非线性增强子空间聚类的图像识别方法	2020-05-11	634
一种基于扩张点卷积空间金字塔池化的点云语义分割方法	2020-05-11	332
用于操作三维动画角色的方法和装置	2020-05-12	814
基于K最近邻算法攻击识别方法及充电装置	2020-05-11	699
一种基于加权联合最近邻的多任务稀疏表示检测方法	2020-05-08	944
一种机器学习分类模型在青少年孤独症辅助诊断中的应用方法	2020-05-12	742
一种加强鲁棒性的无人机航拍图像拼接方法	2020-05-08	177
基于移动设备的机会式群体智能空气质量监测及评估方法	2020-05-11	336
基于异构多核的卫星气象数据喷泉解码算法硬件化系统	2020-05-12	232
基于自样例增强的超分辨率图像重建方法	2020-05-08	196

卷烟感官质量定性指标评估方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：