首页 / 专利库 / 电脑编程 / K最近邻算法 / 卷烟感官质量定性指标评估方法

卷烟感官质量定性指标评估方法

阅读:379发布:2021-12-20

专利汇可以提供卷烟感官质量定性指标评估方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种 卷烟 感官 质量 定性指标评估方法,以卷烟样本的理化指标为 基础 ,采用自适应K近邻聚类 算法 ,建立卷烟感官质量定性指标评估模型,以实现对待测卷烟感官质量定性指标的评估。本发明创造性地将K个近邻的选取过程更合理,首先通过传统K近邻 聚类算法 计算出每个样本的初始类别。然后依次从它的最近邻样本中组成矩阵,求它的协方差矩阵的迹,如果迹小于迹 门 限值,说明这几个近邻内聚性好;否则 马 上进行初始类别的融合。直至所有测试样本的具体类别所属关系确定。本发明具有减少人工评吸工作量,降低检测 费用 ,提高工作效率的功能。,下面是卷烟感官质量定性指标评估方法专利的具体信息内容。

1、一种卷烟感官质量定性指标评估方法,其特征在于,以卷烟样 本的理化指标为基础,采用自适应K近邻聚类算法,建立卷烟感官质 量定性指标评估模型,以实现对待测卷烟感官质量定性指标的评估。
2、如权利要求1所述卷烟感官质量定性指标评估方法,其特征在 于,所述采用自适应K近邻聚类算法建立卷烟感官质量定性指标评估 模型包括如下步骤:
1)、将卷烟的理化指标标样样本数据和对应的卷烟感官质量指标 样本数据存储;
2)、在上一步的卷烟的标样样本数据中选出若干个作为参考点,同 时确定这些参考点的相应的理化指标项为输入参数,并对其进行极差 归一化处理;将上述卷烟样本对应的感官质量指标数据中的定性指标 样本数据转换为离散的类别值,将该类别值作为输出参数;
3)、定义自适应K近邻聚类算法的初始化参数:协方差矩阵迹 限值为0.01,距离门限值为0.1;
4)、通过传统K近邻聚类算法求得初始类别,先计算所有卷烟测 试数据与标样数据间的距离值;按照传统K近邻聚类算法,搜索出当 前测试数据与标样数据距离最小者,来确定测试样本Xi的初始类别;
5)、循环判断上一步得到的初始类别中近邻内聚的情况,依次从 测试样本Xi的K近邻样本中组成矩阵M,求其协方差矩阵的迹,如果 迹小于迹门限值,说明这几个近邻内聚性好,如完成所有测试样本类 别聚类则转到7)步结束;否则上进行初始类别的融合,转到6)步;
6)、进行初始类别的融合,并循环完成每个初始类别最终的融合;
7)、建模成功,保存相应模型的参数:近邻数目值K,协方差矩 阵迹门限值tr,距离门限值d0。
3、如权利要求2所述卷烟感官质量定性指标评估方法,其特征在 于,步骤6)中初始类别的融合过程为:保存每个检测样本Xi最近邻 样本名称Xj,取出Xi剩余的K-1个近邻样本和Xj的K-1个近邻样 本进行距离计算Dmn=min‖Xm-Xn‖2,获得距离矩阵[Dmn](k-1)*(k-1);然 后根据已经设定的距离门限值λ,将距离矩阵转换为二值矩阵[Tmn](k-1) *(k-1) ,原则为:当Dmn<λ则为1,否则为0;根据二值矩阵,求出矩阵 的秩,则为连通子图的数目,求矩阵行向量的线性相关组,则将每行 中包含1值的列所代表的样本点连接起来,就是每个类的连通子图, 它们是属于同一个类的样本点。
4、如权利要求1或2所述卷烟感官质量定性指标评估方法,其特 征在于,通过自适应K近邻聚类算法建立的卷烟感官质量定性指标评 估模型,对待测卷烟感官质量定性指标的评估的步骤如下:
1)、选定待测卷烟理化指标项和数据内容,并进行极差归一化处 理,作为输入参数;
2)、将上一步获得的输入参数输入采用自适应K近邻聚类算法建 立的卷烟感官质量定性指标评估模型;
3)、通过上一步卷烟感官质量定性指标评估模型计算,其输出值 是待测样本的所属类别,代表了待测样本的卷烟感官质量定性指标属 于的等级值。

说明书全文

技术领域

发明涉及一种卷烟感官质量定性指标评估方法,特别涉及一种 利用自适应K近邻聚类算法建立评估模型,实现对待测卷烟感官质量 定性指标的评估的方法。

背景技术

在现今的烟草行业中,要评价烟叶质量的好坏,主要依靠人工评 吸后的感官体验来判定。企业长期以来积累了很多标准样本数据和日 常检测数据。卷烟的烟气成分数据是仪器检测的,具有连续值特征。 而感官质量评定主要依靠专家通过评吸完成,数据是分等级的语言变 量。感官质量定性指标主要包括:香型、香气质、香气量等。日常评 吸结果往往因专家情绪、个人喜好等感性因素的影响,具有主观性和 不确定性,无法得到最客观科学的评价结果。而且组织专家进行大量 的评估,费用高,时间长。因此采用模式识别聚类分析方法,很适 合解决此类质量评估工业应用问题。现有对感官质量定性指标的研究 成果表明,卷烟的理化指标对其感官质量的影响是非常重要的。因此 模型的输入变量为卷烟样本数据中的理化指标,它们为连续值,输出 变量为卷烟的感官质量定性指标,它们为语言值。
近年来,采用计算机辅助和数据分析理论结合来建立常规理化与 感官质量指标间关系模型的研究非常多。一些是采用多元回归等传统 统计方法来分析,这些模型只对使用的样本有适用性,不能自适应新 样本的改变,经常需要重新建立回归模型。另一些则采用神经网络技 术建立模型。但这两种方法在对输入输出参数是连续的情况是较理想 的方法。一旦要建立的是一个离散型输出变量与多维输入变量的关系 模型时,则显现的“不从心”。目前在卷烟行业感官质量定性指标评 估方面的方法主要有线性回归法、灰色关联法、模糊综合评判等方法。 这些方法并不适合评估离散的定性指标值,这也是现有各种算法对这 些定性指标的评估结果不理想的原因。
聚类分析是人们认识事务经常采用的方法。它需要对事务的某些 特征综合考虑,按照约定的类别判定准则得到结果。K近邻方法是一 个不需要特定训练集的简单方法,它通过判断测试样本周围K个参考 样本的类别来确定此样本类别。验证时,仅需要给出样本的参考点集, 在其中考虑测试样本的k个近邻大部分属于哪一类,则此样本就属于 哪一类。设K是事先设定的近邻数目,一般取奇数。K1是测试样本点 K个近邻中属于A类的数目,K2是其中属于B类的数目。K1+K2=K; 决策准则是:K1-K2>0则为A类,K1-K2<=0则为B类。算法简单易实 现。但缺点是边界处样本类别的判断难。
传统的K近邻聚类算法中初始类别数K和连接损失值上限的设定 对聚类结果带来的负面影响传统的K近邻聚类算法简单,但缺陷就在 于受初始近邻值K的影响较大。如果数据集复杂,不是均匀分布时,K 值定太大会使初始类别出错,导致最后聚类也错误。K值太小会使单个 类别中数目多,判定类别关系时计算非常复杂。

发明内容

本发明的目的在于克服现有技术中的缺陷,本发明提供了一种通 过自适应K近邻聚类算法建立卷烟感官质量定性指标评估模型,对待 测卷烟感官质量定性指标的评估,实现了适合于解决烟叶数据的非均 匀分布现状下的数据分析方法。
为了达到上述目的,本发明提供了一种卷烟感官质量定性指标评 估方法,以卷烟的理化指标为基础,通过自适应K近邻聚类算法,建 立卷烟感官质量定性指标评估模型,从而实现对待测卷烟感官质量定 性指标的评估。
所述通过自适应K近邻聚类算法建立卷烟感官质量定性指标评估 模型包括如下步骤:
1)、将卷烟的理化指标样本数据和卷烟感官质量指标样本数据并 存储;
2)、以上一步的卷烟标样样本数据作为参考点,确定其理化指标 作为建模的输入参数,并对其进行极差化归一处理;将上述卷烟感官 质量定性指标样本数据转换为离散的类别值;如将卷烟的香型清香对 应为1,清偏中对应为2,直到浓香对应为7。而其他的卷烟检测数据 中理化指标数据仍要进行归一化处理;卷烟感官质量定性指标数据为 多人评定感官后的平均分值;如香气质会出现2.5;将这些感官值作为 输出数据。
3)、定义自适应K近邻聚类算法的初始化参数:协方差矩阵迹 限值为0.01,距离门限值为0.1;
4)、通过传统K近邻聚类算法求得初始类别,先计算卷烟检测数 据与标样数据间的距离值:Dij=min||Xi-Xj||2;对每个测试样本Xi,其 初始类别的判别原则是:找出与Xi距离最小的K个标样样本,按照传 统K近邻聚类算法,通过比较K个标样样本中靠近K1类还是K2类的 次数多,来确定测试样本Xi的初始类别;
5)、依次从测试样本Xi的K近邻样本中组成矩阵M,求它的协方 差矩阵的迹Trace(M),如果迹小于迹门限值α,说明这几个近邻内聚 性好,即这K个标样样本属于同一类A类的比例占多数,因此可以认 为Xi属于A类,则完成类别聚类,然后循环判断下一个初始类别中的 近邻内聚情况,直到完成所有类别聚类则转到7)步结束;否则上进 行初始类别的融合,转到6)步。
6)、进行初始类别的融合,其过程为:保存每个测试样本Xi最近 邻样本名称Xj,取出Xi剩余的K-1个近邻样本和Xj的K-1个近邻 样本进行距离计算Dmn=min||Xm-Xn||2,获得距离矩阵[Dmn](k-1)*(k-1)。 然后根据已经设定的距离门限值λ,将距离矩阵转换为二值矩阵 [Tmn](k-1)*(k-1),原则为:当Dmn<λ则为1,否则为0。根据二值矩阵,求出 矩阵的秩,则为连通子图的数目,求矩阵行向量的线性相关组,则将 每行中包含1值的列所代表的样本点连接起来,就是每个类的连通子 图,它们是属于同一个类的样本点,循环完成每个初始类别最终的融 合。
7)、建模成功,并保存相应模型的参数:近邻数目值K,协方差 矩阵迹门限值tr,距离门限值d0。
通过自适应K近邻聚类算法建立的卷烟感官质量定性指标评估模 型,对待测卷烟感官质量定性指标的评估的步骤如下:
1)、选定待测卷烟理化指标项和数据内容,并进行极差归一化处 理,然后作为模型的输入;
2)、将上一步获得的测试样本数据,要求必须具有相对应的理化 指标项,输入到已采用自适应K近邻聚类算法建立的卷烟感官质量定 性指标评估模型;
3)、通过上一步卷烟感官质量定性指标评估模型计算,其输出值 是待测样本的所属类别,代表了待测样本的卷烟感官质量定性指标属 于的等级值。
卷烟数据包括标样数据和日常检测数据。标样数据是组织国内著 名专家评吸的具有代表性的卷烟样本相应数据,日常检测数据是平时 为保证生产质量以及研究所采集的相应数据。
卷烟感官质量评价中香型、香气质等指标都以等级表示,非常适 合用自适应K近邻聚类法来建立常规理化与这些感官指标的映射关系。
用K近邻聚类方法充分反映了输入变量对输出变量的综合影响。 而且在类别内起到相似样本的连接作用。自适应的K近邻聚类算法是 加入了类内协方差矩阵,调整类别个数。使之更与实际样本的空间分 布更接近。初始类别建立后,根据样本与其他类别中心的距离建立的 协方差矩阵,利用矩阵迹越小,类别关系越大,样本在类中的内聚性 就越强的原理,判定样本最终类的归属情况。最终能实现更逼近真实 类别中样本的分布情况。
本发明创造性地将K个近邻的选取过程更合理。首先通过传统K 近邻聚类算法计算出每个样本Xm的初始类别。然后依次从它的最近邻 样本中组成矩阵M,求它的协方差矩阵的迹Trace(M),如果迹小于迹 门限值α,说明这几个近邻内聚性好。否则马上进行初始类别的融合。 因为在K近邻聚类时存在如下情况:样本X1与Xm验证时发现它们两 者为最近邻,但是各自又与其他不同的样本为K近邻,X1与X2、Xp, Xm与X5、Xq。这样需要将这些X2、Xp、X5、Xq等K近邻样本 的初始类别间的距离矩阵Dij=min||Xi-Xj||2计算出来。然后根据已经设 定的距离门限值λ将距离矩阵转换为二值矩阵:当Dij<λ则为1,否 则为0。每个类的连通子图就是矩阵求其线性相关组后,得到新的矩阵 每行中对应的所有为1的点连接的子图。它们是属于一个类的样本点。 这样测试样本的具体类别所属关系就确定下来。
这个评估系统改善了过去采用BP神经网络评估定性指标性能差的 缺陷。而且能减少人工评吸量,提高配方功效,逐步实现卷烟配方智 能化;并能从常规理化与感官质量指标间相关性结论提供有力的证明。
附图说明
图1为本发明利用自适应K近邻聚类算法建立卷烟感官质量定性 指标评估模型的流程图
图2为本发明对待测卷烟感官质量定性指标的评估的流程图。

具体实施方式

下面结合附图对本发明进行详细的说明。
本发明提供的一种卷烟感官质量定性指标评估方法,以卷烟的理 化指标为基础,通过自适应K近邻聚类算法,建立卷烟感官质量定性 指标评估模型,从而实现对待测卷烟感官质量定性指标的评估。
如图1所示,通过如下步骤利用自适应K近邻聚类算法建立卷烟 感官质量定性指标评估模型:
1)、将卷烟的理化指标样本数据和卷烟感官质量指标样本数据存 储;单料烟理化指标包括总糖、总烟、还原糖、总氮、蛋白质、氯 气、、施木克值、糖碱比、钾氯比。将测得的上述数据输入数据库; 目前使用卷烟的感官质量定性指标有香型、香气质和香气量,香型包括 清、清偏中、中偏清、中、中偏浓、浓偏中、浓、特异香型;香气质 包括足、较足、较差;香气量包括好、较好、不足、较少。
2)、在上一步得到的理化指标样本数据中选择标样数据作为输入 参数,选择的理化指示样本输入参数为总糖、总烟碱、还原糖、总氮、 蛋白质、氯气、施木克值、糖碱比并对其进行归一化处理;可采用极 差化归一, x = ( x - x max ) ( x - x min ) + 0.01 , xmax、xmin分别为参数x出现的最大、最小 值。原始数据被归一化到(0,1]的范围。用于建立感官定性指标聚类评 估模型的输出参数为:香型、香气质、香气量,将上述标样数据的卷 烟感官质量指标数据中的定性指标样本数据转换为离散的类别值;如 将卷烟的香型清香对应为1,清偏中对应为2,直到浓香对应为7。而 日常卷烟检测数据中理化指标数据仍要进行归一化处理;其卷烟感官 质量定性指标数据是经过多人评吸卷烟后的平均分值;如香气质会出 现2.5;将这些感官值作为输出参数。
3)、定义自适应K近邻聚类算法的初始化参数:协方差矩阵迹门 限值为0.01,距离门限值为0.1;
4)、通过传统K近邻聚类算法,先计算卷烟检测数据与标样数据 间的距离值:Dij=min||Xi-Xj||2;按照传统K近邻聚类算法,搜索出当 前检测数据与标样数据,来确定测试样本Xi的初始类别;对每个测试 样本Xi,其初始类别的判别原则是:找出与Xi距离最小的K个标样样 本,按照传统K近邻聚类算法,通过比较K个标样样本中靠近K1类 还是K2类的次数多,来确定测试样本Xi的初始类别;
5)、依次从它的K近邻样本中组成矩阵M,求它的协方差矩阵的 迹Trace(M),如果迹小于迹门限值α,说明这几个近邻内聚性好,则 循环判断下一个初始类别中的近邻内聚情况,直到完成所有类别聚类 则转到7)步结束,否则马上进行初始类别的融合,转到6)步。
整个算法思想如下:
计算测试样本X和参考样本集Y间的距离矩阵D: Dij=min||Xi-Yj||2。
对每个测试样本Xi对应的D矩阵中第i行,将第i行的元素值进 行从小到大排序。取出前K个最小距离的元素所对应的列,即得到Xi 和这K个标样靠近。比较K个标样输出值的不同的数目,若K1-K2>0则 Xi属于K1个标样代表的类别,K1-K2<=0,则Xi属于K2个标样代表的 类别。
依次从Xi的K近邻样本中组成矩阵M,求它的协方差矩阵的迹 Trace(M),如果迹小于迹门限值α,说明这几个近邻内聚性好,则循环 判断下一个初始类别中的近邻内聚情况,直到完成所有类别聚类则转 到7)步结束。否则马上进行初始类别的融合,转到6)步。
6)、初始类别的融合过程为:保存每个测试样本Xi最近邻样本名 称Yj,取出Xi剩余的K-1个近邻样本进行距离计算 Dmn=min||Xm-Xn||2,获得距离矩阵[Dmn](k-1)*(k-1)。然后根据已经设定 的距离门限值λ,将距离矩阵转换为二值矩阵[Tmn](k-1)*(k-1),原则为: 当Dmn<λ则为1,否则为0。根据二值矩阵,求出矩阵的秩,则为连 通子图的数目,求矩阵行向量的线性相关组,则将每行中包含1值的 列所代表的样本点连接起来,就是每个类的连通子图,它们是属于同 一个类的样本点。循环完成每个初始类别最终的融合。
7)建模成功,保存相应模型的参数:近邻数目值K,协方差矩阵 迹门限值tr,距离门限值d0。
如图2所示,通过上述步骤建立的卷烟感官质量定性指标评估模 型,对新的待测卷烟感官质量定性指标的评估的步骤如下:
1)、输入待测卷烟样本的理化指标数据,要求理化指标项与建模 时采用的理化指标项要对应,确定具有这些理化指标项的测试样本数 据作为输入;
2)、将上一步获得的输入参数输入自适应K近邻聚类算法建立的 卷烟感官质量定性指标评估模型;计算待测样本数据与K个样本的近 邻函数值,判断K个样本归属的类别,以最小近邻函数值出现在某个 类别中来表示待测样本所属。例如,新检测了10个山东地区的烟叶10 个理化指标,可将其数据输入,并完成对数据的归一化处理过程。这 10个数据依次通过与每个类中样本计算其近邻函数值,找出最小近邻 样本点属于哪类,则这个新的烟叶就属于这类。于是就预测出其感官 定性指标用等级分值表示的类别概念,和其语言变量相对应。
3)、通过上一步卷烟感官质量定性指标评估模型计算,其输出值 是待测样本的所属类别,代表了待测样本的卷烟感官质量定性指标属 于的等级值。
最后将待测卷烟的理化指标与卷烟感官质量定性指标之间的对应 关系转换为用户理解的数据或字符型描述形式,供用户参考。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈