首页 / 专利库 / 人工智能 / 人工神经网络 / 一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法

一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法

阅读:1049发布:2020-07-20

专利汇可以提供一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法专利检索,专利查询,专利分析的服务。并且一种 近红外 光谱 判别不同栽培环境同一品种茶鲜叶的方法,应用 近红外光谱 仪扫描获得不同栽培环境同一品种茶鲜叶样品近红外光谱,然后对鲜叶样品光谱进行主成分分析,再以主成分为输入值建立多种信息传递方式的 人工神经网络 预测模型 ,具体包括以下步骤:鲜叶样品采集与分类,光谱采集,光谱预处理,鲜叶光谱主成分分析,人工神经网络预测模型建立以及模型验证。实现了不同栽培环境同一品种茶鲜叶的快速、无损、准确的判定;研究结果为探讨茶树与当地栽培生态环境间的互相作用关系提供了一种新思路。,下面是一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法专利的具体信息内容。

1.一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法,其特征在于,扫描获得不同栽培环境的同一品种鲜叶样品近红外光谱,然后对鲜叶样品光谱进行主成分分析,再以主成分为输入值建立多种信息传递方式的不同栽培环境鲜叶的人工神经网络预测模型判定鲜叶的不同栽培环境,具体包括以下步骤:
步骤一、鲜叶样品采集与分类
分别采集两种不同栽培环境的同一品种茶鲜叶样品,依据栽培环境不同,将样品随机划分为校正集和验证集2个集合,采摘的鲜叶样品为芽,第一叶、第二叶、第三叶、一芽一叶、一芽二叶和一芽三叶;
步骤二、光谱采集
应用傅里叶型近红外光谱仪扫描获得全部鲜叶样品的近红外光谱,该傅里叶型近红外光谱仪为用美国赛默飞·世尔AntarisⅡ型傅里叶近红外光谱仪,光谱扫描范围4000--1 -1
10000cm ,分辨率8cm ,检测器为InGaAs,每个样品采集10次光谱,每次扫描64次,取10次采集光谱的平均值作为该样品的最终光谱;
步骤三、光谱预处理
应用化学计量学软件对全部鲜叶样品的近红外光谱进行求导和平滑预处理,然后将鲜叶样品光谱转化为成对的数据点;
步骤四、鲜叶样品光谱主成分分析
应用Matlab软件对全部鲜叶样品的光谱数据进行主成分分析,求得全部鲜叶样品光谱数据的得分Score1值和Score2值,主成分数及其贡献率;
步骤五、建立人工神经网络预测模型
以校正集样品光谱的前3个主成分为输入值,以两种不同栽培环境的同一品种茶鲜叶样品为输出值,经过反复优化,建立standard nets、jump connection nets和Jordan-Elman nets三种信息传递方式鲜叶不同栽培环境人工神经网络预测模型,比较该三种模型相关系数R和交互验证均方根方差RMSECV值,
其中相关系数R公式为:
交互验证均方根方差RMSECV公式为:
式中,R为相关系数,n表示样本数,yi和yi’分别为样品集中第i个样品的栽培环境实测值和栽培环境预测值,为样品集中第i个样品的实测值的平均值,式中i≤n,其中以相关系数R最大和交互验证均方根方差RMSECV最小的模型为最佳模型,经比较后得到最佳校正集模型;
步骤六、模型验证
为避免出现过度拟合现象,应用验证集样品对得到的三种校正集模型预测效果进行检验,所得结果用相关系数R和验证集均方差RMSEP表示,其中相关系数R越大和验证集均方差RMSEP越小则表示检验效果越好,此时若得到的近红外光谱的栽培环境预测值与栽培环境实测值基本一致,则表示对验证集样品的预测效果很好,最佳校正集模型可以准确的预测鲜叶样品的不同栽培环境,
其中验证集均方差RMSEP公式为:
式中,n表示样本数,yi和yi’分别为样品集中第i个样品的栽培环境实测值和栽培环境预测值,式中i≤n。
2.根据权利要求1所述的一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法,其特征在于:所述的步骤一中鲜叶样品数量为100份,两种不同栽培环境鲜叶样品各50个,鲜叶样品按照7:3的比例随机划分为校正集和验证集。
3.根据权利要求1所述的一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法,其特征在于:所述步骤三中的化学计量学软件为TQAnalyst 9.4.45软件和OPUS 7.0软件。

说明书全文

一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法

技术领域

[0001] 本发明涉及一种同一品种茶鲜叶的判别方法,更具体的说涉及一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法。

背景技术

[0002] 茶树与当地环境是统一体。茶树在生长发育过程中,适应了当地的生态环境条件,而这些生态环境则关系着茶树的生存,对茶树的形态、结构、生理、生化特性都有重要影响。因此,同一品种的茶树在不同的栽培环境下,其鲜叶的理化性状是存在些许不同的。但是,目前还没有一种准确、无损的判别不同栽培环境下的同一品种茶鲜叶的方法。

发明内容

[0003] 本发明的目的在于针对目前没有一种判别不同栽培环境下的同一品种茶鲜叶方法的问题,提供一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法。
[0004] 为实现上述目的,本发明的技术解决方案是:一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法,扫描获得不同栽培环境的同一品种鲜叶样品近红外光谱,然后对鲜叶样品光谱进行主成分分析,再以主成分为输入值建立多种信息传递方式的不同栽培环境鲜叶的人工神经网络预测模型判定鲜叶的不同栽培环境,具体包括以下步骤:
[0005] 步骤一、鲜叶样品采集与分类
[0006] 分别采集两种不同栽培环境的同一品种茶鲜叶样品,依据栽培环境不同,将样品随机划分为校正集和验证集2个集合;
[0007] 步骤二、光谱采集
[0008] 应用傅里叶型近红外光谱仪扫描获得全部鲜叶样品的近红外光谱;
[0009] 步骤三、光谱预处理
[0010] 应用化学计量学软件对全部鲜叶样品的近红外光谱进行求导和平滑预处理,然后将鲜叶样品光谱转化为成对的数据点;
[0011] 步骤四、鲜叶样品光谱主成分分析
[0012] 应用Matlab软件对全部鲜叶样品的光谱数据进行主成分分析,求得全部鲜叶样品光谱数据的得分Score1值和Score2值,主成分数及其贡献率;
[0013] 步骤五、建立人工神经网络预测模型
[0014] 以校正集样品光谱的前3个主成分为输入值,以两种不同栽培环境的同一品种茶鲜叶样品为输出值,经过反复优化,建立standard nets、jump connection nets和Jordan-Elman nets三种信息传递方式鲜叶不同栽培环境人工神经网络预测模型,比较该三种模型相关系数R和交互验证均方根方差RMSECV值,
[0015] 其中相关系数R公式为:
[0016] 交互验证均方根方差RMSECV公式为:
[0017] 式中,R为相关系数,n表示样本数,yi和yi’分别为样品集中第i个样品的栽培环境实测值和栽培环境预测值,为样品集中第i个样品的实测值的平均值,式中i≤n,[0018] 其中以相关系数R最大和交互验证均方根方差RMSECV最小的模型为最佳模型,经比较后得到最佳校正集模型;
[0019] 步骤六、模型验证
[0020] 为避免出现过度拟合现象,应用验证集样品对得到的三种校正集模型预测效果进行检验,所得结果用相关系数R和验证集均方差RMSEP表示,其中相关系数R越大和验证集均方差RMSEP越小则表示检验效果越好,此时若得到的近红外光谱的栽培环境预测值与栽培环境实测值基本一致,则表示对验证集样品的预测效果很好,最佳校正集模型可以准确的预测鲜叶样品的不同栽培环境,
[0021] 其中验证集均方差RMSEP公式为:
[0022] 式中,n表示样本数,yi和yi’分别为样品集中第i个样品的栽培环境实测值和栽培环境预测值,式中i≤n。
[0023] 所述的步骤一中鲜叶样品数量为100份,两种不同栽培环境鲜叶样品各50个,鲜叶样品按照7:3的比例随机划分为校正集和验证集。
[0024] 所述的步骤一中采摘的鲜叶样品为芽,第一叶、第二叶、第三叶、一芽一叶、一芽二叶和一芽三叶。
[0025] 所述步骤二中的傅里叶型近红外光谱仪为用美国赛默飞·世尔Antaris Ⅱ型傅里叶近红外光谱仪,光谱扫描范围4000-10000cm-1,分辨率8cm-1,检测器为InGaAs,每个样品采集10次光谱,每次扫描64次,取10次采集光谱的平均值作为该样品的最终光谱。
[0026] 所述步骤三中的化学计量学软件为TQ Analyst 9.4.45软件和OPUS 7.0软件。
[0027] 与现有技术相比,本发明的有益效果:
[0028] 本发明中基于近红外光谱技术,结合主成分分析和多种信息传递方式的人工神经网络模型判定不同栽培环境同一品种鲜叶,实现了不同栽培环境同一品种茶鲜叶的快速、准确、无损判定,有效的解决了不同栽培环境同一品种茶鲜叶判定难的问题,研究结果为探讨茶树与当地栽培生态环境间的互相作用关系提供了一种新思路。附图说明
[0029] 图1是本发明中全部100个鲜叶样品光谱图。
[0030] 图2是本发明中恩施市和咸丰县龙井43鲜叶样品Scores1值和Scores2值空间分布图。
[0031] 图3是本发明中standard nets信息传递人工神经网络结构。
[0032] 图4是本发明中jump connection nets信息传递人工神经网络结构。
[0033] 图5是本发明中Jordan-Elman nets信息传递人工神经网络结构。

具体实施方式

[0034] 以下结合附图说明和具体实施方式对本发明作进一步的详细描述。
[0035] 一种近红外光谱判别不同栽培环境同一品种茶鲜叶的方法,扫描获得不同栽培环境的同一品种茶鲜叶近红外光谱,然后对样品光谱进行主成分分析,再以主成分为输入值建立多种信息传递方式的不同栽培环境鲜叶的人工神经网络预测模型判定鲜叶的不同栽培环境。具体包括以下步骤:
[0036] 步骤一、鲜叶样品采集与分类
[0037] 分别采集两种不同栽培环境的同一品种茶鲜叶样品,依据栽培环境不同,将样品随机划分为校正集和验证集2个集合;其中验证集鲜叶样品用于检验鲜叶不同栽培环境校正集预测模型的稳健性。
[0038] 步骤二、光谱采集
[0039] 应用傅里叶型近红外光谱仪(FT-NIR)扫描获得全部鲜叶样品的近红外光谱。
[0040] 近红外光谱(NIRS)是一种介于可见光区和中红外光区之间的电磁波,具有快速、准确和无需预处理等特点,目前已经广泛应用于农业、石化行业、纺织业、医药行业和烟草行业中。在茶叶应用领域中,近红外光谱技术已经成功的实现了对咖啡、茶多酚总量的预测及对茶溯源地的判定等。
[0041] 步骤三、光谱预处理
[0042] 应用化学计量学软件对全部鲜叶样品的近红外光谱进行求导和平滑等预处理,然后将鲜叶样品光谱转化为成对的数据点,用于后续建立鲜叶产地校正集预测模型和验证集模型。
[0043] 步骤四、鲜叶样品光谱主成分分析(PCA)
[0044] 应用Matlab软件对全部鲜叶样品的光谱数据进行主成分分析,求得全部鲜叶样品光谱数据的得分Score1值和Score2值,主成分数及其贡献率。
[0045] 步骤五、建立人工神经网络(BP-ANN)预测模型
[0046] 以校正集样品光谱的前3个主成分为输入值,以两种不同栽培环境的同一品种茶鲜叶样品为输出值,经过反复优化,建立standard nets、jump connection nets和Jordan-Elman nets三种信息传递方式鲜叶不同栽培环境人工神经网络预测模型,比较该三种模型相关系数R和交互验证均方根方差RMSECV值,
[0047] 其中相关系数R公式为:
[0048] 交互验证均方根方差RMSECV公式为:
[0049] 式中,R为相关系数,n表示样本数,yi和yi’分别为样品集中第i个样品的栽培环境实测值和栽培环境预测值, 为样品集中第i个样品的实测值的平均值,式中i≤n,[0050] 其中以相关系数R最大和交互验证均方根方差RMSECV最小的模型为最佳模型,该模型精度最高,经比较后得到最佳校正集模型。
[0051] 步骤六、模型验证
[0052] 为避免出现过度拟合现象,应用验证集样品对得到的三种校正集模型预测效果进行检验,即是用已经得到的三种校正集预测模型来预测验证集样品的鲜叶栽培环境预测值是否与已经知道的实测值是否一致。所得结果用相关系数R和验证集均方差RMSEP表示,其中相关系数R越大和验证集均方差RMSEP越小则表示检验效果越好;结果用验证集样品的数据进行表达,此时若得到的近红外光谱的栽培环境预测值与栽培环境实测值基本一致,则表示对验证集样品的预测效果很好,最佳校正集模型可以准确的预测鲜叶样品的不同栽培环境。
[0053] 其中验证集均方差RMSEP公式为:
[0054] 式中,n表示样本数,yi和yi’分别为样品集中第i个样品的栽培环境实测值和栽培环境预测值,式中i≤n。
[0055] 具体的,所述的步骤一中鲜叶样品数量为100份,两种不同栽培环境鲜叶样品各50个,鲜叶样品按照7:3的比例随机划分为校正集和验证集。
[0056] 具体的,所述的步骤一中采摘的鲜叶样品为芽,第一叶、第二叶、第三叶、一芽一叶、一芽二叶和一芽三叶。
[0057] 具体的,所述步骤二中的傅里叶型近红外光谱仪为用美国赛默飞·世尔Antaris Ⅱ型傅里叶近红外光谱仪,光谱扫描范围4000-10000cm-1,分辨率8cm-1,检测器为InGaAs,每个样品采集10次光谱,每次扫描64次,取10次采集光谱的平均值作为该样品的最终光谱。
[0058] 具体的,所述步骤三中的化学计量学软件为TQ Analyst 9.4.45软件和OPUS 7.0软件。
[0059] 具体实施例一:
[0060] (1)鲜叶样品采集与分类
[0061] 分别采集湖北省恩施市和咸丰县的龙井43茶鲜叶样品共100个,其中恩施市和咸丰县龙井43鲜叶样品各50个。采摘时间为2015年3月30日-4月5日;采摘的鲜叶样品为芽,第一叶、第二叶、第三叶、一芽一叶、一芽二叶和一芽三叶。依据栽培地点不同,将样品随机划分为校正集和验证集2个集合,其中校正集70个样品(恩施市和咸丰县龙井43鲜叶样品各35个);验证集样品30个(恩施市和咸丰县龙井43鲜叶样品各15个),验证集用于检验校正集模型的稳健性。
[0062] (2)光谱采集
[0063] 参见图1,采用美国赛默飞·世尔Antaris Ⅱ型傅里叶近红外光谱仪(FT-NIR),选用积分球漫反射光学平台;光谱扫描范围4000-10000cm-1;分辨率8cm-1,检测器为InGaAs。每个样品采集10次光谱,每次扫描64次,取10次采集光谱的平均值作为该样品的最终光谱。
光谱采集前,将该光谱仪预热1h,保持室内温度和湿度基本一致后,将鲜叶样品装入与该仪器配套的旋转杯中采集光谱,全部鲜叶样品光谱参见图1。
[0064] (3)光谱预处理
[0065] 在光谱采集过程中,通常会产生高频噪声和基线漂移等影响模型预测效果的噪声信息,因此,在建立校正集模型前需要对光谱进行预处理。因此应用化学计量学软件TQ Analyst 9.4.45软件和OPUS 7.0软件对全部鲜叶样品的近红外光谱进行求导和平滑等预处理;然后将鲜叶样品光谱转化为1557对数据点,用于后续数据分析,建立判别模型。
[0066] (4)鲜叶光谱主成分分析(PCA)
[0067] 应用Matlab软件对全部鲜叶光谱进行主成分分析,求得主成分数及其贡献率。前8个主成分的贡献率分别如下:
[0068] 表1前8个主成分贡献率
[0069]
[0070] 从表1可以看出,PC1贡献率最大,为91.53%,从PC1—PC8主成分贡献率急剧降低,PC8贡献率仅为0.01%。其中,PC1,PC2和PC3三个主成分的累计贡献率为99.76%,完全可以代表上述光谱信息,用于后续数据分析。
[0071] 根据上述主成分分析求得的全部鲜叶样品光谱数据的得分Score1值和Score2值信息,得到得到恩施市和咸丰县龙井43鲜叶样品的空间位置分布图,具体参见图2。
[0072] 从图2可以看出,恩施市龙井43鲜叶样品绝大部分分布在第一、第二象限,咸丰县龙井43鲜叶样品绝大部分分布在第三、四象限,有少部分样品与恩施市龙井43鲜叶有交叉分布,混杂在一起。因此,仅应用主成分分析求得样品scores1和scores2值进而确定其空间位置的方法无法达到准确判别恩施市和咸丰县龙井43鲜叶样品的目的。
[0073] (5)建立人工神经网络(BP-ANN)预测模型
[0074] 在建立人工神经网络模型时,要求尽可能的减少输入变量,但还要尽可能多的代表原始光谱数据信息,因此,选择以上述主成分分析法筛选的前3个主成分(累计贡献率为99.76%)为输入值,以恩施市和咸丰县龙井43鲜叶样品类型为输出值(恩施市龙井43样品值为1.0000,咸丰县龙井43鲜叶样品值为2.0000),经过反复优化,建立不同栽培环境的同一品种茶鲜叶样品的人工神经网络预测模型。在建立模型的过程中,由于人工神经网络模型内部信息传递方式的不同,而导致建立模型的预测效果也会产生较大差异。在建模过程中,分别比较了standard nets、jump connection nets和Jordan-Elman nets三种信息传递方式人工神经网络模型的预测效果,具体参见图3,通过将前3个主成分分别输入到3种人工神经网络模型中,比较该三种模型相关系数R和交互验证均方根方差RMSECV值,得到了最佳校正集预测模型。最佳校正集模型为Jordan-Elman nets传递方式人工神经网络模型,R为0.945,RMSECV为0.169。
[0075] (6)模型验证
[0076] 为避免出现过度拟合现象,应用验证集30份样品对三种校正集模型进行检验,所得结果用相关系数R和验证集均方差RMSEP表示,具体参见下面的表2:
[0077] 表2 3种人工神经网络模型建模结果比较
[0078]
[0079] 从表2可以看出,恩施市和咸丰县龙井43鲜叶样品standard nets结构人工神经网络模型校正集相关系数R为0.710,交互验证均方根方差RMSECV为0.441,当用验证集样品进行检验时,得到验证集模型R为0.584,RMSEP为0.468。恩施市和咸丰县龙井43鲜叶jump connection nets结构人工神经网络模型校正集R为0.734,RMSECV为0.358,当用验证集样品进行检验时,得到验证集模型R为0.604,RMSEP为0.452。恩施市和咸丰县龙井43鲜叶Jordan-Elman nets结构人工神经网络模型校正集R为0.945,RMSECV为0.169,当用验证集样品进行检验时,得到验证集模型R为0.894,RMSEP为0.224。可见,在建立的3种信息传递方式人工神经网络模式中,以Jordan-Elman nets结构模型最优,而standard nets结构模型和jump connection nets结构模型预测结果较为接近,预测效果不是很理想。
[0080] 应用最佳Jordan-Elman nets结构模型对30个验证集鲜叶样品进行预测,判别结果具体见表3。从表3可以看出,最佳校正集模型可以准确的预测未知鲜叶样品的栽培地,达到了较为理想的预测效果,判定准确率为100%。可见,Jordan-Elman nets结构人工神经网络模型可以实现不同栽培环境鲜叶样品的快速、准确判别。
[0081] 表3 30个验证集样品预测结果
[0082]
[0083] 本发明应用近红外光谱技术,先扫描获得鲜叶样品的近红外光谱,有效降低噪声信息后,对样品光谱进行主成分分析求得Score1值和Score2值,但还不能完全区分2类不同栽培环境的鲜叶样品;接着采用具有良好非线性特性的人工神经网络方法,以前3个主成分为输入值,建立了standard nets、jump connection nets和Jordan-Elman nets三种结构的不同栽培环境的鲜叶人工神经网络模型,得到以Jordan-Elman nets结构模型预测效果最佳,验证集模型R为0.894,RMSEP为0.224。实现了不同栽培环境同一品种茶鲜叶的快速、准确判别,有效的解决了不同栽培环境同一品种茶鲜叶判定存在的难题。同时,研究结果也为探讨茶树与当地栽培生态环境间的互相作用关系提供了一种新思路。
[0084] 以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,上述结构都应当视为属于本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈