首页 / 专利库 / 人工智能 / 机器学习 / 集成学习 / 一种基于集成神经网络学习的电子鼻信号漂移补偿方法

一种基于集成神经网络学习的电子信号漂移补偿方法

阅读:297发布:2020-05-08

专利汇可以提供一种基于集成神经网络学习的电子信号漂移补偿方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种基于集成神经网络学习的 电子 鼻 信号 漂移补偿方法,包括如下步骤:1、每个时段内的电子鼻数据特征提取、标记标签、 整理 数据集;2、利用每个时段内的数据集训练得到各自的浅层神经网络分类器;3、定义所有 基础 分类器的加权集合为未来一个时段的分类器,求解各基础分类器的权值;4、输出各基础分类器参数及其权值,利用它们构建步骤3中的集成分类器;通过方法建立的集成分类器模型将含有历史数据集的偏移或异构特征,能够自动补偿掉未来一个时段的漂移误差。该集成分类器技术采用了电子鼻原有的弱神经网络模型,同时不需要复杂或深度的学习和训练,兼顾了计算时效性和分类器 精度 ,对 硬件 要求也低,实际应用性强。,下面是一种基于集成神经网络学习的电子信号漂移补偿方法专利的具体信息内容。

1.一种基于集成神经网络学习的电子信号漂移补偿方法,其特征在于,包括以下步骤:
步骤1,对每个时期内的电子鼻数据进行预处理,提取数据集的特征作为输入,并记录该数据集所对应的标签,即当前时期为t的完整数据集可表示为
St={(x1,y1),(x2,y2),...(xi,yi)},...(xn,yn)}  (1)
其中,(xi,yi)为当前t时段数据集的第i个样本对,i∈[1,n],n为总样本数;此时电子鼻传感器的特征矩阵和标签可分别记为Xt={x1,x2,...,xn}和Yt={y1,y2,...,yn},所述标签为被测气体或分析物的种类;
步骤2,采用浅层神经网络对每个t时段的数据集St进行训练学习,得到各自的基础分类器Nt(x),这些神经网络分类器模型可记为
Net=[N1(x),N2(x),...Nj(x),...,Nt(x)]  (2),
其中,Nj为第j个分类器,j∈[1,t],Net表示这些分类器模型的集合;
步骤3,将这些分类器模型Nj加权组合,进而可将模型求解转化为一个数值求解问题,即式中,βj即为各个分类器所对应的权值, 表示寻找满足公式(3)最小误差的最优权值βj的数值求解算法
步骤4,输出神经网络分类器参数{N1,N2,...,Nt}及其权值向量{β1,β2,...,βt},采用加权的方式组合当前及其之前时段的基础分类器,得到的集成分类器定义为未来一个时段t+
1的分类器,即
所述的集成分类器保留了当前及之前数据集的漂移或异
构数据的特征信息,能够自动补偿掉未来t+1时段内的漂移误差;所述集成分类器能够采用条件判断的方式,随着数据集的更新而进行自动更新:当新的数据采集时段t+1完成后,判断新采集的数据集St+1样本个数是否满足要求,若满足,则自动依据St+1训练新的基础神经网络Nt+1,并更新Net为[N1(x),N2(x),...,Nt(x),Nt+1(x)],同时训练新的集成学习器ft+2(x);
若不满足,则再次判断t+1时段间隔是否小于等于t时段:若是,则认为数据集St+1中的样本分布与前一批次st一致,直接使用权值βj作为当前批次St+1应有的权值,同时训练新的集成分类器ft+2(x);若不是,则提示需要进行增加样本数据量的信息。
2.根据权利要求1所述的基于集成神经网络学习的电子鼻信号漂移补偿方法,其特征在于,步骤1中所述数据预处理包括电子鼻内传感器测量的原始信号降噪和归一化处理,所述原始信号包含传感器的稳态响应特征和瞬态响应特征,预处理后的信号特征值为一维向量形式,样本收集的每个时间段t为一个月,样本数n不小于400,所述标签采用0或1形式编码。
3.根据权利要求1所述的基于集成神经网络学习的电子鼻信号漂移补偿方法,其特征在于,步骤2中的浅层神经网络采用常规的前向多层感知机或反馈神经网络作为基础分类器,所述浅层神经网络包含输入层、隐含层、输出层的三层典型结构,所述隐含层的单元数为20。
4.根据权利要求1所述的基于集成神经网络学习的电子鼻信号漂移补偿方法,其特征在于,步骤3中权值优化问题采用梯度迭代算法求解。
5.根据权利要求1所述的基于集成神经网络学习的电子鼻信号漂移补偿方法,其特征在于,步骤4中的集成基础分类器个数应当不小于5个。

说明书全文

一种基于集成神经网络学习的电子信号漂移补偿方法

技术领域

[0001] 本发明涉及一种电子鼻信号和信息处理领域,具体涉及一种基于集成神经网络学习的电子鼻信号漂移补偿方法。

背景技术

[0002] 电子鼻作为一种模仿生物嗅觉系统的智能装置,能够利用气敏传感器阵列的响应图谱等信号特征来实现简单或复杂气味的识别,被广泛应用于环境、食品、医疗等领域。理论上,相同测量条件下的电子鼻对同一气体的同一浓度响应应当是相同的。然而,实际应用中,电子鼻的传感器随着使用时间的增长而不断老化、退化、中毒等,而使得其响应信号逐渐离其应有的数值,这种漂移使得电子鼻的识别精度降低,甚至变得不可靠。
[0003] 现有的电子鼻信号漂移抑制或补偿技术可概述为三类:成分校正法、调节补偿法和机器学习法。成分校正法主要通过响应数据的空间映射变换找到信号漂移的方向并将该部分的成分移除,典型代表为主成分分析法;然而这类方法的补偿需要建立在所有数据漂移是稳定一致的,这与实际情况差异较大。调节补偿法根据电子鼻内传感器在不同阶段的信号特征进行差异化调整;但这种方法容易将瞬态响应误判为电子鼻的传感器正在发生剧烈变化的漂移,扰乱电子鼻原有的匹配模式,导致原本准确的测量经补偿后反而不能够正确地识别。机器学习方法并不计算或者明确描述信号的漂移问题,而是直接借助于大量样本的训练学习得到的分类器进行调整;因此,该类方法能够克服信号校正法或调节补偿法的缺点,适应性更广,成为了近年来较受关注的技术和方法。
[0004] 现有技术中,ZL201110340596.6和ZL201110340338.8分别公开了基于多重自组织神经网络的电子鼻漂移抑制方法和在线漂移补偿方法,是一种通过自动寻找样本中的内在规律从而自适应地改变神经网络参数与结构的学习方法;ZL201610245615.X公开了一种带子空间投影的电子鼻信号误差自适应学习方法;ZL201610218450.7和ZL201610216768.1分别公开了一种基于源域迁移极限学习和目标域迁移极限学习的电子鼻气体识别方法,能够对电子鼻异构或漂移数据进行补偿抑制。然而,上述这些方法在实际电子鼻应用中仍然存在很多不足:1)这些学习器的训练仅是建立“未漂移数据集(或源域)”和“已漂移数据集(或目标域)”之间的数学关系模型,或是将两个数据集进行映射变换后再建立的相互关系模型。2)实际应用中,这些学习器在当前一段时期内的补偿效果较好,但随着时间增加其效果越来越差,通常需要每隔一段时间的重新进行训练,其时间自适应性和长期稳定性较弱。3)这些技术所训练的模型均是在有限样本条件下进行的浅层机器学习方法,如支持向量机、自组织神经网络、极限学习机等,所获得的分类器性能或补偿效果并不很令人满意;ZL201610120715.X还公开了一种基于深度信念网络特征提取的电子鼻漂移补偿方法,为一种大样本深度学习的网络架构和方法,但该网络学习和训练的计算复杂度较高、时间较长、硬件要求也较高。因此,兼顾计算时效性和高性能的机器学习方法显得很有必要。

发明内容

[0005] 为了解决上述问题,本发明提供了一种基于集成神经网络学习的(Ensemble Neural Network Learning,ENNL)电子鼻信号漂移补偿方法,该方法采用加权组合将电子鼻当前及之前所训练的弱神经网络分类器集成,并提升为一个新的‘强分类器’,该分类器含有各个基础分类器之间的偏移或异构数据信息,能够自动补偿掉未来一个时段内的漂移误差。该方法采用了电子鼻原有的弱神经网络模型,同时不需要复杂或深度的学习和训练,因此兼顾了计算时效性和分类器精度,对硬件要求也低,实际应用性强。
[0006] 为解决上述技术问题,本发明采取的技术方案为:
[0007] 一种基于集成神经网络学习的电子鼻信号漂移补偿方法,包括以下步骤:
[0008] 步骤1,对每个时期内的电子鼻数据进行预处理,提取数据集的特征作为输入,并记录该数据集所对应的标签,即当前时期为t的完整数据集可表示为St={(x1,y1),(x2,y2),...(xi,yi)},...(xn,yn)}  (1)
[0009] 其中,(xi,yi)为当前t时段数据集的第i个样本对,i∈[1,n],n为总样本数;此时电子鼻传感器的特征矩阵和标签可分别记为Xt={x1,x2,…,xn}和Ytt={y1,y2,…,yn},所述标签为被测气体或分析物的种类;
[0010] 步骤2,采用浅层神经网络对每个t时段的数据集St进行训练学习,得到各自的基础分类器Nt(x),这些神经网络分类器模型可记为
[0011] Net=[N1(x),N2(x),…Nj(x),…,Nt(x)]  (2)
[0012] ,其中,Nj为第j个分类器,j∈[1,t],Net表示这些分类器模型的集合;
[0013] 步骤3,将这些分类器模型Nj加权组合,进而可将模型求解转化为一个数值求解问题,即
[0014]
[0015] ,式中,βj即为各个分类器所对应的权值, 表示寻找满足公式(3)最小误差的最优权值βj的数值求解算法
[0016] 步骤4,输出神经网络分类器参数{N1,N2,…,Nt}及其权值向量{β1,β2,…,βt},采用加权的方式组合当前及其之前时段的基础分类器,得到的集成分类器定义为未来一个时段t+1的分类器,即
[0017] 所述的集成分类器保留了当前及之前数据集的漂移或异构数据的特征信息,能够自动补偿掉未来t+1时段内的漂移误差;所述集成分类器能够采用条件判断的方式,随着数据集的更新而进行自动更新:当新的数据采集时段t+1完成后,判断新采集的数据集St+1样本个数是否满足要求,若满足,则自动依据St+1训练新的基础神经网络Nt+1,并更新Net为[N1(x),N2(x),…,Nt(x),Nt+1(x)],同时训练新的集成学习器ft+2(x);若不满足,则再次判断t+1时段间隔是否小于等于t时段:若是,则认为数据集St+1中的样本分布与前一批次st一致,直接使用权值βj作为当前批次St+1应有的权值,同时训练新的集成分类器ft+2(x);若不是,则提示需要进行增加样本数据量的信息。
[0018] 作为改进的是,步骤1中所述数据预处理包括电子鼻内传感器测量的原始信号降噪和归一化处理,所述原始信号包含传感器的稳态响应特征和瞬态响应特征,预处理后的信号特征值为一维向量形式,样本收集的每个时间段t为一个月,样本数n不小于400,所述标签采用0或1形式编码。
[0019] 作为改进的是,步骤2中的浅层神经网络采用常规的前向多层感知机或反馈神经网络作为基础分类器,所述浅层神经网络包含输入层、隐含层、输出层的三层典型结构,所述隐含层的单元数为20。
[0020] 作为改进的是,步骤3中权值优化问题采用梯度迭代算法求解。
[0021] 作为改进的是,步骤4中的集成基础分类器个数应当不小于5个,以保证好的分类器漂移信息和特征。
[0022] 有益效果:
[0023] 本发明提供了一种基于集成神经网络学习的电子鼻信号漂移补偿方法,采用加权方式将电子鼻当前及之前所训练的基础分类器集成为一个新的分类器,用于未来一个时段的气体识别和预测更新;集成学习将原有的‘弱分类器’提升为‘强分类器’,‘强分类器’含有各个‘弱分类器’之间的漂移信息,进而实现漂移补偿。对比现有的技术,本发明技术本身虽然采用了电子鼻原有的有限样本下的弱学习模型,但并不需要更复杂或深度的网络学习和训练,通过加权集成兼顾了计算时效性和分类器精度,对硬件要求也低。
[0024] 另外,基于集成学习的补偿方法还有利于电子鼻在线样本的收集和实时漂移补偿的操作,也无需假设传感器的本身漂移一致性,即对基础分类器的性能要求较低,因而适应性更广,更容易转换为实际的气体检测应用。附图说明
[0025] 图1为本发明的一种基于集成神经网络学习的电子鼻信号漂移补偿方法的流程图
[0026] 图2为本发明电子鼻信号漂移补偿方法的算法架构模型;
[0027] 图3为本发明一个基于Matlab环境下的三层神经网络实例示意图;
[0028] 图4为本发明采用电子鼻的一个传感器的气敏响应曲线示例;
[0029] 图5为本发明一个电子鼻数据集测试结果的对比示例。

具体实施方式

[0030] 下面结合具体实例对本发明的发酵方法进行详细描述和说明。其内容是对本发明的解释而非限定本发明的保护范围。
[0031] 实施例1
[0032] 如图1所示,一种基于集成神经网络学习的(Ensemble  Neural Network Learning,ENNL)电子鼻信号漂移补偿方法,包括如下步骤:
[0033] 步骤1,对每个时期内的电子鼻数据进行预处理,提取数据集的特征作为输入,并记录该数据集所对应的标签,即当前时期为t的完整数据集可表示为
[0034] St={(x1,y1),(x2,y2),..(xi,yi)},…(xn,yn)}  (1)其中,(xi,yi)为当前t时段数据集的第i个样本对,i∈[1,n],n为总样本数。此时电子鼻传感器的特征矩阵和标签可分别记为Xt={x1,x2,...,xn}和Yt={y1,y2,...,yn};所述标签为被测气体或分析物的种类;
[0035] 步骤2,采用浅层神经网络对每个t时段的数据集St进行训练学习,得到各自的基础分类器Nt(x),这些神经网络分类器模型可记为
[0036] Net=[N1(x),N2(x),...Nj(x),...,Nt(x)]  (2)
[0037] ,其中,Nj为第j个分类器,j∈[1,t],Net表示这些分类器模型的集合;
[0038] 步骤3,将这些分类器模型Nj加权组合,进而可将模型求解转化为一个数值求解问题,算法框架如图2所示,即
[0039]
[0040] 其中,βj即为各个分类器所对应的权值, 表示寻找满足公式(3)最小误差的最优权值βj的数值求解算法;
[0041] 步骤4,输出神经网络分类器参数{N1,N2,...,Nt}及其权值向量{β1,β2,...,βt},采用加权的方式组合当前及其之前时段的基础分类器,得到的集成分类器定义为未来一个时段t+1的分类器,即
[0042] 所述的集成分类器保留了当前及之前数据集的漂移或异构数据的特征信息,能够自动补偿掉未来t+1时段内的漂移误差;所述集成分类器能够采用条件判断的方式,随着数据集的更新而进行自动更新:当新的数据采集时段t+1完成后,判断新采集的数据集St+1样本个数是否满足要求,若满足,则自动依据St+1训练新的基础神经网络Nt+1,并更新Net为
[0043] Net=[N1(x),N2(x),...Nj(x),...,Nt(x)]  (2)
[0044] ,同时训练新的集成学习器ft+2(x);若不满足,则再次判断t+1时段间隔是否小于等于t时段:若是,则认为数据集St+1中的样本分布与前一批次st一致,直接使用权值βj作为当前批次St+1应有的权值,同时训练新的集成分类器ft+2(x);若不是,则提示需要进行增加样本数据量的信息。
[0045] 所述步骤1中的所述数据预处理包括电子鼻内传感器测量的原始信号降噪和归一化处理,所述原始信号包含传感器的稳态响应特征和瞬态响应特征,预处理后的信号特征值为一维向量形式,样本收集的每个时间段t为一个月,样本数n不小于400,所述标签采用0或1形式编码。
[0046] 实施例2
[0047] 基于实施例1的基础上,本实施例采用的电子鼻为四个气敏传感器构成的阵列,选用的Figaro lnc.公司的TGS系列传感器,分别为TGS2600、TGS2602、TGS2610、TGS2620,单个TGS传感器的响应信号如图3所示,包含阵列中每个传感器响应的瞬态吸附、稳态峰值、瞬态下降区间的特征,采用ZL201510252261.7中的移动窗函数法进行特征提取,可获得稳态特征值ΔR、瞬态吸附上升特征u、瞬态脱附下降特征D,单次测量记为xi=[ΔR1,U1,D1;ΔR2,U2,D2;...;ΔR4,U4,D4],共12个特征,选取的被测分析物乙烯、乙醇和丙,它们对应的yi类别标签分别记为(0,0,1)、(0,1,0)和(1,0,0)。
[0048] 所述步骤2中的浅层神经网络可采用常规的前向多层感知机(Multiple Layer Perception,MLP)或反馈神经网络(Back Propagation Neural Network,BPNN)作为基础分类器,该神经网络包含输入层、隐含层、输出层的三层典型结构,隐含层单元数为20。
[0049] 实施例3
[0050] 在实施例2的基础上,选用BPNN对单个时段t内的数据集St进行分类器学习,其中80%的数据做训练,剩余20%做测试;经测试发现,该基础分类器Nt(x)对当前时段t(如t=
1)的分类准确率均大于80%,而对后一时段,如t=2的数据集测试精度大幅降低,说明所训练得每个基础神经网络为‘弱分类器’,在面对未来某一时段的数据分类时产生了偏移。
[0051] 实施例4
[0052] 在实施例3的基础上,本发明利用Matlab2018R环境的机器学习工具箱来训练这些基础分类器,如图4所示为一个基础分类器的三层结构图,其中w和b分别表示所训练神经网络的权值和偏置,初始迭代周期设置为500,采用patternnet命令调用分类器模型,trainscg函数调用归一化的梯度反向传播算法进行训练,交叉熵函数crossentropy评价训练分类器的性能。
[0053] 所述步骤3中的集成的基础分类器个数应当不小于5个,以保证较好的分类器漂移信息和特征,最终权值优化问题采用梯度迭代算法求解。在本发明一个较佳的实例中,利用Matlab2018R环境或Optimization Tool函数实现公式(3)的编译,能够快速的得到权值的最优解,集成十个基础分类器获得了良好的性能。
[0054] 所述步骤4中构建的集成分类器能够采用条件判断的方式,随着数据集的更新而进行自动更新:当新的数据采集时段t+1完成后,判断新采集的数据集St+1样本个数是否满足要求,若满足,则自动依据St+1训练新的基础神经网络Nt+1,并更新Net为[N1(x),N2(x),...,Nt(x),Nt+1(x)],同时训练新的集成学习器ft+2(x);若不满足,则再次判断t+1时段间隔是否小于等于t时段:若是,则认为数据集St+1中的样本分布与前一批次st一致,直接使用权值βi作为当前批次St+1应有的权值,同时训练新的集成分类器ft+2(x);若不是,则提示进行增加样本数据量。
[0055] 实施例5
[0056] 在实施例4的基础上,为了得到较好漂移补偿效果,不满足“判断新采集的数据集St+1样本个数是否满足要求”的次数应当不大于两次,总的样本采集或测量时间应当小于电子鼻内传感器使用寿命,如设置为一半;同样可利用Matlab2018R环境对步骤4中集成分类器的条件判断进行编译,整个ENNL网络算法可采用的便携式硬件平台具备一Intel(R)Core(TM)i7-7700的中央处理器(CPU)、主频为3.60GHz、缓存RAM 16.0GB,能够满足训练要求。
[0057] 实施例6
[0058] 利用实施例5的方法,本实施例选取了一个公开于UCl Machine Learning Repository[http://archive.ics.uci.edu/ml/datasets/Gas+Sensor+Array+Drift+Dataset]的数据库的部分数据进行测试验证,该数据库耗时3年采集了13910个样本,采集了包含丙酮,乙醇,乙,乙烯,气以及甲苯在内的6种分析物;利用该数据库,该测试对比分析了文献[Vergara A,Vembu S,Ayhan T,et al.Chemical gas sensor drift compensation using classifier ensembles.Sensors and Actuators B:Chemical,
2012,166:320-329]中给出的四种测试方法:Test1-用前一个月的数据所训练的分类器来测试当前月;Test2-用以前月份的所有数据训练一个集成神经网络分类器来测试当前月;
Test3-与Test2相似但采用相同的权值来训练结成分类器;Test4-与Test1相似但加入了基于主成分分析法的分量校正;其中第一个时间批次训练的神经网络作为参考分类器,标记为Reference。如图5所示,Test2为采用本发明ENNL方法的结果,可观测到随着时间批次增加,集成神经网络的结果方法始终保持了较高的分类器精度,性能优于其余的方法。
[0059] 以上所述为本发明的一个实施例子,并不用于限制本发明。凡在本发明的原则之内,所做的等同替换,均应包含在本发明的保护范围之内。本发明未做详细阐述的内容属于本专业领域技术人员公知的已有技术。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈