专利汇可以提供基于半监督领域自适应的气体检测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于半监督领域自适应的气体检测方法,包括步骤:对气体 传感器 采集的气体数据 信号 进行预处理;利用预处理后的信号构造特征子空间;根据构造特征子空间建立组合核函数;选择目标域中无标记样本;根选择的目标域中无标记样本训练分类器,根据得到的训练分类器进行气体识别。本发明根据气体 传感器数据 的时间序列特点,通过对领域自适应的核函数进行构造,提出了目标域的无标记样本的选择策略,能有效处理 气体传感器 数据及传感器漂移,新的核函数既考虑了靠近源域和目标域的子空间应该有更大的权重,又考虑了源域和目标域之间的中间数据,利用格拉斯曼流型几何来描述气体传感器的漂移,有效解决漂移对气体检测和识别的影响。,下面是基于半监督领域自适应的气体检测方法专利的具体信息内容。
1.一种基于半监督领域自适应的气体检测方法,具体包括如下步骤:
S1.对气体传感器采集的气体数据信号进行预处理;
S2.利用步骤S1预处理后的信号构造特征子空间;
S3.根据步骤S2构造特征子空间建立组合核函数;
S4.选择目标域中无标记样本;
S5.根据步骤S4选择的目标域中无标记样本训练分类器,根据得到的训练分类器进行气体识别。
2.根据权利要求1所述的气体检测方法,其特征在于,步骤S1的具体过程如下:采集一持续时间段的数据,对数据进行小波变换,每个样本经过预处理后表示为一个N维实数向量,即X=(x1,x2,…,xN)。
3.根据权利要求2所述的气体检测方法,其特征在于,所述预处理具体为滤波处理。
4.根据权利要求2所述的气体检测方法,其特征在于,步骤S2的具体过程如下: S21.将多个样本数据按照时间的先后组成数据集D1,D2,…,Di,…,DT,其中,T表示时间段,D1={X1,X2,…,Xn},共有n个样本,每个样本被人工标记,其中,Xi的类标记为Yi∈{-1,1},1表示正样本,即待检测的气体,-1表示负样本,为其它气体;D1是唯一的标记样本集,D2,……,DT是无标签样本集,数据集Di可以表示为矩阵形式,用Di表示这个样本矩阵;
S22.对样本数据Di进行特征中心化、进行主成分分析,得到每个d维度的特征子空间,其中,d是预先设计的一个整数,且d
对特征中心化后的每个Di,进行主成分分析,得到特征子空间,其具体步骤如下: 计算样本矩阵Di的协方差矩阵Hi;
计算协方差矩阵Hi的特征向量的特征值,并把特征值按从大到小排序;
提取最大的d个特征值,其对应的特征向量为特征子空间的基底,构成一个矩阵Si,Si为Di特征子空间,其维度为N×d;
通过上述处理,每个Di可以通过Si变为低维度d的数据,Si是对应子空间,且S1,N N
S2,.....,ST都是R 的d维子空间,记R 的所有d维子空间为GN×d,称为格拉斯曼流型,所述Si∈GN×d。
5.根据权利要求2或4所述的气体检测方法,其特征在于,步骤S3的具体过程如下: S31.构建权重核函数,
S311.选定S1、ST分别为源域D1,目标域DT的特征子空间,则S1和ST为格拉斯曼流型GN×d上的点,在GN×d上构建一条从S1到ST的曲线,设曲线的参数化函数Φ(t):
[0,1]→GN×d,具体如下:
其中,R1是S1的垂直补子空间,U1和U2分别是d×d和(N-d)×d的对角矩阵,具体通过矩阵SVD分解计算得到:
S1'ST=U1ΓV',R1'ST=-U2ΣV';
其中,S1'表示S1的转置矩阵,Γ和Σ是d×d的对角矩阵,其对角线上的元素分别为cos(θi)和sin(θi),其中,i∈{1,2,……,d},同样,Γ(t)和Σ(t)的对角元素分别为cos(tθi)和sin(tθi);
通过以上计算,可以得到U1和U2,Γ(t)和Σ(t),从而得到Φ(t);
S312.设w(t):[0,1]→R为权重函数,w(t)=|1-2t|,用w(t)乘以Φ(t),得到
g(t)=w(t)Φ(t);
S313.g(t)在每个点上代表一个子空间的带权重的基底,对g(t)表示的无限维的希尔伯特空间的内积求和,即内积
由 带入上式可得:
则:
由于Γ(t)和Σ(t)为对角矩阵,且其对角元素分别为cos(tθi)和sin(tθi),则设 Ω=[S1U1,-R1U2],
则可设G有下面的形式:
其中,Λ1,Λ2,Λ3是d×d的对角矩阵,设其对角元素分别为λ1i,λ2i,λ3i,其中i∈{1,2,……,d}:
S314.定义核函数:K(Xi,Xj)=Xi'G Xj,其中,Xi,Xj是源域D1和目标域DT中任意样本向量;
S32.计算组合核函数,
S321.根据步骤S22可知,D1,D2,……,DT其对应格拉斯曼流型的子空间为S1,S2,.....,ST,设Φi-j(t):[0,1]→GN×d是格拉斯曼流型上从Si到Sj的一条曲线,定义如下: 则w(t)Φi-j(t)表示从Si到Sj的一条权重曲线;
S322.对任意的j∈{2,3,……,T-1},定义如下从S1到ST的权重曲线:
w(t)Φ1-j-T(t)表示从S1到ST的经过Sj的一条权重曲线;则内积
Φ1-j-T(t)>表示w(t)Φ1-j-T(t)'Φ1-j-T(t)从0到2积分,可得:
其中,Gi-j表示根据公式(a)计算的Si到Sj的权重核函数;
G1-j-T定义了一个源域D1和目标域DT中的核函数如下:
K(Xi,Xj)=Xi′G1-j-TXj
S323.根据步骤S322,得到源域D1和目标域DT中T-1个核函数集合,其对应的核矩阵集合为{G1-T,G1-2-T,……,G1-(T-1)-T},其中,G1-T表示根据公式(a)计算的S1到ST的权重核函数,利用这些核函数构造组合核函数的核矩阵如下:
Gc=w1G1-T+w2G1-2-T+......+wT-1G1-(T-1)-T
其中,w1,w2,……,wT-1是预先设定的权重值,则对应的核函数为:
K(Xi,Xj)=Xi'GcXj (b)
其中,Xi,Xj是源域D1和目标域DT中任意样本向量,式(b)定义的函数即为组合核函数。
6.根据权利要求2或4所述的气体检测方法,其特征在于,步骤S4的具体过程如下: S41.设源域D1={X1,X2,……,Xn}共n个标记样本,目标域DT={Xn+1,Xn+2,……,Xn+q}共q个无标记样本;从目标域DT中选择一个子集来进行无监督学习,使得选择的子集能给分类器提供增量知识去自适应目标领域;
首先描述DT中子集与D1的相似性:DT的任意子集可以用一个0,1的q维向量表示:
μ=(μ1,μ2,……,μq),其中,μi=1表示Xn+i在这个子集中,否则,μi=0表示Xn+i不在这个子集中;用最小化均值来表示这个子集的样本与源域D1中样本的相似性:
其中, 表示样本的高维特征函数,m=μ1+μ2+……+μq,即m表示子集的样本个数,|| ||表示希尔伯特空间的范数,从DT中选中最相似D1的子集,即最优化上面等式: 表示使得{}中取得最小值的参数μ,式(c)是个NP问题,为解决上述优化问
题,定义向量α:
则0≤αi≤1,且α1+α2+……+αq=1,带入公式(c)可得
S42.由于 表示将样本的高维特征函数,而公式(c)中的核函数已经实现了高维空间映射,为此,设范数对应的核函数为公式(c)中组合核函数,则
设矩阵A=(K(Xn+i,Xn+j))q×q是目标域DT的样本核矩阵,B=(K(Xi,Xn+j))n×q是源域到目标域的样本核矩阵,则公式(d)可化简为:
其中,T=(1,1,……,1)是一个q维向量,上式是一个二次优化问题,其约束条件为
0≤αi,且α1+α2+……+αq=1,解出最优的α;
S43.得到α后,设集合Z={Xn+j|αj≥τ,Xn+j∈DT},其中,参数τ是预先设定的阈值参数,DT=DT–Z,即在目标域中将Z中元素去掉,DT被用来作为半监督学习中的无标记样本。
7.根据权利要求6所述的气体检测方法,其特征在于,步骤S5的具体过程如下: S51.采用基于流形规则化半监督学习方法,其中,核函数为步骤S323中公式(b)中的组合核函数,训练样本集为源域D1和通过步骤S43计算后选择的DT;
设经过步骤S43后DT={Xn+1,Xn+2,……,Xn+p}共p个无标记样本,D1={X1,X2,……,Xn}共n个标记样本,Xi的标签为yi,对D1和DT进行归一化处理;
S52.设分类函数为f(X),为输入向量X到实数的函数,则流形规则化在再生希尔伯特空间搜索一个最优分类器,其优化的目标函数为:
其中,V(Xi,yi,f)为代价函数,取Hinge函数,即V(Xi,yi,f)=max(0,1-yif(Xi)),F=(f(X1),f(X2),……,f(Xn+p)), 是组合核函数K诱导的再生希尔伯特空间的范数,L是D1和DT中数据邻接矩阵的拉普拉斯变换,γA,γI是预先定义的参数;
S53.D1和DT中数据的邻接图按照KNN方法来构造,其中,样本间的距离按照下式定义: d(Xi,Xj)=K(Xi,Xi)+K(Xj,Xj)-2K(Xi,Xj)
数据的邻接矩阵按照上面的公式有K-NN方法构造得到邻接矩阵W,即对D1和DT的每个样本X,按照上面公式计算距离X最近的K个样本点,X与这K个样本点用无向边分别连接,且边对应的权重值为两点的距离;最终得到一个无向图,所述无向图的邻接矩阵即为W;将矩阵W中每行元素相加作为矩阵D的对角元素,D的非对角线元素为0,则L=D-W; *
S54.利用步骤S53得到的矩阵L,优化公式(e),最终得到分类器f ;
S55.输入一个新的气体样本,采用步骤S1对样本进行预处理得到处理后的样本
*
Z=(z1,z2,...,zN),利用步骤S22中的mean(D1)将Z中心化:即Z=Z-mean(D1),计算f(Z),*
如果f(Z)>0则新样本Z为待检测的气体,否则为其它气体。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于半监督学习算法的移动设备实体识别方法及装置 | 2020-05-12 | 843 |
一种基于层次注意力机制的半监督网络表示学习模型 | 2020-05-13 | 599 |
基于半监督学习的DPI数据中host的自动化挖掘方法及系统 | 2020-05-18 | 540 |
一种特征权重自学习的睡眠质量检测关键脑区判定方法 | 2020-05-08 | 88 |
基于对抗训练的跨领域虚假评论识别方法 | 2020-05-13 | 239 |
基于半监督学习的检测模型训练方法、装置、设备及介质 | 2020-05-12 | 875 |
一种获取临床数据预测模型的方法、装置、可读介质及电子设备 | 2020-05-15 | 546 |
一种面向半结构化数据流的实时主题分类方法 | 2020-05-16 | 842 |
一种基于半监督学习的多标签语料库文本分类方法 | 2020-05-13 | 481 |
一种融合半监督学习和主动学习的搜索引擎用户满意度评估方法 | 2020-05-13 | 482 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。