首页 / 专利库 / 人工智能 / 机器学习 / 一种基于机器学习的电离层幅度闪烁检测方法

一种基于机器学习的电离层幅度闪烁检测方法

阅读:356发布:2020-05-11

专利汇可以提供一种基于机器学习的电离层幅度闪烁检测方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种结合 机器学习 的电离层幅度闪烁检测方法,该方法利用机器学习中的SVM 算法 ,对电离层幅度闪烁 信号 进行检测,依此判断是否发生闪烁事件。在此过程中,首先将接收到的GPS信号经处理并计算得幅度闪烁指数S4的最大值和平均值,将其作为学习样本对对应的闪烁事件进行标记,设置标签为1表示闪烁事件发生,为‑1表示闪烁事件未发生。接着将样本输入SVM分类器中进行学习,得到最优分类器。当新的闪烁事件 特征向量 进入SVM分类器时,将对其自动进行分类。该检测方法能同时检测大量闪烁事件,提高了检测效率的同时,简化了检测过程并获得了较高且稳定的准确度。,下面是一种基于机器学习的电离层幅度闪烁检测方法专利的具体信息内容。

1.一种基于机器学习的电离层幅度闪烁检测方法,其特征在于,包括:
(1)对于不同位置GPS接收机采集到的数据,采用窗口长度为a秒并每次移动b秒的移动窗口获取数据,对于每一次移动窗口获取的数据计算幅度闪烁指标S4;其中,a、b为正整数,且a>b;
(2)将不同位置GPS接收机采集到的数据以每t分钟为一个数据进行划分,将每个数据块中的幅度闪烁指标的最大值和平均值作为该数据块的特征量,并采用标签标记该数据块是否发生闪烁事件,其中,t为正整数;
(3)将部分数据块的特征量和对应标签作为训练样本,并根据标签分为发生闪烁事件样本和未发生闪烁事件样本两类,剩余数据块的特征量和对应标签作为校验样本;
(4)建立线性SVM分类器模型;
(5)将两类训练样本输入线性SVM分类器模型进行交叉验证,得到SVM分类器模型中的最优超参数,获得最优SVM分类器;
(6)将校验样本中的特征量输入最优SVM分类器进行分类,将输出的分类结果与对应标签比对,当准确率达到预设值则认为SVM分类器合格;
(7)将未知的闪烁事件数据的特征量输入到合格的SVM分类器中,SVM分类器的输出即为分类结果。
2.根据权利要求1所述的基于机器学习的电离层幅度闪烁检测方法,其特征在于:步骤(1)具体包括:
(1.1)将GPS接收机接收到的数字中频信号分别与本地正交载波信号相乘产生I和Q两路基带信号,将I和Q基带信号分别与即时码相乘得到Ip和Qp;
(1.2)根据Ip和Qp采用下式计算信号的宽带功率和窄带功率:
式中,Ip,i、Qp,i分别为对Ip、Qp以每h毫秒采样一次得到的第i个采样值,Δt为功率计算间隔时间值,J表示将Ip和Qp的所有采样值以Δt为间隔分别划分成J个分段,WBP,j、NBP,j分别表示第j个分段信号的宽带功率和窄带功率;
(1.3)根据信号的宽带功率和窄带功率采用下式计算信号的标准化信号强度:
SI,raw,j=NBP,j-WBP,j
式中,SI,norm,j表示第j个分段信号的标准化信号强度,SI,trend,j表示根据SI,raw,j的4阶拟合多项式而得的去趋势信号强度;
(1.4)采用窗口长度为a秒并每次移动b秒的移动窗口获取数据,对于每一次移动窗口获取的数据计算其幅度闪烁指标S4,其中,第k次移动窗口获取的数据的幅度闪烁指标值S4为:
式中, 表示位于k次移动窗口中的a秒数据的标准化信号强度总集合,标准化信号强度数据共a*1000/Δt个,E[·]表示求数学期望。
3.根据权利要求1所述的基于机器学习的电离层幅度闪烁检测方法,其特征在于:步骤(2)具体包括:
(2.1)将不同位置GPS接收机采集到的数据以每t分钟为一个数据块进行无重叠划分;
(2.2)获取根据每个数据块中数据计算得到的多个幅度闪烁指标S4,从中提取最大值S4,max和平均值S4,avg作为该数据块的特征量,并采用标签标记该数据块是否发生闪烁事件,用数学形式表示为:
特征量:
标签:
式中,l表示数据块序号, 表示二维向量空间。
4.根据权利要求1所述的基于机器学习的电离层幅度闪烁检测方法,其特征在于:步骤(4)中建立的线性SVM分类器模型为:
约束条件:
式中,w为待求参数矩阵,b为待求参数, 为一维空间,ξl为第l个训练
样本的松弛变量,m为训练样本数量,C为超参数,表示对超过最大化边界的训练样本的容忍度,x(l)、y(l)分别表示第l个训练样本的特征量和标签。
5.根据权利要求4所述的基于机器学习的电离层幅度闪烁检测方法,其特征在于:步骤(5)具体包括:
(5.1)引入拉格朗日乘子αl,βl,将线性SVM分类器模型表示为:
分别将L对wi,bi,ξi求导并置0得:
(5.2)将上述结果代入步骤(4)建立的模型,再根据强对偶关系转换为对偶形式并去掉负号,得到模型:
约束条件:
隐藏条件:
对于该模型在MATLAB中使用函数quadprog求解,得到w的最优值w0;并根据w0求解得到b最优值b0=y(s)-w0Tx(s),其中x(s)对应的ξs=0,x(s)为支持向量,为αl≠0项所对应的训练样本特征量,y(s)为对应的标签;
(1) (2) (m)
(5.3)将训练样本特征量记为X=(x ,x ,...,x ),即2×m的矩阵;标签记为Y=(y(1),y(2),...,y(m)),即1×m的行向量,将上述矩阵和向量组合成3×m的矩阵Z=(X;Y),作为样本输入矩阵;
(5.5)将样本输入矩阵整体输入SVM分类器模型,并设置交叉验证折数和超参数C的值,在训练过程中,随机将输入的样本数等分为u份,其中每u-1份用来对模型进行学习,剩下1份对学习过的模型进行测试,得到测试准确率,依次共进行u次训练后得当前超参数C对应的平均测试准确率;
(5.6)更改超参数C的值,并返回执行步骤(5.5),从而得到不同超参数C的值对应的平均测试准确率;
(5.7)将所有超参数对应的平均准确率进行比较,找出最大准确率对应的超参数C即为最佳超参数,该参数设置下训练所得模型即为最优分类模型。

说明书全文

一种基于机器学习的电离层幅度闪烁检测方法

技术领域

[0001] 本发明涉及无线通信领域,尤其涉及一种基于机器学习的电离层幅度闪烁检测方法。

背景技术

[0002] 随着GNSS等卫星技术在现代社会越来越广泛应用,电离层闪烁及其对射频信号的影响已成为不可忽视的重要部分。电离层闪烁是电离层等离子体中不规则结构引起的,是指射频信号(如GNSS)在电离层中传播的振幅和相位的快速波动。由于产生这种现象的原因有很多,包括但不限于太阳活动、磁暴、局部电场、电导率、波相互作用等。更具体地说,高纬度地区的闪烁通常与太阳活动和磁暴时期有关,因此闪烁预测和建模非常困难。在赤道和低纬度地区,赤道电离异常和日落后形成的电离层气泡是闪烁事件的潜在原因。闪烁会影响穿透电离层的所有空间无线电信号,并可能导致精度和连续性的性能下降。强闪烁会严重影响GNSS接收机的信号采集和跟踪,导致失和导航失败。因此,寻求准确、高效的电离层闪烁检测方法不仅有助于设计性能更优的接收机以提高定位精度、减小电离层闪烁的影响,同时也能为电离层和空间天气模型建立提供帮助。
[0003] 传统的电离层闪烁检测是通过研究人员观察检测数据进行人工识别,这一过程耗时长且不可能遍历所有数据。为此提出了自动闪烁检测方法以提高检测效率。最熟悉的以经验为主的检测方法是判断幅度闪烁指数S4,若大于0.2则发生闪烁事件。另有更复杂的基于NP检测理论的检测算法,如小波分解法,即通过假设小波系数服从高斯分布来区分闪烁和非闪烁事件;另有一种互补的集成经验模态分解方法,该方法通过对载噪比的精确测量来检测闪烁。虽然上述算法能够对闪烁事件进行检测,但在设计过程中均受到非优化经验阈值或理想假设模型的限制。

发明内容

[0004] 发明目的:本发明针对现有技术存在的问题,提供一种基于机器学习的电离层幅度闪烁检测方法,所述方法结合机器学习中的SVM算法,通过学习电离层幅度闪烁特征,对闪烁事件进行自动检测。相比于其他方法,既有效提高了检测精确度,简化了检测步骤,又能同时处理大批量数据,有效提高了检测效率。
[0005] 技术方案:本发明所述的基于机器学习的电离层幅度闪烁检测方法包括:
[0006] (1)对于不同位置GPS接收机采集到的数据,采用窗口长度为a秒并每次移动b秒的移动窗口获取数据,对于每一次移动窗口获取的数据计算幅度闪烁指标S4;其中,a、b为正整数,且a>b;
[0007] (2)将不同位置GPS接收机采集到的数据以每t分钟为一个数据进行划分,将每个数据块中的幅度闪烁指标的最大值和平均值作为该数据块的特征量,并采用标签标记该数据块是否发生闪烁事件,其中,t为正整数;
[0008] (3)将部分数据块的特征量和对应标签作为训练样本,并根据标签分为发生闪烁事件样本和未发生闪烁事件样本两类,剩余数据块的特征量和对应标签作为校验样本;
[0009] (4)建立线性SVM分类器模型;
[0010] (5)将两类训练样本输入线性SVM分类器模型进行交叉验证,得到SVM分类器模型中的最优超参数,获得最优SVM分类器;
[0011] (6)将校验样本中的特征量输入最优SVM分类器进行分类,将输出的分类结果与对应标签比对,当准确率达到预设值则认为SVM分类器合格;
[0012] (7)将未知的闪烁事件数据的特征量输入到合格的SVM分类器中,SVM分类器的输出即为分类结果。
[0013] 进一步的,步骤(1)具体包括:
[0014] (1.1)将GPS接收机接收到的数字中频信号分别与本地正交载波信号相乘产生I和Q两路基带信号,将I和Q基带信号分别与即时码相乘得到Ip和Qp;
[0015] (1.2)根据Ip和Qp采用下式计算信号的宽带功率和窄带功率:
[0016]
[0017]
[0018] 式中,Ip,i、Qp,i分别为对Ip、Qp以每h毫秒采样一次得到的第i个采样值,Δt为功率计算间隔时间值,J表示将Ip和Qp的所有采样值以Δt为间隔分别划分成J个分段,WBP,j、NBP,j分别表示第j个分段信号的宽带功率和窄带功率;
[0019] (1.3)根据信号的宽带功率和窄带功率采用下式计算信号的标准化信号强度:
[0020] SI,raw,j=NBP,j-WBP,j
[0021]
[0022] 式中,SI,norm,j表示第j个分段信号的标准化信号强度,SI,trend,j表示根据SI,raw,j的4阶拟合多项式而得的去趋势信号强度;
[0023] (1.4)采用窗口长度为a秒并每次移动b秒的移动窗口获取数据,对于每一次移动窗口获取的数据计算其幅度闪烁指标S4,其中,第k次移动窗口获取的数据的幅度闪烁指标值S4为:
[0024]
[0025] 式中, 表示位于k次移动窗口中的a秒数据的标准化信号强度总集合,标准化信号强度数据共a*1000/Δt个,E[·]表示求数学期望。
[0026] 进一步的,步骤(2)具体包括:
[0027] (2.1)将不同位置GPS接收机采集到的数据以每t分钟为一个数据块进行无重叠划分;
[0028] (2.2)获取根据每个数据块中数据计算得到的多个幅度闪烁指标S4,从中提取最大值S4,max和平均值S4,avg作为该数据块的特征量,并采用标签标记该数据块是否发生闪烁事件,用数学形式表示为:
[0029] 特征量:
[0030] 标签:
[0031] 式中,l表示数据块序号, 表示二维向量空间。
[0032] 进一步的,步骤(4)中建立的线性SVM分类器模型为:
[0033]
[0034] 约束条件:
[0035] 式中,w为待求参数矩阵,b为待求参数, 为一维空间,ξl为第l个训练样本的松弛变量,m为训练样本数量,C为超参数,表示对超过最大化边界的训练样本的容忍度,x(l)、y(l)分别表示第l个训练样本的特征量和标签。
[0036] 进一步的,步骤(5)具体包括:
[0037] (5.1)引入拉格朗日乘子αl,βl,将线性SVM分类器模型表示为:
[0038]
[0039] 分别将L对wi,bi,ξi求导并置0得:
[0040]
[0041] (5.2)将上述结果代入步骤(4)建立的模型,再根据强对偶关系转换为对偶形式并去掉负号,得到模型:
[0042]
[0043] 约束条件:
[0044] 隐藏条件:
[0045] 对于该模型在MATLAB中使用函数quadprog求解,得到w的最优值w0;并根据w0求解得到b最优值b0=y(s)-w0Tx(s),其中ξs=0,x(s)为支持向量,为αl≠0项所对应的训练样本特征量,y(s)为对应的标签;
[0046] (5.3)将训练样本特征量记为X=(x(1),x(2),...,x(m)),即2×m的矩阵;标签记为Y=(y(1),y(2),...,y(m)),即1×m的行向量,将上述矩阵和向量组合成3×m的矩阵Z=(X;Y),作为样本输入矩阵;
[0047] (5.5)将样本输入矩阵整体输入SVM分类器模型,并设置交叉验证折数和超参数C的值,在训练过程中,随机将输入的样本数等分为u份,其中每u-1份用来对模型进行学习,剩下1份对学习过的模型进行测试,得到测试准确率,依次共进行u次训练后得当前超参数C对应的平均测试准确率;
[0048] (5.6)更改超参数C的值,并返回执行步骤(5.5),从而得到不同超参数C的值对应的平均测试准确率;
[0049] (5.7)将所有超参数对应的平均准确率进行比较,找出最大准确率对应的超参数C即为最佳超参数,该参数设置下训练所得模型即为最优分类模型。
[0050] 有益效果:本发明与现有技术相比,其显著优点是:本发明提出了一种基于机器学习的电离层幅度闪烁检测方法,所述方法首先从检测到的已知是否发生闪烁事件的数据中提取特征并标记,整理为样本,输入所建立的SVM分类器模型中进行学习并找出最佳分类器模型,接着对学习过的分类器进行测试,可获得较高准确率,该分类器模型优于其他方法。最后将该分类器应用到新的闪烁事件中,能自动进行分类检测,且相比于传统根据闪烁指数S4判断闪烁是否发生的方法,所述方法具有更高的精确度,能够检测到闪烁指数低于0.2的闪烁事件,这对于电离层结构模型和闪烁机理研究具有重要意义,且该方法能够同时处理大批量数据,在很大程度上提高了检测效率。
附图说明
[0051] 图1是本发明的一个实施例流程图

具体实施方式

[0052] 如图1所示,本发明所述的基于机器学习的电离层幅度闪烁检测方法包括:
[0053] (1)对于不同位置GPS接收机采集到的数据,采用窗口长度为10秒并每次移动1秒的移动窗口获取数据,对于每一次移动窗口获取的数据计算幅度闪烁指标S4。
[0054] 步骤(1)具体包括:
[0055] (1.1)将GPS接收机接收到的数字中频信号分别与本地正交载波信号相乘产生I和Q两路基带信号,将I和Q基带信号分别与即时码相乘得到Ip和Qp;
[0056] (1.2)根据Ip和Qp采用下式计算信号的宽带功率和窄带功率:
[0057]
[0058]
[0059] 式中,Ip,i、Qp,i分别为对Ip、Qp以每1ms采样一次得到的第i个采样值,Δt为功率计算间隔时间值,取20ms,J表示将Ip和Qp的所有采样值以20ms为间隔分别划分成J个分段,WBP,j、NBP,j分别表示第j个20ms信号的宽带功率和窄带功率;
[0060] (1.3)根据信号的宽带功率和窄带功率采用下式计算信号的标准化信号强度:
[0061] SI,raw,j=NBP,j-WBP,j
[0062]
[0063] 式中,SI,norm,j表示第j个分段信号的标准化信号强度,SI,trend,j表示根据SI,raw,j的4阶拟合多项式而得的去趋势信号强度;
[0064] (1.4)采用窗口长度为10秒并每次移动1秒的移动窗口获取数据,对于每一次移动窗口获取的数据计算其幅度闪烁指标S4.则10s里可以移动10次移动窗口,每1秒就可以计算得到1次幅度闪烁指标值S4。
[0065] 第k次移动窗口获取的数据的幅度闪烁指标值S4为:
[0066]
[0067] 式中, 表示位于k次移动窗口中的a秒数据的标准化信号强度总集合,标准化信号强度数据共10*1000/20=500个,E[·]表示求数学期望。
[0068] (2)将不同位置GPS接收机采集到的数据以每3分钟为一个数据块进行划分,将每个数据块中的幅度闪烁指标的最大值和平均值作为该数据块的特征量,并采用标签标记该数据块是否发生闪烁事件。
[0069] 步骤(2)具体包括:
[0070] (2.1)将不同位置GPS接收机采集到的数据以每3分钟为一个数据块进行无重叠划分;
[0071] (2.2)获取根据每个数据块中数据计算得到的多个幅度闪烁指标S4,从中提取最大值S4,max和平均值S4,avg作为该数据块的特征量,并采用标签标记该数据块是否发生闪烁事件,用数学形式表示为:
[0072] 特征量:
[0073] 标签:
[0074] 式中,l表示数据块序号, 表示二维向量空间。
[0075] (3)将80%数据块的特征量和对应标签作为训练样本,并根据标签分为发生闪烁事件样本和未发生闪烁事件样本两类,剩余数据块的特征量和对应标签作为校验样本。
[0076] (4)建立线性SVM分类器模型模型y=wTx+b,找出参数w0和b0使得y=w0Tx+b0作为一个平面将样本分为两类,且保证距离该超平面两侧最近的样本具有最远的间距,具有这些特征的样本点即为“支持向量(SV)”。上述最大化边界问题经一系列转化表述为如下数学形式:
[0077]
[0078] 约束条件:
[0079] 式中,w为待求参数矩阵,b为待求参数, 为一维空间,ξl为第l个训练样本的松弛变量,m为训练样本数量,C为超参数,表示对超过最大化边界的训练样本的容忍度,x(l)、y(l)分别表示第l个训练样本的特征量和标签。
[0080] (5)将两类训练样本输入线性SVM分类器模型进行交叉验证,得到SVM分类器模型中的最优超参数,获得最优SVM分类器。
[0081] 步骤(5)具体包括:
[0082] (5.1)引入拉格朗日乘子αl,βl,将线性SVM分类器模型表示为:
[0083]
[0084] 分别将L对wi,bi,ξi求导并置0得:
[0085]
[0086] (5.2)将上述结果代入步骤(4)建立的模型,再根据强对偶关系转换为对偶形式并去掉负号,得到模型:
[0087]
[0088] 约束条件:
[0089] 隐藏条件:
[0090] 上述问题即转化为二次规划问题求αl,在MATLAB中使用函数quadprog即可解得,代入隐藏条件求得符合最大化边界问题的w0向量。另外,拉格朗日函数特点决定了αl≠0项(s) (s) T (s)所对应的第i个训练样本即为支持向量SV(以x 表示),对应的可求出b0=y -w0x ,其中ξs=0。
[0091] (5.3)将最大化问题通过MATLAB中Classification Learner模型进行样本学习来寻找最佳分类器。将训练样本特征量记为X=(x(1),x(2),...,x(m)),即2×m的矩阵;标签记为Y=(y(1),y(2),...,y(m)),即1×m的行向量,将上述矩阵和向量组合成3×m的矩阵Z=(X;Y),作为样本输入矩阵;
[0092] (5.5)将样本输入矩阵将矩阵整体输入MATLAB中的Classification Learner,并选择线性SVM分类器模型,设置交叉验证折数和超参数C的值,在训练过程中,随机将输入的样本数等分为u份,其中每u-1份用来对模型进行学习,剩下1份对学习过的模型进行测试,得到测试准确率,依次共进行u次训练后得当前超参数C对应的平均测试准确率;
[0093] (5.6)更改超参数C的值,并返回执行步骤(5.5),从而得到不同超参数C的值对应的平均测试准确率;更改超参数C的值可以近似3倍增长速度设置参数C值,如0.001,0.003,0.01,0.03,0.1,0.3,1,3,10,30;
[0094] (5.7)将所有超参数对应的平均准确率进行比较,找出最大准确率对应的超参数C即为最佳超参数,该参数设置下训练所得模型即为最优分类模型。
[0095] (6)将校验样本中的特征量输入最优SVM分类器进行分类,将输出的分类结果与对应标签比对,当准确率达到预设值则认为SVM分类器合格。
[0096] (7)将未知的闪烁事件数据的特征量输入到合格的SVM分类器中,SVM分类器的输出即为分类结果。运行结果即为新闪烁事件的标签,为1则判断为有闪烁事件发生,为-1则判断为闪烁事件未发生。
[0097] 本发明数据样本选取不同,准确率会产生较小偏差,经测试统计,准确率会达96%,相比于传统方法,提高了检测准确度。
[0098] 以上所揭露的仅为本发明一种较佳实施例而已,不能以此来限定本发明之权利范围,因此依本发明权利要求所作的等同变化,仍属本发明所涵盖的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈