首页 / 专利库 / 信号处理 / 稀疏变换 / 小波变换 / 离散小波变换 / 一种数据预测方法及存储介质

一种数据预测方法及存储介质

阅读:773发布:2020-05-12

专利汇可以提供一种数据预测方法及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种数据预测方法及存储介质,本发明的数据预测方法包括:获取一 时间窗 口的样本数据;数据预处理过程:对样本数据的全局数据进行中心化处理、DWT离散 小波变换 、周期差分处理;数据回归分析处理:获取某一时间窗口的若干个先验模型,并计算若干个先验模型的协方差矩阵,将所述协方差矩阵的进行融合求解得到新的协方差矩阵,以新的协方差矩阵作为新模型的协方差矩阵;数据预测:通过新模型进行数据预测,将新模型预测数据依次进行反差分处理、小波反变换和反中心化处理。本发明通过数据预处理,能利用较少的数据资源计算模型,且模型拟合计算复杂性低,比传统的预测流程成本低,更效率。,下面是一种数据预测方法及存储介质专利的具体信息内容。

1.一种数据预测方法,其特征在于,包括:
获取一时间窗口的样本数据;
数据预处理过程:对样本数据的全局数据进行中心化处理,对中心化处理后数据进行DWT离散小波变换,对DWT离散小波变换后的数据进行设定周期差分处理;
数据回归分析处理:获取某一时间窗口的若干个先验模型,并计算若干个先验模型的协方差矩阵,将所述协方差矩阵的进行融合求解得到新的协方差矩阵,以新的协方差矩阵作为新模型的协方差矩阵;
数据预测:通过新模型进行数据预测,将新模型预测数据依次进行反差分处理、小波反变换和反中心化处理。
2.根据权利要求1所述的数据预测方法,计算若干个先验模型的协方差矩阵,将所述协方差矩阵的进行融合求解得到新的协方差矩阵的步骤包括:获取所述时间窗口数据的ARMA模型参数的变化作协方差矩阵,根据该变化作协方差矩阵求解下个时间窗口的ARMA模型参数,得到新的协方差矩阵。
3.根据权利要求1所述的数据预测方法,获取某一时间窗口的若干个先验模型的步骤包括:
通过不同的ARMA模型拟合得到不同模型;
通过AIC值比较对所述不同模型进行阶数定权,以AIC值最小原则选择最优的前若干个模型作为先验的局部模型。
4.根据权利要求1所述的数据预测方法,对数据进行中心化处理的步骤包括:
随机选取一组数据,将全局的数据减去该组数据,得到去除某组数据后的全局数据;
将去除某组数据后的全局数据整体将移动到超维空间中的原点附近,得到对全局数据进行中心化处理后的数据。
5.根据权利要求1所述的数据预测方法,对数据进行设定周期差分处理的步骤包括:
设定一个周期间隔的时间,将某时刻的数据减去该时刻一个周期间隔前的数据,得到该时刻进行设定周期差分处理后的数据。
6.根据权利要求1所述的数据预测方法,进行DWT离散小波变换的步骤包括:将数据通过DWT离散小波变换对信号进行不停的分解,每次得到高频信号和低频信号,再通过DWT离散小波变换对低频信号分解,直到达到指定的阶数为止。
7.根据权利要求5所述的数据预测方法,对新模型预测数据进行反差分处理的步骤包括:将所述某时刻的预测数据加上该时刻一个周期间隔前的数据,得到该时刻进行反差分处理后的预测数据。
8.根据权利要求6所述的数据预测方法,小波反变换的步骤包括:将预测的数据作为达到指定阶数的低频分解信号,将低频分解信号再进行指定阶数的DWT离散小波逆变换,得到小波反变换的预测数据。
9.根据权利要求4所述的数据预测方法,反中心化处理的步骤包括:将预测数据的全局数据均加上所述某组数据,得到反中心化处理的数据。
10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1-9任一项所述的数据预测方法。

说明书全文

一种数据预测方法及存储介质

技术领域

[0001] 本发明涉及数据处理技术领域,具体涉及一种数据预测方法及存储介质。

背景技术

[0002] 智慧城市建设需要大数据支撑,而其中重要的数据处理方法穷数不尽,横跨了经济、建筑、计算机、物联网、测绘等大领域。大量的数据如何分出好数据与坏数据、如何将数据利用现有理论的原理建立符合物理规律的数学模型、如何利用模型预测未来可能出现的数据等问题受到更多的关注,也将各种写在书本上的原理搬到应用舞台上。
[0003] 目前的数据预测方法有以下几种:趋势外推预测法、回归预测方法、卡尔曼滤波预测模型、BP神经网络预测模型、深度学习预测模型等。现有的方法一般都为趋势外推法和回归预测法,它们的缺点有:数据预处理简单,历史数据要求量大,预测结果容易过拟合;卡尔曼滤波预测模型一般适用于高速的预测,对于低速目标预测效果不友好;BP神经网络预测模型是目前流行的模型,但对数据的时间序列处理不友好,一旦模型建立,要再次更新的成本代价大;深度学习一方面训练数据成本高昂,主要体现在数据量需求大、训练时间长、硬件成本高等,另一方面也同时拥有BP神经网络的弊端。

发明内容

[0004] 鉴于以上技术问题,本发明的目的在于提供一种数据预测方法,解决现有技术数据量需求大且效率低的问题。
[0005] 本发明采用技术方案如下:
[0006] 一种数据预测方法,包括:
[0007] 获取一时间窗口的样本数据;
[0008] 数据预处理过程:对样本数据的全局数据进行中心化处理,对中心化处理后数据进行DWT离散小波变换;对DWT离散小波变换后的数据进行设定周期差分处理;
[0009] 数据回归分析处理:获取某一时间窗口的若干个先验模型,并计算若干个先验模型的协方差矩阵,将所述协方差矩阵的进行融合求解得到新的协方差矩阵,以新的协方差矩阵作为新模型的协方差矩阵。
[0010] 数据预测:通过新模型进行数据预测,将新模型预测数据依次进行反差分处理、小波反变换和反中心化处理。
[0011] 进一步的,计算若干个先验模型的协方差矩阵,将所述协方差矩阵的进行融合求解得到新的协方差矩阵的步骤包括:获取所述时间窗口数据的ARMA模型参数的变化作协方差矩阵,根据该变化作协方差矩阵求解下个时间窗口的ARMA模型参数,得到新的协方差矩阵。
[0012] 进一步的,获取某一时间窗口的若干个先验模型的步骤包括:
[0013] 通过不同的ARMA模型拟合得到不同模型;
[0014] 通过AIC值比较对所述不同模型进行阶数定权,以AIC值最小原则选择最优的前若干个模型作为先验的局部模型。
[0015] 进一步的,对数据进行中心化处理的步骤包括:
[0016] 随机选取一组数据,将全局的数据减去该组数据,得到去除某组数据后的全局数据;
[0017] 将去除某组数据后的全局数据整体将移动到超维空间中的原点附近,得到对全局数据进行中心化处理后的数据。
[0018] 进一步的,对数据进行设定周期差分处理的步骤包括:
[0019] 设定一个周期间隔的时间,将某时刻的数据减去该时刻一个周期间隔前的数据,得到该时刻进行设定周期差分处理后的数据。
[0020] 进一步的,进行DWT离散小波变换的步骤包括:将数据通过DWT离散小波变换对信号进行不停的分解,每次得到高频信号和低频信号,再通过DWT离散小波变换对低频信号分解,直到达到指定的阶数为止。
[0021] 进一步的,对新模型预测数据进行反差分处理的步骤包括:将所述某时刻的预测数据加上该时刻一个周期间隔前的数据,得到该时刻进行反差分处理后的预测数据。
[0022] 进一步的,小波反变换的步骤包括:将预测的数据作为达到指定阶数的低频分解信号,将低频分解信号再进行指定阶数的DWT离散小波逆变换,得到小波反变换的预测数据。
[0023] 进一步的,反中心化处理的步骤包括:将预测数据的全局数据均加上所述某组数据,得到反中心化处理的数据。
[0024] 一种计算机存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现所述的数据预测方法。
[0025] 相比现有技术,本发明的有益效果在于:
[0026] 本发明通过数据预处理,能利用较少的数据资源计算模型,且模型拟合计算复杂性低,比传统的预测流程成本低,更效率。进一步的,用自回归符合和加权平均的方式形成模型更新的有效方法,比传统的预测方法更精确。附图说明
[0027] 图1为本发明数据预测方法的流程示意图;
[0028] 图2为本发明数据预测方法的结构示意图;
[0029] 图3为本发明数据预测方法进行DWT离散小波变换的示意图。

具体实施方式

[0030] 下面,结合附图以及具体实施方式,对本发明做进一步描述,需要说明的是,在不相冲突的前提下,以下描述的各实施例之间或各技术特征之间可以任意组合形成新的实施例。
[0031] 实施例:
[0032] 请参考图1-3所示,一种数据预测方法,如图1所示,包括:
[0033] 步骤S1:获取一时间窗口的样本数据;
[0034] 步骤S2:数据预处理过程:对样本数据的全局数据进行中心化处理,对中心化处理后数据进行DWT离散小波变换;对DWT离散小波变换后的数据进行设定周期差分处理;
[0035] 步骤S3:数据回归分析处理:获取某一时间窗口的若干个先验模型,并计算若干个先验模型的协方差矩阵,将所述协方差矩阵的进行融合求解得到新的协方差矩阵,以新的协方差矩阵作为新模型的协方差矩阵。
[0036] 步骤S4:数据预测:通过新模型进行数据预测,将新模型预测数据依次进行反差分处理、小波反变换和反中心化处理。
[0037] 进一步的,计算若干个先验模型的协方差矩阵,将所述协方差矩阵的进行融合求解得到新的协方差矩阵的步骤包括:获取所述时间窗口数据的ARMA模型参数的变化作协方差矩阵,根据该变化作协方差矩阵求解下个时间窗口的ARMA模型参数,得到新的协方差矩阵。
[0038] 进一步的,获取某一时间窗口的若干个先验模型的步骤包括:
[0039] 通过不同的ARMA模型拟合得到不同模型;
[0040] 通过AIC值比较对所述不同模型进行阶数定权,以AIC值最小原则选择最优的前若干个模型作为先验的局部模型。
[0041] 进一步的,对数据进行中心化处理的步骤包括:
[0042] 随机选取一组数据,将全局的数据减去该组数据,得到去除某组数据后的全局数据;
[0043] 将去除某组数据后的全局数据整体将移动到超维空间中的原点附近,得到对全局数据进行中心化处理后的数据。
[0044] 进一步的,对数据进行设定周期差分处理的步骤包括:
[0045] 设定一个周期间隔的时间,将某时刻的数据减去该时刻一个周期间隔前的数据,得到该时刻进行设定周期差分处理后的数据。
[0046] 进一步的,进行DWT离散小波变换的步骤包括:将数据通过DWT离散小波变换对信号进行不停的分解,每次得到高频信号和低频信号,再通过DWT离散小波变换对低频信号分解,直到达到指定的阶数为止。
[0047] 小波分解的意义就在于能够在不同尺度上对信号进行分解,而且对不同尺度的选择可以根据不同的目标来确定。
[0048] 对于许多信号,低频成分相当重要,它常常蕴含着信号的特征,而高频成分则给出信号的细节或差别。人的话音如果去掉高频成分,听起来与以前可能不同,但仍能知道所说的内容;如果去掉足够的低频成分,则听到的是一些没有意义的声音。在小波分析中经常用到近似与细节。近似表示信号的高尺度,即低频信息;细节表示信号的高尺度,即高频信息。因此,原始信号通过两个相互滤波器产生两个信号。通过不断的分解过程,将近似信号连续分解,就可以将信号分解成许多低分辨率成分。理论上分解可以无限制的进行下去,但事实上,分解可以进行到细节(高频)只包含单个样本为止。因此,在实际应用中,一般依据信号的特征或者合适的标准来选择适当的分解层数。
[0049] 进一步的,对新模型预测数据进行反差分处理的步骤包括:将所述某时刻的预测数据加上该时刻一个周期间隔前的数据,得到该时刻进行反差分处理后的预测数据。
[0050] 进一步的,小波反变换的步骤包括:将预测的数据作为达到指定阶数的低频分解信号,将低频分解信号再进行指定阶数的DWT离散小波逆变换,得到小波反变换的预测数据。
[0051] 进一步的,反中心化处理的步骤包括:将预测数据的全局数据均加上所述某组数据,得到反中心化处理的数据。
[0052] 本发明的预测算法流程,旨在经过一段时间训练的旧模型与新观测的数据加入到算法时可以形成自适应,以表示目标的最新模型,避免了由于目标运动规律变化而导致模型偏离实际的情况。
[0053] 作为实施例,本发明方法组成由数据预处理模、数据回归分析模块、数据预测模块和自适应模块组成(如图2所示),下面进行具体讲解:
[0054] 1、样本数据的时间窗口
[0055] 时间窗口控制着样本数据的数量,作用是建立先验的局部模型,以更好的与移动后的窗口形成自适应的良性循环。数据在时间轴上形成了若干维度的“数据体”,时间窗口表示一段时间内的“数据体”,且这些数据往往与时间有着千丝万缕的关系,会随着时间推移而发生变化。因此本流程通过计算推移时间窗口上的数据ARMA模型参数变化作协方差矩阵,将上个时间窗口的协方差矩阵(先验的局部模型)参与到下个时间窗口的ARMA模型参数的解算中,得到新的协方差矩阵(后验的局部模型)。
[0056] 2、数据预处理模块
[0057] ·对数据中心化,压缩数据量,减少运算时的存储负担。随机选择一组数据,将全局的数据减去该组数据,将数据整体移动到超维空间中的原点附近,减少重复数据以减少运算的重复运算量。
[0058] ·DWT,离散小波变换,将整体样本数据看作信号,分离其高频与低频信号,消除部分由偶然误差导致的高频振动,如图3所示。
[0059] X(t)为样本数据的输入信号,经过DWT之后分解为一阶高频信号与一阶低频信号,一阶低频信号再次DWT分解为二阶、三阶、直到指定阶数为止,这个阶数的确定由具体的数据决定,本流程也不针对特定的数据作分析因此不在这里讨论小波变换阶数确定的问题。
[0060] ·周期差分处理,消除信号在时间序列上存在某些系统误差。对于ARMA回归算法来讲,其中MA模型要求在时间上仅存在白噪声,但现实一般的数据都与时间存在相关,因此周期差分,即设定一个周期间隔用后一个数据与一个周期间隔前的数据相减,消除掉部分不可解释的时间相关性,提高模型的适用能
[0061] 3、数据回归分析模块
[0062] ·模型阶数循环拟合。对于一个时间窗口的先验模型,需要通过不同的ARMA阶数去拟合而得到模型,并计算各个阶数分别对应的协方差矩阵。
[0063] ·以AIC值最小原则选择最优的前若干个模型,并通过AIC值比较对该模型阶数定权,从而计算协方差矩阵。AIC信息准则即Akaike information criterion,是衡量统计模型拟合优良性(Goodness of fit)的一种标准,由于它为日本统计学家赤池弘次创立和发展的,因此又称赤池信息量准则。它建立在熵的概念基础上,可以权衡所估计模型的复杂度和此模型拟合数据的优良性。
[0064] ·融合若干个模型的先验协方差矩阵后,得到新模型。
[0065] 4、数据预测模块
[0066] ·对预测数据反差分处理,恢复原始状态。由于在第2步中我们对数据进行了差分处理,要恢复原始状态的数据必须将周期间隔后的那个数据加回来,恢复数据本身对时间的相关性。
[0067] ·对预测数据IDWT,小波反变换。由于预测数据是建立在小波变换后各个信号频率上时间窗口先验局部模型上的,因此可以将各个分解信号上的预测数据重新反变换之后得到原始信号上的预测值。
[0068] ·对预测数据反中心化,即加上中心化时减掉的数据。
[0069] 本发明的算法流程优势效果在于:利用较少的数据资源计算模型,模型拟合计算复杂性低,并且局部的模型对目标的近期规律特征表现明显,用自回归符合和加权平均的方式形成模型更新的有效方法,比传统的预测流程成本低,更效率,更精确。其发明点在于:①使用小波变换与ARMA方法结合;②回归分析时利用AIC值对模型进行定权;③多模型的加权平均拟合。
[0070] 作为本发明的应用,本发明能实现利用一段时间的测量得到物理目标地理位置的历史数据,通过离散数学、数学建模与统计决策的方法建立的一套用于预测未来一段时间该物理目标地理位置的算法流程,并且该算法流程实现自适应以表示物理目标的最新位置模型,更好排除由于物理目标的运动规律变化而导致预测效果不佳的情况。
[0071] 本发明还提供一种计算机存储介质,其上存储有计算机程序,本发明的方法如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在该计算机存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机存储介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机存储介质不包括电载波信号和电信信号。
[0072] 对本领域的技术人员来说,可根据以上描述的技术方案以及构思,做出其它各种相应的改变以及形变,而所有的这些改变以及形变都应该属于本发明权利要求的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈