首页 / 专利库 / 电脑编程 / K最近邻算法 / 一种利用GPS信息实现对农机工况状态分析的方法

一种利用GPS信息实现对农机工况状态分析的方法

阅读:1023发布:2020-05-15

专利汇可以提供一种利用GPS信息实现对农机工况状态分析的方法专利检索,专利查询,专利分析的服务。并且为了解决 现有技术 中GPS信息容易造成误判段的问题,本 发明 提出一种利用农机GPS信息对农机工况状态进行分析的方法,包括以下步骤:S1.建立数据样本集S;S2.获得训练样本集S0;S3.建立农机 采样 频率 平均速度样本集 S4.获得 怠速 样本GPS数据集S1和移动状态样本S3;S5.将移动状态样本S3分为移动样本St和作业样本Sw。本发明对农机实时GPS信息进行采集,利用isolation tree(iTree)方法对农机GPS信息进行异常值剔除,然后根据样本采用频率平均速度及k-mean 算法 实现对怠速状态和移动状态的识别,最后利用邻近度和参考点 密度 聚类算法 对移动状态进行分析,实现对移动状态中转移、作业工况的识别。,下面是一种利用GPS信息实现对农机工况状态分析的方法专利的具体信息内容。

1.一种利用GPS信息实现对农机工况状态分析的方法,其特征在于,包括以下步骤:
S1.采集农机GPS信息,建立数据样本集S;
S2.将S1步骤得到的样本数据集S进行异常值剔除获得训练样本集S0;
S3.根据GPS信息,建立农机采样频率平均速度样本集
S4.根据S3步骤获得的农机采样频率平均速度样本集 区分农机的怠速样本GPS数据集S1和移动状态样本S3;
S5.设定密度阈值,通过该密度阈值确定状态样本S3中的核心点;再设定移动状态样本S3中两点距离最大距离、最小距离以及农具幅宽为,通过三者比较获得距离阈值;最后,利用k近邻和密度聚类算法对S4步骤获得的移动状态样本S3进行分析,将移动状态样本S3分为移动样本St和作业样本Sw,实现对农机移动状态中转移、作业工况的识别。
2.根据权利要求1所述的一种利用GPS信息实现对农机工况状态分析的方法,其特征在于,所述S5步骤中将移动状态样本S3分为移动样本St和作业样本Sw的过程如下:
S501.获取核心点:针对移动状态样本S3设定密度阈值,将密度大于或等于密度阈值的样本确定为核心点;
S502.确定距离阈值:设定移动状态样本S3中两点距离最大距离dmax、最小的距离dmin以及农机作业时农具幅宽为df,通过三者比较获得距离阈值;
S503.获取参考点:通过上述S501得到样本核心点,从样本核心点中选取相距最远的两个核心点作为初始参考点,然后根据剩余核心点距离参考点的距离,将其他核心点划分到距离它最近的参考点所属的类别,组成两个初始参考点集合,对比两个参考点集合元素的个数,选择包含元素较多的参考点集合重复该步骤,直到无法划分为止;
S504.聚类的形成:通过S503步骤,把目标数据集分成不同的集合,每一个非空子集形成一个聚类;
S505.移动样本St和作业样本Sw的形成:根据集合聚集密度进行区分,如果聚集密度接近于零,那么该集合GPS样本为移动样本St,否则为作业样本Sw。
3.根据权利要求2所述的一种利用GPS信息实现对农机工况状态分析的方法,其特征在于,步骤S502中:如果dmaxdf>dmin,那么距离阈值为df,如果dmin>df,那么距离阈值为dmin。
4.根据权利要求1所述的一种利用GPS信息实现对农机工况状态分析的方法,其特征在于:
S2步骤中的异常值剔除采用isolation tree方法,具体步骤如下:
S201.农机作业状态分析样本数据集的数据为N条,在N条数据中均匀无放回抽取出φ条数据作为树的训练样本;
S202.在样本中随机选一个特征,利用二叉划分法对s201步骤得到的训练样本进行二叉划分,直到一个数据本身不可分或者树的高度达到log2(φ);
S203.将测试数据在iTree树上沿对应的条件分支进行计算,直到达到叶子节点,并记录这过程中经过的路径长度h(x),所走过的边的数量;最后,将h(x)带入,计算每条待测数据的异常分数,其计算公式为:
其中, 是二叉搜索树的平均路径长度;h(x)为路径长度;E(h
(x))为森林中所有iTree树的平均路径长度;H为GPS信息采集的频率;n为采样的样本数量;
S204.对S203获得的待测数据的异常分数进行分析,如果分数比0.5要小,确定为正常数据;
S205.通过S204步骤获得训练样本数据集S0。
5.根据权利要求1所述的一种利用GPS信息实现对农机工况状态分析的方法,其特征在于,S3步骤中建立农机采样频率平均速度样本集 的方法是:
S301.采用Haversine法,根据GPS信息中的经纬度求取两个样本点之间的距离,其计算公式为:
其中 表示纬度,λ表示经度,γ表示地球半径,d表示两个经纬度之间的距离;
S302.根据农机采样平均速度计算公式 建立农机采样频率平均速度样本集 其中,H为GPS信息采集的频率。
6.根据权利要求1所述的一种利用GPS信息实现对农机工况状态分析的方法,其特征在于,所述的S4步骤农机的怠速的判断方法是:
S401.相邻时间内经纬度的距离为:d;GPS采样频率:H;误差平均速度 根据农机采样频率平均速度样本集 与α进行比较,以 作为标准,获得怠速样本GPS数据集S1;
S402.利用k-mean算法对怠速样本集S1进行聚类,获得聚类中心点,然后求取聚类中心点与怠速样本集的距离dD,将dD与相邻时间内经纬度的距离为d比较;如果dD

说明书全文

一种利用GPS信息实现对农机工况状态分析的方法

技术领域

[0001] 发明涉及一种利用农机GPS数据信息对农机工况进行分析,确定农机怠速、转移、作业工作状态,特别涉及一种利用邻近度及参考点密度聚类算法对农机工况进行分析的方法。

背景技术

[0002] 由于农机工作环境及驾驶员习惯问题,远程很难实现对农机状态的判断,目前应用较为广泛的方法一种是通过对农机加装传感器或者摄像头,通过传感器的状态或者实时拍照的方法实现对农机状态的判断,由于农机工作环境特殊性,无论是传感器还是摄像头在判断效率上有很大的局限性,且无法对农机作业面积进行计算;另一种是如中国专利CN201910306805.1,所公开的一种基于GPS和发动机数据的农机作业状态判断方法,其技术方案是通过“发动机 ECU数据”结合GPS信息对农机工况状态进行判断。虽然上述方法得到的判断精度得以提高,但是目前国内农机皆是以国标国二、国三发动机,而且农机ECU 存在多样性,准确的采集发动机参数存在很大的难度,导致该判断方法存在很大的困难。
[0003] 一种仅利用GPS信息就可以准确判断农机状态的农机工况状态分析方法亟待研发。

发明内容

[0004] 为了解决现有技术中GPS信息容易造成误判段的问题,本发明提出一种利用农机GPS信息对农机工况状态进行分析的方法,特别涉及一种基于邻近度和参考点的密度聚类算法的农机工况分析方法,该方法通过对安装在农机上 GPS模,根据农机GPS信息实现对农机转移、作业、怠速工况状态进行准确分析。
[0005] 为了实现上述目的,本发明采用的具体方案为:一种利用GPS信息实现对农机工况状态分析的方法,其特征在于,包括以下步骤:
[0006] S1.采集农机GPS信息,建立数据样本集S;
[0007] S2.将S1步骤得到的样本数据集S进行异常值剔除获得训练样本集S0;
[0008] S3.根据GPS信息,建立农机采样频率平均速度样本集
[0009] S4.根据S3步骤获得的农机采样频率平均速度样本集 区分农机的怠速样本GPS数据集S1和移动状态样本S3;
[0010] S5.设定密度阈值,通过该密度阈值确定状态样本S3中的核心点;再设定移动状态样本S3中两点距离最大距离、最小距离以及农具幅宽为,通过三者比较获得距离阈值;最后,利用k近邻和密度聚类算法对S4步骤获得的移动状态样本S3进行分析,将移动状态样本S3分为移动样本St和作业样本Sw,实现对农机移动状态中转移、作业工况的识别。
[0011] 所述S5步骤中将移动状态样本S3分为移动样本St和作业样本Sw的过程如下:
[0012] S501.获取核心点:针对移动状态样本S3设定密度阈值,将密度大于或等于密度阈值的样本确定为核心点;
[0013] S502.确定距离阈值:设定移动状态样本S3中两点距离最大距离dmax、最小的距离dmin以及农机作业时农具幅宽为df,通过三者比较获得距离阈值;
[0014] S503.获取参考点:通过上述S501得到样本核心点,从样本核心点中选取相距最远的两个核心点作为初始参考点,然后根据剩余核心点距离参考点的距离,将其他核心点划分到距离它最近的参考点所属的类别,组成两个初始参考点集合,对比两个参考点集合元素的个数,选择包含元素较多的参考点集合重复该步骤,直到无法划分为止;
[0015] S504.聚类的形成:通过S503步骤,把目标数据集分成不同的集合,每一个非空子集形成一个聚类;
[0016] S505.移动样本St和作业样本Sw的形成:根据集合聚集密度进行区分,如果聚集密度接近于零,那么该集合GPS样本为移动样本St,否则为作业样本Sw。
[0017] 进一步的,步骤S502中:如果dmaxdf>dmin,那么距离阈值为df,如果dmin>df,那么距离阈值为dmin。
[0018] 其中,S2步骤中的异常值剔除采用isolationtree方法,具体步骤如下:
[0019] S201.农机作业状态分析样本数据集的数据为N条,在N条数据中均匀无放回抽取出φ条数据作为树的训练样本;
[0020] S202.在样本中随机选一个特征,利用二叉划分法对s201步骤得到的训练样本进行二叉划分,直到一个数据本身不可分或者树的高度达到log2(φ);
[0021] S203.将测试数据在iTree树上沿对应的条件分支进行计算,直到达到叶子节点,并记录这过程中经过的路径长度h(x),所走过的边的数量;最后,将h(x)带入,计算每条待测数据的异常分数,其计算公式为:
[0022]其中, 是二叉搜索树的平均路径长度;h(x)为路径长度; E(h
(x))为森林中所有iTree树的平均路径长度;H为GPS信息采集的频率;n 为采样的样本数量;
[0023] S204.对S203获得的待测数据的异常分数进行分析,如果分数比0.5要小,确定为正常数据;
[0024] S205.通过S204步骤获得训练样本数据集S0。
[0025] 其中,S3步骤中建立农机采样频率平均速度样本集 的方法是:
[0026] S301.采用Haversine法,根据GPS信息中的经纬度求取两个样本点之间的距离,其计算公式为:
[0027]
[0028] 其中 表示纬度,λ表示经度,γ表示地球半径,d表示两个经纬度之间的距离;
[0029] S302.根据农机采样平均速度计算公式 建立农机采样频率平均速度样本集其中,H为GPS信息采集的频率。
[0030] 其中,所述的S4步骤农机的怠速的判断方法是:
[0031] S401.相邻时间内经纬度的距离为:d;GPS采样频率:H;误差平均速度 根据农机采样频率平均速度样本集 与α进行比较,以 作为标准, 获得怠速样本GPS数据集S1;
[0032] S402.利用k-mean算法对怠速样本集S1进行聚类,获得聚类中心点,然后求取聚类中心点与怠速样本集的距离dD,将dD与相邻时间内经纬度的距离为d比较;如果dD
[0033] 需要明确的是:本文中转移状态和作业状态统称为移动状态。
[0034] 有益效果:本发明需要对农机实时GPS信息或者历史GPS信息进行采集,利用isolationtree(iTree)方法对农机GPS信息进行异常值剔除,然后根据样本采用频率平均速度及k-mean算法实现对怠速状态和移动状态的识别,最后利用邻近度和参考点密度聚类算法对移动状态进行分析,实现对移动状态中转移、作业工况的识别。附图说明
[0035] 图1怠速GPS数据获取。
[0036] 图2转移样本、作业样本分析框图
[0037] 图3参考点计算方法。
[0038] 图4近邻和参考点密度聚类算法。
[0039] 图5车辆GPS轨迹信息。
[0040] 图6经过本发明所述方法处理后的车辆作业轨迹。

具体实施方式

[0041] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
[0042] 所述的一种利用GPS信息实现对农机工况状态分析的方法,具体步骤是:
[0043] 步骤一、建立样本数据集,依托加装在农机上的GPS装置,获取农机GPS 信息数据,建立农机作业状态分析样本数据集S,GPS信息包括农机所在地理位置的经度(longitude)、纬度(latitude)、海拔(altitude)、方位 (azimuth)、速度(speed)及GPS信息发送时间(send_time);
[0044] 步骤二、异常值剔除,GPS信息异常值的产生主要是有两个方面,一方面是由于GPS信息本身出现漂移现象,导致个别GPS信息出现较大的误差,另一方面由于农机作业环境的特殊性导致GPS信息传输网络可能会出现信息延迟,导致农机GPS信息的缺失。对于GPS信息数据中的漂移数据,本发明采用 isolationtree(iTree)方法对GPS信息样本数据集进行异常值剔除,与随机森林由大量决策树组成一样,iForest森林也由大量的树组成。iForest中的树叫isolationtree,简称iTree。iTree树和决策树不太一样,其构建过程也比决策树简单,因为其中就是一个完全随机的过程。是无监督的异常检测算法,在实际应用时,并不需要黑白标签。需要注意的是,如果训练样本中异常样本的比例比较高,违背了先前提到的异常检测的基本假设,可能最终的效果会受影响;异常检测跟具体的应用场景紧密相关,算法检测出的“异常”不一定是实际想要的。
[0045] 具体步骤如下:
[0046] (1)假如农机作业状态分析样本数据集有N条数据,本发明从这N条数据中均匀无放回抽取出φ条数据作为树的训练样本。
[0047] (2)利用二叉划分法,在样本中随机选一个特征,并在这个特征的最大与最小值直接随机的选取一个值,对样本进行二叉划分,将样本中小于该值的划分到节点的左边,大于等于该值的划分到节点的右边,这样就获得了一个分裂条件和左右两个数据集,然后对左右两个数据集重复二叉划分法,直到一个数据本身不可分或者树的高度达到log2(φ)。
[0048] (3)训练样本数据的预测,预测的过程就是把测试数据在iTree树上沿对应的条件分支往下走,直到达到叶子节点,并记录这过程中经过的路径长度h(x),即从根节点,穿过中间的节点,最后到达叶子节点,所走过的边的数量(pathlength)。最后,将h(x)带入,计算每条待测数据的异常分数(Anomaly Score),其计算公式为:
[0049]其中 是二叉搜索树的平均路径长度,用来对结果进行归一化
处理,其中的H(k)=ln(k)+ξ来估计,ξ为欧拉常数,h(x)为路径长度。E(h(x))为森林中所有iTree树的平均路径长度。
[0050] 异常值剔除,如果分数越接近1,其是异常点的可能性越高;如果分数都比0.5要小,那么基本可以确定为正常数据;如果所有分数都在0.5附近,那么数据不包含明显的异常样本。通过异常值的剔除获得训练样本数据集S0。
[0051] 步骤三、建立农机采样频率平均速度集 在本发明中采用Haversine 法,根据GPS信息中的经纬度求取两个样本点之间的距离,其计算公式为:
[0052]
[0053] 其中 表示纬度,λ表示经度,γ表示地球半径,,d表示两个经纬度之间的距离。
[0054] 在本发明中GPS信息采集的频率以H表示,那么农机采样平均速度计算公式如下:通过计算建立农机采样频率平均速度样本集
[0055] 步骤四、怠速样本集的确定如图1所示,首先获取误差速度集,农机处于怠速状态即静止状态,对于GPS信息来说,即使是静止不动,在一段时间内,定位信息不会呈现一个点,而是在一个区域内呈现聚集状态,但是却和农机作业状态呈现相似的聚集特征。在本发明中先基于速度对训练样本数据集S0进行筛选,建立怠速样本GPS数据集S1,然后利用K-Mean聚类算法对怠速样本GPS 数据集进行分析,确定农机怠速GPS信息集,具体步骤如下:
[0056] (1)根据GPS本身误差,然后基于采样频率,求得误差平均速度 根据平均速度 作为标准,将该时间段内的经纬度、采样时间进行分类,怠速样本GPS数据集S1。
[0057] (2)基于怠速样本GPS数据集S1的K-Mean聚类算法,从怠速样本GPS 数据集S1中随机取k个元素,作为k个簇的各自的中心,分别计算剩下的元素到k个簇中心的相异度,将这些元素分别划归到相异度最低的簇。
[0058] (3)根据聚类结果,重新计算k个簇各自的中心,计算方法是取簇中所有元素各自维度的算术平均数,将怠速样本GPS数据集S1中全部元素按照新的中心重新聚类。
[0059] (4)重复第3步,直到聚类结果不再变化。
[0060] (5)输入聚类中心,然后求取聚类中心点与怠速样本集的距离dD,将dD与定位误差d比较,如果dD
[0061] 步骤五、基于k近邻和密度聚类的转移作业状态分析过程如图2所示,具体步骤如下:
[0062] 1、建立样本数据集,在步骤四中已经得到了农机的移动状态样本S3。
[0063] 2、相关参数的确定。
[0064] (1)样本核心点的获取,对于一个样本集来说,核心点的获取首先针对样本集给定的一个密度阈值,如果样本中点的密度大于或等于密度阈值,则称该点为核心点,反之为非核心点。
[0065] (2)距离阈值即空间点领域范围半径(Eps)的确定,数据集中任意一点p的领域是以该点为圆心,以Eps为半径的圆区域内包含的点的集合。农机移动速度相对其他机械来说相对小很多,而农机在进行耕作、收割、播种等农业活动时,农机移动速度更小,为了确定距离阈值,求取农机的移动状态样本 S3中两点距离最大距离dmax和最小的距离dmin,农机作业时农具幅宽为df,如果dmaxdf>dmin,那么距离阈值为df,如果 dmin>df,那么距离阈值为dmin。
[0066] (3)密度阈值即最小邻居点阈值(MinPts)的确定,假定p为一个数据集数据集中任意一点q的密度是点q的Eps领域内包含的点的数目称作为q的密度。
[0067] (4)核心点,在获得密度阈值MinPts后,如果样本中点的密度大于或等于密度阈值,那么改点为核心点,反之为非核心点。
[0068] (5)参考点,代表若干核心点的集合的核心点为参考点。参考点在一定的程度表现出了若干个核心点的分布情况。
[0069] 3、参考点的获取,参考点的获取如图3所示,在上述步骤中得到样本核心点,从样本核心点中选取相距最远的两个核心点作为初始参考点,然后根据剩余核心点距离参考点的距离,将其他核心点划分到距离它最近的参考点所属的类别,组成两个初始参考点集合,对比两个参考点集合元素的个数,选择包含元素较多的参考点集合重复上述步骤,直到无法划分为止。一般来说参考点领域内的区域密度要大于该点领域周围的邻居的局部密度;不同参考点间的距离一般来说相对较远。
[0070] 4、聚类的形成,通过上述步骤,就把目标数据集分成不同的集合。假如一个参考点p既属于一个集合,又属于另一个集合,那么这两个集合可密度相连接成一个新的集合。每一个非空子集就形成一个聚类,对于每个聚类来说都可以由其中的一个参考点及密度可达于该参考点的所有数据点构成。
[0071] 5、转移、作业样本数据集的形成,根据集合聚集密度的不同,如果聚集密度接近于零,那么该集合GPS样本为移动样本集合,否则为作业样本集合。通过上述步骤将农机的移动状态样本S3分为移动样本St和作业样本Sw。
[0072] 结果论证:
[0073] 图5为车辆编号为86223704409800农机在2019年7月15日00:00:00 至2019年7月16日00:00:00分车辆轨迹图,在该时间段,农机的状态为转移、怠速、作业者三种状态,通过该发明对农机GPS信息轨迹进行分析处理,得到农机作业轨迹如图6所示,在图6中将农业的作业GPS进行精确区分,在这一时间段共采集到GPS信息数量为965条,其中作业信息数量
332个。通过本发明中的算法分析获得作业GPS点数量为327个,准确率达98.6%,与同类算法相比,该算法分析精度大幅提高,为基于GPS信息的农机作业面积计算、转移路径计算等功能有着至关重要的意义。
[0074] 以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易变化或替换,都属于本发明的保护范围之内。因此本发明的保护范围所述以权利要求的保护范围为准。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈