首页 / 专利库 / 机场和地面运营 / 无人机充电站 / 一种基于无人机的大规模无线传感器网络数据收集方法

一种基于无人机的大规模无线传感器网络数据收集方法

阅读:47发布:2020-05-12

专利汇可以提供一种基于无人机的大规模无线传感器网络数据收集方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于无人机的大规模无线 传感器 网络数据收集方法,包括以下步骤:传感器 节点 以事件驱动采集周围信息;将目标区域按网格型划分,在同一网格中的传感器节点组成簇;在每个簇内统计节点 能量 ,选则簇内剩余能量最多的一个节点为簇头节点;计算网格中非簇头节点在t时刻的信息价值;给定 阈值 函数 若 则将节点数据转发给同一网格中的簇头节点,否则返回;根据DFP模型在线训练无人机,规划无人机路径;无人机根据规划的路径收集传感器节点的数据,并将数据传输回基站。本发明将DFP模型应用于无人机路径规划问题,使无人机最大化收集的总信息价值同时能够保证低电量时充电,非常适用于动物监测,森林火灾, 地震 救援等场景。,下面是一种基于无人机的大规模无线传感器网络数据收集方法专利的具体信息内容。

1.一种基于无人机的大规模无线传感器网络数据收集方法,其特征在于,包括以下步骤:
S1:传感器节点以事件驱动采集周围信息;
S2:将目标区域按网格型划分,在同一网格中的传感器节点组成簇;
S3:在每个簇内统计节点能量,选则簇内剩余能量最多的一个节点为簇头节点CH;
S4:计算网格中非簇头节点si在t时刻的信息价值VoIi(t);
S5:给定阈值函数 若 则将非簇头节点si数据转发给同一网格中的
簇头节点CH,否则返回步骤S4;
S6:根据DFP模型在线训练无人机,规划无人机路径;
S7:无人机根据规划的路径收集传感器节点的数据,并将数据传输回基站。
2.根据权利要求1所述的一种基于无人机的大规模无线传感器网络数据收集方法,其特征在于,所述步骤S4具体为:
假设传感器节点集合为S={si|i=1,2,...,n},则非簇头节点si在t时刻的信息价值计算如下:
其中参数Ai和Bi与发生在非簇头节点si周围的事件有关,由目标区域发生过的事件概率统计而得,Ai表示在节点si周围发生的事件的初始信息价值程度,Bi表示事件信息价值衰减程度。
3.根据权利要求1所述的一种基于无人机的大规模无线传感器网络数据收集方法,其特征在于,所述步骤S6具体为:
S6-1:在每一个时间间隔t,无人机接收一个观察ot,ot详细定义如下:
ot=(st,mt)
其中,st表示感官输入流,它是一个高维的变量,由原数据组成;mt表示测量流,是一个低维变量,是从st中提取出能够代表学习目标的的测量值;
S6-2:设置目标矢量gt;
S6-3:训练网络去预测在未来的若干步移动后收集的信息价值和无人机电量,形式上表示为:
其中,T代表时间偏移量的列表, 表示无人机移动的步数;
S6-4:目标函数是测量流的线性函数,表示为如下:
u(f;g)=gT·f
定义预测器F为
Ptα=F(ot,a,g;θ);
S6-5:当训练完成的时候,用这个预测器F进行决策,策略定义如下:
at=arg maxa∈A gTF(ot,a,g;θ)
当无人机根据行动at进入相邻网格之一时,会发现网格有事件或无事件发生,然后,无人机将更新从前一状态进入该状态的测量流;
S6-6:完成无人机路径的规划。
4.根据权利要求3所述的一种基于无人机的大规模无线传感器网络数据收集方法,其特征在于,所述步骤S6-1中mt选择两个测量值,收集的信息价值(V)和无人机电量(E),表示为[V,E]。
5.根据权利要求3所述的一种基于无人机的大规模无线传感器网络数据收集方法,其特征在于,所述步骤S6-2中gt=[1,0]表示只关心收集到的信息总价值,当前目标是使信息价值最大化,无人机到达存在事件发生的网格收集数据时,对应的mt就会加上当前网格簇头节点的信息价值VoIi(t);gt=[0,1]表示只关心无人机的剩余电量,当前目标希望无人机最大化电池电量,在此目标驱动下,无人机会逐渐飞向充电站充电。

说明书全文

一种基于无人机的大规模无线传感器网络数据收集方法

技术领域

[0001] 本发明属于无线传感器网络技术领域,具体涉及一种基于无人机的大规模无线传感器网络数据收集方法。

背景技术

[0002] 在无线传感网络中数据收集是一个活跃的研究话题,调度无人机从分布式传感器中获取传感器数据有望显著提高传统无线传感器网络的数据采集效率。它已广泛应用于灾难抢险,动物跟踪,森林监测等领域。无线传感网络的通信方式主要可以分为三种:查询驱动,事件驱动和时钟驱动。在事件驱动型传感器网络中,只有在某些特定事件(例如地震、火灾、温度/湿度等达到某一阈值)发生时,传感器才被唤醒进行数据传输工作,在其他时刻则保持低功耗休眠状态。事件驱动的通信方式可以降低系统通信频率和减少传感器能耗。
[0003] 在现有的研究中,无人机数据收集的性能指标主要从数据时延、能源效率、飞行时间和数据质量等方面考虑,但是收集到的数据信息价值这个指标却很少考虑到。在很多实际应用场景中,每个节点采集到的信息并不是同等重要的,比如火灾监测应用中某个温度传感器采集的温度远高于常温,动物追踪应用中某些节点周围出现目标濒危动物。这些信息具有时效性,无人机越晚收集到,数据信息价值就越低。无人机收集数据时,一般方法是传感器节点先向基站上报信息价值,然后通过贪婪算法遗传算法离线规划无人机路径。随着智能算法的成熟和GPU计算能的提高,机器学习应用的领域扩大,无人机通过与环境的交互在线学习并规划路径成为热点研究话题。
[0004] 一般机器学习问题可以分为三类:监督学习无监督学习以及强化学习。监督学习主要是学习一个输入到输出的映射函数,而无监督学习更加关注如何挖掘数据本身的隐含结构。强化学习是一个面向目标的策略学习问题,因此大部分关于无人机轨迹规划的问题都建模为强化学习问题。对于一个代理可以与环境进行交互的学习问题,如果环境提供的反馈是稀疏的标量,采用传统的强化学习算法会十分有效;但是如果环境给出的反馈是一个即时密集的多维度反馈,监督学习算法更具优势。如何把强化学习问题在某种程度上转化为一个监督学习问题,加快智能体在环境中学习的速度是一个亟待解决的问题。

发明内容

[0005] 发明目的:为了克服现有技术中存在的不足,提供一种基于无人机的大规模无线传感器网络数据收集方法,其将DFP模型应用于无人机路径规划问题,使无人机最大化收集的总信息价值同时保证低电量时充电。
[0006] 技术方案:为实现上述目的,本发明提供一种基于无人机的大规模无线传感器网络数据收集方法,包括以下步骤:
[0007] S1:传感器节点以事件驱动采集周围信息,仅在某些特定事件(例如地震、火灾、温度/湿度等达到某一阈值)发生时,传感器才被唤醒进行数据传输工作,在其他时刻则保持低功耗休眠状态;
[0008] S2:将目标区域按网格型划分,在同一网格中的传感器节点组成簇;
[0009] S3:在每个簇内统计节点能量,选则簇内剩余能量最多的一个节点为簇头节点CH,在一个网格中仅有一个簇头节点;
[0010] S4:计算网格中非簇头节点si在t时刻的信息价值VoIi(t);
[0011] S5:给定阈值函数 若 则将节点si数据转发给同一网格中的簇头节点CH,否则返回步骤S4;
[0012] S6:根据DFP(Direct Future Prediction)模型在线训练无人机,规划无人机路径;
[0013] S7:无人机根据规划的路径收集传感器节点的数据,并将数据传输回基站。
[0014] 进一步的,所述步骤S4具体为:
[0015] 假设传感器节点集合为S={si|i=1,2,...,n},则非簇头节点si在t时刻的信息价值计算如下:
[0016]
[0017] 其中参数Ai和Bi与发生在非簇头节点si周围的事件有关,由目标区域发生过的事件概率统计而得,Ai表示在节点si周围发生的事件的初始信息价值程度,Bi表示事件信息价值衰减程度;事件发生概率越小,收集到得数据信息价值越大,Ai越大表示在节点si周围发生的事件的初始信息价值越高,而Bi越大则表示事件信息价值衰减越快,信息有效期越短。
[0018] 进一步的,所述步骤S6具体为:
[0019] S6-1:在每一个时间间隔t,无人机接收一个观察(转移到一个状态)ot,ot详细定义如下:
[0020] ot=(st,mt)
[0021] 其中,st表示感官输入流,它是一个高维的变量,由原数据组成,如无人机航拍图像信息组成,mt表示测量流,是一个低维变量,是从st中提取出能够代表学习目标的的测量值;
[0022] S6-2:设置目标矢量gt;
[0023] S6-3:训练网络去预测在未来的若干步移动后收集的信息价值和无人机电量,形式上表示为:
[0024]
[0025] 其中,T代表时间偏移量的列表, 表示无人机移动的步数;
[0026] S6-4:目标函数是测量流的线性函数,表示为如下:
[0027] u(f;g)=gT·f
[0028] 定义预测器F为
[0029] Ptα=F(ot,a,g;θ);
[0030] S6-5:当训练完成的时候,用这个预测器F进行决策,策略定义如下:
[0031] at=argmaxa∈A gTF(ot,a,g;θ)
[0032] 当无人机根据行动at进入相邻网格之一时,会发现网格有事件或无事件发生,然后,无人机将更新从前一状态进入该状态的测量流;这些访问的结果有助于无人机决定接下来要访问哪个网格;
[0033] S6-6:完成无人机路径的规划。
[0034] 进一步的,所述步骤S6-1中mt选择两个测量值,收集的信息价值(V)和无人机电量(E),表示为[V,E]。
[0035] 进一步的,所述步骤S6-2中gt=[1,0]表示只关心收集到的信息总价值,当前目标是使信息价值最大化,无人机到达存在事件发生的网格收集数据时,对应的mt就会加上当前网格簇头节点的信息价值VoIi(t);gt=[0,1]表示只关心无人机的剩余电量,当前目标希望无人机最大化电池电量,在此目标驱动下,无人机会逐渐飞向充电站充电。
[0036] 进一步的,所述步骤S7中无人机数据收集过程中,无人机仅收集每个簇的簇头节点,为了保证数据时效性,无人机收集数据后立即将数据发送至基站。
[0037] 有益效果:本发明与现有技术相比,将DFP模型应用于无人机路径规划问题,使无人机最大化收集的总信息价值同时能够保证低电量时充电,非常适用于动物监测,森林火灾,地震救援等场景。附图说明
[0038] 图1为本发明方法的模型图;
[0039] 图2为本发明方法的流程图
[0040] 图3为本发明方法的仿真图。

具体实施方式

[0041] 下面结合附图和具体实施例,进一步阐明本发明。
[0042] 本实施例中将本发明方法应用于无人机辅助的无线传感器网络(UAV-aided WSNs),将DFP(Direct Future Prediction)模型应用于无人机路径规划问题,如图1所示,本实施例考虑的场景由一组传感器节点S={si|i=1,2,...,n},一架无人机,基站和充电站组成。传感器节点随机部署到目标区域,无人机作为移动汇聚节点收集数据并将数据发送回基站。在收集过程中电池电量不足时,它会飞到充电站充电。
[0043] 在基于无人机的大规模无线传感网络场景下,让无人机收集每个节点的数据显然是不现实的。所以为了降低收集数据的时空相关性,我们将目标区域以面积相等的网格分簇。假设gi=(xi,yi)表示第i个网格的中心位置,G={gi|i=1,2,...n}为包含不同单元格中心位置的集合。若无人机飞行高度不变,将它的轨迹由网格中心节点序列简单表示为[0044] 为了最大限度地提高整个网络的整体信息价值,需要保证无人机收集到的每个集群的最大信息价值。事件的信息价值在事件发生时最高,之后随时间衰减,不失一般性,所以将事件的信息价值函数为如下:
[0045]
[0046] 其中参数Ai和Bi与发生在节点si周围的事件有关,由目标区域发生过的事件概率统计而得。事件发生概率越小,收集到得数据信息价值越大。Ai越大事件i的初始信息价值越高,而Bi越大事件i信息价值衰减越快,信息有效期越短。
[0047] 研究发现,与传输成本相比,感知信息或计算所需的能源成本可以忽略不计。在模型中簇头节点充当网关节点接收其他节点的数据并传输给无人机,因此簇头的耗能最多。为了延长网络生命周期,本实施例选择簇内剩余电量最多的节点作为簇头节点。
[0048] 当簇头节点选择后,需要制定簇内节点转发规则以使每个簇保持最大信息价值。其他传感器根据可用能量的大小和信息的值决定是否传输其数据。
[0049] 当某节点死亡时,该节点就采集不到周围事件信息,当簇内节点都死亡时,该簇监视区域信息价值变为零,从这一度来说,减少簇内传感器耗能有利于簇内整体信息价值最大化。因此,节点不是一采集到事件数据就传输给簇头节点,这样会增加簇头节点的负担。且节点能量较低时,传输一些信息价值低的数据其实是不划算的,需要在节点能耗和信息价值之间取舍。根据当前节点电量ei(t),假设存在一个与电池电量ei(t)成反比的阈值函数 在节点当前电量ei(t)下,只有信息价值超过阈值函数的数据才会被传输,簇内节点传输策略如下所示
[0050]
[0051] πi=0表示节点i在t时刻不需要将数据传输给簇头节点,反之πi=1则需要。
[0052] 分簇及簇内路由完成后,传感器节点由事件驱动,采集信息,在无人机在收集数据阶段,我们有如下假设:
[0053] (1)每个节点的地理位置通过手工部署或GPS定位可知;
[0054] (2)目标区域以网格划分簇,每个簇只有一个簇头节点且无人机仅收集簇头节点信息;
[0055] (3)在数据收集过程中,无人机的飞行高度和飞行速度不变。
[0056] 如图2所示,本实施例提供的一种基于无人机的大规模无线传感器网络数据收集方法,其具体过程如下:
[0057] S1:传感器节点以事件驱动采集周围信息,仅在某些特定事件(例如地震、火灾、温度/湿度等达到某一阈值)发生时,传感器才被唤醒进行数据传输工作,在其他时刻则保持低功耗休眠状态;
[0058] S2:将目标区域按网格型划分,在同一网格中的传感器节点组成簇;
[0059] S3:每个簇内统计节点能量,选择簇内剩余能量最多的节点为簇头节点CH,在一个网格中仅有一个簇头节点;
[0060] S4:计算网格中非簇头节点si在t时刻的信息价值VoIi(t):
[0061] 节点si在t时刻的信息价值计算如下:
[0062]
[0063] 其中参数Ai和Bi与发生在节点si周围的事件有关,由目标区域发生过的事件概率统计而得。事件发生概率越小,收集到的数据信息价值越大。Ai越大表示在节点si周围发生的事件的初始信息价值越高,而Bi越大则表示事件信息价值衰减越快,信息有效期越短;
[0064] S5:若 则将节点si数据转发给同一网格中的簇头节点CH,否则返回步骤S4;
[0065] S6:根据DFP模型在线训练无人机,规划无人机路径:
[0066] S6-1:在每一个时间间隔t,无人机接收一个观察(转移到一个状态)ot,ot详细定义如下:
[0067] ot=(st,mt)  (3)
[0068] st表示感官输入流,它是一个高维的变量,由原数据组成,如无人机航拍图像信息组成,mt表示测量流,它是一个低维变量,是从st中提取出能够代表我们学习目标的的测量值。在本实施例中,我们的目标是最大化信息价值,同时保证低电量时给电池充电。因此mt选择两个测量值,收集的信息价值(V)和无人机电量(E),表示为[V,E];
[0069] S6-2:设置目标矢量gt,gt=[1,0]表示我们只关心收集到的信息总价值,当前目标是使信息价值最大化,无人机到达存在事件发生的网格收集数据时,对应的mt就会加上当前网格簇头节点的信息价值VoIi(t);gt=[0,1]表示我们只关心无人机的剩余电量,当前目标希望无人机最大化电池电量,在此目标驱动下,无人机会逐渐飞向充电站充电;
[0070] S6-3:训练网络去预测在未来的1,2,4,8,16和32步移动后收集的信息价值和无人机电量。形式上这可以写成:
[0071]
[0072] 这里T代表时间偏移量的列表,即[1,2,4,8,16,32],表示无人机移动的步数;
[0073] S6-4:目标函数是测量流的线性函数,表示为如下:
[0074] u(f;g)=gT·f
[0075] 定义预测器F为
[0076] Ptα=F(ot,a,g;θ)
[0077] S6-5:当训练完成的时候,用预测器F进行决策,策略定义如下:
[0078] at=argmaxa∈A gTF(ot,a,g;θ)
[0079] 当无人机根据行动at进入相邻网格之一时,它可能会发现网格有事件或无事件发生。然后,无人机将更新从前一状态进入该状态的测量流。这些访问的结果有助于无人机决定接下来要访问哪个网格;
[0080] S6-6:完成无人机路径的规划;
[0081] S7:无人机根据规划的路径收集传感器节点的数据,并将数据传输回基站。
[0082] 本实施例中将本发明收集方法和传统的收集方法进行仿真试验,如图3所示,比较了本发明的DFP算法与经典Q-Learning算法和深度Q-Learning网络(DQN)的性能。从训练曲线可以看出,与Q-Learning和DQN相比,用DFP算法无人机前期收集的事件信息价值增长速率更快,学习效率更高。这是因为一个传统的强化学习问题,其训练对象就是最大化一个关于奖励的函数。一般奖励都是人为给定的,这就使得学习问题的方差变得很大,训练过程十分不稳定,收敛速度慢,甚至可能不收敛。但DFP算法用测量流来代替奖励,使得奖励具有更强的状态表示能力,且测量流提供“丰富的和时间密集的”监督,可以稳定和加速训练。Q-Learing的学习效率最低,因为它没有用到缓冲区,经验缓存是可以一定程度上增加数据多样性。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈