首页 / 专利库 / 资料储存系统 / 挖矿 / 数据挖掘 / 一种航天器遥测参数的数据类型自动判别方法

一种航天器遥测参数的数据类型自动判别方法

阅读:1023发布:2020-06-07

专利汇可以提供一种航天器遥测参数的数据类型自动判别方法专利检索,专利查询,专利分析的服务。并且本 发明 提供了一种 航天器 遥测参数的数据类型自动判别方法,确定待分析的遥测参数集合,剔除遥测参数集合中的空值参数和恒值参数;针对每个遥测参数,分别计算其偏移零值占比、偏移正值占比和数值元素计数这三个特征量;利用三个特征量,按照预设的 阈值 进行航天器遥测参数的数据类型判别。本发明既有利于分析人员高效快速的确定航天器遥测参数的参数类型,又有利于提高大数量遥测参数集应用 数据挖掘 方法时的准确性。,下面是一种航天器遥测参数的数据类型自动判别方法专利的具体信息内容。

1.一种航天器遥测参数的数据类型自动判别方法,其特征在于包括以下步骤:
步骤1,确定待分析的遥测参数集合,剔除遥测参数集合中的空值参数和恒值参数;
步骤2,针对每个遥测参数,分别计算其偏移零值占比、偏移正值占比和数值元素计数这三个特征量;
步骤3,利用三个特征量,按照预设的阈值进行航天器遥测参数的数据类型判别。
2.根据权利要求1所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤1中,待分析的遥测参数集合S={para1,para2,…,paran},S中包含n个遥测参数;每个遥测参数parai=[[t1,v1],…,[tpi,vpi]]为时间和数值组成的序列,1≤i≤n,parai包含pi项数据;如果参数parai的数据项数pi=0,则该参数不含遥测数据,将该参数从待分析集合S中剔除;计算参数parai中的最大值maxpi和最小值minpi,如果maxpi=minpi,则将该参数从集合S中剔除。
3.根据权利要求2所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤2中,对于遥测参数parai,设置偏移序列paraSi=parai.shift(1),计算过程为偏移序列paraSi与原序列parai等长,其中每个数据项的时间不变,参数值依次往后偏移一项,且最后一项补到第一项,即paraSi=[[t1,vpi],[t2,v1],…,[tpi,vpi-1]];偏移序列与原始序列对应时间项的参数值之差定义为paraSubi=parai-paraSi=[v1-vpi,v2-v1,…,vpi-vpi-1];参数parai的偏移零值占比定义为zpi=zi/pi,其中zi为paraSubi中等于0的数据项个数,pi为参数parai中总的数据项个数。
4.根据权利要求3所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤2中,对于遥测参数parai,偏移正值占比定义为upi=ui/pi,其中ui为paraSubi中大于
0的数据项个数,pi为参数parai中数据项总数。
5.根据权利要求4所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤2中,对于遥测参数parai,pvi中所有不同数值元素组成的序列dvi=[vd1,…,vdi],其中任意两个元素均不相等,且di≤pi,则遥测参数的数值元素个数cpi=di,即序列dvi中的元素个数。
6.根据权利要求5所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤3中,设置偏移零值占比阈值ZPc、偏移正值占比阈值UPc和数值元素数量阈值CPc;对于遥测参数parai,如果其偏移零值占比量zpi>ZPc,并且数值元素计数为cpiUPc,若是,则该遥测参数的参数类型判定为计数型变量;如果不满足条件,则该遥测参数为连续型变量。
7.根据权利要求6所述的航天器遥测参数的数据类型自动判别方法,其特征在于:所述的步骤3中,ZPc=0.9,UPc=0.9,CPc=20。

说明书全文

一种航天器遥测参数的数据类型自动判别方法

技术领域

[0001] 本发明涉及一种数据类型自动判别方法,属于航天器故障诊断分析领域。

背景技术

[0002] 大数据已经在航天领域产生了深远的影响,并呈现出不断发展的蓬勃趋势。数据既是航天理论的基础,又是航天实践的基石。航天器遥测数据包含系统状态的重要参数信息,反映航天器的数字特征或状态,作为分析挖掘和检测评估等应用的数据依据。数据挖掘涉及的决策树、神经网络、随机森林、贝叶斯等方法都在航天器遥测数据分析中发挥了积极作用,但这些方法在应用时都要求明确遥测参数的数据类型。
[0003] 目前航天器遥测参数数据类型的判别与设置依靠分析人员手动完成,当分析参数集扩大到几千个甚至上万个参数时,人工操作方式已经无法满足数据分析挖掘的时效性和准确性要求。

发明内容

[0004] 为了克服现有技术的不足,本发明提供一种航天器遥测参数的数据类型自动判别方法,按照数据挖掘领域中无序离散量、有序离散量及连续变量的定义,对应将遥测参数划分为开关状态、控制模式等离散型状态变量、指令计数与积日积秒等计数型变量和温度电压电流等连续型变量,在确定分析参数集后,针对其中的每个参数计算偏移零值占比、偏移正值占比和数值元素计数三个特征量,根据这三个特征量自动判别遥测参数的数据类型。该方法既有利于分析人员高效快速的确定航天器遥测参数的参数类型,又有利于提高大数量遥测参数集应用数据挖掘方法时的准确性。
[0005] 本发明解决其技术问题所采用的技术方案包括以下步骤:
[0006] 步骤1,确定待分析的遥测参数集合,剔除遥测参数集合中的空值参数和恒值参数;
[0007] 步骤2,针对每个遥测参数,分别计算其偏移零值占比、偏移正值占比和数值元素计数这三个特征量;
[0008] 步骤3,利用三个特征量,按照预设的阈值进行航天器遥测参数的数据类型判别。
[0009] 所述的步骤1中,待分析的遥测参数集合S={para1,para2,…,paran},S中包含n个遥测参数;每个遥测参数parai=[[t1,v1],…,[tpi,vpi]]为时间和数值组成的序列,1≤i≤n,parai包含pi项数据;如果参数parai的数据项数pi=0,则该参数不含遥测数据,将该参数从待分析集合S中剔除;计算参数parai中的最大值maxpi和最小值minpi,如果maxpi=minpi,则将该参数从集合S中剔除。
[0010] 所述的步骤2中,对于遥测参数parai,设置偏移序列paraSi=parai.shift(1),计算过程为偏移序列paraSi与原序列parai等长,其中每个数据项的时间不变,参数值依次往后偏移一项,且最后一项补到第一项,即paraSi=[[t1,vpi],[t2,v1],…,[tpi,vpi-1]];偏移序列与原始序列对应时间项的参数值之差定义为paraSubi=parai-paraSi=[v1-vpi,v2-v1,…,vpi-vpi-1];参数parai的偏移零值占比定义为zpi=zi/pi,其中zi为paraSubi中等于0的数据项个数,pi为参数parai中总的数据项个数。
[0011] 所述的步骤2中,对于遥测参数parai,偏移正值占比定义为upi=ui/pi,其中ui为paraSubi中大于0的数据项个数,pi为参数parai中数据项总数。
[0012] 所述的步骤2中,对于遥测参数parai,pvi中所有不同数值元素组成的序列dvi=[vd1,…,vdi],其中任意两个元素均不相等,且di≤pi,则遥测参数的数值元素个数cpi=di,即序列dvi中的元素个数。
[0013] 所述的步骤3中,设置偏移零值占比阈值ZPc、偏移正值占比阈值UPc和数值元素数量阈值CPc;对于遥测参数parai,如果其偏移零值占比量zpi>ZPc,并且数值元素计数为cpiUPc,若是,则该遥测参数的参数类型判定为计数型变量;如果不满足条件,则该遥测参数为连续型变量。
[0014] 所述的步骤3中,ZPc=0.9,UPc=0.9,CPc=20。
[0015] 本发明的有益效果是:
[0016] 1)通过对大数据集遥测参数的预处理,去除了不含遥测数据的空值参数和不包含有效信息的恒值参数,提高了后续数据分析挖掘的效率。
[0017] 2)通过计算特征量自动判别遥测参数的数据类型,使分析人员能够进一步了解掌握参数特性,并为分析人员在大规模参数集上应用数据挖掘算法创造了条件。附图说明
[0018] 图1是本发明的流程图
[0019] 图2是本发明应用案例的示意。

具体实施方式

[0020] 下面结合附图和实施例对本发明进一步说明,本发明包括但不仅限于下述实施例。
[0021] 本发明提供一种航天器遥测参数的数据类型自动判别方法,具体包括如下步骤:
[0022] 第一步,遥测参数集的确定及预处理;
[0023] 第二步,遥测参数特征量计算;
[0024] 第三步,遥测参数的数据类型判别。
[0025] 如上所述的第一步具体包括如下步骤:
[0026] 步骤1.1:确定遥测参数集合。待分析的遥测参数集合表示为S={para1,para2,…,paran},S中包含n个遥测参数。对于其中的每个遥测参数parai为时间和数值组成的序列,表示为parai=[[t1,v1],…,[tpi,vpi]],其中1≤i≤n,pi表示参数parai包含pi项数据。对S中的每个参数parai依次执行后续步骤。
[0027] 步骤1.2:空值参数剔除。航天器遥测参数中有一些发射段使用的参数在在轨运行过程中已经停用,需要剔除这些参数。剔除方法为如果参数parai的数据项数pi=0,则该参数不含遥测数据,将该参数从待分析集合S中剔除,跳转回步骤1.1进行下一个参数的判别。
[0028] 步骤1.3:恒值参数剔除。航天器遥测参数中有一些备份器部件的参数在未启用时一直为恒定的数值,这些参数不包含任何有效信息,在分析过程中也应该剔除。剔除方法为计算参数parai中的最大值maxpi和最小值minpi,如果maxpi=minpi,则将该参数从待分析集合S中剔除,跳转回步骤1.1进行下一个参数的判别。
[0029] 如上所述的第二步包括如下步骤:
[0030] 针对每个遥测参数parai,分别计算其偏移零值占比、偏移正值占比和数值元素计数这三个特征量。具体步骤如下:
[0031] 步骤2.1:偏移零值占比量计算。对于遥测参数parai,其原始数据序列为[[t1,v1],…,[tpi,vpi]],设置偏移序列paraSi=parai.shift(1),计算过程为偏移序列paraSi与原序列parai等长,其中每个数据项的时间不变,参数值依次往后偏移一项,且最后一项补到第一项,即paraSi=[[t1,vpi],[t2,v1],…,[tpi,vpi-1]]。偏移序列与原始序列对应时间项的参数值之差定义为paraSubi=parai-paraSi=[v1-vpi,v2-v1,…,vpi-vpi-1]。参数parai的偏移零值占比定义为zpi=zi/pi,其中zi为paraSubi中等于0的数据项个数,pi为参数parai中总的数据项个数。
[0032] 步骤2.2:偏移正值占比量计算。对于遥测参数parai,由上一步可知其偏移序列与原始序列对应时间项的参数值之差paraSubi=parai-paraSi=[v1-vpi,v2-v1,…,vpi-vpi-1]。参数parai的偏移正值占比定义为upi=ui/pi,其中ui为paraSubi中大于0的数据项个数,pi为参数parai中数据项总数。
[0033] 步骤2.3:遥测参数的数值元素统计。对于遥测参数parai,其所有数值元素组成的序列为pvi=[v1,v2,…,vpi],pi为参数parai中数据项个数。pvi中所有不同数值元素组成的序列dvi=[vd1,…,vdi],其中任意两个元素均不相等,且di≤pi。则遥测参数的数值元素个数cpi=di,即序列dvi中的元素个数。
[0034] 如上所述的第三步包括如下步骤:
[0035] 利用上一步计算,得出遥测参数parai的偏移零值占比量为zpi,偏移正值占比量为upi,数值元素计数为cpi,利用这三个特征量进行航天器遥测参数的数据类型判别,具体步骤如下:
[0036] 步骤3.1:离散型变量判断。设置偏移零值占比阈值ZPc,偏移正值占比阈值UPc和数值元素数量阈值CPc。一般设置ZPc=0.9,UPc=0.9,CPc=20,也可根据经验进行调整。对于遥测参数parai,如果其偏移零值占比量zpi>ZPc,并且数值元素计数为cpi
[0037] 步骤3.2:计数型变量判断。对于遥测参数parai,如果其偏移正值占比量为upi>UPc,则该遥测参数的参数类型判定为计数型变量。如果不满足条件,则继续进行后续判断。
[0038] 步骤3.3:连续型变量判断。如果遥测参数parai既不满足离散型变量的条件,也不满足计数型变量的条件,则该遥测参数的参数类型判定为连续型变量。
[0039] 如图1、图2所示,本发明的实施例包括以下步骤:
[0040] 1)遥测参数集合S中包含4个元素,即S={para1,para2,para3,para4}。分别计算S中各个参数的数据项数p和最大最小差值max-min,其中4个参数的数据项数p都是非零,但遥测参数para1的max-min值为零,说明该参数数据一直未发生变化,无有效信息,将该参数剔除,不参与后续的分析。
[0041] 2)对遥测参数集合S中剩余的3个参数,即S={para2,para3,para4}。分别计算S中各个参数的偏移零值占比量zp,偏移正值占比量up和数值元素数量cp这三个特征量的值。para2的计算结果分别为zp2=0.99,up2=0.53和cp2=3。para3的计算结果分别为zp3=0.0,up3=0.97和cp3=625。para3的计算结果分别为zp4=0.39,up4=0.01和cp4=186。
[0042] 3)在完成参数特征量计算后,进行遥测参数参数类型的判断。设置偏移零值占比阈值ZPc=0.9,偏移正值占比阈值UPc=0.9,数值元素数量阈值CPc=20。对于遥测参数para2,其偏移零值占比量zp2>ZPc并且cp2CPc,不满足离散型变量条件,但是偏移正值占比量up3>UPc,满足计数变量条件,则判定para3为计数型变量。对于遥测参数para4,zp4CPc,不满足离散型变量条件,同时up4
[0043] 综上所述,本发明提供的一种航天器遥测参数的数据类型自动判别方法,解决了现有大数量遥测参数集中参数数据类型的判别与设置依靠分析人员手动完成,难以满足数据分析挖掘的时效性和准确性要求的技术问题。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈