首页 / 专利库 / 天文学 / 天文望远镜 / 射电天文望远镜 / 一种快速射电暴实时搜寻方法

一种快速射电暴实时搜寻方法

阅读:610发布:2020-05-18

专利汇可以提供一种快速射电暴实时搜寻方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种快速射电暴实时搜寻方法,该方法由获取快速射电暴分类模型;实时读取快速射电暴观测数据流;获取快速射电暴的 频率 -时间谱图样本;对频率-时间谱图样本数据进行预处理;将频率-时间谱图样本数据输入到快速射电暴分类模型中识别,获得快速射电暴候选体;保存快速射电暴候选体观测数据;对快速射电暴候选体观测数据进行成图并保存步骤完成。本发明所述方法利用 深度学习 分类模型直接对天文观测数据中的快速射电暴瞬态 信号 进行搜寻识别,减少了数据转到图片,图片再转到数据带来的数据表征 精度 损失,提高了分类模型识别的精度和整个 数据处理 流程的速度,满足快速射电暴原始 电压 数据转储、干涉阵列望远镜 跟踪 观测和实时邮件通知需要的精度和速度上的需求,大大提高了工作效率。,下面是一种快速射电暴实时搜寻方法专利的具体信息内容。

1.一种快速射电暴实时搜寻方法,其特征在于,按下列步骤进行:
a、获取快速射电暴分类模型:将不含有单脉冲的观测数据,以固定时间长度分割,并对其进行零均值化和归一化处理,获得负样本数据集;重复仿真模拟快速射电暴脉冲,并分别与负样本叠加,获得正样本数据集;对所述正样本数据集和负样本数据集中的所有样本标注对应的标签类别,组成训练样本数据集;运用训练样本集对深度学习网络模型进行训练获得快速射电暴分类模型;
b、实时读取天文观测数字终端服务器共享内存中的快速射电暴观测数据流;
c、每次截取固定时间长度的观测数据流,组成快速射电暴的频率-时间谱图样本;
d、对所述频率-时间谱图样本数据进行零均值化和归一化预处理;
e、将所述预处理之后的频率-时间谱图样本数据输入到所述快速射电暴分类模型中进行识别分类,获得快速射电暴候选体;
f、保存所述快速射电暴候选体观测数据到服务器硬盘阵列中;
g、对所述快速射电暴候选体观测数据进行零均值化和归一化预处理,对预处理之后的候选体频率-时间谱图数据,进行消色散处理,获得消色散频率-时间谱图数据;对消色散频率-时间谱图数据,计算所有频率通道上的平均值,获得脉冲轮廓数据;对消色散频率-时间谱图数据进行转换,获取色散-时间谱图数据;对脉冲轮廓数据、频率-时间谱图数据、消色散频率-时间数据、色散-时间数据成图,并保存图片。

说明书全文

一种快速射电暴实时搜寻方法

技术领域

[0001] 本发明涉及一种快速射电暴实时搜寻方法,尤其是一种基于深度学习的快速射电暴实时搜寻方法,属于射电天文数据处理技术领域。

背景技术

[0002] 快速射电暴(Fast Radio Burst:FRB)是一种持续时间仅为数毫秒的爆发性、宽带、高度色散的脉冲式射电辐射天文现象,瞬时辐射流量可达数十央斯基(Jy)。2007年,Lorimer在分析澳大利亚Parkes天文台脉冲星巡天的历史数据时首次发现了这种天文现象。目前,在FRB目录网站显示已有80余例FRB事件被探测到,其中包含2个重复的快速射电暴FRB121102和FRB180814。不过这些发现还未能使天文学家完全确定这种神秘信号的"身份",对于其来源,科学家也只是进行各种推测。到目前,FRB的许多属性仍然未知。因此,需要基于大量的FRB观测数据进行研究,以回答与其起源和发射机理有关的问题。
[0003] 目前,国际上,越来越多的望远镜开始寻找FRB,更有多个新的宽视场干涉阵列射电望远镜投入到FRB的观测搜寻中。国内,也有多个天文台站望远镜陆续开展FRB搜寻观测,如,昆明40米望远镜,新疆天文台25米望远镜,上海65米望远镜等,FAST也已安装了L波段19多波束接收机,用于脉冲星和FRB的搜寻观测。预计未来几年,FRB探测率将迅速提高,甚至每年可探测数百至数千个FRB。
[0004] FRB的研究进程随着FRB探测率的快速增加将进入一个新的纪元,随之而带来的需要解决的大数据量FRB搜寻技术瓶颈也显现出来:FRB的一次性、瞬态特性,对FRB实时搜寻精度和速度具有很高的要求。同时,FRB搜寻观测具有保存原始电压数据的需求,因为电压数据保留了偶然电磁辐射的幅度和相位信息,可以用来做FRB事件的后续评估和验证,以及进行详细的离线分析,以揭露其精密的时间和频率结构。因此,高速率和高精度的FRB检测搜寻技术对于实现选择性实时电压数据转储至关重要。
[0005] 目前,这些罕见且似乎不重复(FRB121102,FRB180814例外)的单脉冲事件,由自动化、高性能的基于消色散理论的软件进行搜寻,如HEIMDALL,FDMT,Bonsai等。这些软件对于离线处理和较低的数据速率是能够满足处理速度需求的。但是,由于射频干扰(RFI)、系统增益变化或者其他的因素,这些算法面临着噪声和RFI伪装成假阳性候选体的挑战。最初,其筛查工作是由人工进行的。但是,随着FRB观测数据量的增加,特别是多波束、天线阵所产生的数据程指数级增长,这也将与假阳性候选体数量的增长相对应。因此,传统的人工筛查方式已难以为继。另外,在宽带观察中,脉冲的频率结构是高度可变的,当消色散数据在整个带宽上求和时,这也削弱了基于消色散算法搜寻FRB信号的有效性。
[0006] 近些年,由于计算机技术的发展,特别是GPU技术的发展,使得深度学习在所有数据科学领域的信号分类、模式识别等方面取得了卓越的成绩。深度学习已成功应用于射电天文领域。如脉冲星候选体的识别和分类。深度学习需要非常大的数据集训练网络来实现高性能,但是,到目前为止,已检测到的FRB数量仅有两位数,这些可能不是潜在FRB群体的代表性样本,不足以为深度学习建立有意义的训练集。虽然FRB单脉冲与来自河系脉冲星的单脉冲近似,但是直接采用脉冲星的单脉冲作为主要的训练集,会导致训练得到的模型可能过拟合脉冲星的特性。然而,由于FRB的脉冲信号在时频域呈现的是结构简单的二次曲线形状,因此,可以通过较少的参数来仿真模拟建立FRB脉冲样本。
[0007] 本发明利用深度学习建立一种快速射电暴实时搜寻方法,解决目前FRB搜寻工作中,面临的精度和速度上的瓶颈。
[0008] 发明专利《一种快速射电暴信号识别方法与系统》(申请号:201910706020.3)提出了一种基于卷积神经网络的快速射电暴信号识别方法与系统,该方法是针对基于消色散算法的快速射电暴搜寻软件输出的快速射电暴候选体图片进行识别。能够有效识别出快速射电暴信号,减少后期人工筛查的工作量。

发明内容

[0009] 本发明的目的在于,针对目前基于消色散算法的快速射电暴搜寻技术面临的速度和精度上的瓶颈,提供一种快速射电暴实时搜寻方法,该方法由获取快速射电暴分类模型;实时读取快速射电暴观测数据流;获取快速射电暴的频率-时间谱图样本数据;将频率-时间谱图样本数据输入到快速射电暴分类模型中识别,获得快速射电暴候选体;保存快速射电暴候选体观测数据到服务器硬盘阵列中;对快速射电暴候选体观测数据成图并保存步骤完成。本发明所述方法利用深度学习分类模型直接对天文观测数据流进行快速射电暴瞬态信号搜寻与识别,减少了数据转到图片,图片再转到数据带来的数据表征精度损失,提高了模型识别的精度和整个数据处理流程的速度,满足快速射电暴原始电压数据转储、干涉阵列望远镜跟踪观测和实时邮件通知需要的精度和速度上的需求,大大提高了工作效率。
[0010] 本发明所述的一种基于快速射电暴实时搜寻方法,按下列步骤进行:
[0011] a、获取快速射电暴分类模型:将不含有单脉冲的观测数据,以固定时间长度分割,并对其进行零均值化和归一化处理,获得负样本数据集;重复仿真模拟快速射电暴脉冲,并分别与负样本叠加,获得正样本数据集;对所述正样本数据集和负样本数据集中的所有样本标注对应的标签类别,组成训练样本数据集;运用训练样本集对深度学习网络模型进行训练获得快速射电暴分类模型;
[0012] b、实时读取天文观测数字终端服务器共享内存中的快速射电暴观测数据流;
[0013] c、每次截取固定时间长度的观测数据流,组成快速射电暴的频率-时间谱图样本;
[0014] d、对所述频率-时间谱图样本数据进行零均值化和归一化预处理;
[0015] e、将所述预处理之后的频率-时间谱图样本数据输入到所述快速射电暴分类模型中进行识别分类,获得快速射电暴候选体;
[0016] f、保存所述快速射电暴候选体观测数据到服务器硬盘阵列中;
[0017] g、对所述快速射电暴候选体观测数据进行零均值化和归一化预处理,对预处理之后的候选体频率-时间谱图数据,进行消色散处理,获得消色散频率-时间谱图数据;对消色散频率-时间谱图数据,计算所有频率通道上的平均值,获得脉冲轮廓数据;对消色散频率-时间谱图数据进行转换,获取色散-时间谱图数据;对脉冲轮廓数据、频率-时间谱图数据、消色散频率-时间数据、色散-时间数据成图,并保存图片。
[0018] 本发明所述的一种基于快速射电暴实时搜寻方法,该方法中:
[0019] 获取快速射电暴分类模型:将不含有单脉冲的观测数据,以固定时间长度分割,并对其进行零均值化和归一化处理,获得负样本数据集;用高斯分布与指数散射轮廓卷积,仿真模拟快速射电暴信号在每个频率通道的脉冲轮廓,设置色散值(色散值在10-2000cm-3pc范围内随机取值),以中心频率为参考,根据色散值计算出每个频率通道上脉冲到达时间的延迟量dtDM,设置快速射电暴脉冲到达的参考时间tref(参考时间在0-t范围内随机取值,t为样本的时间长度),由(dtDM+tref)/dt(dt为观测数据的时间分辨率)计算出每个频率通道上的脉冲轮廓的位置。将仿真的归一化的脉冲轮廓数据与负样本数据叠加,获得正样本。重复仿真快速射电暴,获取正样本数据集;对所述正样本数据集和负样本数据集中的所有样本数据标注对应的标签类别,组成训练样本集;运用训练样本集对深度学习网络模型进行训练获得快速射电暴分类模型。
[0020] 本发明与专利申请号:201910706020.3,一种快速射电暴信号识别方法与系统相比其优点为:
[0021] 本发明所述方法,采用深度学习分类模型直接对天文观测数据流进行实时搜寻,在处理速度上具有绝对优势,能够满足快速射电暴原始电压数据转储、干涉阵列望远镜跟踪观测的需求,同时,还避免了宽带观测中,由于快速射电暴信号波动,导致消色散算法有效性降低的问题。该方法直接对观测数据流进行快速射电暴瞬态信号实时搜寻,能够准确、快速的识别快速射电暴候选体,满足快速射电暴原始电压数据转储、干涉这列望远镜跟踪观测和实时邮件通知需要的精度和速度上的需求,大大提高工作效率。
[0022] 综合来说,本发明基于天体物理理论,综合分析已检测并得到认证的快速射电暴脉冲特性,如色散、宽度、幅度等,采用模拟快速射电暴脉冲的方法建立大量快速射电暴样本,解决了因快速射电暴真实样本太少,不足以为深度学习模型建立有意义的训练集的难题。本发明在自动化程度上优于传统方法,解决了基于消色散算法的快速射电暴搜寻技术存在的识别精度不高、速度慢等问题,实现了快速射电暴高精度、高效率的实时搜寻,进一步为实现快速射电暴原始电压数据选择性转储、干涉阵列望远镜跟踪观测及实时邮件通知等提供精度和速度上的保证。附图说明
[0023] 图1为本发明的一种快速射电暴实时搜寻方法步骤图;
[0024] 图2为本发明的训练样本集生成过程示意图;
[0025] 图3为本发明实施例的仿真的不同色散值的快速射电暴样本;
[0026] 图4为本发明实施例的快速射电暴候选体生成过程;
[0027] 图5为本发明实施例识别出来的单脉冲信号样本。

具体实施方式

[0028] 下面将结合本发明的附图和具体实施例,进一步阐述本发明。这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,基于本发明中的实施例,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所限定的范围。
[0029] 实施例
[0030] a、获取快速射电暴分类模型,过程包括:
[0031] 将不含有单脉冲的观测数据,以64ms时间长度分割,并对其进行零均值化和归一化处理,获得负样本数据集,本实施例所用观测数据的时间分辨率dt=64us,频率分辨率df=781.25kHz。根据目前已经检测到的快速射电暴信号,其脉冲宽度从亚毫秒到数毫秒之间,每取1000次的采样数据(即64ms数据长度)组成频率-时间谱图样本,即能大致捕获快速射电暴脉冲的色散持续时间轮廓;
[0032] 星际介质是宇宙中重要的物质组成部分,当遥远的天体辐射信号穿越星际介质时,会发生变化,主要包括色散和散射效应。色散效应导致宽带信号在达到地球时,不同频率的信号产生时间延迟,表现为高频信号比低频信号先到达,因此,信号在时频域呈现的就是简单的二次曲线形状;散射效应使得脉冲轮廓的宽度展宽,并产生拖尾效果,表现为频率越低,信号宽度越宽。本发明用高斯分布与指数散射轮廓卷积,仿真模拟快速射电暴信号在每个频率通道的脉冲轮廓,选取色散值(色散值在10-2000cm-3pc范围内随机取值),以中心频率为参考,根据色散值计算出每个频率通道上脉冲到达时间的延迟量dtDM,设置快速射电暴脉冲到达的参考时间tref(参考时间在0-64ms范围内随机取值),由(dtDM+tref)/dt(dt为观测数据的时间分辨率)计算出每个频率通道上的脉冲轮廓的位置。将仿真的归一化的脉冲轮廓数据与负样本数据叠加,获得快速射电暴频率-时间谱图样本。重复该步骤,持续仿真快速射电暴,获得正样本数据集。每次仿真通过随机设置快速射电暴脉冲到达的参考时间,变换快速射电暴色散轮廓在频率-时间谱图中的分布位置。图3所示为仿真的不同色散值、不同参考时间的快速射电暴样本;
[0033] 对所述正样本和负样本标注对应的标签类别,组成训练样本集;
[0034] 运用训练样本集对深度学习网络模型进行训练获得快速射电暴分类模型。本实施例采用的深度学习网络模型为ResNet18(残差神经网络)模型,其结构图4虚线框内所示。采用随机梯度下降法,运用训练样本集对深度学习网络模型进行训练,通过前向传播算法和反向传播算法两个步骤反复训练,不断调整网络模型参数,直到网络模型输出的损失函数值小于预定值,保存训练好的网络作为快速射电暴的分类模型;
[0035] b、实时读取天文观测数字终端服务器共享内存中的快速射电暴观测数据流;
[0036] c、每64ms的观测数据流,组成待识别的快速射电暴的频率-时间谱图样本;
[0037] d、对所述频率-时间谱图样本数据进行零均值化和归一化预处理;
[0038] e、将所述预处理之后的频率-时间谱图样本数据输入到所述快速射电暴分类模型中进行识别和分类,图4所示,将频率-时间谱图样本数据输入到基于图形处理器(GPU)的快速射电暴分类模型中,模型通过卷积层逐层提取特征,最后由全连接层输出两个概率值,分别代表其是快速射电暴和非快速射电暴的概率,从而获得快速射电暴候选体。该过程由于只用到神经网络前向传播,其只是一系列卷积和矩阵算法,该算法比消色散算法更适合GPU运算,因此在处理速度上具有绝对优势,能够实现实时处理观测数据流;
[0039] f、保存所述快速射电暴候选体观测数据到服务器硬盘阵列中;
[0040] g、对所述快速射电暴候选体观测数据进行零均值化和归一化预处理,对预处理之后的候选体频率-时间谱图数据,进行消色散处理,获得消色散频率-时间谱图数据;对消色散频率-时间谱图数据,计算所有频率通道上的平均值,获得脉冲轮廓数据;对消色散频率-时间谱图数据进行转换,获取色散-时间谱图数据;对脉冲轮廓数据、频率-时间谱图数据、消色散频率-时间数据、色散-时间数据成图,并保存图片。
[0041] 目前全世界已观测到的快速射电暴数量非常少,其低频率的爆发特性,使其难以捕获。由于快速射电暴的脉冲形态与脉冲星的单脉冲近似,因此,我们使用脉冲星的单脉冲来验证本发明方法。本发明选用脉冲星J0332+5434的观测数据样本输入快速射电暴分类模型,输出结果显示,该快速射电暴分类模型可以将该脉冲星的单脉冲全部搜寻出来;该脉冲星的单脉冲轮廓图、频率-时间谱图、消色散频率-时间谱图及色散-时间谱图如图5所示,从上到下依次为脉冲轮廓图、频率-时间谱图、消色散频率-时间谱图及色散-时间谱图。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈