首页 / 专利库 / 电脑编程 / 算法 / 一种基于机器学习的地震震相初至识别方法及识别系统

一种基于机器学习地震震相初至识别方法及识别系统

阅读:513发布:2021-06-06

专利汇可以提供一种基于机器学习地震震相初至识别方法及识别系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 机器学习 的 地震 震相初至识别方法及识别系统,包括:步骤1:构造训练样本,基于训练样本进行模型训练,获得训练模型;步骤2:对地震数据进行降噪处理,获得处理数据;步骤3:基于训练模型,对处理数据进行震相初至识别。本发明的基于机器学习的地震震相初至识别方法及识别系统,通过构造训练样本,对训练样本进行模型训练,获得训练模型,基于训练模型,对进行降噪处理的地震数据进行震相初至识别,能准确、高效地处理大量地震数据,从而实现对地震震相初至时间的准确拾取。,下面是一种基于机器学习地震震相初至识别方法及识别系统专利的具体信息内容。

1.一种基于机器学习地震震相初至识别方法,其特征在于,包括:
步骤1:构造训练样本,基于所述训练样本进行模型训练,获得训练模型;
步骤2:对地震数据进行降噪处理,获得处理数据;
步骤3:基于所述训练模型,对所述处理数据进行震相初至识别。
2.根据权利要求1所述的地震震相初至识别方法,其特征在于,所述训练样本包括正训练样本和负训练样本,在候选信号中标记所有目标地震信号,将所述目标地震信号作为正训练样本,候选信号中的其他非目标地震信号作为负训练样本。
3.根据权利要求1所述的地震震相初至识别方法,其特征在于,根据特征数量,将所述训练样本采用随机压缩方法进行采样获得训练样本集。
4.根据权利要求1所述的地震震相初至识别方法,其特征在于,所述步骤2包括:
利用小波变换对所述地震数据进行分解,获得多个频段波形
根据小波分层阈值法对每个频段波形对应的系数进行处理;
根据处理后的系数重构所述地震数据,获得处理数据。
5.根据权利要求4所述的地震震相初至识别方法,其特征在于,采用Symlets小波基函数对所述地震数据进行分解。
6.根据权利要求5所述的地震震相初至识别方法,其特征在于,所述分解的分解层数为
3至5层。
7.根据权利要求3所述的地震震相初至识别方法,其特征在于,采用随机森林算法进行模型训练,采用随机森林算法进行模型训练包括以下步骤:
步骤701:对训练样本集进行重采样,构成多个随机训练集;
步骤702:根据所述多个随机训练集,创建相应的决策树
步骤703:抽取所述决策树的属性构成非叶子节点上的分裂属性集,完成所述非叶子节点的分裂,获取更新的决策树;
步骤704:使每棵所述更新的决策树最大限度地分裂生长,不做修剪,获取最后的决策树;
步骤705:基于所述最后的决策树,对所述地震数据进行分类;
步骤706:获取所述地震数据的所属类别;
步骤707:判断所述地震数据的所属类别是否正确,若所述地震数据的所属类别正确,则将所述最后的决策树作为所述训练模型;否则,返回步骤701,重新获取所述训练模型。
8.一种基于机器学习的地震震相初至识别系统,其特征在于,该系统包括:存储器,存储有计算机可执行指令;
处理器,所述处理器运行所述存储器中的计算机可执行指令,执行以下步骤:
步骤1:构造训练样本,基于所述训练样本进行模型训练,获得训练模型;
步骤2:对地震数据进行降噪处理,获得处理数据;
步骤3:基于所述训练模型,对所述处理数据进行震相初至识别。
9.根据权利要求8所述的地震震相初至识别系统,其特征在于,所述步骤2包括:
利用小波变换对所述地震数据进行分解,获得多个频段波形;
根据小波分层阈值法对每个频段波形对应的系数进行处理;
根据处理后的系数重构所述地震数据,获得处理数据。
10.根据权利要求8所述的地震震相初至识别系统,其特征在于,采用Symlets小波基函数对所述地震数据进行分解。

说明书全文

一种基于机器学习地震震相初至识别方法及识别系统

技术领域

[0001] 本发明属于地震信号处理领域,具体涉及一种基于机器学习的地震震相初至识别方法及识别系统。

背景技术

[0002] 山前带等复杂地区的油气勘探是目前重要的勘探目标之一,而进行这类油气勘探时所面临的共同问题是在相对高的噪音中如何识别低信噪比地震信号。低信噪比地震信号是指幅度很弱的信号或者被噪声淹没的信号,由于低信噪比地震信号在常规时空域中不易识别,需要一定的检测手段才能将它检测出来。
[0003] 把地震事件从海量震动监测数据中识别出来,并进行震相初至的准确拾取是地震数据处理的重要步骤。现场采集的地震数据具有非平稳性、多样性等特点,由于受到釆集现场机械震动、电磁噪声、岩石破裂、爆破振动等多种外界因素的影响,采集的数据信噪比较低。
[0004] 因此,需要一种高准确度的地震数据识别方法,准确地识别低信噪比地震信号,以保证油气勘探的正常进行。

发明内容

[0005] 本发明的目的是提出一种高准确度识别低信噪比地震信号的基于机器学习的地震震相初至识别方法及识别系统。
[0006] 为了实现上述目的,本发明提供一种基于机器学习的地震震相初至识别方法,包括:步骤1:构造训练样本,基于所述训练样本进行模型训练,获得训练模型;步骤2:对地震数据进行降噪处理,获得处理数据;步骤3:基于所述训练模型,对所述处理数据进行震相初至识别;其中,步骤1包括:针对所述训练样本,采用随机压缩方法进行采样,获得训练样本集;采用决策树算法或者随机森林算法,基于所述训练样本进行模型训练。
[0007] 优选的,所述训练样本包括正训练样本和负训练样本,在候选信号中标记所有目标地震信号,将所述目标地震信号作为正训练样本,候选信号中的其他非目标地震信号作为负训练样本。
[0008] 优选的,根据特征数量,将所述训练样本采用随机压缩方法进行采样获得训练样本集。
[0009] 优选的,所述步骤2包括:利用小波变换对所述地震数据进行分解,获得多个频段波形;根据小波分层阈值法对每个频段波形对应的系数进行处理;根据处理后的系数重构所述地震数据,获得处理数据。
[0010] 优选的,采用Symlets小波基函数对所述地震数据进行分解。
[0011] 优选的,所述分解的分解层数为3至5层。
[0012] 优选的,采用随机森林算法进行模型训练,采用所述随机森林算法进行模型训练包括以下步骤:步骤701:对训练样本集进行重采样,构成多个随机训练集;步骤702:根据所述多个随机训练集,创建相应的决策树;步骤703:抽取所述决策树的属性构成非叶子节点上的分裂属性集,完成所述非叶子节点的分裂,获取更新的决策树;步骤704:使每棵所述更新的决策树最大限度地分裂生长,不做修剪,获取最后的决策树;步骤705:基于所述最后的决策树,对所述地震数据进行分类;步骤706:获取所述地震数据的所属类别;步骤707:判断所述地震数据的所属类别是否正确,若判断所述地震数据的所属类别正确,则将所述最后的决策树作为所述训练模型;否则,返回步骤701,重新获取所述训练模型。
[0013] 优选的,采用决策树算法进行模型训练包括以下步骤:步骤801:建立决策树的根节点;步骤802:选择所述训练样本集,对所述训练样本集进行类别判断,若所述训练样本集全部属于是类别或全部属于不是类别,则将所述根节点作为叶子节点,并标记类别为是类别或不是类别,否则,继续到步骤803;步骤803:判断所述训练样本集的候选属性集合状态,则判断所述训练样本集的候选属性集合状态,若所述训练样本集的候选属性集合状态为空,则将所述根节点作为叶子节点,并标记为所述训练样本集包含的训练样本中类别最多的类别;步骤804:计算所述训练样本集的候选属性的信息增益,将所述信息增益最大的第一属性标记为新的根节点;步骤805:在所述新的根节点位置生成分支,将所述分支定义为所述训练样本集的样本子集合;步骤806:判断所述样本子集合是否为空,若所述样本子集合为空,则将所述样本子集合对应的叶子节点标记为训练样本集中类别最多的类别,若所述样本子集合不为空,则将所述第一属性从所述候选属性集合中删除,并返回步骤801,以便递归创建子树;步骤807:全部子树创建成功后,将最终决策树作为所述训练模型。
[0014] 为了实现上述目的,本发明还提供一种基于机器学习的地震震相初至识别系统,包括:该系统包括:存储器,存储有计算机可执行指令;处理器,所述处理器运行所述存储器中的计算机可执行指令,执行以下步骤:步骤1:构造训练样本,基于所述训练样本进行模型训练,获得训练模型;步骤2:对地震数据进行降噪处理,获得处理数据;步骤3:基于所述训练模型,对所述处理数据进行震相初至识别。
[0015] 优选的,所述步骤2包括:利用小波变换对所述地震数据进行分解,获得多个频段波形;根据小波分层阈值法对每个频段波形对应的系数进行处理;根据处理后的系数重构所述地震数据,获得处理数据。
[0016] 优选的,采用Symlets小波基函数对所述地震数据进行分解。
[0017] 本发明的有益效果在于:本发明的一种基于机器学习的地震震相初至识别方法及系统,通过构造训练样本,对训练样本进行模型训练,获得训练模型,基于训练模型,对进行降噪处理的地震数据进行震相初至识别,准确、高效地处理大量地震数据,从而实现对地震震相初至时间的准确拾取。附图说明
[0018] 通过结合附图对本发明示例性实施方式进行更详细的描述,本发明的上述以及其它目的、特征和优势将变得更加明显,其中,在本发明示例性实施方式中,相同的参考标号通常代表相同部件。
[0019] 图1示出了根据本发明的一个实施例的一种基于机器学习的地震震相初至识别方法的流程图

具体实施方式

[0020] 下面将更详细地描述本发明的优选实施方式。虽然以下描述了本发明的优选实施方式,然而应该理解,可以以各种形式实现本发明而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本发明更加透彻和完整,并且能够将本发明的范围完整地传达给本领域的技术人员。
[0021] 根据本发明的基于机器学习的地震震相初至识别方法,包括:步骤1:构造训练样本,基于训练样本进行模型训练,获得训练模型;步骤2:对地震数据进行降噪处理,获得处理数据;步骤3:基于训练模型,对处理数据进行震相初至识别;其中,步骤1包括:针对训练样本,采用随机压缩方法进行采样,获得训练样本集;采用决策树算法或者随机森林算法,基于训练样本进行模型训练。
[0022] 具体地,采用随机压缩方法对训练样本进行采样获得训练样本集,采用决策树算法或者随机森林算法训练样本进行模型训练,获取模型训练,基于训练模型,对进行降噪处理的地震数据进行震相初至识别。
[0023] 根据示例性的实施方式基于机器学习的地震震相初至识别方法,能准确、高效地处理大量地震数据,从而实现对地震震相初至时间的准确拾取。
[0024] 作为优选方案,训练样本包括正训练样本和负训练样本,在候选信号中标记所有目标地震信号,将目标地震信号作为正训练样本,候选信号中的其他非目标地震信号作为负训练样本。
[0025] 具体的,构造训练样本时采用人工的方式标记出所有目标地震信号,将目标地震信号作为正训练样本,而将其他非目标地震信号作为负训练样本。
[0026] 作为优选方案,根据特征数量,将训练样本采用随机压缩方法进行采样获得训练样本集。
[0027] 具体的,因为地震信号样本的特征数量不一致,需要对训练样本进行采样以实现使用同一个机器学习模型进行训练,将一个特征数量为n的样本压缩到m,假设m=n/2,那么只需要使得采样频率由原先的fHz降低为f/2Hz。如果n与m之间不是整数倍的关系,则加入一定的随机性来解决:n秒的样本压缩到m秒,意味着有n-m秒的数据需要被删去,那么每个采样点被删去的概率为p=(n-m)/n。通过对样本中每个采样点进行迭代,以p的概率将其从样本中删去。若一轮迭代后,没有完全删去n-m秒的数据,则重新计算概率p,再次进行下一轮迭代,直至完全删去n-m秒的数据,那么获取的采样数据即为训练样本集。
[0028] 作为优选方案,步骤2包括:利用小波变换对地震数据进行分解,获得多个频段波形;根据小波分层阈值法对每个频段波形对应的系数进行处理;根据处理后的系数重构所述地震数据,获得处理数据。
[0029] 具体的,首先利用小波变换对地震数据分解,经过小波分解后的原始信号被分解为多个频段的波形,每个频段的波形都有对应的系数,根据小波分层阈值法对各级小波系数进行处理,然后根据处理后的各级小波系数重构地震数据,获得处理数据,以此实现降噪处理。
[0030] 作为优选方案,采用Symlets小波基函数对地震数据进行分解。
[0031] 作为优选方案,分解的分解层数为3至5层。
[0032] 具体的,以分解层数的选择对降噪效果影响的试验来说明分解层数为3至5层为优:
[0033] 试验中采用降噪前后的信噪比(RSN)和降噪后信号占原信号能量百分比(ESN)两个指标来评价降噪效果,其中信噪比计算如下:
[0034]
[0035] 其中Sn为原始信号,Sn+1为降噪后信号,N为采样点数,降噪后信号的RSN越大,说明降噪效果越好。
[0036] 能量计算公式如下:
[0037]
[0038] x(t)为信号幅值,T为采样点数。因此能量百分比ESN为:
[0039]
[0040] 其中变量E代表降噪处理前信号的能量值,E0代表降噪处理后信号的能量值。
[0041] 表1不同分解层数的降噪效果对比
[0042]
[0043] 如表1所示,试验结果表明分解层数设置为3至5时,试验信号的降噪后RSN和ESN都较高,降噪效果较好;分解层数设置为5时,降噪效果最佳。
[0044] 作为优选方案,采用随机森林算法进行模型训练包括以下步骤:步骤701:对训练样本集进行重采样,构成多个随机训练集;步骤702:根据多个随机训练集,创建相应的决策树;步骤703:抽取决策树的属性构成非叶子节点上的分裂属性集,完成非叶子节点的分裂,获取更新的决策树;步骤704:使每棵更新的决策树最大限度地分裂生长,不做修剪,获取最后的决策树;步骤705:基于最后的决策树,对地震数据进行分类;步骤706:获取地震数据的所属类别;步骤707:判断地震数据的所属类别是否正确,若判断地震数据的所属类别正确,则将最后的决策树作为训练模型;否则,返回步骤701,重新获取训练模型。
[0045] 具体的,首先,假定样本属性个数为M,令m为大于零且小于M的整数;
[0046] (1)利用Bootstrap法对信号进行重采样,构成T个随机训练集S1,S2,...,ST;
[0047] (2)以T个训练集为基础,创建相应的决策树C1,C2,...,CT;随机地从M个属性中抽取m个属性构成每一个非叶子节点上的分裂属性集,按照其中最好的分裂方式完成该节点的分裂,获取更新的决策树(在整个森林的生长过程中,m值一般不变);
[0048] (3)在不执行任何剪枝操作的条件下让每棵更新的决策树完成最大限度地分裂完整生长,获取最后的决策树;
[0049] (4)基于最后的决策树,对地震数据待测样本X进行分类,用C1(X),C2(X),...,CT(X)表示;
[0050] (5)最后利用投票、加权平均等方法汇总经过决策树分类的结果,获得样本X的所属的类别。
[0051] (6)判断地震数据的所属类别是否正确,若判断多个地震数据的待测样本的所属类别正确,则将最后的决策树作为训练模型;否则,返回步骤(1),重新获取训练模型。
[0052] 作为优选方案,采用决策树算法进行模型训练包括以下步骤:步骤801:建立决策树的根节点;步骤802:选择训练样本集,对训练样本集进行类别判断,若训练样本集全部属于是类别或全部属于不是类别,则将根节点作为叶子节点,并标记类别为是类别或不是类别,否则,继续到步骤803;步骤803:判断训练样本集的候选属性集合状态,若训练样本集的候选属性集合状态为空,则将根节点作为叶子节点,并标记为训练样本集包含的训练样本中类别最多的类别;步骤804:计算训练样本集的候选属性的信息增益,将信息增益最大的第一属性标记为新的根节点;步骤805:在新的根节点位置生成分支,将分支定义为训练样本集的样本子集合;步骤806:判断样本子集合是否为空,若样本子集合为空,则将样本子集合对应的叶子节点标记为训练样本集中类别最多的类别,若样本子集合不为空,则将第一属性从所述候选属性集合中删除,并返回步骤801,以便递归创建子树;步骤807:全部子树创建成功后,将最终决策树作为训练模型。
[0053] 具体的,(1)建立决策树的根节点N;
[0054] (2)选择训练样本集并进行类别判断,若训练样本集全部属于是类别或全部属于不是类别,则将根节点N作为叶子节点,并标记类别为是类别或不是类别;
[0055] (3)否则,若训练样本集的类别包括是和不是两种类别,则判断候选属性集合状态,如果训练样本集的候选属性集合状态为空,则将根节点N当作是一个叶子节点,并标记为该节点所含样本中类别最多的类别,否则节点N不作为叶子节点,不做处理;
[0056] (4)计算训练样本集的候选属性集合中每一个候选属性的信息增益,将信息增益最大的第一属性(Attribute*)标记为根节点N;其中,信息增益的计算公式为:
[0057]
[0058] 其中,Gain(S,A)为信息增益,V(A)为属于A的值域,Sv为集合S在属于A上值等于v的子集,Entropy(S)为属性值的熵, 其中,S1为样本中类别为是的个数,S2为样本中类别为不是的个数,Pi为在子集合中第i个属性值的样本数所占的比例。
[0059] (5)利用信息增益最大属性值域中的每个取值Vi,在根节点N位置生成一个分支Si,并将Si定义为训练样本集合中满足第一属性Attribute*=Vi的样本子集合;
[0060] (6)判断样本子集合Si是否为空,如果样本子集合为空,则把对应的叶子节点标记为训练样本集合中类别最多的类别;否则,如果样本子集合为非空集合,则将第一属性Attribute*从候选属性集合中删除,返回(1),递归创建子树;
[0061] (7)全部子树创建成功后,将最终决策树作为训练模型。
[0062] 根据本发明的基于机器学习的地震震相初至识别系统,包括:存储器,存储有计算机可执行指令;处理器,处理器运行存储器中的计算机可执行指令,执行以下步骤:步骤1:构造训练样本,基于训练样本进行模型训练,获得训练模型;步骤2:对地震数据进行降噪处理,获得处理数据;步骤3:基于训练模型,对处理数据进行震相初至识别。
[0063] 作为优选方案,步骤2包括:利用小波变换对地震数据进行分解,获得多个频段波形;根据小波分层阈值法对每个频段波形对应的系数进行处理;根据处理后的系数重构所述地震数据,获得处理数据。
[0064] 作为优选方案,采用Symlets小波基函数对地震数据进行分解。
[0065] 实施例
[0066] 图1示出了根据本发明的一个实施例的一种基于机器学习的地震震相初至识别方法的流程图。
[0067] 如图1所示,基于机器学习的地震震相初至识别方法,包括:
[0068] 步骤1:构造训练样本,基于训练样本进行模型训练,获得训练模型;
[0069] 其中,步骤1包括:针对训练样本,采用随机压缩方法进行采样,获得训练样本集;采用决策树算法或者随机森林算法,基于训练样本进行模型训练;
[0070] 其中,训练样本包括正训练样本和负训练样本,在候选信号中标记所有目标地震信号,将目标地震信号作为正训练样本,候选信号中的其他非目标地震信号作为负训练样本。
[0071] 其中,根据特征数量,将训练样本采用随机压缩方法进行采样获得训练样本集;
[0072] 其中,采用随机森林算法进行模型训练包括以下步骤:步骤701:对训练样本集进行重采样,构成多个随机训练集;步骤702:根据多个随机训练集,创建相应的决策树;步骤703:抽取决策树的属性构成非叶子节点上的分裂属性集,完成非叶子节点的分裂,获取更新的决策树;步骤704:使每棵更新的决策树最大限度地分裂生长,不做修剪,获取最后的决策树;步骤705:基于最后的决策树,对地震数据进行分类;步骤706:获取地震数据的所属类别;步骤707:判断地震数据的所属类别是否正确,若判断地震数据的所属类别正确,则将最后的决策树作为训练模型;否则,返回步骤701,重新获取训练模型;
[0073] 其中,采用决策树算法进行模型训练包括以下步骤:步骤801:建立决策树的根节点;步骤802:选择训练样本集,对训练样本集进行类别判断,若训练样本集全部属于是类别或全部属于不是类别,则将根节点作为叶子节点,并标记类别为是类别或不是类别否则,继续到步骤803;步骤803:判断训练样本集的候选属性集合状态,若训练样本集的候选属性集合状态为空,则将根节点作为叶子节点,并标记为训练样本集包含的训练样本中类别最多的类别;步骤804:计算训练样本集的候选属性的信息增益,将信息增益最大的第一属性标记为新的根节点;步骤805:在新的根节点位置生成分支,将分支定义为训练样本集的样本子集合;步骤806:判断样本子集合是否为空,若样本子集合为空,则将样本子集合对应的叶子节点标记为训练样本集中类别最多的类别,若样本子集合不为空,则将第一属性从所述候选属性集合中删除,并返回步骤801,以便递归创建子树;步骤807:全部子树创建成功后,将最终决策树作为训练模型;
[0074] 步骤2:对地震数据进行降噪处理,获得处理数据;
[0075] 其中,步骤2包括:利用小波变换对地震数据进行分解,获得多个频段波形;根据小波分层阈值法对每个频段波形对应的系数进行处理;根据处理后的系数重构所述地震数据,获得处理数据;
[0076] 其中,采用Symlets小波基函数对地震数据进行分解;
[0077] 其中,分解的分解层数为3至5层;
[0078] 步骤3:基于训练模型,对处理数据进行震相初至识别。
[0079] 针对本发明的基于机器学习的地震震相初至识别方法的的稳定性试验:
[0080] 试验例采用随机森林算法训练模型,在拾取震相初至时间前对待测数据进行降噪处理,具体而言,利用小波变换对信号分解时选取Symlets小波基函数,分解层数设置为5层。对比例不进行降噪处理,其他试验条件不变。运行20次得到的统计结果如表2所示。
[0081] 表2识别结果对比
[0082]
[0083] 由表2可以看出,对比例计算耗时最少,而试验例的稳定可靠,拾取准确率更高。
[0084] 以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈