基于AdaBoost算法的地震相干体图像断层自动识别方法及
系统
技术领域
背景技术
[0002] 地震相干解译是实现地质断层
位置及属性分析的最主要技术。然而,由于地震数据野外采集过程中不可避免的会存在由于设备、环境及人为等外在因素,以及这些外在因素对不同地质结构的作用所产生的复杂干扰及噪声等影响,而这些影响造成的数据降质往往是非线性的。为此,地震断层图像中
地层背景及断层目标数据往往为不规则分布的复杂数据。面对这种复杂数据,传统的基于图像
边缘检测/轮廓提取、
图像分割/目标提取等方法很难实现断层的准确识别及
定位,往往需要较多的人工编辑工作。另外,地震相干体图像中断层与背景类数据比例
不平衡,背景数据稀疏性像对较好,而断层相对较复杂,为自动断层识别带来了一定的困难。
[0003] 考虑到
机器学习等
人工智能方法已经在
信号与信息处理相关的各个学科及领域中都得到了较好的应用。特别是,
集成学习方法对
训练数据的先验分布没有进行任何假设,对数据分布情况具有很强的鲁棒性。该类方法通过直接工作于输入数据的概率空间,能够有效解决类别不平衡、属性不均匀的分类任务。显然,有必要从分类的
角度开展集成学习方法在地震相干体断层识别中的应用技术。
[0004] 因此,
现有技术中的
缺陷是,现有的地震相干体图像中地震断层方法,由于断层分布不规则、断层形状复杂多变、断层与背景数据比例不平衡等造成断层的自动识别与提取的结果不准确。
发明内容
[0005] 针对上述技术问题,本发明提供一种基于AdaBoost算法的地震相干体图像断层自动识别方法及系统,采用了集成学习的方法训练分类网络,运用分类网络对图像
块进行分类,可使断层的自动识别与提取的结果更准确。
[0006] 为解决上述技术问题,本发明提供的技术方案是:
[0007] 第一方面,本发明提供一种基于AdaBoost算法的地震相干体图像断层自动识别方法,包括:
[0008] 步骤S1,获取地震相干体断层图像中的图像块,所述图像块包括断层体图像块、断层
边缘图像块和断层背景图像块;
[0009] 步骤S2,通过预先训练的分类网络,对图像块进行分类,得到分类结果,所述分类网络由多个分类器构成,所述分类网络通过AdaBoost算法学习获得;
[0010] 步骤S3,根据所述分类结果,实现对所述地震相干体断层图像的自动识别。
[0011] 本发明的基于AdaBoost算法的地震相干体图像断层自动识别方法,其技术方案是:获取地震相干体断层图像中的图像块,所述图像块包括断层体图像块、断层边缘图像块和断层背景图像块;通过预先训练的分类网络,对图像块进行分类,得到分类结果,所述分类网络由多个分类器构成,所述分类网络通过AdaBoost算法学习获得;根据所述分类结果,实现对所述地震相干体断层图像的自动识别。
[0012] 本发明的基于AdaBoost算法的地震相干体图像断层自动识别方法,采用了集成学习的方法训练分类网络,运用分类网络对图像块进行分类,可使断层的自动识别与提取的结果更准确。
[0013] 进一步地,所述分类网络的训练过程为:
[0014] 选取N个离线训练样本形成第一训练样本,对所述第一训练样本的学习得到第一个弱分类器,所述离线训练样本为地震相干体断层图像中的图像块;
[0015] 将所述第一个弱分类器中分错的样本和其他离线训练样本构成第二个训练样本,通过对所述第二个训练样本的学习得到第二个弱分类器,所述第二个训练样本由N个离线训练样本构成;
[0016] 将所述第一个弱分类器和第二个弱分类器中都分错的样本和其他离线训练样本构成第三个训练样本,通过对所述第三个训练样本的学习得到第三个弱分类器,形成三个二类分类器构成的分类网络,所述第三个训练样本由N个离线训练样本构成。
[0017] 进一步地,所述步骤S2,具体为:
[0018] 通过所述分类网络中的分类器对图像块进行分类,得到经每个分类器处理后的图像块;
[0019] 计算所述图像块与所述经每个分类器处理后的图像块之间的相似度,得到多个相似度;
[0020] 根据所述多个相似度,计算每个分类器的投票结果;
[0021] 根据所述投票结果,得到分类结果,所述分类结果为多次累积投票结果最大的类。
[0022] 进一步地,所述图像块的尺寸为3*3、5*5、7*7和9*9中的至少一种。
[0023] 进一步地,所述图像块中的断层体图像块、断层边缘图像块和断层背景图像块的选取比例为3:2:1。
[0024] 第二方面,本发明提供了一种基于AdaBoost算法的地震相干体图像断层自动识别系统,包括:
[0025] 图像块获取模块,用于获取地震相干体断层图像中的图像块,所述图像块包括断层体图像块、断层边缘图像块和断层背景图像块;
[0026] 图像块分类模块,用于通过预先训练的分类网络,对图像块进行分类,得到分类结果,所述分类网络由多个分类器构成,所述分类网络通过AdaBoost算法学习获得;
[0027] 断层图像自动识别模块,用于根据所述分类结果,实现对所述地震相干体断层图像的自动识别。
[0028] 本发明提供的基于AdaBoost算法的地震相干体图像断层自动识别系统,其技术方案为:先通过图像块获取模块,用于获取地震相干体断层图像中的图像块,所述图像块包括断层体图像块、断层边缘图像块和断层背景图像块;
[0029] 接着通过图像块分类模块,用于通过预先训练的分类网络,对图像块进行分类,得到分类结果,所述分类网络由多个分类器构成,所述分类网络通过AdaBoost算法学习获得;最后通过断层图像自动识别模块,用于根据所述分类结果,实现对所述地震相干体断层图像的自动识别。
[0030] 本发明的基于AdaBoost算法的地震相干体图像断层自动识别系统,采用了集成学习的方法训练分类网络,运用分类网络对图像块进行分类,可使断层的自动识别与提取的结果更准确。
[0031] 进一步地,所述图像块分类模块,具体用于训练分类网络,具体为:
[0032] 选取N个离线训练样本形成第一训练样本,对所述第一训练样本的学习得到第一个弱分类器,所述离线训练样本为地震相干体断层图像中的图像块;
[0033] 将所述第一个弱分类器中分错的样本和其他离线训练样本构成第二个训练样本,通过对所述第二个训练样本的学习得到第二个弱分类器,所述第二个训练样本由N个离线训练样本构成;
[0034] 将所述第一个弱分类器和第二个弱分类器中都分错的样本和其他离线训练样本构成第三个训练样本,通过对所述第三个训练样本的学习得到第三个弱分类器,形成三个二类分类器构成的分类网络,所述第三个训练样本由N个离线训练样本构成。
[0035] 进一步地,所述图像块分类模块,具体用于:
[0036] 通过所述分类网络中的分类器对图像块进行分类,得到经每个分类器处理后的图像块;
[0037] 计算所述图像块与所述经每个分类器处理后的图像块之间的相似度,得到多个相似度;
[0038] 根据所述多个相似度,计算每个分类器的投票结果;
[0039] 根据所述投票结果,得到分类结果,所述分类结果为多次累积投票结果最大的类。
[0040] 进一步地,所述图像块的尺寸为3*3、5*5、7*7和9*9中的至少一种。
[0041] 进一步地,所述图像块中的断层体图像块、断层边缘图像块和断层背景图像块的选取比例为3:2:1。
附图说明
[0042] 为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。
[0043] 图1示出了本发明
实施例所提供的一种基于AdaBoost算法的地震相干体图像断层自动识别方法的
流程图;
[0044] 图2示出了本发明实施例所提供的一种基于AdaBoost算法的地震相干体图像断层自动识别方法的多类分类网络示意图;
[0045] 图3示出了本发明实施例所提供的一种基于AdaBoost算法的地震相干体图像断层自动识别系统的示意图。
具体实施方式
[0046] 下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。
[0047] 实施例一
[0048] 图1示出了本发明实施例所提供的一种基于AdaBoost算法的地震相干体图像断层自动识别方法的流程图;如图1所示,实施例一提供的一种基于AdaBoost算法的地震相干体图像断层自动识别方法,包括:
[0049] 步骤S1,获取地震相干体断层图像中的图像块,图像块包括断层体图像块、断层边缘图像块和断层背景图像块;
[0050] 步骤S2,通过预先训练的分类网络,对图像块进行分类,得到分类结果,分类网络由多个分类器构成,分类网络通过AdaBoost算法学习获得;
[0051] 步骤S3,根据分类结果,实现对地震相干体断层图像的自动识别。
[0052] 本发明的基于AdaBoost算法的地震相干体图像断层自动识别方法,其技术方案是:获取地震相干体断层图像中的图像块,图像块包括断层体图像块、断层边缘图像块和断层背景图像块;通过预先训练的分类网络,对图像块进行分类,得到分类结果,分类网络由多个分类器构成,分类网络通过AdaBoost算法学习获得;根据分类结果,实现对地震相干体断层图像的自动识别。
[0053] 本发明的基于AdaBoost算法的地震相干体图像断层自动识别方法,采用了集成学习的方法训练分类网络,Adaboost是一种
迭代算法,其核心思想是针对同一个地震相干体图像形成的训练集,训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个分类网络,分类网络的分类能
力更强。
[0054] 通过分类网络,改变断层分布不规则、断层形状复杂多变、断层与背景数据的分布,根据每次训练集中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将
修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用Adaboost分类器可以排除一些不必要的训练数据特征,并放在关键的训练数据上面。通过不断的训练,可以提高对数据的分类能力。本发明运用经Adaboost训练得到的分类网络对图像块进行分类,可使断层的自动识别与提取的结果更准确。
[0055] 参见图2,分类网络的训练过程为:
[0056] 选取N个离线训练样本形成第一训练样本,对第一训练样本的学习得到第一个弱分类器,离线训练样本为地震相干体断层图像中的图像块;
[0057] 将第一个弱分类器中分错的样本和其他离线训练样本构成第二个训练样本,通过对第二个训练样本的学习得到第二个弱分类器,第二个训练样本由N个离线训练样本构成;
[0058] 将第一个弱分类器和第二个弱分类器中都分错的样本和其他离线训练样本构成第三个训练样本,通过对第三个训练样本的学习得到第三个弱分类器,形成三个二类分类器构成的分类网络,第三个训练样本由N个离线训练样本构成。
[0059] 通过不断的训练,得到如图2所示的三个二类分类器,构成分类网络,对断层图像块进行分类,得到更准确的分类结果,进而使断层的自动识别与提取的结果更准确。
[0060] 具体地,步骤S2具体为:
[0061] 通过分类网络中的分类器对图像块进行分类,得到经每个分类器处理后的图像块;
[0062] 计算图像块与经每个分类器处理后的图像块之间的相似度,得到多个相似度;
[0063] 其中,计算图像块与经每个分类器处理后的图像块之间的相似度的具体过程为:
[0064] 在概率论和统计理论中,Hellinger距离被用来度量两个概率分布的相似度,因此计算图像块到各类样本平均图像块灰度高斯分布拟合的Hellinger距离来表示图像块与经每个分类器处理后的图像块之间的相似度,其Hellinger距离的计算公式为:
[0065]
[0066] 其中 为当前图像块灰度高斯分布拟合参数; 为第i类样本平均图像块灰度高斯分布拟合参数。
[0067] 根据多个相似度,计算每个分类器的投票结果;
[0068] 通过以下公式计算得到投票结果:
[0069]
[0070] 其中vk={vk(i)}为第k个二类分类器的投票值;
[0071] 根据投票结果,得到分类结果,分类结果为多次累积投票结果最大的类。
[0072] 具体地,图像块的尺寸为3*3、5*5、7*7和9*9中的至少一种。
[0073] 根据相关研究发现地震相干体图像中断层边缘
像素的最小描述尺度为3*3,而图像边缘的完整表示往往需要9*9的图像块尺度,为此,本发明中分别选取了3*3、5*5、7*7和9*9几个尺度来选取样本图像块。
[0074] 优选地,经实验进一步对比结果可知,如果图像块过小,如3*3,则分类结果中会出现连续断层被分裂开的现象,而如果图像块过大,如9*9,则实验结果中会出现断层边缘及断层体均有膨胀的效果。只有在图像块大小选择适中,如5*5或7*7的情况下,最终的分类结果才能准确识别断层体和断层边缘。因此本发明中优选的图像块的尺寸为5*5或7*7。
[0075] 优选地,图像块中的断层体图像块、断层边缘图像块和断层背景图像块的选取比例为3:2:1。
[0076] 考虑样本数据的代表性和对应类别的稀疏度问题,即背景数据稀疏性像对较好,而断层相对较复杂的情况,本发明图像块中的断层体图像块、断层边缘图像块和断层背景图像块的选取比例为3:2:1。这样可解决断层体图像块、断层边缘图像块和断层背景图像块数量不平衡,导致断层的自动识别与提取的结果不准确的问题。
[0077] 图3示出了本发明实施例所提供的一种基于AdaBoost算法的地震相干体图像断层自动识别系统的示意图。如图3所示,本发明提供了一种基于AdaBoost算法的地震相干体图像断层自动识别系统10,包括:
[0078] 图像块获取模块101,用于获取地震相干体断层图像中的图像块,图像块包括断层体图像块、断层边缘图像块和断层背景图像块;
[0079] 图像块分类模块102,用于通过预先训练的分类网络,对图像块进行分类,得到分类结果,分类网络由多个分类器构成,分类网络通过AdaBoost算法学习获得;
[0080] 断层图像自动识别模块103,用于根据分类结果,实现对地震相干体断层图像的自动识别。
[0081] 本发明提供的基于AdaBoost算法的地震相干体图像断层自动识别系统10,其技术方案为:先通过图像块获取模块,用于获取地震相干体断层图像中的图像块,图像块包括断层体图像块、断层边缘图像块和断层背景图像块;
[0082] 接着通过图像块分类模块,用于通过预先训练的分类网络,对图像块进行分类,得到分类结果,分类网络由多个分类器构成,分类网络通过AdaBoost算法学习获得;最后通过断层图像自动识别模块,用于根据分类结果,实现对地震相干体断层图像的自动识别。
[0083] 本发明的基于AdaBoost算法的地震相干体图像断层自动识别系统,采用了集成学习的方法训练分类网络,Adaboost是一种迭代算法,其核心思想是针对同一个地震相干体图像形成的训练集,训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个分类网络,分类网络的分类能力更强。
[0084] 通过分类网络,改变断层分布不规则、断层形状复杂多变、断层与背景数据的分布,根据每次训练集中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。使用Adaboost分类器可以排除一些不必要的训练数据特征,并放在关键的训练数据上面。通过不断的训练,可以提高对数据的分类能力。本发明运用经Adaboost训练得到的分类网络对图像块进行分类,可使断层的自动识别与提取的结果更准确。
[0085] 参见图2,图像块分类模块102,具体用于训练分类网络,具体为:
[0086] 选取N个离线训练样本形成第一训练样本,对第一训练样本的学习得到第一个弱分类器,离线训练样本为地震相干体断层图像中的图像块;
[0087] 将第一个弱分类器中分错的样本和其他离线训练样本构成第二个训练样本,通过对第二个训练样本的学习得到第二个弱分类器,第二个训练样本由N个离线训练样本构成;
[0088] 将第一个弱分类器和第二个弱分类器中都分错的样本和其他离线训练样本构成第三个训练样本,通过对第三个训练样本的学习得到第三个弱分类器,形成三个二类分类器构成的分类网络,第三个训练样本由N个离线训练样本构成。
[0089] 通过不断的训练,得到如图2所示的三个二类分类器,构成分类网络,对断层图像块进行分类,得到更准确的分类结果,进而使断层的自动识别与提取的结果更准确。
[0090] 具体地,图像块分类模块102,具体用于:
[0091] 通过分类网络中的分类器对图像块进行分类,得到经每个分类器处理后的图像块;
[0092] 计算图像块与经每个分类器处理后的图像块之间的相似度,得到多个相似度;
[0093] 其中,计算图像块与经每个分类器处理后的图像块之间的相似度的具体过程为:
[0094] 在概率论和统计理论中,Hellinger距离被用来度量两个概率分布的相似度,因此计算图像块到各类样本平均图像块灰度高斯分布拟合的Hellinger距离来表示图像块与经每个分类器处理后的图像块之间的相似度,其Hellinger距离的计算公式为:
[0095]
[0096] 其中 为当前图像块灰度高斯分布拟合参数; 为第i类样本平均图像块灰度高斯分布拟合参数。
[0097] 根据多个相似度,计算每个分类器的投票结果;
[0098] 通过以下公式计算得到投票结果:
[0099]
[0100] 其中vk={vk(i)}为第k个二类分类器的投票值;
[0101] 根据投票结果,得到分类结果,分类结果为多次累积投票结果最大的类。
[0102] 具体地,图像块的尺寸为3*3、5*5、7*7和9*9中的至少一种。
[0103] 根据相关研究发现地震相干体图像中断层边缘像素的最小描述尺度为3*3,而图像边缘的完整表示往往需要9*9的图像块尺度,为此,本发明中分别选取了3*3、5*5、7*7和9*9几个尺度来选取样本图像块。
[0104] 优选地,经实验进一步对比结果可知,如果图像块过小,如3*3,则分类结果中会出现连续断层被分裂开的现象,而如果图像块过大,如9*9,则实验结果中会出现断层边缘及断层体均有膨胀的效果。只有在图像块大小选择适中,如5*5或7*7的情况下,最终的分类结果才能准确识别断层体和断层边缘。因此本发明中优选的图像块的尺寸为5*5或7*7。
[0105] 优选地,图像块中的断层体图像块、断层边缘图像块和断层背景图像块的选取比例为3:2:1。
[0106] 考虑样本数据的代表性和对应类别的稀疏度问题,即背景数据稀疏性像对较好,而断层相对较复杂的情况,本发明图像块中的断层体图像块、断层边缘图像块和断层背景图像块的选取比例为3:2:1。这样可解决断层体图像块、断层边缘图像块和断层背景图像块数量不平衡,导致断层的自动识别与提取的结果不准确的问题。
[0107] 最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的
权利要求和
说明书的范围当中。