首页 / 专利库 / 地球科学 / 地质学 / 一种基于钻孔数据进行机器学习的地层序列模拟方法

一种基于钻孔数据进行机器学习地层序列模拟方法

阅读:765发布:2020-08-26

专利汇可以提供一种基于钻孔数据进行机器学习地层序列模拟方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于钻孔数据进行 机器学习 的 地层 序列模拟方法,该方法包括:数据归一化、地层序列填充、地层编码、建立地层类型序列模型、建立地层层厚序列模型、地层序列模型;该方法利用python语言,在Pytorch 深度学习 框架 下进行,特别涉及三维地质建模过程中地层层序的建立,适用于在地层 三维建模 过程中进行地层序列模型的开发与验证。能够较为准确地判断相应 位置 的地层信息,同时该方法不依赖于数据假设与专家经验等主观因素,通过与实际钻孔数据结果对比表明,上述模型具有较好的可行性,可应用于地质信息化研究与工程规划、设计建造等方面。,下面是一种基于钻孔数据进行机器学习地层序列模拟方法专利的具体信息内容。

1.一种基于钻孔数据进行机器学习地层序列模拟方法,属于机器学习与地质学的交叉领域,其特征是:将钻孔地层数据处理为地层类型序列与地层层厚序列,利用循环神经网络建立地层类型序列模型,采用序列-序列架构建立地层层厚序列模型,组成完整地层序列模型。
2.基于权利要求1所述的地层序列,其特征在于引入终止标记(End of Sequence,EOS)作为虚拟地层充当填充元素,将不等长地层序列填充为等长,同时作为表示地层序列结束标记。
3.基于权利要求1所述地层层厚序列采取seq2seq(sequence to sequence,序列-序列)架构,其特征在于利用两个串联RNN分别作为编码器解码器建立地层层厚模型,编码器负责处理地层类型信息,以其最后时刻隐藏层状态作为解码器初始状态,进而预测每一地层类型对应层厚。

说明书全文

一种基于钻孔数据进行机器学习地层序列模拟方法

技术领域:

[0001] 本发明属于机器学习与地质学交叉领域,该方法利用python语言,在 Pytorch深度学习框架下进行。特别涉及三维地质建模过程中地层层序的建立。适用于在地层三维建模过程中进行地层序列模型的开发与验证。背景技术:
[0002] 地层结构是漫长的地质作用的结果,在时空分布上表现为不均匀、不规则性等,但在宏观上具有统计上的规律性。弄清地层结构及其规律是地质信息化基础,同时不良地层分布也是工程建设的重点关注对象。
[0003] 在地层序列模拟的过程中,存在两大难点,一是地层三维模型建立过程中,建模方法与插值方法选择受主观因素影响大,具有局限性且缺乏科学合理性。目前钻孔连接插值方法有多重选择,如线性插值、多项式插值、反距离插值以及克里金插值等,不同方法模拟效果存在差异。二是地层结构与分布规律研究,钻孔数据是基础,它可以提供准确地层结构信息,但成本高,耗时长,同时具有离散性。目前可采用方法是采取虚拟钻孔,利用地质学家经验补充,但一则是有经验的地质学家数量有限,其次在地层三维建模过程中数据量大,效率有限,该方法受主观因素影响仍然较大。
[0004] 本发明提供一种基于钻孔数据进行机器学习的地层序列模拟方法,它将钻孔数据处理为地层序列数据,建立地层类型序列与地层层厚序列模型,实现基于输入钻孔坐标,能较准确判断相应位置地层信息。发明内容:
[0005] 针对现有技术不足,发明了一种基于钻孔数据进行机器学习的地层序列模拟方法,规避假设与专家经验等主观因素,实现基于输入钻孔坐标,能较为准确判断相应位置地层信息,通过与实际钻孔数据结果对比,上述模型具有较好可行性,可应用于地质信息化研究与工程规划、设计建造等方面。
[0006] 一种基于循环神经网络原理的地层序列机器学习模拟方法,包括以下步骤:
[0007] (1)数据归一化,钻孔数据中,坐标与地层层厚间数量级相差较大。为保证收敛,数据需进行归一化处理——将取值范围压缩为0~1;
[0008] (2)地层序列填充,引入终止标记(End of Sequence,EOS)作为虚拟地层充当填充元素,将不等长地层序列填充为等长地层序列,同时表示地层序列结束。此外,为地层序列添加起始标记(Start of Sequence,SOS),作为RNN预测开始信号
[0009] (3)地层编码,将每一种地层用唯一数字标识表示,并利用独热编码实现地层向量化表示;
[0010] (4)建立地层类型序列模型,建立坐标信息与RNN输出过程关联方法,利用坐标信息对RNN进行初始状态赋值,以此使坐标指导地层序列模拟;
[0011] (5)模型验证,利用地层准确率以及编辑距离序列相似度为评价标准;
[0012] (6)建立地层层厚序列模型,利用坐标信息作为RNN隐藏层初始状态,建立坐标与地层类型连接。
[0013] (7)建立地层序列模型,将地层类型序列模型与地层厚度序列模型相连接,以地层类型序列模型模拟结果作为地层厚度序列模型编码器输入,构建完整地层序列模型。
[0014] 本发明具有以下优点:
[0015] (1)一种基于钻孔数据进行机器学习的地层序列模拟方法,区别于传统插值方法,如线性插值、多项式插值、反距离插值与克里金插值等。模型建模与插值方法选取受主观因素影响,具有局限性且缺乏科学合理性。该方法可规避主观因素,利用智能方法模拟地层分布。该方法不依赖数据假设与专家经验等主观因素,通过与实际钻孔数据结果对比,该方法具有较好可行性。
[0016] (2)与统计学方法相比,机器学习手段不对数据作假设,而是检验输出与数据标签接近程度,通过BP(Back Propagation,误差反向传导)算法不断调整参数以获得更高准确率。
[0017] (3)该方法采用导师驱动学习的回合,有正确监督信号指导,可更好拟合训练数据,有助加快循环神经网络模型收敛速度,对地层序列有较高预测能
[0018] (4)该方法采用地层准确率、基于编辑距离序列相似度作为评价标准,同时引入交叉熵损失函数描述模拟结果与真实地层之间接近程度,在模型进行验证时,地层准确率将模拟结果逐一对比,能够准确描述预测序列与真实地层序列接近程度。附图说明:
[0019] 图1是本发明一种基于钻孔数据进行机器学习的地层序列模拟方法。具体实施方式:
[0020] 下面结合附图对本发明的一个实施例作进一步说明。
[0021] 一种基于钻孔数据进行的地层序列模拟方法,主要包括:输入坐标信息,地层类型序列模型,模拟地层类型序列,截取终止标记填充,地层层厚序列模型,模拟层层厚序列模型,地层序列。具体步骤如下:
[0022] (1)输入坐标信息,寻求坐标信息与RNN输出过程关联,利用坐标信息对 RNN初始状态赋值,使坐标指导地层序列模拟。
[0023] (2)按照标准钻孔柱状图比例尺换算钻孔总深度,判断是否需要分页绘制,若需要则将该地层“剪开”,剪开部分分别位于该页尾,与下页首。
[0024] (3)建立底层层厚序列模型,采取seq2seq(sequence to sequence,序列- 序列)架构,利用两个串联RNN分别作为编码器与解码器建立地层层厚模型,编码器处理地层类型信息,以其最后时刻隐藏层状态作为解码器初始状态,进而预测每种地层类型对应层厚。
[0025] (4)截取终止标记,填充地层序列,引入终止标记作为虚拟地层充当填充元素,将不等长地层序列填充为等长地层序列,同时作为表示地层序列结束标记。在每次训练中,RNN输出等长地层序列,终止标记出现时,采样过程停止,取终止标记出现前所有序列作为预测地层序列。
[0026] (5)连接地层类型序列模型与地层厚度序列模型,以地层类型序列模型模拟结果作为地层厚度序列模型编码器输入,构建完整地层序列模型。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈