一种基于机器学习的井间连通性评价方法专利检索-关联性分析人工智能专利检索查询-专利查询网

一种基于 机器学习的井间连通性评价方法

阅读：900发布：2020-05-11

专利汇可以提供一种基于机器学习的井间连通性评价方法专利检索，专利查询，专利分析的服务。并且本发明提出一种基于机器学习的井间连通性评价方法，包括：1)根据数值模拟技术获取数据集，包括动态数据与静态数据；2)对样本数据集中的动态数据进行特征关联性提取；3)对动态数据与储层样本中的静态数据进行归一化处理；4)将样本数据集划分为训练集与测试集，并构建机器学习模型的输入与输出；5)使用机器学习方法对模型的权值矩阵与偏置矩阵激进行训练，获得训练模型；6)验证所述训练模型归一化后计算结果的准确性与有效性；7)利用所述训练模型根据动态数据计算出的地层平均渗透率定义井间的连通系数，表征井间连通性。本发明的方法只需要油田中最容易获取的各个井的动态生产数据得到储层地质信息，进而得到井间连通性。，下面是一种基于机器学习的井间连通性评价方法专利的具体信息内容。

权利要求

1.一种基于机器学习的井间连通性评价方法，其特征在于，包括：
1)根据数值模拟技术获取数据集，包括动态数据与静态数据；
2)对样本数据集中的动态数据进行特征关联性提取；
3)对经由步骤2)处理的动态数据与储层样本中的静态数据进行归一化处理；
4)将样本数据集划分为训练集与测试集，并构建机器学习模型的输入与输出；
5)使用机器学习方法利用训练集对模型的权值矩阵与偏置矩阵激进行训练，获得训练模型；
6)验证所述训练模型归一化后计算结果的准确性与有效性；
7)利用所述训练模型根据动态数据计算出的地层平均渗透率定义井间的连通系数，表征井间连通性。
2.根据权利要求1所述的基于机器学习的井间连通性评价方法，其特征在于，在步骤1)中，通过数值模拟技术获取生产井和注入井的样本数据集，该样本数据集包含静态数据与动态数据。
3.根据权利要求2所述的基于机器学习的井间连通性评价方法，其特征在于，在步骤2)中，对生产井的动态数据集进行特征关联性提取，得到经过特征关联性提取后的动态数据集。
4.根据权利要求3所述的基于机器学习的井间连通性评价方法，其特征在于，步骤2)包括：
S21，以井号对动态数据进行分类得到生产井动态数据集，求解生产井的协方差矩阵，得到特征向量与对应的特征矩阵；
S22，选取特征向量中的最大值以及对应的特征向量；
S23，将生产井动态数据集与特征向量中的最大值对应的所述特征向量乘，得到动态生产井的数据经由特征关联性提取后的样本数据集。
5.根据权利要求4所述的基于机器学习的井间连通性评价方法，其特征在于，在步骤5)中，模型的训练通过不断调整权值矩阵与偏置矩阵中的值，使得训练集输入的数据经由两个矩阵处理后得到的计算结果与训练集的输出更加接近。
6.根据权利要求5所述的基于机器学习的井间连通性评价方法，其特征在于，步骤5)还包括：
S51，初始化一个权值矩阵以及偏置矩阵进行第一次训练，将训练集的输入与权值矩阵映射相乘，再加上偏置矩阵获得第一次训练的输出结果；
S52，利用误差反向传播算法更新权值矩阵与偏置矩阵，完成机器学习模型的第一次训练；
S53，第二次训练时使用经过第一次训练更新过的权值矩阵与偏置矩阵，重复S51-S53；
S54，建立停止训练的机制，定义容忍系数，当经由损失函数计算得到的误差小于所述容忍系数时则终止训练。
7.根据权利要求6所述的基于机器学习的井间连通性评价方法，其特征在于，在S54中，当经由损失函数计算得到的误差小于所述容忍系数，且继续进行预定次数的训练，每次误差均小于所述容忍系数，则终止训练。
8.根据权利要求1所述的基于机器学习的井间连通性评价方法，其特征在于，在步骤6)中，使用平均绝对相对误差验证归一化后计算结果的准确性与有效性。
9.根据权利要求8所述的基于机器学习的井间连通性评价方法，其特征在于，步骤6)还包括：
S61，将测试集输入至机器学习模型中，计算可得到对应的输出，再进行逆归一处理，最终得到测试集的计算结果；
S62，将该计算结果与实际储层数据对比分析，使用平均绝对相对误差去分析。
10.根据权利要求1所述的基于机器学习的井间连通性评价方法，其特征在于，在步骤
4)中，机器学习模型的输入是经过了步骤3)处理的动态数据集，机器学习模型的输出为静态数据集。

说明书全文

一种基于机器学习的井间连通性评价方法

技术领域

[0001] 本发明属于油田开发领域，涉及一种评价油田各井之间连通性的方法，具体涉及一种基于机器学习的井间连通性评价方法。

背景技术

[0002] 油田开发过程中，由于我国储层地质的低渗透性，导致生产井的日产油量相对较少，各采油厂利用注水井，通过向储层注水的方法来增大地层压力，从而提升各生产井的产量。因此了解生产井与注水井之间的连通性可以优化井的布局，调整作业的优先级从而提高采收率，对油田的二次开发具有重要意义。

[0003] 油田常用评价井间连通性方法有两类：静态法和动态法。静态法利用电缆测井和地层对比的方法基于储层特征对连通性进行评价，但实际开发过程中储层结构会发生较大变化，因此该方法不能准确反映井间的连通性。动态法包括示踪剂测试、井间微地震、干扰试井等方法，此类方法通常实施困难，价格高昂，实施周期较长，甚至有可能干扰油田的正常开采。油田的动态生产数据是最容易获取的最有效的信息，这些数据中蕴含着许多特征可以反映储层的地质情况，因此现如今大量学者利用动态生产数据去得到井间连通性。

发明内容

[0004] 本发明针对目前常规方法无法快速解决的油藏井间连通性问题，创新性的提出一种基于机器学习模型的井间连通性评价方法。

[0005] 随着数值模拟技术的日渐成熟以及计算机的快速发展，基于机器学习的井间连通性评价方法成为可能。数值模拟方法可以通过求解非线性抛物型偏微分方程，设定边界条件和初始条件来模拟不同地质条件下的储层，并计算出相应条件下各井的动态生产数据。机器学习是融合概率论、统计学、逼近论、凸分析、算法复杂度等多门学科的新技术，可以在无物理模型的基础上得到变量之间的非线性关系，该技术可以应用于寻找动态生产数据与储层地质之间的关系，从而反演出各井之间的连通性。

[0006] 本发明提出一种基于机器学习的井间连通性评价方法，包括：1)根据数值模拟技术获取数据集，包括动态数据与静态数据；2)对样本数据集中的动态数据进行特征关联性提取；3)对经由步骤2)处理的动态数据与储层样本中的静态数据进行归一化处理；4)将样本数据集划分为训练集与测试集，并构建机器学习模型的输入与输出；5)使用机器学习方法利用训练集对模型的权值矩阵与偏置矩阵激进行训练，获得训练模型；6)验证所述训练模型归一化后计算结果的准确性与有效性；7)利用所述训练模型根据动态数据计算出的地层平均渗透率定义井间的连通系数，表征井间连通性。

[0007] 可选地，在步骤1)中，通过数值模拟技术获取生产井和注入井的样本数据集，该样本数据集包含静态数据与动态数据。

[0008] 可选地，在步骤2)中，对生产井的动态数据集进行特征关联性提取，得到经过特征关联性提取后的动态数据集。

[0009] 可选地，步骤2)包括：S21，以井号对动态数据进行分类得到生产井动态数据集，求解生产井的协方差矩阵，得到特征向量与对应的特征矩阵；S22，选取特征向量中的最大值以及对应的特征向量；S23，将生产井动态数据集与特征向量中的最大值对应的所述特征向量乘，得到动态生产井的数据经由特征关联性提取后的样本数据集。

[0010] 可选地，在步骤5)中，模型的训练通过不断调整权值矩阵与偏置矩阵中的值，使得训练集输入的数据经由两个矩阵处理后得到的计算结果与训练集的输出更加接近。

[0011] 可选地，步骤5)还包括：S51，初始化一个权值矩阵以及偏置矩阵进行第一次训练，将训练集的输入与权值矩阵映射相乘，再加上偏置矩阵获得第一次训练的输出结果；S52，利用误差反向传播算法更新权值矩阵与偏置矩阵，完成机器学习模型的第一次训练；S53，第二次训练时使用经过第一次训练更新过的权值矩阵与偏置矩阵，重复S51-S53；S54，建立停止训练的机制，定义容忍系数，当经由损失函数计算得到的误差小于所述容忍系数时则终止训练。

[0012] 可选地，在S54中，当经由损失函数计算得到的误差小于所述容忍系数，且继续进行预定次数的训练，每次误差均小于所述容忍系数，则终止训练。

[0013] 可选地，在步骤6)中，使用平均绝对相对误差验证归一化后计算结果的准确性与有效性。

[0014] 可选地，步骤6)还包括：S61，将测试集输入至机器学习模型中，计算可得到对应的输出，再进行逆归一处理，最终得到测试集的计算结果；S62，将该计算结果与实际储层数据对比分析，使用平均绝对相对误差去分析。

[0015] 可选地，在步骤4)中，机器学习模型的输入是经过了步骤3)处理的动态数据集，机器学习模型的输出为静态数据集。

[0016] 本发明提出的方法中所建立的机器学习模型可以根据油田各井的动态生产数据快速评价井间连通性状况，计算速度极快，准确率较高，同时建立了可以提前终止模型训练的机制，保证准确性的同时节约计算资源，根据模型计算的地层平均渗透率定义了新的连通系数，快速表征井间的连通性。

[0017] 其中，步骤1)所述模拟不同储层地质下的生产井与注水井的动态数据。模拟的储层地质越多，机器学习模型可以便能学习到更多不同地质对应的动态数据特征，结果也会越精准，但也会提高运算时间。

[0018] 进一步为了提高运行效率，步骤2)所述的特征关联性提取方法被提出。特征关联性提取是利用协方差矩阵，将样本数据中每个生产井的动态生产数据特征进行了关联性提取，既可以表征这些生产井中包含的特征，又能降低机器模型学习时间，进而提高运行效率。

[0019] 其中，在步骤5)所述的模型训练过程中，一般的机器学习模型会设定好训练次数从而进行迭代计算，为了节约计算资源，根据模型所求的地层平均渗透率定义容忍系数，建立提前终止训练机制，保证了符合物理意义与要求的同时节约了计算时间。

[0020] 其中，在步骤7)所述，利用机器学习模型根据动态数据特征计算出来的储层各区域的平均渗透率定义新的连通系数，根据该系数表征井间的连通性。

[0021] 本发明有益的技术效果在于：

[0022] 1、该方法设计一种基于机器学习算法的计算模型框架，只需要油田中最容易获取的各个井的动态生产数据得到储层地质信息，进而得到井间连通性。

[0023] 2、该方法提出了一种特征关联性提取方法，在保证准确率的同时对所有生产井的动态数据特征进行提取，提高了计算效率。

[0024] 3、本方法结合储层地质渗透率的物理意义与实际要求定义容忍系数，建立了可以提前终止机器学习模型训练的机制，降低了计算时间。

[0025] 4、本方法利用机器学习模型学习了动态数据特征，得到储层平均渗透率来定义新的连通系数，表征注水井与生产井之间的连通性。该模型在实际应用时所需时间极短，可以达到秒级。附图说明

[0026] 为了更容易理解本发明，将通过参照附图中示出的具体实施方式更详细地描述本发明。这些附图只描绘了本发明的典型实施方式，不应认为对本发明保护范围的限制。

[0027] 图1为本发明的方法的一个实施方式的流程图。

[0028] 图2为本发明的方法的一个实施方式的流程图。

[0029] 图3为数值模拟建立的储层、井位以及区域划分示意图。

[0030] 图4为通过本发明的方法计算出的任意一个储层的井间连通性示意图。

具体实施方式

[0031] 下面参照附图描述本发明的实施方式，其中相同的部件用相同的附图标记表示。在不冲突的情况下，下述的实施例及实施例中的技术特征可以相互组合。

[0032] 图1-2显示了本发明方法的流程图。

[0033] 在S1中，通过数值模拟技术获取样本数据集，该样本数据集包含静态数据与动态数据。所述样本数据集针对的是生产井和注入井。

[0034] 本发明通过步骤S1，创新性地构建了不同的样本储层，利用生产井与注入井的动态生产数据包含的特征来判断储层地质情况，考虑了多因素的影响。

[0035] 具体地，如图2所示，建立一个20×20(也可以是其他尺寸)的立体网格结构来模拟实际的储层，共计有400个数据单元。图中划分为四个区域，正中心为注水井，四角均为生产井。每个数据单元中都含有地质渗透率数据。令每个区域的平均地质渗透率为一个随机值，随机范围在1～500(mD)之间。还可以通过改变网格长度模拟不同的储层大小及厚度。通过这种方式可以得到5000个样本储层，即5000个20×20的立体网格结构。

[0036] 由于储层平均地质渗透率的不同，对应生产井的动态生产数据必然存在差异性。利用有限差分的方法，模拟计算出不同样本储层下各井的动态生产数据，包括：各生产井的产量、产水率、井底流压以及注水井的注入量和井底流压。另外，设定模拟时间为1800天。

[0037] 如此，得到动态生产数据的数据集D＝xn，w，i，t，其中x为某一样本数据；n为对应的样本储层(1，2，...5000)；w指代是井号(1为注水井，2～5为生产井)；i对应动态参数，依次为产量、井底流压、产水率及注入量；t为第t天的数据。例如，第5个样本储层条件下，2号生产井第120天的产水率数据为x5，2，3，120。

[0038] 静态数据集为J＝kn，r，k为区域平均渗透率；n为第n个样本储层，r为对应的区域(共4个区域)。

[0039] 在S2中，对生产井的动态数据集进行特征关联性提取，得到经过特征关联性提取后的动态数据集。步骤S2创新性地引入了特征关联性提取方法，保证预测准确度的前提，提取了各个生产井的动态数据特征，提高计算效率。

[0040] 具体地，步骤S2包括步骤S21-S23。

[0041] S21，以井号对动态数据进行分类得到求解生产井的协方差矩阵，得到特征向量β与对应的特征矩阵Z。

[0042] 例如，以井号对动态数据进行分类，其中Dw＝(xn，i，t)w。生产井的动态数据为D2～D5，对4口生产井的数据进行特征提取，首先求解协方差矩阵A，公式如下：

[0043]

[0044] 根据协方差矩阵求解特征矩阵Z与特征向量β，特征矩阵Z与特征向量β应满足AZ＝βZ，其中β为一维向量。求解该方程可以得到特征向量β与对应的特征矩阵Z。

[0045] S22，选取特征向量中的最大值βmax以及对应的特征向量Zmax。

[0046] 具体地，选取特征向量β中的最大值βmax以及相对应特征向量Zmax，对应的偏置矩阵Bmax＝(b1，b2，b3，b4)。

[0047] S23，将生产井的动态数据集与特征向量中的最大值对应的Zmax相乘，得到动态生产井的数据经由特征关联性提取后的样本数据集。

[0048] 具体地，将生产井的动态数据集与Zmax相乘，可得动态生产井的数据经由特征关联性提取后的样本数据集D2′，即：

[0049] D′2＝b1·D2+b2·D3+b3·D4+b4·D5

[0050] 进而得到经过特征关联性提取后的动态数据集D＝[D1，D2′]。

[0051] S3，对特征关联性提取后的动态数据集D＝[D1，D2′]和S1中获取的储层样本中的静态数据集进行归一化处理。

[0052] 对静态和动态数据集进行归一化，公式如下所示：

[0053]

[0054] 其中xmin为该类数据中的最小值，类别指的是产量、压力、含水率等，xmax为该类数据中的最大值，为归一后的数据。通过上述方法，可以得到归一后的动态数据集与静态数据集

[0055] S4，针对S3中得到的动态数据集和静态数据集构建训练集与测试集，并构建机器学习模型的输入与输出。

[0056] 本次模拟共计有5000个储层样本，故有5000组样本数据，样本中动态数据可写成其中同理，静态数据为其中

[0057] 根据生产井与注水井的动态生产数据表现出来的特征去反演静态的地层平均渗透率，因此，模型的输入便是已经经过了预处理(特征关联性提取及归一化)的动态数据集模型的输出为样本储层的地质情况，即静态数据集同时，总的数据集有5000组样本，按照一定比例(例如8∶2)的比例来划分训练集与测试集，训练集用于机器学习模型的训练，测试集用于对训练好的模型测试其准确性，即训练集有4000组数据，测试集有1000组数据，故训练集的输入、输出、测试集的输入、输出分别为：

[0058]

[0059]

[0060]

[0061]

[0062] S5，利用机器学习方法训练连通性评价模型。具体地，利用机器学习方法利用训练集对连通性评价模型的权值矩阵与偏置矩阵进行训练，获得最优的训练模型。步骤S5创新性地在模型中建立了提前终止训练的机制，保证准确性的同时节约了计算资源。

[0063] 该评价模型主要由权值矩阵W与偏置矩阵B构成，模型的训练就是不断调整权值矩阵与偏置矩阵中的值，使得训练集输入X_train的数据经由两个矩阵处理后得到的计算结果与训练集的输出Y_train更加接近。

[0064] 以本次实验为例，首先使用训练集的数据，训练集的输入为X_train，输出为Y_train，需要明白的是Y_train并不是通过机器学习模型计算出来的输出值，而是我们期望的用于跟模型计算的输出结果进行对比分析的真实值。

[0065] 更具体地，步骤S5包括步骤S51-S54。

[0066] S51，初始化一个权值矩阵以及偏置矩阵进行第一次训练，将训练集的输入X_train与权值矩阵映射相乘，再加上一个偏置矩阵获得了第一次训练的输出结果，记为M＝mn，r。该T的数据结构与Y_train是一致的，然后利用损失函数L求取均方根误差，公式如下：

[0067]

[0068] 这样便可以得到第一次训练结果的误差值。

[0069] S52，利用常规的误差反向传播算法更新权值矩阵与偏置矩阵，完成机器学习模型的第一次训练。

[0070] S53，第二次训练时，使用的便是经过第一次训练更新过的权值矩阵与偏置矩阵，重复上述训练过程。如此，模型便会不断被训练，两个矩阵也会不断被更新。

[0071] S54，建立停止训练的机制，定义容忍系数γ，当经由损失函数L计算得到的误差小于γ，且继续进行10次训练，每次误差均小于γ，这样可以认为模型达到了训练要求，训练终止，此时得到的权值矩阵与偏置矩阵为最终的训练模型。

[0072] 为了避免计算资源的浪费，需要建立停止训练的机制，定义一个容忍系数γ：

[0073]

[0074] 其中η为偏差比，本次实验取O.15。当经由损失函数L计算得到的误差小于γ，且继续进行10次训练，每次误差均小于γ，这样可以认为模型达到了训练要求，训练终止，此时得到的权值矩阵与偏置矩阵为最终的训练模型。

[0075] S6，利用测试集对模型进行测试并进行逆归一处理。具体地，使用平均绝对相对误差(AARD)验证归一化后计算结果的准确性与有效性。

[0076] 由于模型训练使用的是训练集，模型会有对训练集的记忆，因此利用测试集对其准确性进行测试。

[0077] S61，将测试集X_test输入至机器学习模型中，计算可得到对应的输出其中再进行逆归一处理，最终得到测试集的计
算结果M＝[M4001，M4002，...，M5000]，其中Mn＝(mr)n，n指代的是样本储层，r为储层划分的区域(共四个区域)。

[0078] S62，将该计算结果与实际储层数据J＝[J4001，J4002，...，J5000]，Jn＝(kr)n，对比分析，使用平均绝对相对误差(AARD)去分析，公式如下：

[0079]

[0080] 一般来说，AARD值越小越好，因为它描述的是机器学习模型计算出的值与实际值之间的相对绝对误差，通过上述公式得到本次测试集的AARD值为9.71％，验证了该模型的有效性与准确性。

[0081] S7，利用机器学习模型计算出的地层平均渗透率定义井间的连通系数，表征井间的连通性。步骤S7创新性地利用机器学习模型计算的地层平均渗透率定义新的连通系数，更为快速准确的表征井间的连通性。

[0082] 以测试集为例，模型的计算结果为M＝[M4001，M4002，...，M5000]，其中Mn＝(mr)n，如要计算第5000个储层的井间连通性，M5000＝(mr)5000＝[m1，m2，m3，m4]5000，注水井与生产井之间的连通系数如下所示：

[0083]

[0084] fr为r区域的注水井与生产井之间连通系数，mr为通过机器学习模型得到的样本储层中r区域的平均渗透率。

[0085] 作为实例，图3显示了为数值模拟建立的储层、井位以及区域划分示意图。图4为通过本发明的方法计算出的任意一个储层的井间连通性示意图。

[0086] 本发明的特点至少包括：在步骤S1中，模拟不同储层地质下的生产井与注水井的动态数据。模拟的储层地质越多，机器学习模型可以便能学习到更多不同地质对应的动态数据特征，结果也会越精准，但也会提高运算时间。

[0087] 进一步为了提高运行效率，在步骤S2中，提出了所特征关联性提取方法。特征关联性提取是利用协方差矩阵，将样本数据中每个生产井的动态生产数据特征进行了关联性提取，既可以表征这些生产井中包含的特征，又能降低机器模型学习时间，进而提高运行效率。

[0088] 在步骤S5中，在模型训练过程中，一般的机器学习模型会设定好训练次数从而进行迭代计算，为了节约计算资源，根据模型所求的地层平均渗透率定义容忍系数，建立提前终止训练机制，保证了符合物理意义与要求的同时节约了计算时间。

[0089] 在步骤S7中，利用机器学习模型根据动态数据特征计算出来的储层各区域的平均渗透率定义新的连通系数，根据该系数表征井间的连通性。

[0090] 以上所述的实施例，只是本发明较优选的具体实施方式，本领域的技术人员在本发明技术方案范围内进行的通常变化和替换都应包含在本发明的保护范围内。

标题	发布/更新时间	阅读量
一种通信网络的性能优化方法	2020-05-08	166
一种邮件信息和恶意代码信息的关联性分析方法及系统	2020-05-08	635
议题显示系统和议题显示方法	2020-05-12	622
一种根据电网特征事件进行场景动态切换的方法、系统和存储介质	2020-05-12	596
一种工地安全调度监管方法及系统	2020-05-08	996
一种基于物联网的智慧农业信息处理系统	2020-05-14	627
一种基于事故风险的城市动态预警系统及方法	2020-05-11	431
一种基于算法特征的SIMT系统	2020-05-11	8
一种基于迁移学习的电力通信网故障检测方法	2020-05-12	507
自动校验测试方法及系统	2020-05-13	912

一种基于机器学习的井间连通性评价方法

一种基于机器学习的井间连通性评价方法

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：