首页 / 专利库 / 地球科学 / 岩石 / 变质岩 / 一种页岩显微薄片自动鉴别方法

一种页岩显微薄片自动鉴别方法

阅读:4发布:2020-05-29

专利汇可以提供一种页岩显微薄片自动鉴别方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 页岩 显微薄片自动 鉴别 方法,其步骤是:1)第一阶段,将 岩石 薄片分为 火成岩 、 沉积岩 、 变质岩 三大类。2)第二阶段,从第一阶段分类得到的沉积岩中鉴别出页岩。以上两阶段采用的分类鉴别技术均为 决策树 技术,提取的特征均为岩石薄片图像RGB三 颜色 通道的统计特征和灰度通道的分形特征。本发明方法运用两阶段的信息处理技术自动鉴别页岩显微薄片,解决了因数据 不平衡 而导致的分类结果不理想的问题。特征选取方面充分利用页岩良好的分形特性,适用于页岩的自动鉴别;本发明计算简单高效,具有扩展性,可随着岩石薄片数据储备的增加而提高鉴别方法的准确性;在地质勘探、矿物研究中具有应用价值。,下面是一种页岩显微薄片自动鉴别方法专利的具体信息内容。

1.一种页岩显微薄片自动鉴别方法,其特征在于包含以下步骤:
第一阶段:区分岩石大类
1)读取待鉴别岩石薄片的显微图像,转换为位图格式;令图像包含M个行和N个列,共有MN个像素,每个像素包含红(R)、绿(G)、蓝(B)三个颜色值;于是分解为三个颜色通道,每一个颜色通道表示为一个M×N矩阵,矩阵元素为像素颜色值;分别根据三个颜色通道统计色阶分布;
2)根据色阶分布计算颜色统计特征,包括均值、中位数、方差、偏度、以及峰值指标;
3)将薄片的位图图像转换为灰度图像;参考二维一阶离散小波分解处理灰度图像,分解为4个频域的系数矩阵即灰度通道:低频分量系数矩阵A,平方向系数矩阵H,竖直方向系数矩阵V和对线方向系数矩阵D;令原始灰度图像的像素行数为M,列数为N,则转换后的系数矩阵行数为 列数为 其中 表示向下取整;
4)基于每一个系数矩阵,计算其分形维数指标,与颜色统计特征共同构成特征值向量;
5)将薄片图像转换为特征值向量,储备样本集,采用决策树分类方法,自动将岩石薄片分为火成岩沉积岩变质岩三大类;
第二阶段:鉴别页岩
6)提取分类得到的沉积岩大类薄片图像的特征,构成特征值向量,特征类别同第一阶段;
7)将薄片图像转换为特征值向量,储备沉积岩样本集,采用决策树分类方法,从沉积岩大类中自动鉴别出页岩。
2.根据权利要求1所述的页岩显微薄片自动鉴别方法,其特征在于,
上述步骤1)中统计色阶分布的计算过程是:像素颜色值分为256个色阶,由数值
0-255表示;针对每一个色阶i统计颜色值为i的像素个数xi,构成色阶分布向量X=,其中向量值满足如下公式要求:
其中M和N分别为图像的行和列数,MN代表像素总数。
3.根据权利要求2所述的页岩显微薄片自动鉴别方法,其特征在于,
上述步骤2)中各颜色统计特征指标的计算方法是:根据色阶分布向量X=,分别计算均值u、中位数I、方差v、偏度s和峰值f,其中M和N为图像的行列数,公式如下:
4.根据权利要求1、2或3所述的页岩显微薄片自动鉴别方法,其特征在于,上述步骤3)中参考二维一阶离散小波分解处理灰度图像的计算过程是:首先确定Haar小波变换的尺度函数φ()和小波函数ψ(),由下述公式所示,其中x为参数,表示任意实数:
然后基于上述基本函数,四个系数矩阵的计算方法分别由下述公式所示,其中,M和N为图像的像素行数和列数,c(x,y)为灰度矩阵C中第x+1行、y+1列像素的灰度值:
其中a(m,n)为低频分量系数矩阵A中第m+1行,n+1列的元素值;h(m,n)为水平方向系数矩阵H中第m+1行,n+1列的元素值;v(m,n)为垂直方向系数矩阵V中第m+1行,n+1列的元素值;d(m,n)为对角线方向系数矩阵D中第m+1行,n+1列的元素值;m的值域是n的值域是 表示向下取整。
5.根据权利要求1、2或3所述的页岩显微薄片自动鉴别方法,其特征在于,上述步骤4)中采用计盒维方法计算分形维数;首先确定向量L={l1,l2,…,lz},其中z表示向量L中值的个数;L中各个元素的计算方法如下,令M和N为图像的像素行数和列数,i依次取[1,z]中的整数:
然后将灰度通道按从左到右、从上到下依次拆解为大小是li×li的像素盒,即子图像,计算拆解得到的像素盒总数NLi,公式如下:
其中 表示向下取整;令rj表示第j(1≤j≤NLi)个像素盒中最大像素值和最小像素值之间的差值,于是计算分形值di,公式如下:
按i依次计算,共获得z个分形值di,即z个样本点;最后利用最小二乘法,将样本点拟合成一条直线,求出直线的斜率,作为分形维数值。
6.根据权利要求4所述的页岩显微薄片自动鉴别方法,其特征在于,
上述步骤4)中采用计盒维方法计算分形维数;首先确定向量L={l1,l2,…,lz},其中z表示向量L中值的个数;L中各个元素的计算方法如下,令M和N为图像的像素行数和列数,i依次取[1,z]中的整数:
然后将灰度通道按从左到右、从上到下依次拆解为大小是li×li的像素盒,即子图像,计算拆解得到的像素盒总数NLi,公式如下:
其中 表示向下取整;令rj表示第j(1≤j≤NLi)个像素盒中最大像素值和最小像素值之间的差值,于是计算分形值di,公式如下:
按i依次计算,共获得z个分形值di,即z个样本点;最后利用最小二乘法,将样本点拟合成一条直线,求出直线的斜率,作为分形维数值。
7.根据权利要求1、2或3所述的页岩显微薄片自动鉴别方法,其特征在于,上述步骤5)和步骤7)中采用决策树分类方法自动鉴别岩石薄片的过程是:首先基于储备的岩石薄片图像数据集,将薄片图像集合转换为特征值向量集合,标识每一个薄片所属的岩石类型;然后在数据集上训练决策树;最后将目标图像的特征作为输入,由决策树判定目标薄片所属大类或是否属于页岩。
8.根据权利要求4所述的页岩显微薄片自动鉴别方法,其特征在于,
上述步骤5)和步骤7)中采用决策树分类方法自动鉴别岩石薄片的过程是:首先基于储备的岩石薄片图像数据集,将薄片图像集合转换为特征值向量集合,标识每一个薄片所属的岩石类型;然后在数据集上训练决策树;最后将目标图像的特征作为输入,由决策树判定目标薄片所属大类或是否属于页岩。

说明书全文

一种页岩显微薄片自动鉴别方法

技术领域

[0001] 本发明涉及一种利用图像进行物品鉴别的方法,具体是一种页岩显微薄片的自动鉴别方法,该方法针对岩石显微薄片人工鉴别成本高昂问题,应用信息处理技术实现页岩薄片的自动鉴别。

背景技术

[0002] 岩石薄片鉴定根据岩石的光学性质,确定岩石的类型,进而确定其结构、来源和成因。页岩是一种沉积岩,主要是由黏土沉积经压温度形成的岩石,其中混杂有石英长石的碎屑以及其他化学物质,成分复杂,但所有的页岩都具有薄页状或薄片层状的节理且颜色较为单一;页岩油和页岩气多发现于页岩层,页岩鉴别有助于能源的勘探。现有岩石薄片鉴定多采用人工,不仅需要专业的鉴别专家,且代价高昂,效率较低;鉴别过程过度依赖个人经验,不可重复。

发明内容

[0003] 本发明所要解决的技术问题是提供一种页岩显微薄片的自动鉴别方法,该方法依靠计算机图像识别技术对岩石薄片的位图图像进行鉴别,从而判断是否为页岩,该方法完全替代了人工,提高了效率,且具有重复性。
[0004] 为实现上述目的,本发明采用如下的步骤,其中第一阶段包含步骤1-5,第二阶段包含步骤6和7,两阶段采用相同的特征:
[0005] 第一阶段:区分岩石大类
[0006] 1)读取页岩薄片的显微图像,转换为位图格式;令图像包含M个行和N个列,共有MN个像素,每个像素包含红(R)、绿(G)、蓝(B)三个颜色值; 于是分解为三个颜色通道,每一个颜色通道表示为一个M×N矩阵,矩阵元素为像素颜色值;分别根据三个颜色通道统计色阶分布;
[0007] 2)根据色阶分布计算三个颜色通道的统计特征,包括均值、中位数、方差、偏度、以及峰值指标;
[0008] 3)将薄片的位图图像转换为灰度图像;参考二维一阶离散小波分解处理灰度图像,分解为4个频域的系数矩阵(灰度通道):低频分量系数矩阵A,平方向系数矩阵H,竖直方向系数矩阵V和对线方向系数矩阵D;令原始灰度图像的像素行数为M,列数为N,则转换后的系数矩阵行数为 列数为 其中 表示向下取整;
[0009] 4)基于每一个系数矩阵,计算其分形维数指标,与颜色通道的统计特征共同构成特征值向量;
[0010] 5)将薄片图像转换为特征值向量,储备样本集,采用决策树分类方法,自动将岩石薄片分为火成岩、沉积岩、变质岩三大类;
[0011] 第二阶段:鉴别页岩
[0012] 6)提取第一阶段分类得到的沉积岩大类的岩石薄片的特征,构成特征值向量,提取的特征同第一阶段;
[0013] 7)将薄片图像转换为特征值向量,基于沉积岩样本集,采用决策树分类方法,从沉积岩大类中自动鉴别出页岩。
[0014] 上述步骤1)中统计色阶分布的计算过程是:像素颜色值分为256个色阶,由数值0-255表示;针对每一个色阶i统计颜色值为i的像素个数xi,构成色阶分布向量X=,其中向量值满足如下公式要求:
[0015]
[0016] 其中M和N分别为图像的行和列数,MN代表像素总数。
[0017] 上述步骤2)中各颜色统计特征指标的计算方法是:根据色阶分布向量X=,分别计算均值u、中位数I、方差v、偏度s和峰值f,其中M和N为图像的行列数,公式如下:
[0018]
[0019]
[0020]
[0021]
[0022]
[0023] 上述步骤3)中参考二维一阶离散小波分解处理灰度图像的计算过程是:首先确定Haar小波变换的尺度函数φ()和小波函数ψ(),由下述公式所示,其中x为参数,表示任意实数:
[0024]
[0025]
[0026] 然后基于上述基本函数,四个系数矩阵的计算方法分别由下述公式所示,其中,M和N为图像的像素行数和列数,c(x,y)为灰度矩阵C中第x+1行、y+1列像素的灰度值:
[0027]
[0028]
[0029] 其中a(m,n)为低频分量系数矩阵A中第m+1行,n+1列的元素值;h(m,n)为水平方向系数矩阵H中第m+1行,n+1列的元素值;v(m,n)为垂直方向系数矩阵V中第m+1行,n+1列的元素值;d(m,n)为对角线方向系数矩阵D中第m+1行,n+1列的元素值;m的值域是 n的值域是 表示向下取整。
[0030] 上述步骤4)中采用“计盒维”方法计算分形维数;首先确定向量L={l1,l2,…,lz},其中z表示向量L中值的个数,本发明取参考值z=20;L中各个元素的计算方法如下,令M和N为图像的像素行数和列数,i依次取[1,z]中的整数:
[0031]
[0032]
[0033]
[0034]
[0035] 然后将灰度通道按从左到右、从上到下依次拆解为大小是li×li的像素盒(即子图像),计算拆解得到的像素盒总数NLi,公式如下:
[0036]
[0037] 其中 表示向下取整;令rj表示第j(1≤j≤NLi)个像素盒中最大像素值和最小像素值之间的差值,于是计算分形值di,公式如下:
[0038]
[0039] 按i依次计算,共获得z个分形值di,即z个样本点;最后利用最小二乘法,将样本点拟合成一条直线,求出直线的斜率,作为分形维数值。
[0040] 上述步骤5)和步骤7)中采用决策树分类方法自动鉴别岩石薄片的过程是:首先基于储备的岩石薄片图像数据集,将薄片图像集合转换为特征值向量集合,标识每一个薄片所属的岩石类型;然后在数据集上训练决策树;最后将目标图像的特征作为输入,由决策树判定目标薄片所属大类或是否属于页岩。
[0041] 本发明先将岩石薄片分为火成岩、沉积岩、变质岩三大类,再从沉积岩大类中鉴别出页岩。采用了两阶段的鉴别方法,在一定程度上解决了因页岩数据少造成的数据不平衡问题,在保证分类准确率的情况下,提升了召回率;同时充分利用了页岩良好的分形特性,提取灰度通道的分形特征,适用于页岩的自动鉴别;实验数据表明本发明方法对页岩显微薄片鉴别具有较高的准确性,包括召回率和精度;另外通过岩石薄片数据的不断储备,可以进一步提高页岩鉴别的准确性。附图说明
[0042] 图1是两阶段的页岩显微薄片自动鉴别方法的总体框架
[0043] 图2是一种页岩显微薄片的示意图;
[0044] 图3是另一种页岩显微薄片的示意图;
[0045] 图4是二维一阶离散小波分解的示意图;
[0046] 图5是页岩显微薄片自动鉴别方法的整体流程;

具体实施方式

[0047] 图1所示为页岩显微薄片自动鉴别方法的技术框架。方法的输入是岩石薄片的显微图像;方法的输出是岩石薄片是否属于页岩。为保证方法的正确应用,需 要预先制备岩石薄片图像数据集,并在数据集中标识每张图片的岩石类别以及是否属于页岩。技术框架分两个阶段:第一阶段为提取岩石薄片的RGB三通道统计特征和灰度通道的分形特征,并根据此特征自动将岩石薄片分为火成岩、沉积岩、变质岩三大类;第二阶段自动将页岩从沉积岩大类中鉴别出来,提取的薄片特征同阶段一。
[0048] 图2和图3为两张页岩显微薄片的示意图。从图中可以看出,页岩是一种沉积岩,成分复杂;但所有的页岩都具有薄页状或薄片层状的节理且颜色较为单一,适于采用颜色与分形维数特征予以鉴别。
[0049] 本发明方法分为两个阶段共七个步骤,其中第一阶段为划分岩石大类,包括步骤一到步骤五;第二阶段为鉴别页岩,包括步骤六和步骤七。每一个阶段均提取了15个RGB通道统计特征和4个灰度通道分形特征共19个特征组成特征向量。各个步骤的具体实施方式如下:
[0050] 第一个步骤是根据位图图像的三个颜色通道统计色阶分布。令岩石薄片对应的位图图像包含M个行和N个列,于是共有MN个像素。对应红(R)、绿(G)和蓝(B)三个基本颜色,每一个颜色通道表示为一个M×N矩阵;矩阵的元素(代表像素)是颜色值,分为256个色阶,由数值0-255表示。为获得色阶分布,针对每一个色阶i统计颜色值为i的像素个数xi,构成分布向量X=,其中向量值满足公式(1)要求:
[0051]
[0052] 针对三个颜色通道共获得三个分布向量。
[0053] 第二个步骤是根据三个色阶分布分别计算统计特征,包括均值u、中位数I、方差v、偏度s、以及峰值f共5类特征指标。其中均值u的计算方法如公式(2) 所示:
[0054]
[0055] 其中M和N为图像的行列数,MN为图像的像素总数,xi为颜色值为i的像素个数,即色阶分布向量X中第i个元素值;
[0056] 中位数I为分布向量X中处于中间位置的颜色值,计算方法如公式(3)所示:
[0057]
[0058] 其中各个参数的含义同公式(2);
[0059] 基于均值u,方差v的计算方法如公式(4)所示:
[0060]
[0061] 基于均值u和方差v,偏度s度量色阶分布的偏斜方向和程度,计算方法如公式(5)所示:
[0062]
[0063] 峰值f度量色阶分布在均值位置的凸起比率,反映分布集中或分散的程度,计算方法如公式(6)所示:
[0064]
[0065] 第三个步骤是参考二维一阶离散小波分解处理灰度图像。将岩石薄片转换为灰度图像,由M×N维的灰度矩阵C表示,将矩阵C变换成为4个 维的系数矩阵,表示向下取整,分别是低频分量系数矩阵A,水平方向系数矩阵H,竖直方向系数矩阵V和对角线方向系数矩阵D。图3解释了二维一阶离散小波分解的过程。
[0066] 其中Lo_D和Hi_D分别表示二维一阶离散小波变换中的低通和高通滤波器。经过低通滤波器信号变换,可以获得图像信息中变换缓慢的粗略部分;经过高通滤波器的信号变换,可以获得图像信息中快速变换的细节部分。
[0067] 表示对图像做行(水平)方向2取1抽样;
[0068] 表示对图像做列(垂直)方向2取1抽样;
[0069] 和 表示在行上用滤波器进行卷积运算;
[0070] 和 表示在列上用滤波器进行卷积运算。
[0071] 按照图4,参考二维一阶离散小波分解处理灰度图像的计算过程是:首先确定Haar小波变换的尺度函数φ()和小波函数ψ(),分别由公式(7)和(8)所示,其中x为参数,表示任意实数:
[0072]
[0073]
[0074] 然后基于上述基本函数,四个系数矩阵的计算方法分别由公式(9)-(12)所示,其中,M和N为图像的像素行数和列数,c(x,y)为灰度矩阵C中第x+1行、y+1列像素的灰度值,即:
[0075]
[0076] 其中a(m,n)为低频分量系数矩阵A中第m+1行,n+1列的元素值;h(m,n)为水平方向系数矩阵H中第m+1行,n+1列的元素值;v(m,n)为垂直方向系数 矩阵V中第m+1行,n+1列的元素值;d(m,n)为对角线方向系数矩阵D中第m+1行,n+1列的元素值;m的值域是 n的值域是 表示向下取整。
[0077] 第四个步骤是针对每一个系数矩阵(称为灰度通道),分别计算分形维数指标。本发明中采用“计盒维”方法计算分形维数。首先确定向量L={l1,l2,…,lz},其中z表示向量L中值的个数,本发明取参考值z=20;L中各个元素的计算方法如公式(13)-(16)所示,令M和N为图像的像素行数和列数,i依次取[1,z]中的整数:
[0078]
[0079]
[0080]
[0081]
[0082] 然后将灰度通道按从左到右、从上到下依次拆解为大小是li×li的像素盒(即子图像),计算拆解得到的像素盒总数NLi,如公式(17)所示:
[0083]
[0084] 其中 表示向下取整;令rj表示第j(1≤j≤NLi)个像素盒中最大像素值和最小像素值之间的差值,于是计算分形值di,如公式(18)所示:
[0085]
[0086] 按i依次计算,共获得z个分形值di,即z个样本点;最后将样本点拟合成一条直线,利用最小二乘法求出直线的斜率,作为分形维数值。
[0087] 通过分别计算RGB三个颜色通道的五类统计特征,以及灰度通道(系数矩 阵)的分形维数指标,共获得19个特征值,构成特征值向量,用于代表薄片图像。
[0088] 第五个步骤是基于薄片图像的特征值向量,采用决策树分类方法,将岩石薄片分为三大类。分类过程是:首先基于储备的岩石薄片图像数据集,将薄片图像集合转换为特征值向量集合,标识每一个薄片所属的岩石类型;然后在数据集上训练决策树分类器;最后将目标图像的特征值向量作为输入,由决策树分类器将岩石薄片分为火成岩、沉积岩、变质岩三大类。
[0089] 第六个步骤是提取第一阶段分类得到的沉积岩大类的岩石薄片的特征,构成特征值向量,提取的特征同第一阶段。
[0090] 第七个步骤是将薄片图像转换为特征值向量,储备沉积岩样本集,采用决策树分类方法,从沉积岩大类中自动鉴别出页岩。鉴别过程是:首先基于第一阶段分出的沉积岩薄片图像数据集,将薄片图像集合转换为特征值向量集合,标识每一个薄片所属的岩石类型;然后在数据集上训练决策树分类器;最后将目标图像的特征值向量作为输入,由决策树分类器自动从第一阶段分类得到的沉积岩中鉴别出页岩。
[0091] 本发明运用信息处理技术自动鉴别页岩岩石薄片,计算简单高效,具有扩展性,在地质勘探、矿物研究中具有应用价值。
[0092] 本发明涉及的技术包括:图像存取和像素表示技术、小波变换技术和分形维数、以及决策树分类方法。
[0093] 岩石薄片需要采用数字图像的形式进行存储、处理和传播,需要一定的图像格式来组织和记录组成图像的像素信息。本发明方法采用RGB位图格式描述图像数据:每一个像素由红(R)、绿(G)、蓝(B)三个颜色分量表示,每一个颜 色分量分为256(0~255)个色阶。按照图像的行列,像素信息依据颜色分量组成三个二维矩阵,构成颜色通道。
[0094] 小波变换采用一系列小波函数,以不同程度的缩放和平移,处理傅里叶变换的正弦波和余弦波参数,运用数学计算(微分、积分和卷积等)统计信号频域特征,可以反映(图像)数据里的隐含信息。分形维数测量的是图像数据在不同尺度下的复杂度分布变化。
[0095] 决策树是一种类似流程图的树结构,其中每个内部节点(非树叶节点)表示在一个属性上的测试,每个分枝代表一个测试结果,而每个树叶节点存放一个类标号。一旦建立好了决策树,对于一个未给定类标号的元组,从根节点开始,按其属性确定一条路径直到叶节点,叶节点的类标号即是对该元组的预测。决策树的优势在于不需要领域知识或参数设置,适合于探测性的知识发现。本发明方法采用C4.5算法实现决策树分类方法;储备一定数量的岩石薄片图像数据作为训练集,在训练集上构建决策树分类器,再对新的岩石薄片进行智能鉴别。
[0096] 图5所示是本发明方法的整体流程。本发明方法计算简单高效:实验过程中读取2500余幅岩石薄片图像,共耗时约5,300秒;训练分类器并判定目标薄片图像仅耗时70秒。在特征提取过程中,本发明充分利用了页岩良好的分形特性,适用于页岩的自动鉴别;同时采用了两阶段的鉴别方法,在一定程度上解决了因页岩数量少造成的数据不平衡问题,在保证鉴别精度的前提下,提升了鉴别的召回率;实验数据表明本发明方法对页岩显微薄片鉴别具有较高的准确性,能够满足地质勘探中岩石鉴别的基本要求,其中召回率达到
90%,精度达到92%,与没有采取两阶段的方法相比,召回率提高了30%。另外,本发明方法具有较好的扩展性:其一可以采用其他的人工智能技术;其二通过岩石薄片数据的不断储备, 可以进一步提高页岩鉴别的准确性。
[0097] 本发明具体应用途径很多,以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以作出若干改进,这些改进也应视为本发明的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈