首页 / 专利库 / 视听技术与设备 / 均值漂移过程 / 基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法

基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法

阅读:984发布:2020-05-15

专利汇可以提供基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法专利检索,专利查询,专利分析的服务。并且基于OpenStreetMap的高空间 分辨率 遥感影像迁移学习分类方法,包括:基于OpenStreetMap数据自动生成目标域的影像对象样本集;采用与目标域影像具有相同成像 传感器 的源域影像,基于其历史分类图自动生成源域的影像对象样本集;综合以上目标域和源域样本集形成混合样本集,用于训练基于 随机森林 的迁移学习 算法 分类器;采用最终分类器预测目标域影像对象类型,以此得到最终分类结果。本 发明 在没有人工标注目标域影像类别的情况下,可以从OpenStreetMap数据中提取目标域影像对象的标签,通过挖掘相同传感器影像的历史分类图信息,结合目标域影像样本集,采用迁移学习算法对影像进行分类,降低了分类成本,可应用于大范围高空间分辨率遥感影像分类工作。,下面是基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法专利的具体信息内容。

1.基于OpenStreetMap(OSM)的高空间分辨率遥感影像迁移学习分类方法,包括如下步骤:
步骤1:基于OSM数据自动生成目标域样本集,包括以下过程:
(11)准备研究区的高空间分辨率遥感影像和相同空间范围的OSM数据,选择稳定、明显的控制点,对栅格影像与矢量数据进行空间配准;
(12)基于OSM数据生成像素级标签,过程如下:
(12a)对于需要把目标域影像分为n(n>1)种地类的情况,记类型集合为Y={1,2,...,n},根据类型集合Y,从OSM数据中挑选感兴趣的标签,把OSM标签合并为集合Y中的一类或保持原始标签不变,给OSM矢量数据表中新建字段class,class的值为OSM对应集合Y中类别的编号;
(12b)把矢量OSM数据栅格化,栅格的像素值为OSM矢量表中class字段对应的值,栅格的空间分辨率与目标域影像一致,由此得到目标域影像的像素级标签;
(13)目标域影像对象生成及特征计算,过程如下:
(13a)采用影像分割算法获取一系列具有空间同质性的影像对象,这里采用均值漂移算法分割目标域影像:首先,把影像转换至LUV特征空间,转换后每个像素的空间位置与特征对应一个5维向量(x,y,l*,u*,v*),其中,x和y表示空间位置,l*表示图像亮度,u*和v*表示色度;确定核函数及带宽后对LUV图像进行均值漂移滤波;在此基础上,对影像进行聚类并标记区域,从而实现影像分割;
(13b)计算影像对象的光谱、纹理和几何特征:采用波段计算获得影像对象的归一化植被指数均值与标准差、归一化体指数均值与标准差,采用光谱统计信息获取影像对象各波段的最大值、最小值、均值与标准差,采用影像对象的几何形状获取其边长、长度、宽度、长宽比、对称度、紧致度、形状指数、点数目、主方向,采用灰度共生矩阵计算影像对象的相异性、同质性、对比度、角二阶矩、熵、最大概率的六类纹理信息;
(14)目标域样本集生成,过程如下:由步骤(12)中栅格化的OSM类别信息和步骤(13)中得到的目标域影像对象,按空间位置统计目标域影像对象中每种类型出现的比例,当占比最大的类型比例超过阈值θ时,该类型会被选为对象的标签,具体规则如下:
其中,Oi表示目标域影像中第i个对象,Pj表示在对象中出现的第j个类别的比例,Nj表示第j个类别在对象中出现的像素总数, 表示影像对象Oi中的像素总数,θ表示选取标签的阈值,范围在0.8~1.0之间;由此,可获得目标域样本集 其中,
表示第i个目标域样本的特征矢量, 表示第i个目标域样本的类别,T表示目标域样本的总数;
步骤2:基于源域影像历史分类图自动生成源域样本集,包括以下过程:
(21)搜集和目标域影像具有相同成像传感器的高空间分辨率遥感影像作为源域影像,源域影像选择时要求与目标域影像空间范围、成像时间较接近,并且有相应的历史影像分类图;
(22)采用影像分割算法获取一系列具有空间同质性的源域影像对象,分割方法和步骤(13a)一致;
(23)计算源域影像对象的光谱、纹理和几何特征,方法同步骤(13b);
(24)结合源域影像历史分类图的类型信息,按照步骤(14)的对象标签赋值方法,给源域影像对象标记类型标签;由此,可获得源域样本集 其中, 表
示第i个源域样本的特征矢量, 表示第i个源域样本的类别,S表示源域样本的总数;
步骤3:将由步骤1中生成的目标域样本集和步骤2中生成的源域样本集组成的混合训i i i
练样本集L={L|(L∈Ls)OR(L ∈Lt),i=1,2,...,S+T}作为算法的输入,采用基于随机森林的迁移学习算法训练分类器,包括以下过程:
(31)设集合L中每个样本的权重为w,初始化权重
(32)设样本集合L'={Li|(Li∈L,i=1,2,...,N'}参与训练分类器,N'的初始值为S+T,将L'中的样本权重归一化:
(33)采用样本集L'训练随机森林模型f(x),假设模型中有h棵树,模型训练流程如下:
(33a)从样本集L'中有放回的抽取N'个训练样本,随机选取影像对象中s个特征参与分类树的训练,s取特征数目的平方根;
(33b)采用CART算法生成分类树,分类树生成时没有减枝过程;
重复步骤(33a)与(33b),直到h棵树全部生成为止;
(34)计算随机森林模型f(x)在目标域样本集 上的错误率e:
其中,Fi在分类正确时记为0,分类错误时记为1;
(35)更新源域样本的权重:
其中,R为总循环次数;
更新目标域样本的权重:
(36)计算当前循环中随机森林模型f(x)的重要性:
(37)进入步骤(32),直至循环R次结束;
步骤4:目标域影像对象类型预测,采用步骤3中获取的影像分类器对目标域影像对象进行预测,每个影像对象的类型预测结果为:
其中,α(i)表示第i次循环得到的模型重要性,y(i)表示第i次循环得到的模型预测结果;
由此获得目标域影像的最终分类结果。

说明书全文

基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类

方法

技术领域

[0001] 本发明属于遥感影像处理领域,具体地说,涉及一种基于OpenStreetMap(OSM)的高空间分辨率遥感影像迁移学习分类方法,该方法可以基于OpenStreetMap获取目标域样本集,并结合源域样本集,采用迁移学习算法对高空间分辨率遥感影像进行分类。

背景技术

[0002] 从高空间分辨率遥感影像上获取的地表信息可应用于城市规划、国土监测等行业。目前,从高空间分辨率遥感影像上获取地表类型信息主要分为非监督分类与监督分类两大类方法,监督分类需要事先准备一个样本集用于分类器的训练,而非监督分类无需先验知识的参与。在国土等行业的实际应用中,主要采用监督分类方法获取感兴趣区域的地表类型,其中一个关键问题就是训练样本集的获取。
[0003] 传统的样本集获取通常采用人工目视解译或野外调查的方法,这些方法费时费费钱,不适合用于大范围遥感影像分类问题。针对大范围分类问题,近年来,研究人员试图利用OpenStreetMap等开源地图数据辅助获取样本集(WAN  T,LU  H,LU Q,LUO N.Classification of High-Resolution Remote-Sensing Image Using OpenStreetMap Information[J].IEEE Geoscience and Remote Sensing Letters,2017,14(12):2305-9.),这类方法能够有效利用地图上的各类地表类型信息,但在应用时也存在一些不足。例如,这类方法首先需要解决地图数据与影像的空间位置配准问题,空间位置偏移往往会导致错误样本的产生;第二个问题,像OpenStreetMap这种开源的地图数据依赖于大众的贡献,数据在不同的区域完整度差异较大,例如,在我国东部沿海城市相对于西部而言,数据完整性更高。这些问题给直接依赖OpenStreetMap数据产生样本集进行分类带来了挑战。
[0004] 另一类可利用的先验知识为历史土地覆盖/利用信息,利用这类信息时往往需要采用迁移学习的思想,如果空间范围一致,历史土地覆盖/利用类型可直接作为属性信息迁移至目标影像(吴田军,骆剑承,夏列,杨海平,沈占锋,胡晓东.迁移学习支持下的遥感影像对象级分类样本自动选择方法[J].测绘学报,2014,(9):908-16.)。如果空间范围不一致,目标域分类时可借鉴源域中的类型特征,但为了提高分类精度,不可避免地需要人工标记一些目标域中的标签。

发明内容

[0006] 本发明采用面向对象的影像分类思想,利用影像分割算法获取高空间分辨率遥感影像对象,结合OSM数据获取目标域样本集,结合源域影像的历史分类图获取源域样本集,使用基于随机森林的迁移学习算法训练分类器,采用该分类器预测目标域影像对象的类别,从而完成目标域影像的分类。
[0007] 本发明的技术方案为一种基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法,包含以下步骤:
[0008] 步骤1:基于OSM数据自动生成目标域样本集,包括以下过程:
[0009] (11)准备研究区的高空间分辨率遥感影像和相同空间范围的OSM数据,选择稳定、明显的控制点,对栅格影像与矢量数据进行空间配准;
[0010] (12)基于OSM数据生成像素级标签,过程如下:
[0011] (12a)对于需要把目标域影像分为n(n>1)种地类的情况,记类型集合为Y={1,2,...,n},根据类型集合Y,从OSM数据中挑选感兴趣的标签,把OSM标签合并为集合Y中的一类或保持原始标签不变,给OSM矢量数据表中新建字段class,class的值为OSM对应集合Y中类别的编号;
[0012] (12b)把矢量OSM数据栅格化,栅格的像素值为OSM矢量表中class字段对应的值,栅格的空间分辨率与目标域影像一致,由此得到目标域影像的像素级标签;
[0013] (13)目标域影像对象生成及特征计算,过程如下:
[0014] (13a)采用影像分割算法获取一系列具有空间同质性的影像对象,这里采用均值漂移算法分割目标域影像:首先,把影像转换至LUV特征空间,转换后每个像素的空间位置与特征对应一个5维向量(x,y,l*,u*,v*),其中,x和y表示空间位置,l*表示图像亮度,u*和v*表示色度;确定核函数及带宽后对LUV图像进行均值漂移滤波;在此基础上,对影像进行聚类并标记区域,从而实现影像分割;
[0015] (13b)计算影像对象的光谱、纹理和几何特征:采用波段计算获得影像对象的归一化植被指数均值与标准差、归一化体指数均值与标准差,采用光谱统计信息获取影像对象各波段的最大值、最小值、均值与标准差,采用影像对象的几何形状获取其边长、长度、宽度、长宽比、对称度、紧致度、形状指数、点数目、主方向,采用灰度共生矩阵计算影像对象的相异性、同质性、对比度、角二阶矩、熵、最大概率等六类纹理信息;
[0016] (14)目标域样本集生成,过程如下:由步骤(12)中栅格化的OSM类别信息和步骤(13)中得到的目标域影像对象,按空间位置统计目标域影像对象中每种类型出现的比例,当占比最大的类型比例超过阈值θ时,该类型会被选为对象的标签,具体规则如下:
[0017]
[0018] 其中,Oi表示目标域影像中第i个对象,Pj表示在对象中出现的第j个类别的比例,Nj表示第j个类别在对象中出现的像素总数, 表示影像对象Oi中的像素总数,θ表示选取标签的阈值,范围在0.8~1.0之间;由此,可获得目标域样本集其中, 表示第i个目标域样本的特征矢量, 表示第i个目标域样本的类别,T表示目标域样本的总数;
[0019] 步骤2:基于源域影像历史分类图自动生成源域样本集,包括以下过程:
[0020] (21)搜集和目标域影像具有相同成像传感器的高空间分辨率遥感影像作为源域影像,源域影像选择时要求与目标域影像空间范围、成像时间较接近,并且有相应的历史影像分类图;
[0021] (22)采用影像分割算法获取一系列具有空间同质性的源域影像对象,分割方法和步骤(13a)一致;
[0022] (23)计算源域影像对象的光谱、纹理和几何特征,方法和步骤(13b)一致;
[0023] (24)结合源域影像历史分类图的类型信息,按照步骤(14)的对象标签赋值方法,给源域影像对象标记类型标签。由此,可获得源域样本集 其中,表示第i个源域样本的特征矢量, 表示第i个源域样本的类别,S表示源域样本的总数。
[0024] 步骤3:将由步骤1中生成的目标域样本集和步骤2中生成的源域样本集组成的混合训练样本集L={Li|(Li∈Ls)OR(Li∈Lt),i=1,2,...,S+T}作为算法的输入,采用基于随机森林的迁移学习算法训练分类器,包括以下过程:
[0025] (31)设集合L中每个样本的权重为w,初始化权重
[0026] (32)设样本集合L'={Li|(Li∈L,i=1,2,...,N'}参与训练分类器,N'的初始值为S+T,将L'中的样本权重归一化:
[0027]
[0028] (33)采用样本集L'训练随机森林模型f(x),假设模型中有h棵树,模型训练流程如下:
[0029] (33a)从样本集L'中有放回的抽取N'个训练样本,随机选取影像对象中s个特征参与分类树的训练,s取特征数目的平方根;
[0030] (33b)采用CART算法生成分类树,分类树生成时没有减枝过程;
[0031] 重复步骤(33a)与(33b),直到h棵树全部生成为止。
[0032] (34)计算随机森林模型f(x)在目标域样本集 上的错误率e:
[0033]
[0034] 其中,Fi在分类正确时记为0,分类错误时记为1;
[0035] (35)更新源域样本的权重:
[0036]
[0037] 其中,R为总循环次数;
[0038] 更新目标域样本的权重:
[0039]
[0040] (36)计算当前循环中随机森林模型f(x)的重要性:
[0041]
[0042] (37)进入步骤(32),直至循环R次结束。
[0043] 步骤4:目标域影像对象类型预测,采用步骤3中获取的影像分类器对目标域影像对象进行预测,每个影像对象的类型预测结果为:
[0044]
[0045] 其中,α(i)表示第i次循环得到的模型重要性,y(i)表示第i次循环得到的模型预测结果;由此获得目标域影像的最终分类结果。
[0046] 本发明的优点是:
[0047] 1)本发明在没有人工标注目标域影像类别的情况下,可以从OSM数据中提取目标域影像对象的标签,采用的标记策略可以减少因空间位置偏移问题引入的错误标签;
[0048] 2)本发明通过挖掘相同传感器影像的历史分类图信息,结合目标域影像样本集,采用迁移学习算法对影像进行分类,降低了分类成本,对应用于大范围高空间分辨率遥感影像分类具有重要意义。附图说明
[0049] 图1是本发明方法的流程图

具体实施方式

[0050] 下面通过实施例,结合附图进一步说明本发明的技术方案。
[0051] 本发明的基于OpenStreetMap的高空间分辨率遥感影像迁移学习分类方法,包括如下步骤:
[0052] 步骤1:基于OSM数据自动生成目标域样本集,包括以下过程:
[0053] (11)准备研究区的高空间分辨率遥感影像和相同空间范围的OSM数据,选择稳定、明显的控制点,如道路的交叉点,对栅格影像与矢量数据进行空间配准;
[0054] (12)基于OSM数据生成像素级标签,过程如下:
[0055] (12a)对于需要把目标域影像分为n(n>1)种地类的情况,记类型集合为Y={1,2,...,n},根据类型集合Y,从OSM数据中挑选感兴趣的标签,把OSM标签合并为集合Y中的一类或保持原始标签不变,例如,Y中有类型为林地,那么可直接从OSM标签的forest类型中搜索;如果Y中有类型为水体,那么需要把OSM中water和river标签合并为水体类型;给OSM矢量数据表中新建字段class,class的值为OSM对应集合Y中类别的编号;
[0056] (12b)把矢量OSM数据栅格化,栅格的像素值为OSM矢量表中class字段对应的值,栅格的空间分辨率与目标域影像一致,由此得到目标域影像的像素级标签;
[0057] (13)目标域影像对象生成及特征计算,过程如下:
[0058] (13a)采用影像分割算法获取一系列具有空间同质性的影像对象,这里采用均值漂移算法分割目标域影像:首先,把影像转换至LUV特征空间,转换后每个像素的空间位置与特征对应一个5维向量(x,y,l*,u*,v*),其中,x和y表示空间位置,l*表示图像亮度,u*和v*表示色度;确定核函数及带宽后对LUV图像进行均值漂移滤波;在此基础上,对影像进行聚类并标记区域,从而实现影像分割;
[0059] (13b)计算影像对象的光谱、纹理和几何特征:采用波段计算获得影像对象的归一化植被指数均值与标准差、归一化水体指数均值与标准差,采用光谱统计信息获取影像对象各波段的最大值、最小值、均值与标准差,采用影像对象的几何形状获取其边长、长度、宽度、长宽比、对称度、紧致度、形状指数、角点数目、主方向,采用灰度共生矩阵计算影像对象的相异性、同质性、对比度、角二阶矩、熵、最大概率等六类纹理信息;
[0060] (14)目标域样本集生成,过程如下:由步骤(12)中栅格化的OSM类别信息和步骤(13)中得到的目标域影像对象,按空间位置统计目标域影像对象中每种类型出现的比例,当占比最大的类型比例超过阈值θ时,该类型会被选为对象的标签,具体规则如下:
[0061]
[0062] 其中,Oi表示目标域影像中第i个对象,Pj表示在对象中出现的第j个类别的比例,Nj表示第j个类别在对象中出现的像素总数, 表示影像对象Oi中的像素总数,θ表示选取标签的阈值,范围在0.8~1.0之间,这里θ设为0.8。由此,可获得目标域样本集其中, 表示第i个目标域样本的特征矢量, 表示第i个目标域样本的类别,T表示目标域样本的总数。
[0063] 步骤2:基于源域影像历史分类图自动生成源域样本集,包括以下过程:
[0064] (21)搜集和目标域影像具有相同成像传感器的高空间分辨率遥感影像作为源域影像,源域影像选择时要求与目标域影像空间范围、成像时间较接近,并且有相应的历史影像分类图;
[0065] (22)采用影像分割算法获取一系列具有空间同质性的源域影像对象,分割方法和步骤(13a)一致;
[0066] (23)计算源域影像对象的光谱、纹理和几何特征,方法和步骤(13b)一致;
[0067] (24)结合源域影像历史分类图的类型信息,按照步骤(14)的对象标签赋值方法,给源域影像对象标记类型标签。由此,可获得源域样本集 其中,表示第i个源域样本的特征矢量, 表示第i个源域样本的类别,S表示源域样本的总数;
[0068] 步骤3:将由步骤1中生成的目标域样本集和步骤2中生成的源域样本集组成的混合训练样本集L={Li|(Li∈Ls)OR(Li∈Lt),i=1,2,...,S+T}作为算法的输入,采用基于随机森林的迁移学习算法训练分类器,包括以下过程:
[0069] (31)设集合L中每个样本的权重为w,初始化权重
[0070] (32)设样本集合L'={Li|(Li∈L,i=1,2,...,N'}参与训练分类器,N'的初始值为S+T,将L'中的样本权重归一化:
[0071]
[0072] (33)采用样本集L'训练随机森林模型f(x),假设模型中有h棵树,这里h设为300,模型训练流程如下:
[0073] (33a)从样本集L'中有放回的抽取N'个训练样本,随机选取影像对象中s个特征参与分类树的训练,s取特征数目的平方根;
[0074] (33b)采用CART算法生成分类树,分类树生成时没有减枝过程;
[0075] 重复步骤(33a)与(33b),直到h棵树全部生成为止。
[0076] (34)计算随机森林模型f(x)在目标域样本集 上的错误率e:
[0077]
[0078] 其中,Fi在分类正确时记为0,分类错误时记为1;
[0079] (35)更新源域样本的权重:
[0080]
[0081] 其中,R为总循环次数,这里R设为20;
[0082] 更新目标域样本的权重:
[0083]
[0084] (36)计算当前循环中随机森林模型f(x)的重要性:
[0085]
[0086] (37)进入步骤(32),直至循环R次结束。
[0087] 步骤4:目标域影像对象类型预测,采用步骤3中获取的影像分类器对目标域影像对象进行预测,每个影像对象的类型预测结果为:
[0088]
[0089] 其中,α(i)表示第i次循环得到的模型重要性,y(i)表示第i次循环得到的模型预测结果;由此获得目标域影像的最终分类结果。
[0090] 以上仅是对本发明实施例的描述,但本发明的保护范围不应当被视为仅限于实施例所陈述的具体形式,本发明的保护范围也及于本领域技术人员根据本发明构思所能够想到的等同技术手段。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈