首页 / 专利库 / 地球科学 / 测绘学 / 地貌 / 无监督式的地貌分类模型训练和地貌图构建方法

无监督式的地貌分类模型训练和地貌图构建方法

阅读:70发布:2020-05-11

专利汇可以提供无监督式的地貌分类模型训练和地貌图构建方法专利检索,专利查询,专利分析的服务。并且本 申请 实施例 适用于 人工智能 技术领域,公开了一种无监督式的 地貌 分类模型训练和地貌图构建方法,其中,方法包括:获取未标注的地貌样本 训练数据 集;使用未标注的地貌样本训练数据集对生成式对抗网络进行对抗训练,以得到生成式对抗网络输出的目标伪地貌数据;其中,目标伪地貌数据为生成式对抗网络的训练效果达到最优时输出的伪地貌数据;使用目标伪地貌数据训练预训练后的地貌分类模型;训练完成后再使用地貌分类模型进行地貌图构建。本申请实施例在地貌分类模型训练过程不用进行人工标注,直接使用未标注的样本数据进行模型训练,节省了人工标注的人 力 成本,降低了地貌建图的成本。,下面是无监督式的地貌分类模型训练和地貌图构建方法专利的具体信息内容。

1.一种无监督式的地貌分类模型训练方法,其特征在于,包括:
获取未标注的地貌样本训练数据集;
使用所述未标注的地貌样本训练数据集对生成式对抗网络进行对抗训练,以得到所述生成式对抗网络输出的目标伪地貌数据;其中,所述目标伪地貌数据为所述生成式对抗网络的训练效果达到最优时输出的伪地貌数据;
使用所述目标伪地貌数据训练预训练后的地貌分类模型。
2.根据权利要求1所述的无监督式的地貌分类模型训练方法,其特征在于,在所述获取未标注的地貌样本训练数据集之前,还包括:
获取未标注的地貌样本数据集;
通过所述预训练后的地貌分类模型,从所述未标注的地貌样本数据集中随机选取目标样本图像,以获得包括所述目标样本图像的所述未标注的地貌样本训练数据集。
3.根据权利要求2所述的无监督式的地貌分类模型训练方法,其特征在于,在所述获取未标注的地貌样本数据集之前,还包括:
获取采集的地貌原始图像;
将所述地貌原始图像切割成图像,以获得包括所述图像块的所述未标注的地貌样本数据集。
4.根据权利要求2所述的无监督式的地貌分类模型训练方法,其特征在于,所述地貌分类模型的预训练过程具体包括:
从未标注的地貌样本数据集中选取训练样本;
在对所述训练样本进行人工标注后,使用人工标注的训练样本预训练地貌分类模型。
5.根据权利要求1至4任一项所述的无监督式的地貌分类模型训练方法,其特征在于,所述生成式对抗网络为包括生成器、判别器、粗粒度隐藏编码网络和细粒度隐藏编码网络的分层表示信息生成式对抗网络;
所述使用所述未标注的地貌样本训练数据集对生成式对抗网络进行对抗训练,以得到所述生成式对抗网络输出的目标伪地貌数据,包括:
将随机噪声、粗粒度类别信息和细粒度类别信息输入所述生成器,获得所述生成器输出的伪地貌数据;
将所述伪地貌数据和所述未标注的地貌样本训练数据集中的样本图像输入至所述判别器,获得所述判别器输出的判别结果;
将所述伪地貌数据输入至所述粗粒度隐藏编码网络,获得所述粗粒度隐藏编码网络输出的粗粒度隐藏编码;
将所述伪地貌数据和所述粗粒度隐藏编码输入至所述细粒度隐藏编码网络,获得所述细粒度隐藏编码网络输出的细粒度隐藏编码;
依此进行迭代训练,直到所述判别结果、所述粗粒度隐藏编码和所述细粒度隐藏编码达到对应的预设效果时,将所述生成器输出的伪地貌数据作为所述目标伪地貌数据。
6.根据权利要求5所述的无监督式的地貌分类模型训练方法,其特征在于,所述分层表示信息生成式对抗网络的目标函数公式为:
其中,G为生成器,D为判别器,Qc为粗粒度隐藏编码网络,Qs为细粒度隐藏编码网络,c为粗粒度类别信息,s为细粒度类别信息,L为互信息的变分下界,Ls(G,Qs)为用于作为指导模型学习分层细粒度表示的损失项。
7.一种地貌图构建方法,其特征在于,包括:
获取待处理地貌图像;
根据训练完成的地貌分类模型和所述待处理地貌图像,得到所述待处理地貌图像的地貌分类结果;其中,所述地貌分类模型为通过上述权利要求1至6任一项所述的无监督式的地貌分类模型训练方法训练得到的模型;
根据所述地貌分类结果构建地貌图。
8.根据权利要求7所述的地貌图构建方法,其特征在于,所述根据训练完成的地貌分类模型和所述待处理地貌图像,得到所述待处理地貌图像的地貌分类结果,包括:
将所述待处理地貌图像切割成图像块;
将所述图像块输入至所述地貌分类模型,得出各个所述图像块的地貌分类结果。
9.根据权利要求8所述的地貌图构建方法,其特征在于,所述根据所述地貌分类结果构建地貌图,包括:
按照各个所述图像块的所属地貌类别,使用与所述地貌分类结果对应的预设标签对各个所述图像块进行标注,得到标注后的图像块;
按照各个图像块在所述待处理地貌图像中的位置,将各个图像块进行拼接,以构建出所述地貌图。
10.一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至6和/或7至9任一项所述的方法。
11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6和/或7至9任一项所述的方法。

说明书全文

无监督式的地貌分类模型训练和地貌图构建方法

技术领域

[0001] 本申请属于人工智能技术领域,尤其涉及一种无监督式的地貌分类模型训练方法和地貌图构建方法。

背景技术

[0002] 地貌图是指表示各种不同地貌标志的地图。其可以反映各种不同地貌的外部形态特征及成因、年代、发展过程、发育程度以及相互关系。
[0003] 目前,采用卷积神经网络模型进行地貌图构建时,需要使用大量的地貌样本图像去训练相应的模型,且训练所采用的地貌样本图像均需要进行人工标注。大量的人工标注地貌样本图像需要耗费大量的时间及人成本,导致现有的地貌图构建的成本较高。发明内容
[0004] 本申请实施例提供一种无监督式的地貌分类模型训练和地貌图构建方法,以解决现有地貌图构建成本较高问题。
[0005] 第一方面,本申请实施例提供了一种无监督式的地貌分类模型训练方法,包括:
[0006] 获取未标注的地貌样本训练数据集;
[0007] 使用所述未标注的地貌样本训练数据集对生成式对抗网络进行对抗训练,以得到所述生成式对抗网络输出的目标伪地貌数据;其中,所述目标伪地貌数据为所述生成式对抗网络的训练效果达到最优时输出的伪地貌数据;
[0008] 使用所述目标伪地貌数据训练预训练后的地貌分类模型。
[0009] 结合第一方面,在一种可能的实现方式中,在所述获取未标注的地貌样本训练数据集之前,还包括:
[0010] 获取未标注的地貌样本数据集;
[0011] 通过所述预训练后的地貌分类模型,从所述未标注的地貌样本数据集中随机选取目标样本图像,以获得包括所述目标样本图像的所述未标注的地貌样本训练数据集。
[0012] 结合第一方面,在一种可能的实现方式中,在所述获取未标注的地貌样本数据集之前,还包括:
[0013] 获取采集的地貌原始图像;
[0014] 将所述地貌原始图像切割成图像,以获得包括所述图像块的所述未标注的地貌样本数据集。
[0015] 结合第一方面,在一种可能的实现方式中,其特征在于,所述地貌分类模型的预训练过程具体包括:
[0016] 从未标注的地貌样本数据集中选取训练样本;
[0017] 在对所述训练样本进行人工标注后,使用人工标注的训练样本预训练地貌分类模型。
[0018] 结合第一方面,在一种可能的实现方式中,所述生成式对抗网络为包括生成器、判别器、粗粒度隐藏编码网络和细粒度隐藏编码网络的分层表示信息生成式对抗网络;
[0019] 所述使用所述未标注的地貌样本训练数据集对生成式对抗网络进行对抗训练,以得到所述生成式对抗网络输出的目标伪地貌数据,包括:
[0020] 将随机噪声、粗粒度类别信息和细粒度类别信息输入所述生成器,获得所述生成器输出的伪地貌数据;
[0021] 将所述伪地貌数据和所述未标注的地貌样本训练数据集中的样本图像输入至所述判别器,获得所述判别器输出的判别结果;
[0022] 将所述伪地貌数据输入至所述粗粒度隐藏编码网络,获得所述粗粒度隐藏编码网络输出的粗粒度隐藏编码;
[0023] 将所述伪地貌数据和所述粗粒度隐藏编码输入至所述细粒度隐藏编码网络,获得所述细粒度隐藏编码网络输出的细粒度隐藏编码;
[0024] 依此进行迭代训练,直到所述判别结果、所述粗粒度隐藏编码和所述细粒度隐藏编码达到对应的预设效果,将所述生成器输出的伪地貌数据作为所述目标伪地貌数据。
[0025] 结合第一方面,在一种可能的实现方式中,所述分层表示信息生成式对抗网络的目标函数公式为:
[0026]
[0027] 其中,G为生成器,D为判别器,Qc为粗粒度隐藏编码网络,Qs为细粒度隐藏编码网络,c为粗粒度类别信息,s为细粒度类别信息,,L为互信息的变分下界,Ls(G,Qs)为用于作为指导模型学习分层细粒度表示的损失项。
[0028] 第二方面,本申请实施例提供一种地貌图构建方法,包括:
[0029] 获取待处理地貌图像;
[0030] 根据训练完成的地貌分类模型和所述待处理地貌图像,得到所述待处理地貌图像的地貌分类结果;其中,所述地貌分类模型为通过上述第一方面任一项所述的无监督式的地貌分类模型训练方法训练得到的模型;
[0031] 根据所述地貌分类结果构建地貌图。
[0032] 结合第二方面,在一种可能的实现方式中,所述根据训练完成的地貌分类模型和所述待处理地貌图像,得到所述待处理地貌图像的地貌分类结果,包括:
[0033] 将所述待处理地貌图像切割成图像块;
[0034] 将所述图像块输入至所述地貌分类模型,得出各个所述图像块的地貌分类结果。
[0035] 结合第二方面,在一种可能的实现方式中,所述根据所述地貌分类结果构建地貌图,包括:
[0036] 按照各个所述图像块的所属地貌类别,使用与所述地貌分类结果对应的预设标签对各个所述图像块进行标注,得到标注后的图像块;
[0037] 按照各个图像块在所述待处理地貌图像中的位置,将各个图像块进行拼接,以构建出所述地貌图。
[0038] 第三方面,本申请实施例提供一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面和/或第二方面任一项所述的方法。
[0039] 第四方面,本申请实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如上述第一方面和/或第二方面任一项所述的方法。
[0040] 第五方面,本申请实施例提供一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行如上述第一方面和/或第二方面任一项所述的方法。
[0041] 本申请实施例基于未标注的地貌样本训练数据集,通过生成式对抗网络生成大量的目标伪地貌数据,使用目标伪地貌数据训练预训练后的地貌分类模型,即在地貌分类模型训练过程不用进行人工标注,直接使用未标注的样本数据进行模型训练,节省了时间及人工标注成本,从而降低了地貌建图的成本。附图说明
[0042] 为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0043] 图1为本申请实施例提供的一种无监督式的地貌分类模型训练方法的流程示意框图
[0044] 图2为本申请实施例提供的未标注的地貌样本训练数据集的生成过程的流程示意框图;
[0045] 图3为本申请实施例提供的分层表示信息生成式对抗网络的对抗训练过程的流程示意框图;
[0046] 图4为本申请实施例提供的分层表示信息生成式对抗网络模型框架示意图;
[0047] 图5为本申请实施例提供的一种地貌图构建方法的流程示意框图;
[0048] 图6为本申请实施例提供的地貌图构建方法的另一种流程示意框图;
[0049] 图7为本申请实施例提供的地貌分类模型训练装置的结构框图;
[0050] 图8为本申请实施例提供的地貌图构建装置的结构框图;
[0051] 图9为本申请实施例提供的终端设备的结构示意图。

具体实施方式

[0052] 以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。
[0053] 本申请实施例提供的技术方案应用于地貌图构建,地貌图构建过程可以大体分为地貌分类模型训练阶段和地貌图构建阶段。
[0054] 在地貌分类模型训练阶段中,将未标注的地貌样本训练数据集输入至生成式对抗网络,以生成大量的目标伪地貌数据,将该目标伪地貌数据作为模型的训练数据,来训练预训练后的地貌分类模型。在模型训练过程中不用进行人工标注,可以节省人力成本,从而降低地貌建图的成本。
[0055] 在地貌分类模型训练完成后,可以将待处理的地貌图输入至地貌分类模型中,以获得该图像的地貌分类结果,然后再根据地貌分类结果构建出所需的地貌图。
[0056] 值得指出的是,本申请实施例提供的地貌分类模型训练和地貌图构建方法均是无监督式的,即在地貌分类模型训练过程中,不需要引入监督者,不需要监督者的参与。监督学习的方式体现在:通过预训练的地貌分类模型从未标注的地貌样本训练数据集中随机选取出样本图像,将选取出的样本图像作为用于进行对抗训练的数据集;再使用该数据集进行对抗训练,生成大量的伪地貌数据;最后使用生成的伪地貌数据对预训练后的地貌分类模型进行训练。其中,在对抗训练过程中,按照指定的粗粒度类别和细粒度类别生成大量的伪地貌数据,从而使得生成的伪地貌数据带有伪标签。下面将通过具体实施例对本申请实施例提供的技术方案进行介绍。
[0057] 请参见图1,为本申请实施例提供的一种无监督式的地貌分类模型训练方法的流程示意框图,该方法可以包括以下步骤:
[0058] 步骤S101、获取未标注的地貌样本训练数据集。
[0059] 需要说明的是,上述未标注的地貌样本训练数据集包括多种地貌类别的地貌样本图像,且每一种地貌类别可能有多张样本图像。例如,每一种地貌类别包括10张样本图像。该未标注的地貌样本训练数据集内的地貌样本图像是未标注的图像。
[0060] 值得指出的是,上述未标注的地貌样本训练数据集中的地貌样本图像可以是整张图像,也可以是图像块。按照预设尺寸将一整张地貌样本图像进行切割,可以获得多个大小相同的图像块。
[0061] 在一些实施例中,可以通过预先训练好的地貌分类模型从未标注的地貌样本数据集中随机选取出相应的样本图像,形成上述未标注的地貌样本训练数据集。参见图2示出的未标注的地貌样本训练数据集的生成过程的流程示意框图,在上述获取未标注的地貌样本训练数据集之前,上述方法还可以包括:
[0062] 步骤S201、获取未标注的地貌样本数据集。
[0063] 需要说明的是,上述未标注的地貌样本数据集包括多张未标注的地貌样本图像,该地貌样本图像可以是图像块,该图像块可以通过切割地貌原始样本图像得到。而地貌原始样本图像可以是无人机采集的地貌图像。且该未标注的地貌样本数据集包括多个地貌类别的图像块。
[0064] 在一些实施例中,在上述获取未标注的地貌样本数据集之前,上述模型训练方法还可以包括:获取采集的地貌原始图像;将地貌原始图像切割成图像块,以获得包括图像块的未标注的地貌样本数据集。
[0065] 其中,上述地貌原始图像可以是无人机采集的地貌图像。按照预设尺寸对采集的地貌原始图像进行切割,获得相应的图像块;然后基于切割得到的图像块组成上述未标注的地貌样本数据集。例如,按照64*64的大小,将一幅地貌原始图像切割成多个64*64大小的图像块。
[0066] 步骤S202、通过预训练后的地貌分类模型,从未标注的地貌样本数据集中随机选取目标样本图像,以获得包括目标样本图像的未标注的地貌样本训练数据集。
[0067] 需要说明的是,上述地貌分类模型可以包括但不限于卷积层、池化层、Flatten层、激活函数层、全连接层和softmax函数层,各层的连接关系和对应的作用已被本领域技术人员所熟知,在此不再赘述。
[0068] 该地貌分类模型是预训练好的,其中,当迭代训练地貌分类模型预定次数时,则可以认为预训练好该地貌分类模型。例如,可以设定迭代训练次数大于50次时,认为地貌分类模型预训练完成。预训练是指使用少量人工标注的地貌样本图像对建立的地貌分类模型进行初步训练。预训练的过程具体包括:从未标注的地貌样本数据集中人工选取训练样本;在对训练样本进行人工标注后,使用人工标注的训练样本预训练预先构建的地貌分类模型。
[0069] 具体地,从未标注的地貌样本图像数据集中人工选取少量的样本图像,然后对选取的地貌样本图像进行人工标注,然后再使用少量人工标注后的地貌样本图像预训练上述地貌分类模型。上述“少量的样本图像”可以根据实际需要进行定义。在本实施例中,“少量的样本图像”可以是指每种地貌类别选取10条地貌样本图像数据。
[0070] 在预训练好地貌分类模型之后,可以使用地貌分类模型从未标注的地貌样本数据集中随机选取出的目标样本图像。具体应用中,可以设定选取的目标样本图像数量和地貌类别。
[0071] 可以看出,上述通过预训练好的地貌分类模型从未标注的地貌样本数据集中随机选取出目标样本图像,以形成上述未标注的地貌样本训练数据集的过程是一个无监督的学习过程,通过无监督的学习过程选取带有伪标签的地貌样本数据来训练地貌分类模型,可以减少人为参与,降低人力成本。
[0072] 步骤S102、使用未标注的地貌样本训练数据集对生成式对抗网络进行对抗训练,得到生成式对抗网络输出的目标伪地貌数据;其中,目标伪地貌数据为生成式对抗网络的训练效果达到最优时输出的伪地貌数据。
[0073] 需要说明的是,上述生成式对抗网络可以是分层表示信息生成式对抗网络,该分层表示信息生成式对抗网络可以包括生成器、判别器、粗粒度隐藏编码网络和细粒度隐藏编码网络。当生成式对抗网络趋于收敛时,可以认为生成式对抗网络的训练效果达到最优。
[0074] 其中,判别器是用于让生成器所生成的伪地貌数据的分布与真实地貌数据的分布接近。粗粒度隐藏编码网络和细粒度隐藏编码网络是由卷积层和全连接层组成的网络。粗粒度隐藏编码网络用于让生成器所生成的伪地貌数据的粗粒度语义表示接近指定的粗粒度。细粒度隐藏编码网络用于让生成器所生成的伪地貌数据的细粒度语义表示接近指定的细粒度。
[0075] 在一些实施例中,参见图3示出的分层表示信息生成式对抗网络的对抗训练过程的流程示意框图,上述使用未标注的地貌样本训练数据集对生成式对抗网络进行对抗训练,得到生成式对抗网络输出的目标伪地貌数据的具体过程可以包括:
[0076] 步骤S301、将随机噪声、粗粒度类别信息和细粒度类别信息输入生成器,获得生成器输出的伪地貌数据。
[0077] 需要说明的是,上述随机噪声可为高斯随机噪声,粗粒度类别信息和细粒度类别信息均是指地貌类别信息。粗粒度类别信息和细粒度类别是指表征样本图像的所属地貌类别的信息。其中,粗粒度类别包括但不限于草地、纹理地和泥地。与粗粒度类别相对应,细粒度类别是对粗粒度类别的进一步表示,例如,粗粒度类别为草地,对应的细粒度类别包括秃草地、稀疏草地和浓密草地等。
[0078] 值得指出的是,上述粗粒度类别信息和细粒度信息不是相互独立的,即在不同粗粒度的表示下,细粒度的表示不一样。例如,草地的细粒度类别有3种,纹理地的细粒度表示可能只有2种。且输入至生成器的粗粒度和细粒度是人工指定的。
[0079] 生成器根据输入的随机噪声、粗粒度类别信息和细粒度类别信息生成对应的伪地貌数据。
[0080] 步骤S302、将伪地貌数据和未标注的地貌样本训练数据集中的样本图像输入至判别器,获得判别器输出的判别结果。
[0081] 其中,生成器可以生成对应的伪地貌数据,判别器可以判断输入的伪地貌数据和真实地貌数据的区别。
[0082] 步骤S303、将伪地貌数据输入至粗粒度隐藏编码网络,获得粗粒度隐藏编码网络输出的粗粒度隐藏编码。
[0083] 步骤S304、将伪地貌数据和粗粒度隐藏编码输入至细粒度隐藏编码网络,获得细粒度隐藏编码网络输出的细粒度隐藏编码。
[0084] 步骤S305、依此进行迭代训练,直到判别结果、粗粒度隐藏编码和细粒度隐藏编码达到对应的预设效果,将生成器输出的伪地貌数据作为目标伪地貌数据。
[0085] 需要说明的是,上述粗粒度隐藏编码为与输入的伪地貌数据对应的粗粒度类别信息,细粒度隐藏编码为与输入的伪地貌数据对应的细粒度类别信息。当判别器无法区分真实地貌数据和伪地貌数据,且粗粒度隐藏编码对应的变分下界Lc趋近于零,细粒度隐藏编码对应的变分下界Ls趋近于零,认为训练效果达到最优,即达到上述预设效果,完成对抗训练,将此时生成器输出的伪地貌数据作为上述目标伪地貌数据。
[0086] 参见图4示出的分层表示信息生成式对抗网络模型框架示意图,构建分层表示信息生成式对抗网络模型提出隐藏编码C,C=[c,s],c表示粗粒度的类别,如草地、水泥地和纹理地等,s表示细粒度的类别如草地下的秃草地、稀疏草地和浓密草地等。
[0087] 分层表示信息生成式对抗网络模型提出的潜变量的表示不是独立的,即c和s两个隐藏编码的潜在变量不是独立的,P(c,s)=P(c)P(s|c)。也就是说在不同粗粒度的表示下,细粒度的表示不一样;z表示随机噪音,c表示粗粒度类别的隐藏编码,s表示细粒度类别的隐藏编码,生成器为G(z,(c,s))。互信息越大代表生成的图像块与细粒度类别越相关。互信息为I[(c,s);G(z,(c,s))],计算公式为:I[(c,s);G(z,c,s)]=H[(c,s)-H[(c,s)|G(z,c,s)]=H[(c,s)]-H[c|G(z,c,s)]-H[s|G(z,c,s)]
[0088] 在展开公式H[c|G(z,c,s)]时需引入额外的关键变量进行二次采样,具体引用原理是:假设f(x,y), 表示是X,Y的联合概率密度函数fX|Y和fY分别表示条件密度函数和边缘密度函数,在f(x,y)=fX|Y(x|y)fY(y)的条件下y可以看作是一个关键变量,通过序列采样重复先从Y~fY中采样Y,之后从X~fX|Y中采样X,能够得到一组随机的f采样序列。此外由于后验概率P(c|x)很难直接去计算,需要引入额外的分布Qc(c|x)来去近似计算P(c|x),至此H[c|G(z,c,s)]项展开如下所示:
[0089]
[0090] 进一步展开公式H[s|G(z,c,s)],这一项表示的是指定粗粒度和细粒度类别表示与其生成图像联合熵。目的是尽可能最小化这一项来减少不确定性,达到生成的图像与指导的粗、细粒度有很大的相关性。数学上在引入负号后,即目标就变成了最大化这一项,同上依旧需要引入额外的分布QS(s'|x,c')去近似P(s|x,c'),同时利用序列采样的方法,c作为关键变量,进行二次采样,公式展开如下所示:
[0091]
[0092]
[0093] 最终,在生成器和判别器中,生成式对抗网络目标函数公式为:
[0094]
[0095] 其中,G为生成器,D为判别器,Qc为粗粒度隐藏编码网络,Qs为细粒度隐藏编码网络,c为粗粒度类别信息,s为细粒度类别信息,Ls(G,Qs)为用于作为指导模型学习分层细粒度表示的损失项。惩罚项即损失项.,是函数期望的结果与实际的结果之间的差值。
[0096] 可以看出,通过分层表示信息生成式对抗网络,可以在学习粗粒度的类别表示下进一步学习不同的细粒度表示,生成质量较好的模型训练数据,以提高后续地貌建图的效果。
[0097] 步骤S103、使用目标伪地貌数据训练预训练后的地貌分类模型。
[0098] 可以理解的是,上述预训练后的地貌分类模型的预训练过程可以参见上文,在此不再赘述。目标伪地貌数据为训练完成的生成式对抗网络生成的带有不同伪标签的样本图像。
[0099] 具体地,输入带有伪标签的样本图像,softmax函数层预测输入样本图像的地貌类别,然后判断预测的地貌类别与输入的样本图像地貌类别是否一致。依此迭代训练多次,直到预测输入样本图像的地貌类别的准确率大于等于90%时,可以认为训练好预训练后的地貌分类模型,即训练完成。其中而准确率可通过公式 计算得到,其中N为总的测试样本数目, Mij表示类别为i的测试样本被分类到类别j的个
数。
[0100] softmax函数层先得到输入的样本图像属于不同类别的概率值,再最终预测输入的样本图像属于哪种类别。具体根据公式 得到输入的图像块属于不同类别的概率值,而θ为模型参数,x为输入的图像块,j表示总的类别数目,i表示输出的第几个类别;得到输入的图像块属于不同类别的概率值后,再根据公式
预测该图像块属于哪种地貌类别,x代表预
测集D中的图片,c代表具体地类别,C代表类别总数,pc(x)代表图片x属于类别c的概率值。
通过输入的图像块属于哪个地貌类别的概率最大来判断具体是属于哪个类别的地貌。例如,softmax函数层得到当前输入的样本图像属于各类别的概率值分别为草地0.5,水泥地
0.3,纹理地0.2,最终预测输入的样本图像属于草地数据。
[0101] 值得指出的是,上述目标伪地貌数据包括的样本图像可以是一整张地貌图像,也可以是图像块。当使用图像块训练时,后续地貌建图时也需要将图像切割成图像块进行分类。
[0102] 需要说明的是,预训练过程可以看作是一个初步训练过程,所使用的训练样本数据较少,预训练后的地貌分类模型的分类精度较低。而上述使用生成的目标伪地貌数据对预训练后的地貌分类模型训练的过程,可以看作是在初步训练后再进一步的训练,所使用的训练样本数更多,训练后的地貌分类模型的分类精度较高。
[0103] 本申请实施例基于未标注的地貌样本训练数据集,通过生成式对抗网络生成大量的目标伪地貌数据,使用目标伪地貌数据训练地貌分类模型,即在地貌分类模型训练过程不用进行人工标注,直接使用未标注的样本数据进行模型训练,从而降低了地貌建图的成本。
[0104] 训练完地貌分类模型之后,则使用训练好的地貌分类模型对采集的地貌图像进行分类,然后再进行地貌建图。下面将对如何使用训练好的地貌分类模型进行地貌建图进行介绍。
[0105] 请参见图5,为本申请实施例提供的一种地貌图构建方法的流程示意框图,该方法可以包括以下步骤:
[0106] 步骤S501、获取待处理地貌图像。
[0107] 可以理解的是,上述待处理地貌图像可以是由无人机采集的地貌原始图像,也可以是其它的待处理地貌图像。
[0108] 步骤S502、根据训练完成的地貌分类模型和待处理地貌图像,得到待处理地貌图像的地貌分类结果;其中,地貌分类模型为通过上文任一项的地貌分类模型训练方法训练得到的模型。
[0109] 可以理解的是,上述地貌分类模型为上文的地貌分类模型训练方法中的地貌分类模型。即该地貌分类模型是使用上文介绍的任一项地貌分类模型训练方法进行训练得到的,关于模型训练的相关介绍请参见上文,在此不再赘述。
[0110] 训练好的地貌分类模型的输入为地貌图像,输出为地貌图像的地貌分类结果。该地貌分类结果可以表征地貌图像对应哪种地貌类别。例如,输入的地貌图像为无人机拍摄的草地图像时,则输出的地貌分类结果为草地类别。
[0111] 需要说明的是,上述地貌分类模型的输入可以是整张待处理地貌图像,也可以是将整张待处理地貌图像切割得到图像块,即将图像块输入至地貌分类模型。相较而言,整张待处理地貌图像可能没有整张图片的特征,或者,很难确定代表整张图片的特征,导致通过整张图片构建地貌图的效果较差。优选地,将待处理地貌图像切割成多个图像块之后,通过图像块进行地貌建图。
[0112] 步骤S503、根据地貌分类结果构建地貌图。
[0113] 需要说明的是,当地貌分类模型的输入为图像块时,输出的是每个图像块的分类结果。在得出每个图像块的地貌分类结果之后,再根据地貌分类结果重新拼接在一起,形成完整的地貌图。
[0114] 下面将对通过图像块进行地貌建图的过程进行介绍。
[0115] 参见图6示出的地貌图构建方法的另一种流程示意框图,该方法可以包括以下步骤:
[0116] 步骤S601、获取待处理地貌图像。
[0117] 步骤S602、将待处理地貌图像切割成图像块。
[0118] 具体地,按照预设尺寸将待处理地貌图像切割成多个大小一样的图像块。例如,将待处理地貌图像切割成多个64*64的图像块。
[0119] 步骤S603、将图像块输入至地貌分类模型,得出各个图像块的地貌分类结果。
[0120] 可以理解的是,每个图像块可能对应不同的地貌,例如,一个图像块为草地,一个图像块为纹理地,一个图像块为水泥地等。将图像块输入至地貌分类模型,则可以得出每个图像块的地貌分类结果。
[0121] 步骤S604、按照各个图像块的所属地貌类别,使用与地貌分类结果对应的预设标签对各个图像块进行标注,得到标注后的图像块。
[0122] 需要说明的是,使用预设标签对图像块进行标注是为了便于区分不同类别的地貌。例如,第一种地貌使用第一种标签,第二种地貌使用第二种标签。预先设定地貌类别和标签的对应关系,后续直接使用对应的标签进行标注。
[0123] 上述预设标签可以是任意记号,只要能区分不同类别的地貌即可。例如,上述预设标签为颜色,按照预设的颜色进行标注,即通过不同的颜色以区分不同类别的地貌。具体地,草地对应绿色,水泥地对应蓝色,纹理地对应橙色,当某个图像块的地貌分类结果为草地,则用绿色填充该图像块,当地貌分类结果为水泥地,则用蓝色填充该图像块。
[0124] 步骤S605、按照各个图像块在待处理地貌图像中的位置,将各个图像块进行拼接,以构建出地貌图。
[0125] 具体地,在标注图像块之后,可以将标注后的图像块重新拼接在一起。例如,当一张待处理地貌图像被切割成四个图像块,且这四个图像块在原图像中的位置分别为左上、右上角、左下角和右下角;通过地貌分类模型分别得出这四个图像块的地貌分类结果,并使用对应的标签进行标注之后,按照这些图像块在原图像的所处位置拼接在一起,具体地,将原本位于左上角的图像块放在左上角,依此拼接在一起,形成完整的地貌图。拼接形成完整的地貌图之后,可以通过不同的标签得知对应区域的地貌类别。
[0126] 本申请实施例通过无监督的学习方式选取地貌训练样本,对地貌分类模型进行训练,不用进行人工标注,减少了人为的参与。其中,无监督的学习方式可以解释为:通过分层表示信息生成式对抗网络,在学习粗粒度的类别表示下进一步学习不同的细粒度表示,生成质量较好的带有伪标签的训练数据,替代人工标注数据,从而达到接受范围内的地貌建图的效果。
[0127] 应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本申请实施例的实施过程构成任何限定。
[0128] 对应于上文实施例所述的地貌分类模型训练方法,下面将对相应的地貌分类模型训练装置进行介绍。
[0129] 参见图7示出的本申请实施例提供的地貌分类模型训练装置的结构框图,该装置可以包括:
[0130] 第一获取模块71,用于获取未标注的地貌样本训练数据集;
[0131] 对抗训练模块72,用于使用未标注的地貌样本训练数据集对生成式对抗网络进行对抗训练,得到生成式对抗网络输出的目标伪地貌数据;其中,目标伪地貌数据为生成式对抗网络的训练效果达到最优时输出的伪地貌数据;
[0132] 训练模块73,用于使用目标伪地貌数据训练预训练后的地貌分类模型。
[0133] 在一种可能的实现方式中,上述装置还可以包括:
[0134] 第二获取模块,用于获取未标注的地貌样本数据集;
[0135] 随机选取模块,用于通过预训练后的地貌分类模型,从未标注的地貌样本数据集中随机选取目标样本图像,以获得包括目标样本图像的未标注的地貌样本训练数据集。
[0136] 在一种可能的实现方式中,上述装置还可以包括:
[0137] 第三获取模块,用于获取采集的地貌原始图像;
[0138] 切割模块,用于将地貌原始图像切割成图像块,以获得包括图像块的未标注的地貌样本数据集。
[0139] 在一种可能的实现方式中,其特征在于,上述装置还包括预训练模块,具体用于:
[0140] 从未标注的地貌样本数据集中选取训练样本;
[0141] 在对训练样本进行人工标注后,使用人工标注的训练样本预训练预先构建的地貌分类模型。
[0142] 在一种可能的实现方式中,生成式对抗网络为包括生成器、判别器、粗粒度隐藏编码网络和细粒度隐藏编码网络的分层表示信息生成式对抗网络;
[0143] 上述对抗训练模块具体用于:
[0144] 将随机噪声、粗粒度类别信息和细粒度类别信息输入生成器,获得生成器输出的伪地貌数据;
[0145] 将伪地貌数据和未标注的地貌样本训练数据集中的样本图像输入至判别器,获得判别器输出的判别结果;
[0146] 将伪地貌数据输入至粗粒度隐藏编码网络,获得粗粒度隐藏编码网络输出的粗粒度隐藏编码;
[0147] 将伪地貌数据和粗粒度隐藏编码输入至细粒度隐藏编码网络,获得细粒度隐藏编码网络输出的细粒度隐藏编码;
[0148] 依此进行迭代训练,直到判别结果、粗粒度隐藏编码和细粒度隐藏编码达到对应的预设效果,将生成器输出的伪地貌数据作为目标伪地貌数据。
[0149] 在一种可能的实现方式中,分层表示信息生成式对抗网络的目标函数公式为:
[0150]
[0151] 其中,G为生成器,D为判别器,Qc为粗粒度隐藏编码网络,Qs为细粒度隐藏编码网络,c为粗粒度类别信息,s为细粒度类别信息,Ls(G,Qs)为用于作为指导模型学习分层细粒度表示的损失项。
[0152] 需要说明的是,地貌分类模型训练装置与上文的地貌分类模型训练方法一一对应,相关介绍请参见上文相应内容,在此不再赘述。
[0153] 对应于上文实施例所述的地貌图构建方法,下面将对相应的地貌图构建装置进行介绍。
[0154] 参见图8示出的本申请实施例提供的地貌图构建装置的结构框图,该装置可以包括:
[0155] 图像获取模块81,用于获取待处理地貌图像;
[0156] 分类模块82,用于根据训练完成的地貌分类模型和待处理地貌图像,得到待处理地貌图像的地貌分类结果;其中,地貌分类模型为通过上述第一方面任一项的地貌分类模型训练方法训练得到的模型;
[0157] 构建模块83,用于根据地貌分类结果构建地貌图。
[0158] 在一种可能的实现方式中,上述分类模块具体用于:
[0159] 将待处理地貌图像切割成图像块;
[0160] 将图像块输入至地貌分类模型,得出各个图像块的地貌分类结果。
[0161] 在一种可能的实现方式中,上述构建模块具体用于:
[0162] 按照各个图像块的所属地貌类别,使用与地貌分类结果对应的预设标签对各个图像块进行标注,得到标注后的图像块;
[0163] 按照各个图像块在待处理地貌图像中的位置,将各个图像块进行拼接,以构建出地貌图。
[0164] 需要说明的是,地貌图构建装置与上文的地貌图构建方法一一对应,相关介绍请参见上文相应内容,在此不再赘述。
[0165] 需要说明的是,上述装置/模块之间的信息交互、执行过程等内容,由于与本申请方法实施例基于同一构思,其具体功能及带来的技术效果,具体可参见方法实施例部分,此处不再赘述。
[0166] 图9为本申请一实施例提供的终端设备的结构示意图。如图9所示,该实施例的终端设备9包括:至少一个处理器90、存储器91以及存储在所述存储器91中并可在所述至少一个处理器90上运行的计算机程序92,所述处理器90执行所述计算机程序92时实现上述任意各个地貌分类模型训练方法和/或地貌图构建方法实施例中的步骤。
[0167] 所述终端设备9可以是桌上型计算机、笔记本、掌上电脑及服务器等计算设备。该终端设备可包括,但不仅限于,处理器90、存储器91。本领域技术人员可以理解,图9仅仅是终端设备9的举例,并不构成对终端设备9的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如还可以包括输入输出设备、网络接入设备等。
[0168] 所称处理器90可以是中央处理单元(Central Processing Unit,CPU),该处理器90还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0169] 所述存储器91在一些实施例中可以是所述终端设备9的内部存储单元,例如终端设备9的硬盘或内存。所述存储器91在另一些实施例中也可以是所述终端设备9的外部存储设备,例如所述终端设备9上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器91还可以既包括所述终端设备9的内部存储单元也包括外部存储设备。所述存储器91用于存储操作系统、应用程序、引导装载程序(BootLoader)、数据以及其他程序等,例如所述计算机程序的程序代码等。所述存储器91还可以用于暂时地存储已经输出或者将要输出的数据。
[0170] 本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述任意各个地貌分类模型训练方法和/或地貌图构建方法实施例中的步骤。
[0171] 本申请实施例提供一种计算机程序产品,当计算机程序产品在终端设备上运行时,使得终端设备执行时实现上述任意各个地貌分类模型训练方法和/或地貌图构建方法实施例中的步骤。
[0172] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0173] 本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
[0174] 以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈