首页 / 专利库 / 银行与财务事项 / 交易对手风险 / 一种训练方法、特征提取方法、装置及电子设备

一种训练方法、特征提取方法、装置及电子设备

阅读:217发布:2020-05-08

专利汇可以提供一种训练方法、特征提取方法、装置及电子设备专利检索,专利查询,专利分析的服务。并且本 说明书 实施例 提供一种训练方法、特征提取方法、装置及 电子 设备。训练方法包括:将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,第一短期特征集中的各短期特征对应有相同的第一时间粒度。将第二短期特征集按照时间顺序组合成长期特征集,其中,长期特征集中的各长期特征对应有相同的第二时间粒度,第二时间粒度大于第一时间粒度。将长期特征集输入至 卷积神经网络 ,得到目标对象对应所述目标分类下的目标特征集。将目标特征集输入至用于识别目标分类的分类模型,以基于所述分类模型针对样本对象的识别结果,对循环神经网络和卷积神经网络进行训练。,下面是一种训练方法、特征提取方法、装置及电子设备专利的具体信息内容。

1.一种训练方法,包括:
将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
2.根据权利要求1所述的方法,
将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练,包括:
将所述目标特征集作为用于识别所述目标分类的分类模型的输入,将所述样本对象的标签作为所述分类模型的输出,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练,其中,所述样本对象的标签用于指示所述样本用对象是否符合所述目标分类。
3.根据权利要求1所述的方法,还包括:
所述循环神经网络包括以下至少一者:
长短期记忆网络、控循环单元网络以及自注意机制网络。
4.根据权利要求1所述的方法,
所述卷积神经网络包括:文本卷进循环网络。
5.根据权利要求1-4中任一项所述的方法,
所述卷积神经网络包括:
卷积层,对长期特征集进行卷积处理,得到卷积层输出特征集;
池化层,基于最大值池化算法和/或均值池化算法,对所述卷积层输出特征集进行池化处理,得到池化层输出特征集;
全连接层,将池化层输出特征集转换为单一维度的目标特征集。
6.根据权利要求1-4中任一项所述的方法,
所述目标分类为金融险,所述第一短期特征集包括以下至少一种特征维度的短期特征:
所述样本对象在各第一时间粒度所对应的交易总金额、交易总笔数以及交易对手总数。
7.一种特征提取方法,包括:
将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
8.一种神经网络的训练装置,包括:
第一处理模,将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
第一组合模块,将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
第二处理模块,将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
训练模块,将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
9.一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
11.一种特征提取装置,包括:
第三处理模块,将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
第二组合模块,将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
第四处理模块,将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
12.一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
13.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。

说明书全文

一种训练方法、特征提取方法、装置及电子设备

技术领域

[0001] 本文件涉及数据处理技术领域,尤其涉及一种训练方法、特征提取方法、装置及电子设备。

背景技术

[0002] 随着人工智能的发展,越来越多的场景会应用到由神经网络所构建的深度学习模型,以达到机械化处理信息的目的。在其中一些场景中,需要使用不同时间粒度所呈现的特征对模型进行训练。现有技术的作为是分别针对每种时间粒度的特征,对模型进行单独训练。这种方式下,首先训练效率不高;其次,训练后的模型无法体现出短期特性与长期特性之间的隐性关联,导致模型性能不佳。
[0003] 有鉴于此,如何以较高的效率,训练出能够关联短期特性和长期特性的模型,是当前亟需要解决的技术问题。发明内容
[0004] 本说明书实施例目的是提供一种训练方法、特征提取方法及相关装置,能够以较高的效率,训练出能够关联短期特性和长期特性的模型。
[0005] 为了实现上述目的,本说明书实施例是这样实现的:
[0006] 第一方面,提供一种训练方法,包括:
[0007] 将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0008] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0009] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0010] 将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
[0011] 第二方面,提供一种特征提取方法,包括:
[0012] 将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0013] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0014] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0015] 其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
[0016] 第三方面,提供一种神经网络的训练装置,包括:
[0017] 第一处理模,将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0018] 第一组合模块,将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0019] 第二处理模块,将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0020] 训练模块,将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
[0021] 第四方面,提供一种电子设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行:
[0022] 将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0023] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0024] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0025] 将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
[0026] 第五方面,提供一种算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
[0027] 将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0028] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0029] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0030] 将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
[0031] 第六方面,提供一种特征提取装置,包括:
[0032] 第三处理模块,将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0033] 第二组合模块,将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0034] 第四处理模块,将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0035] 其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
[0036] 第七方面,提供一种电子设备,包括:
[0037] 将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0038] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0039] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0040] 其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
[0041] 第八方面,提供一种算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如下步骤:
[0042] 将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0043] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0044] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0045] 其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
[0046] 本说明书实施例的方案采用RNN+CNN的模型结构,在训练过程中,将短期特征组成长期特征,并进一步将长期特征转换为单维度的目标特征后输入至分类器,从而根据分类器的输出结果调整RNN和CNN的参数,以达到训练目的。显然,整个训练过程同时使用了短期特征和长期特征,不仅大幅提高了训练效率,还能够使模型学习到短期特征和长期特征之间的隐形联系,从而获得更好的模型性能。附图说明
[0047] 为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书实施例中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0048] 图1为本说明书实施例提供的训练方法的流程示意图。
[0049] 图2为本说明书实施例提供的训练方法中的训练结构示意图。
[0050] 图3为本说明书实施例提供的特征提取方法的步骤示意图。
[0051] 图4为本说明书实施例提供的训练装置的结构示意图。
[0052] 图5为本说明书实施例提供的特征提取装置的结构示意图。
[0053] 图6为本说明书实施例提供的电子设备的结构示意图。

具体实施方式

[0054] 为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0055] 如前所述,现有技术的模型训练方法是针对不同时间粒度的特征,单独对模型(模型由神经网络组成)进行训练。比如,先将短期特征输入至模型,并根据输出结果对模型参数进行调整。之后,再进一步将长期特征输入至模型,并根据输出结果对模型参数进行调整。这种方式下,首先训练效率不高;其次,整个模型虽然是基于短期特征和长期特征进行了学习,但是训练过程是完全独立的,无法形成短期特征和长期特征之间的隐性关联,导致模型训练后达不到较佳的性能。
[0056] 针对上述问题,本文件旨在提供一种可以将短期特征和长期特征同时对模型进行训练的技术方案。进一步地,还提供基于训练后的模型实现相关应用的的技术方案。
[0057] 图1是本说明书实施例训练方法的流程图。图1所示的方法可以由下文相对应的装置执行,包括:
[0058] 步骤S102,将样本对象对应目标分类下的第一短期特征集输入至循环神经网络(RNN,Recurrent Neural Network),得到第二短期特征集,第一短期特征集中的各短期特征对应有相同的第一时间粒度。
[0059] 其中,循环神经网络作为待训练模型中的一部分。第一短期特征可以是比较直观的样本对象的短期特征,这些短期特征可以通过较为常规的特征提取方式获取得到,本说明书实施例不对获取方法作具体限定。
[0060] 本步骤中,将第一短期特征集输入至RNN的目的是由RNN对第一短期特征集进行提炼,得到隐性的第二短期特征集。第二短期特征集中的短期特征可以与第一短期特征集中的短期特征对应有相同的时间粒度,即第一时间粒度。
[0061] 步骤S104,将第二短期特征集按照时间顺序组合成长期特征集,长期特征集中的各长期特征对应有相同的第二时间粒度,第二时间粒度大于第一时间粒度。
[0062] 显然,长期特征是通过短期特征组合而成的,因此不仅可以提现出样本对象的长期特性,也能够提现出样本对象的短期特性。
[0063] 此外,应理解的是,第一时间粒度和第二时间粒度可以根据实际需要进行灵活设置,本说明书实施例不作具体限定。作为示例性介绍,假设第一时间粒度为一天、第二时间粒度为一周,则第二短期特征集中包含有样本对象每天的短期特征。本步骤具体将样本对象相邻7天的短期特征进行组合,得到样本对象一周的长期特征。
[0064] 步骤S106,将长期特征集输入至卷积神经网络(CNN,Convolutional Neural Networks),得到目标对象对应目标分类下的目标特征集。
[0065] 其中,CNN作为待训练模型中的一部分,与上述RNN的用途大致相同,可对长期特征集作进一步提炼,获得更高阶的目标特征集。
[0066] 步骤S108,将目标特征集输入至用于识别目标分类的分类模型,以基于分类模型针对样本对象的识别结果,对循环神经网络和卷积神经网络进行训练。
[0067] 其中,分类模型是训练时所需要引用的部分,并不限定作为待训练模型的一部分。
[0068] 此外,训练方式并不唯一,取决于分类模型的具体结构。
[0069] 如果分类模型采用的是分类器结构,则本步骤可以基于有监督的训练方式对分类模型进行训练。即,将目标特征集作为用于识别分类模型的输入,将样本对象的标签(标签用于指示样本用对象是否符合目标分类)作为分类模型的输出,以基于分类模型针对样本对象的识别结果,对RNN和CNN进行训练。
[0070] 如果分类模型采用的是解码器结构,则本步骤可以基于无监督的训练方式对分类模型进行训练。无监督的训练方式不需要使用标签,因此本步骤可以直接将目标特征集作为用于识别分类模型的输入,以基于分类模型针对样本对象的识别结果,对RNN和CNN进行训练。此外,在训练过程中,还可以基于识别结果,对分类模型进行训练,从而提高分类模型的识别准确率,保证RNN和CNN的训练效果。
[0071] 基于图1所示的训练方法方法可以知道,本说明书实施例的方案采用RNN+CNN的模型结构,在训练过程中,将短期特征组成长期特征,并进一步将长期特征转换为单维度的目标特征后输入至分类器,从而根据分类器的输出结果调整RNN和CNN的参数,以达到训练目的。显然,整个训练过程同时使用了短期特征和长期特征,不仅大幅提高了训练效率,还能够使模型学习到短期特征和长期特征之间的隐形联系,从而获得更好的模型性能。
[0072] 下面对说明书实施例的训练方法进行详细介绍。
[0073] 本说明书实施例的训练方法同时使用短期特征和长期特征对目标模型进行训练。如图2所示,训练结构包括:RNN→CNN→分类模型。其中,RNN+CNN属于待训练的目标模型,分类模型是训练过程中添加的临时部分,并不作为目标模型的一部分。
[0074] 本说明书实施例的训练方法首先将样本对象对应目标分类下的第一短期特征集输入至RNN,得到由RNN输出的第二短期特征集。
[0075] 这里所述的RNN可以是长短期记忆网络、控循环单元网络以及自注意机制网络中的任一者,或者,可以包括:长短期记忆网络、门控循环单元网络以及自注意力机制网络中的至少一者。由于RNN属于现有技术,本文不再具体赘述。
[0076] 应理解,RNN并不会改变短期特征的时间粒度,因此输入获得的第二短期特征集中的短期特征可以与第一短期特征集中的短期特征对应有相同的时间粒度。
[0077] 在获得RNN输出的第二短期特征集后,即可按照时间顺序对第二短期特征集中的短期特征进行组合,得到对应有更大时间粒度的长期特征。
[0078] 这里需要说明的是,特征的组合方法并不唯一,本说明书实施例不作具体限定。作为其中一种可行的方案,可以采用向量组合方式将短期特征组合成长期特征。比如:将短期特征A(q,w,e)和短期特征B(a,s,d)进行组合,可以得到的长期特征AB(q,w,e,a,s,d)。应理解,长期特征是由短期特征拼接而成的,因此含有样本对象短期的特性。
[0079] 之后,将组合而成的长期特征输入至CNN,由CNN进一步提炼出的目标特征集。
[0080] 应理解,CNN与RNN一样,具有不同的实现方式,本说明书实施例不作具体限定。
[0081] 作为示例性介绍,CNN可以包括:卷积层、池化层和全连接层。卷积层用于对长期特征集进行卷积处理,得到卷积层输出特征集。池化层用于基于最大值池化算法和/或均值池化算法,对卷积层输出特征集进行池化处理,得到池化层输出特征集。全连接层用于将池化层输出特征集转换为单一维度的适用于分类模型的目标特征集。
[0082] 在获得目标特征集后,即可将目标特征集的目标特征输入至分类模型,由分类模型对样本对象进行分类,以识别样本对象是否符合目标分类。
[0083] 这里,样本对象是否符合目标分类属于已知信息,分类模型输出的识别结果属于训练结果,训练结果并不一定是真实结果。之后,根据损失函数来计算训练结果与真实结果之间的损失,并以降低损失为目的,对RNN、CNN以及分类模型的参数进行调整(也可以不对分类器的参数进行调整,取决于分类模型是否有调整需求),以达到训练目的。
[0084] 下面结合一个实际的应用场景,对本说明书实施例的训练方法进行实例介绍。
[0085] 本应用场景用于训练刻画金融险特征的学习模型。其中,学习模型采用长短期记忆网络(LSTM,Long Short-Term Memory)+文本卷进循环网络(Text-CNN)的结构,对应的流程包括:
[0086] 步骤一,获取支付应用中样本对象的金融业务数据,并基于语义分析算法,按照每半小的时间粒度,对金融业务数据进行基础特征的提取,得到一个月的第一短期特征集。
[0087] 在本应用场景中,第一短期特征集可以但不限于是样本对象每半小时所对应的交易总金额、交易总笔数以及交易对手总数。这些刻画的是样本对象在短时间内的交易行为,一些不正常的交易模式(如快进快出)可以被这些短期特征捕捉到。
[0088] 步骤二,将第一短期特征集输入至LSTM,得到LSTM输出的第二短期特征集。
[0089] 其中,LSTM数量并不限于一个。作为示例性介绍,LSTM可以与第一短期特征集的天数一一对应,这样每个Lstm的输出代表了一天的短期隐藏特征。
[0090] 步骤三,将第二短期特征集按照时间顺序进行组合,得到长期特征集。
[0091] 如前所述,之前获取了每半小时的短期隐藏特征,但是只能代表半小时的交易动态,为了得到样本对象长期的交易动态,按时间顺序将半小时的短期隐藏特征拼接成每天的长期特征。应理解,长期特征的数据格式应适用于后续的TextCnn。
[0092] 步骤四,将长期特征集输入至TextCnn,由TextCnn提炼出目标特征集。
[0093] 其中,TextCnn的卷积层长度可以自由设置,比如长度为2则可以捕获样本对象相邻2天的局部行为变化,如果长度为6,可以捕捉相邻6天的局部行为变化。也就是说,通过卷积核不同尺寸的组合实现对样本对象不同时间粒度的特征学习。
[0094] TextCnn的池化层对卷积提的输出特征再进行Pooling操作。本应用场景中,池化层可以同时采用最大值池化(Max-Pooling)算法与(Avg-Pooling)算法。其中,Max-Pooling主要用来保留特征发生变化的主要信息,Avg-Pooling用来保留特征平均状态。
[0095] TextCnn的全连接层将Pooling操作得到的特征集进行整合降维,得到适合输入分类模型的单一维度的目标特征集。
[0096] 步骤五,将目标特征集输入至分类模型,以对LSTM和TextCnn进行训练。
[0097] 其中,分类模型可以采用二分类交叉熵机制。在二分类问题中,分类模型的损失函数具体为交叉熵损失函数,样本对象的标签取值只能是1或0,1表示样本对象符合目标分类,0表示样本对象不符合目标分类。
[0098] 假设某个样本对象的真实标签为yt,该样本对象yt=1的概率为yp,则损失函数可以为:-log(yt|yp)=-[yt*log(yp)+(1-yt)log(1-yp)]。对于整个学习模型而言,其损失函数就是所有样本对象的损失函数非负的平均值。
[0099] 目标特征集输入在输入分类模型后,会得到分类模型识别样本对象是否属于风险对象的识别结果。之后,基于损失函数计算识别结果会与标签取值的损失,并以降低损失为目的,来调整LSTM和TextCnn的参数。
[0100] 以上是对本说明书实施例的方法的介绍。应理解,在不脱离本文上述原理基础之上,还可以进行适当的变化,这些变化也应视为本说明书实施例的保护范围。
[0101] 此外,如图3所示,本说明书实施例还提供一种特征提取方法,包括:
[0102] 步骤302,将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,第一短期特征集中的各短期特征对应有相同的第一时间粒度。
[0103] 步骤304,将第二短期特征集按照时间顺序组合成长期特征集,长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度。
[0104] 步骤306,将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集。
[0105] 其中,目标特征集中的目标特征即最终提炼得到的目标对象的隐性特征。
[0106] 应理解,上述循环神经网络和上述卷积神经网络是由图1所示的训练方法所训练得到的。即,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
[0107] 基于图3所示的特征提取方法可以知道,本说明书实施例的方案仅需要将目标对象的短期特征输入至RNN+CNN的模型,即由模型机械方式提炼出即呈现短期特性,又呈现长期特性的目标特征,可用于对目标对象进行更全面的刻画,挖掘出人工难以找到的隐性特征。
[0108] 此外,如图4所示,本说明书实施例还提供一种神经网络的训练装置400,包括:
[0109] 第一处理模块410,将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0110] 第一组合模块420,将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0111] 第二处理模块430,将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0112] 训练模块440,将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
[0113] 基于图4所示的训练装置可以知道,本说明书实施例的方案采用RNN+CNN的模型结构,在训练过程中,将短期特征组成长期特征,并进一步将长期特征转换为单维度的目标特征后输入至分类器,从而根据分类器的输出结果调整RNN和CNN的参数,以达到训练目的。显然,整个训练过程同时使用了短期特征和长期特征,不仅大幅提高了训练效率,还能够使模型学习到短期特征和长期特征之间的隐形联系,从而获得更好的模型性能。
[0114] 可选地,训练模块440在执行时,具体将所述目标特征集作为用于识别所述目标分类的分类模型的输入,将所述样本对象的标签作为所述分类模型的输出,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练,其中,所述样本对象的标签用于指示所述样本用对象是否符合所述目标分类。
[0115] 可选地,所述循环神经网络包括以下至少一者:
[0116] 长短期记忆网络、门控循环单元网络以及自注意力机制网络。
[0117] 可选地,所述卷积神经网络包括:文本卷进循环网络。
[0118] 可选地,所述卷积神经网络包括:
[0119] 卷积层,对长期特征集进行卷积处理,得到卷积层输出特征集;
[0120] 池化层,基于最大值池化算法和/或均值池化算法,对所述卷积层输出特征集进行池化处理,得到池化层输出特征集;
[0121] 全连接层,将池化层输出特征集转换为单一维度的目标特征集。
[0122] 可选地,所述样本对象为支付应用用户,所述目标分类为金融风险,所述第一短期特征集包括以下至少一种特征维度的短期特征:
[0123] 所述支付应用用户在各第一时间粒度所对应的交易总金额、交易总笔数以及交易对手总数。
[0124] 显然,本说明书实施例的训练装置可以作为上述图1所示的训练方法的执行主体,因此能够实现该训练方法在图1和图2所实现的功能。由于原理相同,本文不再赘述。
[0125] 此外,如图5所示,本说明书实施例还提供一种特征提取装置,包括:
[0126] 第三处理模块510,将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集;其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0127] 第二组合模块520,将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0128] 第四处理模块530,将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0129] 其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
[0130] 基于图5所示的特征提取装置可以知道,本说明书实施例的方案仅需要将目标对象的短期特征输入至RNN+CNN的模型,即由模型机械方式提炼出即呈现短期特性,又呈现长期特性的目标特征,可用于对目标对象进行更全面的刻画,挖掘出人工难以找到的隐性特征。
[0131] 显然,本说明书实施例的特征提取装置可以作为上述图3所示的特征提取方法的执行主体,因此能够实现该特征提取方法在图3所实现的功能。由于原理相同,本文不再赘述。
[0132] 图6是本说明书的一个实施例电子设备的结构示意图。请参考图6,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(Random-Access Memory,RAM),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
[0133] 处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是ISA(Industry Standard Architecture,工业标准体系结构)总线、PCI(Peripheral Component Interconnect,外设部件互连标准)总线或EISA(Extended Industry Standard Architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线数据总线、控制总线等。为便于表示,图6中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
[0134] 存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
[0135] 其中,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成神经网络的训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
[0136] 将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0137] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0138] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0139] 将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
[0140] 其中,处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上还可以形成特征提取装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
[0141] 将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0142] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0143] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0144] 其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
[0145] 上述如本说明书图1所示实施例揭示的训练方法或者图3所示实施例揭示的特征提取方法由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(Network Processor,NP)等;还可以是数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本说明书实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0146] 应理解,本说明书实施例的电子设备可以实现上述训练装置在图1和图2所示的实施例的功能,或者上述特征提取装置在图所示的实施例的功能。由于原理相同,本文不再赘述。
[0147] 当然,除了软件实现方式之外,本说明书的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
[0148] 此外,本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令。
[0149] 其中,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1所示实施例的训练方法,并具体用于执行以下方法:
[0150] 将样本对象对应目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0151] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0152] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0153] 将所述目标特征集输入至用于识别所述目标分类的分类模型,以基于所述分类模型针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练。
[0154] 或者,指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图3所示实施例的特征提取方法,并具体用于执行以下方法:
[0155] 将目标对象属于目标分类下的第一短期特征集输入至循环神经网络,得到第二短期特征集,其中,所述第一短期特征集中的各短期特征对应有相同的第一时间粒度;
[0156] 将所述第二短期特征集按照时间顺序组合成长期特征集,其中,所述长期特征集中的各长期特征对应有相同的第二时间粒度,所述第二时间粒度大于所述第一时间粒度;
[0157] 将所述长期特征集输入至卷积神经网络,得到所述目标对象对应所述目标分类下的目标特征集;
[0158] 其中,所述循环神经网络和所述卷积神经网络是将样本对象的目标特征集输入至具有识别所述目标分类的分类模型后,基于所述分类模型得到针对所述样本对象的识别结果,对所述循环神经网络和所述卷积神经网络进行训练所得到的,所述样本对象的目标特征集是基于所述循环神经网络和所述卷积神经网络确定得到的。
[0159] 应理解,上述指令当被包括多个应用程序的便携式电子设备执行时,能够使上文所述的训练装置实现图1和图2所示实施例的功能,或者,能够使上文所述的特征提取装置实现图3所示实施例的功能,本文不再赘述。
[0160] 本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0161] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0162] 以上仅为本说明书的实施例而已,并不用于限制本说明书。对于本领域技术人员来说,本说明书可以有各种更改和变化。凡在本说明书的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书的权利要求范围之内。此外,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈