首页 / 专利库 / 电脑零配件 / 击键 / 子应用的风险识别方法以及装置

子应用的险识别方法以及装置

阅读:458发布:2020-05-11

专利汇可以提供子应用的险识别方法以及装置专利检索,专利查询,专利分析的服务。并且本 说明书 提供子应用的 风 险识别方法以及装置,其中所述子应用的风险识别方法,应用于第三方应用,包括:获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。,下面是子应用的险识别方法以及装置专利的具体信息内容。

1.一种子应用的险识别方法,应用于第三方应用,包括:
获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
2.根据权利要求1所述的子应用的风险识别方法,所述获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据,包括:
通过调用审理接口获取依赖于所述第三方应用运行的所述子应用的开发数据;
以及通过调用巡检接口获取所述子应用的图像数据,通过调用所述巡检接口获取所述子应用的文本数据,在所述子应用的日志文件中提取所述子应用的交易数据,和/或在所述日志文件中提取所述子应用的浏览数据;
将所述开发数据以及所述图像数据、所述文本数据、所述交易数据和/或所述浏览数据进行整合,作为所述子应用的所述属性数据。
3.根据权利要求2所述的子应用的风险识别方法,所述通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据,包括:
根据所述开发数据确定所述子应用的开发团队数据,并基于所述开发团队数据确定所述子应用的每个开发者对应的历史开发数据,将所述历史开发数据作为所述子应用在开发风险识别维度的开发风险识别数据;
以及根据所述开发数据确定所述子应用在发布过程中选择的第一业务类型,根据所述文本数据和所述图像数据识别所述子应用的第二业务类型,将所述第一业务类型和所述第二业务类型作为所述子应用在业务风险识别维度的业务风险识别数据。
4.根据权利要求3所述的子应用的风险识别方法,所述通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据,包括:
通过对所述文本数据进行分词,并对分词结果进行非关键词剔除处理,获得所述子应用在文本风险识别维度的文本风险识别数据;
和/或,
根据所述浏览数据确定所述子应用的浏览量和独立访客,基于所述浏览量和所述独立访客计算所述子应用的点击转换率,将所述点击转换率作为所述子应用在流量风险识别维度的流量风险识别数据;
和/或,
根据所述交易数据确定所述子应用的交易特征,以及根据所述图像数据确定所述子应用的图像特征,将所述交易特征和所述图像特征作为所述子应用在底线风险识别维度的底线风险识别数据。
5.根据权利要求4所述的子应用的风险识别方法,所述各个风险识别维度的风险识别数据包括:
所述开发风险识别数据以及所述业务风险识别数据、所述文本风险识别数据、所述流量风险识别数据和/或所述底线风险识别数据;
相应的,所述各个风险识别维度的风险识别模型,包括:
开发风险识别模型以及业务风险识别模型、文本风险识别模型、流量风险识别模型和/或底线风险识别模型;
相应的,所述各个风险识别维度的风险评分,包括:
开发风险评分以及业务风险评分、文本风险评分、流量风险评分和/或底线风险评分。
6.根据权利要求1所述的子应用的风险识别方法,所述根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,包括:
确定所述各个风险识别维度对应的风险权重;
计算所述各个风险识别维度对应的风险权重和所述各个风险识别维度的风险评分的乘积,获得所述各个风险识别维度的评分数值;
对所述各个风险识别维度的评分数值进行求和,将求和结果作为所述风险总评分。
7.根据权利要求5所述的子应用的风险识别方法,所述根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果步骤执行之后,还包括:
根据所述风险识别结果确定所述子应用存在风险的情况下,基于所述子应用的所述属性数据确定所述子应用的业务类型;
通过所述业务类型以及所述风险总评分确定针对所述子应用的处罚策略,并基于所述处罚策略对所述子应用进行处罚。
8.根据权利要求7所述的子应用的风险识别方法,所述通过所述业务类型以及所述风险总评分确定针对所述子应用的处罚策略,并基于所述处罚策略对所述子应用进行处罚,包括:
通过对所述风险总评分进行分析,确定所述开发风险评分在所述风险总评分中的占比最高的情况下,基于所述业务类型和所述开发风险评分确定应用下架策略作为针对所述子应用的所述处罚策略;
根据所述应用下架策略对所述子应用进行下架审核处理,作为对所述子应用的处罚。
9.根据权利要求7所述的子应用的风险识别方法,所述通过所述业务类型以及所述风险总评分确定针对所述子应用的处罚策略,并基于所述处罚策略对所述子应用进行处罚,包括:
通过对所述风险总评分进行分析,确定所述业务风险评分在所述风险总评分中的占比最高的情况下,基于所述业务类型和所述业务风险评分确定版本下架策略作为针对所述子应用的所述处罚策略;
根据所述版本下架策略对所述子应用进行版本下架处理,作为对所述子应用的处罚。
10.根据权利要求1所述的子应用的风险识别方法,所述基于所述风险总评分确定所述子应用的风险识别结果,包括:
根据所述子应用的所述属性数据确定所述子应用的业务类型;
根据预先建立的业务类型和评分阈值的对应关系,确定所述子应用的所述业务类型对应的评分阈值;
将所述风险总评分与所述评分阈值进行比较,根据比较结果确定所述子应用的所述风险识别结果。
11.根据权利要求1所述的子应用的风险识别方法,所述根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果步骤执行之后,还包括:
根据所述风险识别结果确定所述子应用存在风险的情况下,停止运行所述子应用;
将所述风险识别数据转换为对应风险识别维度下的信息代码并发送至所述子应用的发布方,作为停止运行所述子应用的决策信息。
12.根据权利要求1所述的子应用的风险识别方法,所述各个风险识别维度对应的风险识别模型中,任意一个风险识别模型采用如下方式进行训练:
采集搭载于所述第三方应用的样本子应用的属性数据;
通过对所述样本子应用的属性数据进行风险识别,获得所述样本子应用的风险评分;
将所述样本子应用的属性数据和所述样本子应用的风险评分作为训练样本对风险识别模型进行训练,确定所述样本子应用的属性数据和所述样本子应用的风险评分的关联关系。
13.一种子应用的风险识别装置,应用于第三方应用,包括:
获取属性数据模,被配置为获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
预处理模块,被配置为通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
风险识别模块,被配置为将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
确定识别结果模块,被配置为根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
14.一种计算设备,包括:
存储器和处理器;
所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
15.一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时实现权利要求1至12任意一项所述子应用的风险识别方法的步骤。

说明书全文

子应用的险识别方法以及装置

技术领域

[0001] 本说明书涉及互联网技术领域,特别涉及一种子应用的风险识别方法。本说明书同时涉及一种子应用的风险识别装置,一种计算设备,以及一种计算机可读存储介质。

背景技术

[0002] 随着互联网技术的发展,小程序的应用也越来越广泛,小程序是指一种搭载于其他平台,并且无需下载和安装即可在平台中使用的应用程序,而用户所使用的小程序是商户在其他应用发布的。
[0003] 现有技术中,商户在其他应用中发布小程序时,其他应用对应的服务端会对小程序进行风险识别,而由于小程序的种类繁多,小程序中包含各式各样的非结构化数据,例如图片、文字等,导致小程序的风险表现形式也是多样化的;并且小程序能够提供的服务种类也是较多的,更加弱化了小程序的安全等级;进而造成小程序的风险识别准确率并不是很高,并且现有技术中其他应用对应的服务端对小程序的风险识别主要依赖于用户的投诉和风险识别策略,由于风险识别策略中能够使用的数据类型是有限的,很容易被一些商户绕开,而用户投诉的方式是一种偏被动的风险识别方式,有一定的滞后性,导致对小程序的风险识别效果并不是很好,故亟需一种可以精准识别小程序的风险的方案,以形成对其他应用中的小程序进行良好的治理。发明内容
[0004] 有鉴于此,本说明书实施例提供了一种子应用的风险识别方法。本说明书同时涉及一种子应用的风险识别装置,一种计算设备,以及一种计算机可读存储介质,以解决现有技术中存在的技术缺陷
[0005] 根据本说明书实施例的第一方面,提供了一种子应用的风险识别方法,应用于第三方应用,包括:
[0006] 获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
[0007] 通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
[0008] 将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
[0009] 根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
[0010] 可选的,所述获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据,包括:
[0011] 通过调用审理接口获取依赖于所述第三方应用运行的所述子应用的开发数据;
[0012] 以及通过调用巡检接口获取所述子应用的图像数据,通过调用所述巡检接口获取所述子应用的文本数据,在所述子应用的日志文件中提取所述子应用的交易数据,和/或在所述日志文件中提取所述子应用的浏览数据;
[0013] 将所述开发数据以及所述图像数据、所述文本数据、所述交易数据和/或所述浏览数据进行整合,作为所述子应用的所述属性数据。
[0014] 可选的,所述通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据,包括:
[0015] 根据所述开发数据确定所述子应用的开发团队数据,并基于所述开发团队数据确定所述子应用的每个开发者对应的历史开发数据,将所述历史开发数据作为所述子应用在开发风险识别维度的开发风险识别数据;
[0016] 以及根据所述开发数据确定所述子应用在发布过程中选择的第一业务类型,根据所述文本数据和所述图像数据识别所述子应用的第二业务类型,将所述第一业务类型和所述第二业务类型作为所述子应用在业务风险识别维度的业务风险识别数据。
[0017] 可选的,所述通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据,包括:
[0018] 通过对所述文本数据进行分词,并对分词结果进行非关键词剔除处理,获得所述子应用在文本风险识别维度的文本风险识别数据;
[0019] 和/或,
[0020] 根据所述浏览数据确定所述子应用的浏览量和独立访客,基于所述浏览量和所述独立访客计算所述子应用的点击转换率,将所述点击转换率作为所述子应用在流量风险识别维度的流量风险识别数据;
[0021] 和/或,
[0022] 根据所述交易数据确定所述子应用的交易特征,以及根据所述图像数据确定所述子应用的图像特征,将所述交易特征和所述图像特征作为所述子应用在底线风险识别维度的底线风险识别数据。
[0023] 可选的,所述各个风险识别维度的风险识别数据包括:
[0024] 所述开发风险识别数据以及所述业务风险识别数据、所述文本风险识别数据、所述流量风险识别数据和/或所述底线风险识别数据;
[0025] 相应的,所述各个风险识别维度的风险识别模型,包括:
[0026] 开发风险识别模型以及业务风险识别模型、文本风险识别模型、流量风险识别模型和/或底线风险识别模型;
[0027] 相应的,所述各个风险识别维度的风险评分,包括:
[0028] 开发风险评分以及业务风险评分、文本风险评分、流量风险评分和/或底线风险评分。
[0029] 可选的,所述根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,包括:
[0030] 确定所述各个风险识别维度对应的风险权重;
[0031] 计算所述各个风险识别维度对应的风险权重和所述各个风险识别维度的风险评分的乘积,获得所述各个风险识别维度的评分数值;
[0032] 对所述各个风险识别维度的评分数值进行求和,将求和结果作为所述风险总评分。
[0033] 可选的,所述根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果步骤执行之后,还包括:
[0034] 根据所述风险识别结果确定所述子应用存在风险的情况下,基于所述子应用的所述属性数据确定所述子应用的业务类型;
[0035] 通过所述业务类型以及所述风险总评分确定针对所述子应用的处罚策略,并基于所述处罚策略对所述子应用进行处罚。
[0036] 可选的,所述通过所述业务类型以及所述风险总评分确定针对所述子应用的处罚策略,并基于所述处罚策略对所述子应用进行处罚,包括:
[0037] 通过对所述风险总评分进行分析,确定所述开发风险评分在所述风险总评分中的占比最高的情况下,基于所述业务类型和所述开发风险评分确定应用下架策略作为针对所述子应用的所述处罚策略;
[0038] 根据所述应用下架策略对所述子应用进行下架审核处理,作为对所述子应用的处罚。
[0039] 可选的,所述通过所述业务类型以及所述风险总评分确定针对所述子应用的处罚策略,并基于所述处罚策略对所述子应用进行处罚,包括:
[0040] 通过对所述风险总评分进行分析,确定所述业务风险评分在所述风险总评分中的占比最高的情况下,基于所述业务类型和所述业务风险评分确定版本下架策略作为针对所述子应用的所述处罚策略;
[0041] 根据所述版本下架策略对所述子应用进行版本下架处理,作为对所述子应用的处罚。
[0042] 可选的,所述基于所述风险总评分确定所述子应用的风险识别结果,包括:
[0043] 根据所述子应用的所述属性数据确定所述子应用的业务类型;
[0044] 根据预先建立的业务类型和评分阈值的对应关系,确定所述子应用的所述业务类型对应的评分阈值;
[0045] 将所述风险总评分与所述评分阈值进行比较,根据比较结果确定所述子应用的所述风险识别结果。
[0046] 可选的,所述根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果步骤执行之后,还包括:
[0047] 根据所述风险识别结果确定所述子应用存在风险的情况下,停止运行所述子应用;
[0048] 将所述风险识别数据转换为对应风险识别维度下的信息代码并发送至所述子应用的发布方,作为停止运行所述子应用的决策信息。
[0049] 可选的,所述各个风险识别维度对应的风险识别模型中,任意一个风险识别模型采用如下方式进行训练:
[0050] 采集搭载于所述第三方应用的样本子应用的属性数据;
[0051] 通过对所述样本子应用的属性数据进行风险识别,获得所述样本子应用的风险评分;
[0052] 将所述样本子应用的属性数据和所述样本子应用的风险评分作为训练样本对风险识别模型进行训练,确定所述样本子应用的属性数据和所述样本子应用的风险评分的关联关系。
[0053] 根据本说明书实施例的第二方面,提供了一种子应用的风险识别装置,应用于第三方应用,包括:
[0054] 获取属性数据模,被配置为获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
[0055] 预处理模块,被配置为通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
[0056] 风险识别模块,被配置为将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
[0057] 确定识别结果模块,被配置为根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
[0058] 根据本说明书实施例的第三方面,提供了一种计算设备,包括:
[0059] 存储器和处理器;
[0060] 所述存储器用于存储计算机可执行指令,所述处理器用于执行所述计算机可执行指令:
[0061] 获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
[0062] 通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
[0063] 将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
[0064] 根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
[0065] 根据本说明书实施例的第四方面,提供了一种计算机可读存储介质,其存储有计算机可执行指令,该指令被处理器执行时实现所述子应用的风险识别方法的步骤。
[0066] 本说明书一实施例实现了在不同的维度对子应用进行风险识别,通过获取子应用的属性数据,再对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据,通过所述各个风险识别维度对应的风险识别模型对各个风险识别数据进行风险识别,获得各个风险识别维度的风险评分,最后通过各个风险识别维度的风险评分计算所述子应用的风险总评分以确定所述子应用的风险识别结果,实现了可以精准的、高效率的对第三方应用中的子应用进行风险识别,避免出现子应用传播异常信息的情况发生,解决的子应用的风险防控滞后性问题,可以针对任意业务类型的子应用进行风险识别,具有更好的通用性和稳定性附图说明
[0067] 图1是本说明书一实施例提供的一种子应用的风险识别方法的流程图
[0068] 图2是本说明书一实施例提供的一种子应用的风险识别方法中业务风险识别过程的示意图;
[0069] 图3是本说明书一实施例提供的一种子应用的风险识别方法中文本风险识别过程的示意图;
[0070] 图4是本说明书一实施例提供的一种子应用的风险识别方法中流量风险识别过程的示意图;
[0071] 图5是本说明书一实施例提供的一种子应用的风险识别方法应用于小程序的风险识别过程的示意图;
[0072] 图6是本说明书一实施例提供的一种子应用的风险识别装置的结构示意图;
[0073] 图7是本说明书一实施例提供的一种计算设备的结构框图

具体实施方式

[0074] 在下面的描述中阐述了很多具体细节以便于充分理解本说明书。但是本说明书能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背本说明书内涵的情况下做类似推广,因此本说明书不受下面公开的具体实施的限制。
[0075] 在本说明书一个或多个实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本说明书一个或多个实施例。在本说明书一个或多个实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本说明书一个或多个实施例中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
[0076] 应当理解,尽管在本说明书一个或多个实施例中可能采用术语第一、第二等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书一个或多个实施例范围的情况下,第一也可以被称为第二,类似地,第二也可以被称为第一。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
[0077] 首先,对本说明书一个或多个实施例涉及的名词术语进行解释。
[0078] 小程序:是一种不需要下载安装即可使用的应用。
[0079] 巡检接口:是一种定时调度,采集子应用页面内容供下游接口分析的技术接口。
[0080] 审理接口:是一种采集子应用在发布时填写信息的技术接口。
[0081] 浏览量:(page view),通常是衡量一个网络新闻频道或网站甚至一条网络新闻的主要指标。网页浏览数是评价网站流量最常用的指标之一,简称为PV。
[0082] 独立访客:(Unique Visitor),一个访客对网站或者一条网络信息进行访问多少次都算作一次独立访问。
[0083] 在本说明书中,提供了一种子应用的风险识别方法,本说明书同时涉及一种子应用的风险识别装置,一种计算设备,以及一种计算机可读存储介质,在下面的实施例中逐一进行详细说明。
[0084] 参见附图1,示出了根据本说明书一实施例提供的一种子应用的风险识别方法的流程图;参见附图2,示出了根据本说明书一实施例提供的一种子应用的风险识别方法中业务风险识别过程的示意图;参见附图3,示出了根据本说明书一实施例提供的一种子应用的风险识别方法中文本风险识别过程的示意图;参见附图4,示出了根据本说明书一实施例提供的一种子应用的风险识别方法中流量风险识别过程的示意图;参见附图5,示出了根据本说明书一实施提供的一种子应用的风险识别方法应用于小程序的风险识别过程的示意图;其中,所述子应用的风险识别方法,应用于第三方应用,具体包括以下步骤:
[0085] 步骤102:获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据。
[0086] 实际应用中,运行于第三方应用的子应用能够为用户带来更便捷的服务,用户不仅可以对子应用不进行下载和安装,还能够在第三方应用中随时调用子应用进行使用,具有很高的便捷性,而能够在第三方应用中发布的子应用都是无异常风险的子应用;为了避免非正常发布方通过子应用传播异常信息,无论是在子应用的发布时,还是在子应用的运行过程中都需要对子应用进行风险识别,以实现可以提前对存在风险的子应用进行处理。
[0087] 本说明书提供的子应用的风险识别方法,通过获取子应用的属性数据,再对属性数据进行预处理,获得各个风险识别维度的风险识别数据,通过各个风险识别维度对应的风险识别模型对各个风险识别数据进行风险识别,获得各个风险识别维度的风险评分,最后通过各个风险识别维度的风险评分计算子应用的风险总评分以确定子应用的风险识别结果,实现了可以精准的、高效率的对第三方应用中的子应用进行风险识别,避免出现子应用传播异常信息的情况发生,解决的子应用的风险防控滞后性问题,可以针对任意业务类型的子应用进行风险识别,具有更好的通用性和稳定性。
[0088] 本实施例中所述子应用,具体是指运行在第三方应用,且不需要下载和安装的一种应用,例如运行于第三方应用的小程序或者微程序等,所述第三方应用,具体是指搭载子应用的应用程序,该应用程序需要安装在终端设备,例如聊天软件、支付软件或阅读软件等,终端设备可以是手机、电脑等。
[0089] 基于此,将以所述子应用为小程序为例对所述子应用的风险识别方法进行描述,所述第三方应用可以是安装在终端设备中的任意一款应用程序;例如,终端设备是手机,而第三方应用是安装在手机上的支付软件A,则子应用是搭载于支付软件A的小程序,包括游戏小程序a1、阅读小程序a2,购物小程序a3……等。
[0090] 具体实施时,在对所述子应用进行风险识别的过程中,为了能够更精准的确定所述子应用是否存在风险,可以在所述子应用已经在所述第三方应用发布后,针对所述子应用进行风险识别,通过获取所述子应用的属性数据进行后续的风险识别,其中,所述属性数据具体是指关于所述子应用的各方面的数据,可以包括子应用的各种要素数据,子应用的开发者数据,子应用涉及的文本数据和图像数据等。
[0091] 例如,对支付软件A中游戏小程序a1进行风险识别,获取游戏小程序a1的属性数据,具体包括游戏小程序a1的开发者,游戏小程序a1中包含的图像、文本,游戏小程序a1日志文件中的浏览数据和交易数据等。
[0092] 进一步的,所述子应用的属性数据在获取的过程中,为了能够更精准的对所述子应用进行风险识别,可以通过不同的方式采集所述子应用的各方面的数据,本实施例的一个或多个实施方式中,所述子应用的属性数据具体的获取过程如下所述:
[0093] 通过调用审理接口获取依赖于所述第三方应用运行的所述子应用的开发数据;
[0094] 以及通过调用巡检接口获取所述子应用的图像数据,通过调用所述巡检接口获取所述子应用的文本数据,在所述子应用的日志文件中提取所述子应用的交易数据,和/或在所述日志文件中提取所述子应用的浏览数据;
[0095] 将所述开发数据以及所述图像数据、所述文本数据、所述交易数据和/或所述浏览数据进行整合,作为所述子应用的所述属性数据。
[0096] 具体的,所述子应用的开发数据具体是指开发所述子应用的开发团队相关的数据,所述图像数据具体是指所述子应用中包含的图像相关的数据,所述文本数据具体是指所述子应用中包含的文本相关的数据,所述交易数据具体是指所述子应用中有过资金交易相关的数据,所述浏览数据具体是指所述子应用的浏览量和独立访客相关的数据;
[0097] 基于此,通过调用所述审理接口获取所述子应用的开发数据以及通过调用所述巡检接口获取所述子应用的文本数据和图像数据,和/或在所述子应用的日志文件中提取所述子应用的交易数据和浏览数据;并且通过将多个接口的数据打通,可以获取到关于所述子应用的更多属性数据。
[0098] 实际应用中,可以同时获取所述子应用的开发数据、文本数据、图像数据、交易数据和浏览数据作为所述子应用的属性数据,用于后续对所述子应用的风险识别;还可以获取所述子应用的开发数据、文本数据、图像数据、交易数据和浏览数据中的任意一种数据作为所述子应用的属性数据,用于后续对所述子应用的风险识别;获取所述子应用的属性数据可以根据实际应用场景选择性的获取,本说明书在此不作任何限定。
[0099] 例如,对支付软件中A中游戏小程序a1进行风险识别时,获取游戏小程序a1的开发数据是开发游戏小程序a1的开发团队数据,游戏小程序a1的图像数据是游戏小程序a1中的图标和每一游戏动画的图像对应的数据,游戏小程序a1的交易数据是在游戏小程序a1中购买游戏道具对应的数据,游戏小程序a1的浏览数据是游戏小程序a1被用户应用的数据。
[0100] 在对所述子应用进行风险识别的过程中,可以结合多种不同的属性数据对所述子应用进行后续的风险识别,实现了可以更精准的对所述子应用进行风险识别。
[0101] 步骤104:通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据。
[0102] 具体的,在上述获取所述子应用的属性数据的基础上,进一步的,通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;其中,对所述属性数据进行预处理的过程中,将需要对不同风险识别维度的数据进行不同的预处理,根据处理结果获得不同风险识别维度的风险识别数据。
[0103] 实际应用中,在对所述属性数据进行预处理的过程中,为了加快对所述子应用的风险识别的效率,需要剔除所述属性数据中无关的数据,以实现增强相关数据的重要性,涉及到交易数据和/或浏览数据需要对其进行统计,便于后续的处理过程。
[0104] 具体实施时,不同的属性数据的预处理过程也是不同的,并且为了提高对所述子应用的风险识别的效率,可以同时对不同的属性数据进行预处理,本实施例的一个或多个实施方式中,所述属性数据的预处理过程如下所述:
[0105] 根据所述开发数据确定所述子应用的开发团队数据,并基于所述开发团队数据确定所述子应用的每个开发者对应的历史开发数据,将所述历史开发数据作为所述子应用在开发风险识别维度的开发风险识别数据;
[0106] 以及根据所述开发数据确定所述子应用在发布过程中选择的第一业务类型,根据所述文本数据和所述图像数据识别所述子应用的第二业务类型,将所述第一业务类型和所述第二业务类型作为所述子应用在业务风险识别维度的业务风险识别数据。
[0107] 具体的,在确定所述属性数据中包含所述开发数据、文本数据和图像数据的情况下,通过对所述开发数据确定所述子应用的开发团队数据,并基于所述开发团队数据确定所述子应用的每个开发者对应的历史开发数据,所述每个开发者对应的历史开发数据具体是指每个开发者在此之前开发过的子应用的数据;将所述历史开发数据作为所述子应用在开发风险识别维度的开发风险识别数据;
[0108] 以及根据所述开发数据确定所述子应用在发布的过程中选择的第一业务类型,根据所述文本数据和所述图像数据识别所述子应用的第二业务类型,所述第一业务类型具体是指在对所述子应用发布过程中发布方选择的子应用的类型,所述第二业务类型具体是指在所述子应用运行于所述第三方应用后,通过检测所述子应用的图像数据和文本数据识别出的所述子应用的类型;基于此将所述第一业务类型和所述第二业务类型作为所述子应用在业务风险识别维度的业务风险识别数据即可。
[0109] 进一步的,在对所述子应用进行风险识别的过程中,可以结合多个风险识别维度对所述子应用进行风险识别,以调高对所述子应用的风险识别准确率,本实施例的一个或多个实施方式中,属性数据在多个风险识别维度进行预处理的过程如下所述:对其他属性数据进行预处理,获得其他风险识别维度的风险识别数据的
[0110] 通过对所述文本数据进行分词,并对分词结果进行非关键词剔除处理,获得所述子应用在文本风险识别维度的文本风险识别数据;
[0111] 和/或,根据所述浏览数据确定所述子应用的浏览量和独立访客,基于所述浏览量和所述独立访客计算所述子应用的点击转换率,将所述点击转换率作为所述子应用在流量风险识别维度的流量风险识别数据;
[0112] 和/或,根据所述交易数据确定所述子应用的交易特征,以及根据所述图像数据确定所述子应用的图像特征,将所述交易特征和所述图像特征作为所述子应用在底线风险识别维度的底线风险识别数据。
[0113] 具体的,在确定所述属性数据中包括文本数据、浏览数据、交易数据和图像数据的情况下,通过对所述文本数据进行分词,获得所述文本数据中包含的词单元,再通过对所述词单元进行非关键词剔除处理,得到所述文本数据中与所述子应用关联度较高的关键词作为在文本风险识别维度的文本风险识别数据;
[0114] 和/或,根据所述浏览数据确定所述子应用的浏览量和独立访客,根据所述浏览量和所述独立访客计算所述子应用的点击转换率,所述点击转换率具体是指针对所述子应用进行点击使用的每个用户相对于所述全部浏览量的占比,所述点击转换率波动越大,说明所述子应用的风险越高;将所述点击转换率作为所述子应用在流量风险识别维度的流量风险识别数据;
[0115] 和/或,根据所述交易数据确定所述子应用的交易特征,以及根据所述图像数据确定所述子应用的图像特征,所述交易特征具体是指所述子应用的交易方式和交易行为,所述图像特征具体是指所述子应用涉及的图像的特征,将所述交易特征和所述图像特征作为所述子应用在底线风险识别维度的底线风险识别数据即可。
[0116] 基于此,在所述开发风险识别维度可以对所述子应用的开发团队进行风险识别,根据所述开发风险识别数据确定在开发团队中若存在异常开发者的情况下,说明所述子应用可能存在异常风险;
[0117] 在所述业务风险识别维度可以对所述子应用的业务类型进行风险识别,根据所述业务风险识别数据确定所述子应用所提供的业务类型,若检测子应用的业务类型和发布时选择的业务类型不匹配的情况下,说明所述子应用可能存在异常风险;
[0118] 在所述文本风险识别维度可以对所述子应用的涉及的文本数据进行风险识别,根据所述文本风险识别数据确定所述子应用的涉及的文本存在异常的情况下,说明所述子应用可能存在异常风险;
[0119] 在所述流量风险识别维度可以对所述子应用的流量数据进行风险识别,根据所述流量风险识别数据确定所述子应用的访问量和浏览量异常的情况下,说明所述子应用可能存在异常风险;
[0120] 在所述底线风险识别维度可以对所述子应用的所提供的业务类型进行风险识别,根据所述底线风险识别数据确定所述子应用的业务类型存在异常的情况下,则可以直接确定所述子应用存在异常风险,所述底线风险识别维度是对所述子应用进行风险识别的红线,只要所述子应用在底线风险识别维度的底线风险识别数据存在异常,则可以直接确定所述子应用存在异常风险。
[0121] 具体实施时,各个风险识别维度的风险识别数据需要输入至对应风险识别维度的风险识别模型进行风险识别,根据各个风险识别维度对应的风险识别模型的输出结果确定所述子应用在各个风险识别维度是否存在异常风险,各个风险识别维度的风险识别模型的具体风险识别过程如下述步骤106。其中,各个风险识别维度的风险识别数据具体是用于在后续作为各个风险识别模型的输入。
[0122] 例如,在对支付软件中A中游戏小程序a1进行风险识别时,获取到游戏小程序a1的开发团队数据,通过开发团队数据确定游戏小程序a1的开发者有甲和乙,再获取开发者甲的历史开发数据和开发者乙的历史开发数据,作为后续输入风险识别模型对游戏小程序a1在开发风险识别维度的风险识别数据。
[0123] 除此之外,不同的子应用可以针对不同的风险识别维度进行预处理,也可以同时针对五个风险识别维度进行属性数据的预处理,能够更精准的确定所述子应用的风险识别结果。
[0124] 通过对属性数据进行预处理获得所述各个风险识别维度的风险识别数据,可以有效的提高对所述子应用的风险识别效率,实现了能够在较短的时间内确定子应用存在的风险,避免出现异常信息的传播。
[0125] 步骤106:将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分。
[0126] 具体的,在上述通过对所述属性数据进行预处理获得各个风险识别维度的风险识别数据的基础上,进一步的,将所述各个风险识别维度的风险识别数据输入至对应风险识别维度的风险识别模型中,对所述子应用在各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分。
[0127] 其中,所述风险评分具体是指所述子应用在各个风险识别维度通过风险识别模型预测出的风险,根据风险的等级高低给出的评分,所述风险评分越高说明所述子应用在该风险识别维度的风险概率越高,反之,风险评分越低说明所述子应用在该风险识别维度的风险概率越低。
[0128] 实际应用中,所述各个风险识别维度的风险识别数据在输入至对应维度的风险识别模型中时,还需要将所述各个风险识别维度的风险识别数据进行向量化处理,获得每个维度的风险识别数据对应的风险识别向量,再输出对应的风险识别模型对子应用在各个风险识别维度进行风险识别。
[0129] 需要说明的是,不同风险识别维度对应的风险识别模型输出的均为对应维度的风险评分,所以各个风险识别维度的风险识别模型,均可以采用如下方式进行训练:
[0130] 采集搭载于所述第三方应用的样本子应用的属性数据;
[0131] 通过对所述样本子应用的属性数据进行风险识别,获得所述样本子应用的风险评分;
[0132] 将所述样本子应用的属性数据和所述样本子应用的风险评分作为训练样本对风险识别模型进行训练,确定所述样本子应用的属性数据和所述样本子应用的风险评分的关联关系。
[0133] 具体实施时,所述各个风险识别维度分别有所述子应用对应的风险评分,本实施例的一个或多个实施方式中,所述各个风险识别维度的风险识别数据包括:所述开发风险识别数据以及所述业务风险识别数据、所述文本风险识别数据、所述流量风险识别数据和/或所述底线风险识别数据;相应的,所述各个风险识别维度的风险识别模型,包括:开发风险识别模型以及业务风险识别模型、文本风险识别模型、流量风险识别模型和/或底线风险识别模型;相应的,所述各个风险识别维度的风险评分,包括:开发风险评分以及业务风险评分、文本风险评分、流量风险评分和/或底线风险评分。
[0134] 其中,所述各个风险识别维度的风险评分均表示所述子应用在该风险识别维度的风险等级,并且所述风险评分可以设置为百分制,即100分为风险最高,0分为无风险。
[0135] 实际应用中,所述开发风险识别模型是用于对所述子应用的开发者团队进行风险识别的模型,所述开发风险识别模型将基于子应用的开发团队的关系网络和社区发现算法进行构建,所述开发风险识别模型的风险识别过程具体是指对所述子应用的开发团队的规模、开发团队中开发者的组成和开发团队中黑名单开发者的浓度三方面进行风险识别,输出的是子应用在开发风险识别维度的开发风险评分;其中,黑名单具体是指开发者参与开发过非正常子应用,则将此类开发者加入黑名单,表明该类开发者是存在风险的开发者。
[0136] 并且,所述开发团队风险识别模型的具体训练过程是通过采集搭载于所述第三方应用的子应用的开发者团队的团队数据;通过对子应用的团队数据进行风险识别,获得子应用的开发风险评分;将子应用的团队数据和子应用的开发风险评分作为训练样本对所述开发风险识别模型进行训练,确定子应用的团队数据和子应用的开发风险评分的关联关系。
[0137] 例如,小程序a2的开发团队中包括开发者1,开发者2,开发者3和开发者4,其中开发者1和开发者2都是黑名单用户,在通过开发风险识别模型对小程序a2进行开发风险识别的过程中,确定小程序a2的黑名单开发者浓度是50%,此时开发风险识别模型输出的风险评分是66分,确定小程序a2在开发风险识别维度的风险偏高;
[0138] 或者小程序a2的开发团队中包括开发者1,开发者2,开发者3和开发者4,在通过开发风险识别模型对小程序a2进行开发风险识别的过程中,确定小程序a2的黑名单开发者浓度是0%,此时开发风险识别模型输出的风险评分是10分,确定小程序a2在开发风险识别维度的风险低。
[0139] 参见图2所示,所述业务风险识别模型是用于对子应用的业务类型进行风险识别的模型,所述业务风险识别模型将基于子应用的文本数据和图像数据,并利用表征、度量学习以及文本分类算法进行构建,所述业务风险识别模型的风险识别过程具体是指对所述子应用在发布的过程中填写的业务类型,和通过子应用的文本数据和图像数据识别出的业务类型进行比对,根据比对结果确定对子应用的风险识别,输出的是子应用在业务风险识别维度的业务风险评分。
[0140] 并且,所述业务风险识别模型的具体训练过程是通过采集搭载于所述第三方应用的子应用的业务数据,其中业务数据中包括发布子应用时填写的业务类型和子应用在运行过程中识别出的业务类型,通过对子应用的业务数据进行风险识别,获得子应用的业务风险评分,将子应用的业务类型和子应用的业务风险评分作为训练样本对所述业务风险识别模型进行训练,确定子应用的业务类型和子应用的业务风险评分的关联关系。
[0141] 例如,小程序a2在发布时填写的业务类型是益智类游戏类型,通过检测小程序a2的图像数据和文本数据确定小程序a2的业务类型是棋牌类游戏类型,通过业务风险识别模型对小程序a2进行业务风险识别,确定小程序a2分布过程中填写的业务类型和识别出的业务类型不匹配,此时业务风险识别模型输出的风险评分是92分,确定小程序a2在业务风险识别维度的风险较高。
[0142] 参见图3所示,所述文本风险识别模型是用于对子应用的文本数据进行风险识别的模型,所述文本风险识别模型将基于子应用的文本数据,并利用文本分类算法和NB-SVM(朴素贝叶斯(Naive Bayers)和支持向量机(Support Vector Machine))算法进行构建,所述文本风险识别模型风险识别过程具体是指对所述子应用中相关的文本数据进行风险识别,其中所述子应用相关的文本数据可以包括子应用运行过程中所使用的文本,已经下架的子应用相关的文本(历史文本),发布子应用时提交的文本等,如图3所示,巡检文本和下架文本均通过所述巡检接口获取,准入文本和驳回文本均通过审理接口获取,其中,驳回文本具体是指子应用在发布的过程中被驳回的相关文本,在获取关于所述子应用的各种类型的文本之后,为了提高风险识别效率,需要对各种类型的文本进行分词、非关键词剔除处理,将最终的处理结果作为在所述文本风险识别维度的文本风险识别数据;基于此,所述文本风险识别模型输出的是子应用在文本风险识别维度的文本风险评分。
[0143] 除此之外,所述文本数据还可以包括子应用相关的名称信息和发布时的描述信息等。
[0144] 并且,所述文本风险识别模型的具体训练过程是通过采集搭载于所述第三方应用的子应用的文本数据,通过对子应用的文本数据进行风险识别,获得子应用的文本风险评分,将子应用的文本数据和子应用的文本风险评分作为训练样本对所述文本风险识别模型进行训练,确定子应用的文本数据和子应用的文本风险评分的关联关系。
[0145] 例如,小程序a2是一款阅读文章的小程序,通过检测小程序a2的文本数据,文本数据中包括小程序a2上存在的文章对应的文本,小程序a2的名称,小程序a2的描述内容,通过文本风险识别模型对小程序a2进行文本风险识别,确定小程序a2中上架的文章存在较多的异常文章,此时文本风险识别模型输出的风险评分是96分,确定小程序a2在文本风险识别维度的风险较高。
[0146] 参见图4所示,所述流量风险识别模型是用于对子应用的流量信息进行风险识别的模型,所述流量风险识别模型将基于所述子应用的浏览量、独立访客以及时需检测算法进行构建,所述流量风险识别模型的风险识别过程具体是指对所述子应用的浏览量和独立访客计算子应用的点击转化率,通过所述点击转化率对所述子应用进行风险识别,输出的是所述子应用在流量风险识别维度的流量风险评分;其中,参见图4所示,随着时间的变化子应用的浏览量应处于平稳的状态才能够说明子应用未存在风险,此时的流量风险评分较低;当在某一时刻子应用的浏览量变化异常(浏览量增高),说明子应用可能存在风险,此时的流量风险评分将较高,所述子应用的流量风险识别数据可以在子应用的日志文件中获取。
[0147] 并且,所述流量风险识别模型的具体训练过程是通过采集搭载于所述第三方应用的子应用的流量数据,通过对子应用的流量数据进行风险识别,获得子应用的流量风险评分,将子应用的流量数据和子应用的流量风险评分作为训练样本对所述流量风险识别模型进行训练,确定子应用的流量数据和子应用的流量风险评分的关联关系。
[0148] 例如,小程序a2是一款视频播放小程序,通过小程序可以观看电影或短视频等,通过在小程序a2的日志文件中提取小程序每一天的流量数据,再将小程序a2当月的流量数据输入至流量风险识别模型对小程序a2进行风险识别,确定小程序a2在当月的10号和15号浏览量异常增高,此时流量风险识别模型输出的风险评分是96分,确定小程序a2在流量风险识别维度的风险较高。
[0149] 实际应用中,所述底线风险识别模型是用于对所述子应用的交易和展示的图像等内容进行风险识别的模型,所述底线风险识别模型是对子应用进行风险识别的最低成防线,只要被底线风险识别模型识别出的子应用的底线风险评分过高,则可以直接对子应用进行永久性下架,故底线风险识别模型的输出可以对子应用的存在风险产生最直接的影响。
[0150] 其中,所述底线风险识别模型的具体训练过程是通过采集搭载于所述第三方应用的子应用的业务数据,所述业务数据中可以包括子应用的交易数据、图像数据、文本数据等,通过对子应用的业务数据进行风险识别,获得子应用的底线风险评分,将子应用的业务数据和子应用的底线风险评分作为训练样本对所述底线风险识别模型进行训练,确定子应用的业务数据和子应用的底线风险评分的关联关系。
[0151] 例如,小程序a2是一款棋牌类游戏小程序,通过在小程序a2的日志文件中提取小程序的交易数据,再将交易数据输入至底线风险识别模型对小程序a2进行风险识别,确定小程序a2中的交易数据中经常出现玩家往复交易的现象,此时底线风险识别模型输出的风险评分是96分,确定小程序a2在底线风险识别维度的风险较高。
[0152] 通过各个风险识别维度的风险识别模型可以对子应用在各个方面进行风险识别,实现了可以通过不同的风险识别维度的风险评分体现所述子应用存在的风险,进一步提高了对所述子应用的风险识别的准确率。
[0153] 步骤108:根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
[0154] 具体的,在获得所述各个风险识别维度的风险识别模型输出的风险评分的基础上,进一步的,将基于所述各个风险识别维度的风险评分计算所述子应用的风险总评分,所述风险总评分是表示所述子应用结合各个风险识别维度的风险评分的综合性评分,基于所述风险总评分确定所述子应用的风险识别结果,所述风险识别结果可以包括子应用存在风险或子应用未存在风险;所述风险识别结果还可以是子应用的风险等级,通过风险等级可以直观的反映出子应用的存在风险,风险等级越高说明子应用存在风险越高。
[0155] 进一步的,在计算所述子应用的风险总评分的过程中,可以采用加权和的方式进行计算所述风险总评分,采用加权和的方式可以结合多个风险识别维度的风险评分计算获得所述风险总评分,计算出的风险总评分能够更直接的体现出所述子应用存在的风险,本实施例的一个或多个实施方式中,所述风险总评分的计算过程如下所述:
[0156] 确定所述各个风险识别维度对应的风险权重;
[0157] 计算所述各个风险识别维度对应的风险权重和所述各个风险识别维度的风险评分的乘积,获得所述各个风险识别维度的评分数值;
[0158] 对所述各个风险识别维度的评分数值进行求和,将求和结果作为所述风险总评分。
[0159] 具体的,首先确定所述各个风险识别维度的风险权重,通过计算各个风险识别维度的风险评分与其对应的风险权重的二者的乘积,获得各个风险识别维度的评分数值,在通过将各个风险识别维度的评分阈值进行求和,即可作为所述风险总评分。
[0160] 例如,在开发风险识别维度、文本风险识别维度、业务风险识别维度、流量风险识别维度和底线风险识别维度对小程序a3进行风险识别,分别获得开发风险评分是66分,文本风险评分是96分,业务风险评分是92分,流量风险评分是96分,底线风险评分是58分,且开发风险识别维度对应的权重是0.15,文本风险识别维度对应的权重是0.25,业务风险识别维度对应的权重是0.18,流量风险识别维度对应的权重是0.22,底线风险识别维度对应的权重是0.2,经过计算确定小程序a3的风险总评分是0.15*66+0.25*96+0.18*92+0.22*96+0.2*58=83.18。
[0161] 更进一步的,在确定所述子应用的风险总评分的基础上,需要确定所述子应用的风险识别结果,而由于不同的子应用在计算所述风险总评分的过程中结合的风险识别维度对应的风险评分不同,即在确定所述子应用的风险识别结果的过程中也需要结合子应用的业务类型,本实施例的一个或多个实施方式中,确定所述子应用的风险识别结果的具体过程如下所述:
[0162] 根据所述子应用的所述属性数据确定所述子应用的业务类型;
[0163] 根据预先建立的业务类型和评分阈值的对应关系,确定所述子应用的所述业务类型对应的评分阈值;
[0164] 将所述风险总评分与所述评分阈值进行比较,根据比较结果确定所述子应用的所述风险识别结果。
[0165] 实际应用中,不同的业务类型将对应不同的评分阈值,一些综合性较高的子应用对应的评分阈值也是较高的,其中综合性较高的子应用可以是同时提供多种服务的子应用,例如小程序a4同时提供转账服务、购物服务和阅读服务,此时小程序对应的评分阈值也是较高的;
[0166] 基于此,在确定所述子应用对应的评分阈值的情况下,将对所述子应用的风险总评分与所述评分阈值进行比较,在所述子应用的风险总评分大于等于评分阈值的情况下,说明所述子应用可能存在风险,则确定所述子应用的风险识别结果为存在风险;在所述子应用的风险总评分小于评分阈值的情况下,说明所述子应用可能未存在风险,则确定所述子应用的风险识别结果为未存在风险。
[0167] 通过结合所述子应用的业务类型和风险总评分同时确定所述子应用的风险识别结果,实现了确定针对所述子应用的风险识别结果更加准确,并且针对不同的业务类型的子应用会采用不用的评分阈值进行比较,能够更具有针对性的对所述子应用进行风险识别,进一步的提高了子应用的风险识别的准确度。
[0168] 具体实施时,在确定所述子应用存在风险的情况下,需要对所述子应用进行处罚,以实现对存在风险的子应用的风险防控,本实施例的一个或多个实施方式中,在对存在风险的子应用进行处罚时,将结合业务类型选择处罚策略,具体实现方式如下所述:
[0169] 根据所述风险识别结果确定所述子应用存在风险的情况下,基于所述子应用的所述属性数据确定所述子应用的业务类型;
[0170] 通过所述业务类型以及所述风险总评分确定针对所述子应用的处罚策略,并基于所述处罚策略对所述子应用进行处罚。
[0171] 具体的,不同的业务类型将对应不同的处罚策略,所述处罚策略可以是对当前版本的子应用下架整改、对子应用永久下架、对子应用下架由人工再次审核或对子应用中存在风险的内容删除等策略。
[0172] 除此之外,子应用的处罚策略还可以包含小程序隐藏策略,小程序特殊业务资质补充策略,具体的所述处罚策略的设置可以根据实际应用场景进行设定,本说明书在此不作任何限定。
[0173] 参见图5所示,在对支付应用B中的游戏小程序b进行风险识别的过程中,通过审理接口获取游戏小程序b的开发数据,通过巡检接口获取游戏小程序b的文本数据和业务数据,并在游戏小程序b的日志文件中提取其对应的交易数据和流量数据;通过对游戏小程序b的属性数据进行预处理,获得游戏小程序b别在开发风险识别维度的开发风险识别数据,在文本风险识别维度的文本风险识别数据,在业务风险识别维度的业务风险识别数据,在流量风险识别维度的流量风险识别数据,以及在底线风险识别维度的底线风险识别数据;
[0174] 将五个风险识别维度的风险识别数据分别输入对应维度的风险识别模型进行风险识别,如图5所示,游戏小程序b在各个风险识别模型中输出的风险评分别是:开发风险识别维度的开发风险评分是66分,文本风险识别维度的文本风险评分是96分,业务风险识别维度的业务风险评分是92分,流量风险识别维度的流量风险评分是96分,底线风险识别维度的底线风险评分是58分;
[0175] 在确定游戏小程序b的风险总评分的情况下,并通过查看图5中所示的各风险识别维度的风险评分的分布情况,确定游戏小程序b在业务风险识别维度、文本风险识别维度和流量风险识别维度的风险评分较高,此时将根据游戏小程序b的业务类型以及风险评分较高的风险识别维度选择处罚策略,对游戏小程序b进行处罚。
[0176] 进一步的,在确定所述子应用的处罚策略的过程中,不同风险识别维度的风险评分异常将决定着针对子应用的处罚策略,本实施例的一个或多个实施方式中,一方面根据所述风险总评分中的风险评分占比进行确定针对所述子应用的触发策略,具体实现方式如下所述:
[0177] 通过对所述风险总评分进行分析,确定所述开发风险评分在所述风险总评分中的占比最高的情况下,基于所述业务类型和所述开发风险评分确定应用下架策略作为针对所述子应用的所述处罚策略;
[0178] 根据所述应用下架策略对所述子应用进行下架审核处理,作为对所述子应用的处罚。
[0179] 具体的,在确定所述子应用的风险总评分之后,并确定所述子应用存在风险的情况下,通过对所述风险总评分进行分析,确定所述开发风险评分在所述风险总评分中的占比最高,说明所述子应用存在风险的原因是开发风险识别维度存在的风险导致,此时可以选择将所述子应用下架的应用下架策略作为针对所述子应用的所述处罚策略,通过所述应用下架策略对所述子应用进行下架审核处理即可。
[0180] 例如,小程序a4的风险总评分是96分,通过对风险总评分进行分析确定小程序a4在开发风险识别维度存在风险,说明开发小程序a4的开发团队中存在处于黑名单中的开发者,进一步说明小程序a4可能是异常小程序,此时可以将小程序a4下架并由人工再次审核。
[0181] 进一步的,在确定所述子应用的处罚策略的过程中,不同风险识别维度的风险评分异常将决定着针对子应用的处罚策略,本实施例的一个或多个实施方式中,另一方面根据所述风险总评分中的风险评分占比进行确定针对所述子应用的触发策略,具体实现方式如下所述:
[0182] 通过对所述风险总评分进行分析,确定所述业务风险评分在所述风险总评分中的占比最高的情况下,基于所述业务类型和所述业务风险评分确定版本下架策略作为针对所述子应用的所述处罚策略;
[0183] 根据所述版本下架策略对所述子应用进行版本下架处理,作为对所述子应用的处罚。
[0184] 具体的,在确定所述子应用的风险总评分之后,并确定所述子应用存在风险的情况下,通过对所述风险总评分进行分析,确定所述业务风险评分在所述风险总评分中的占比最高,说明所述子应用存在的风险原因是业务风险识别维度存在的风险导致,此时可以选择将所述子应用当前版本下架的版本下架策略作为针对所述子应用的所述处罚策略,通过所述版本下架策略对所述子应用进行当前版本下架处理即可。
[0185] 例如,小程序a4的风险总评分是96分,通过对风险总评分进行分析确定小程序a4在业务风险识别维度存在风险,说明小程序a4可能存在当前版本违规的情况,此时可以将小程序a4的当前版本下架,小程序的发布方在对小程序a4更新之后,可以重新发布最新版本的小程序a4。
[0186] 除此之外,通过对所述子应用的风险总评分进行分析之后,在确定子应用的其他风险识别维度的风险评分在所述风险总评分中的占比最高的情况下,将结合占比最高的风险识别维度的风险评分和业务类型确定处罚策略,在对所述子应用进行处罚,具体的处罚策略可以根据实际应用场景进行设定,本说明书在此不作任何限定。
[0187] 通过结合不同风险识别维度的风险评分以及所述业务类型,可以针对不同的子应用选择不同的处罚策略,对所述子应用进行处罚,实现了可以对存在风险的子应用进行处理,作到进一步的风险防控,避免存在风险的子应用的发布方通过子应用传播异常信息,进一步净化了用户使用子应用的使用环境。
[0188] 具体实施时,在确定所述子应用存在风险的情况下,需要立即对所述子应用停止运行,并将所述子应用的停止运行信息发送给子应用的发布方,本实施例的一个或多个实施方式中,在向所述发布方发送子应用的停止运行的信息时,还需要对子应用停止运行原因通知所述发布方,具体实现方式如下所述:
[0189] 根据所述风险识别结果确定所述子应用存在风险的情况下,停止运行所述子应用;
[0190] 将所述风险识别数据转换为对应风险识别维度下的信息代码并发送至所述子应用的发布方,作为停止运行所述子应用的决策信息。
[0191] 具体的,在根据所述风险识别结果确定所述子应用存在风险的情况下,停止运行所述子应用,并将所述风险识别转换为对应风险识别维度下的信息代码并发送至所述子应用的发布方,将作为停止运行所述子应用的决策信息。
[0192] 其中,将所述风险识别数据转换为所述对应风险识别维度下的信息代码具体是指将所述子应用存在风险的信息转换为信息代码,通过将信息代码发送至所述发布方,可以对停止运行所述子应用做出解释。
[0193] 例如,在确定小程序a5存在风险的情况下,停止运行小程序a5,并根据风险总评分确定小程序在文本风险识别维度存在风险,此时将文本风险识别维度的文本风险识别数据转换为信息代码的形式,发送至小程序a5的发布方,作为对停止运行小程序a5的解释。
[0194] 在识别出所述子应用存在风险的情况下,将对存在风险的风险识别维度的风险识别数据转换为信息代码,并将信息代码发送至所述子应用的发布方,实现了可以很好的对所述子应用的停止运行做出解释,以实现在所述发布方对所述子应用进行申诉时,可以通过信息代码的方式做出合理的解释。
[0195] 本说明书提供的子应用的风险识别方法,通过获取子应用的属性数据,再对属性数据进行预处理,获得各个风险识别维度的风险识别数据,通过各个风险识别维度对应的风险识别模型对各个风险识别数据进行风险识别,获得各个风险识别维度的风险评分,最后通过各个风险识别维度的风险评分计算子应用的风险总评分以确定子应用的风险识别结果,实现了可以精准的、高效率的对第三方应用中的子应用进行风险识别,避免出现子应用传播异常信息的情况发生,解决的子应用的风险防控滞后性问题,可以针对任意业务类型的子应用进行风险识别,具有更好的通用性和稳定性,并且在识别出所述子应用存在风险的情况下,可以结合所述子应用的风险总评分以及所述子应用的业务类型选择处罚策略,对所述子应用进行处罚,进一步实现了对所述子应用的风险防控,避免通过子应用传播异常信息的情况发生。
[0196] 与上述方法实施例相对应,本说明书还提供了子应用的风险识别装置实施例,应用于第三方应用,图6示出了本说明书一实施例提供的一种子应用的风险识别装置的结构示意图。如图6所示,该装置包括:
[0197] 获取属性数据模块602,被配置为获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
[0198] 预处理模块604,被配置为通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
[0199] 风险识别模块606,被配置为将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
[0200] 确定识别结果模块608,被配置为根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
[0201] 一个可选的实施例中,所述获取属性数据模块602,包括:
[0202] 第一获取单元,被配置为通过调用审理接口获取依赖于所述第三方应用运行的所述子应用的开发数据;
[0203] 第二获取单元,被配置为以及通过调用巡检接口获取所述子应用的图像数据,通过调用所述巡检接口获取所述子应用的文本数据,在所述子应用的日志文件中提取所述子应用的交易数据,和/或在所述日志文件中提取所述子应用的浏览数据;
[0204] 整合单元,被配置为将所述开发数据以及所述图像数据、所述文本数据、所述交易数据和/或所述浏览数据进行整合,作为所述子应用的所述属性数据。
[0205] 一个可选的实施例中,所述预处理模块604,包括:
[0206] 第一确定单元,被配置为根据所述开发数据确定所述子应用的开发团队数据,并基于所述开发团队数据确定所述子应用的每个开发者对应的历史开发数据,将所述历史开发数据作为所述子应用在开发风险识别维度的开发风险识别数据;
[0207] 第二确定单元,被配置为以及根据所述开发数据确定所述子应用在发布过程中选择的第一业务类型,根据所述文本数据和所述图像数据识别所述子应用的第二业务类型,将所述第一业务类型和所述第二业务类型作为所述子应用在业务风险识别维度的业务风险识别数据。
[0208] 一个可选的实施例中,所述预处理模块604,包括:
[0209] 处理单元,被配置为通过对所述文本数据进行分词,并对分词结果进行非关键词剔除处理,获得所述子应用在文本风险识别维度的文本风险识别数据;
[0210] 和/或,
[0211] 第三确定单元,被配置为根据所述浏览数据确定所述子应用的浏览量和独立访客,基于所述浏览量和所述独立访客计算所述子应用的点击转换率,将所述点击转换率作为所述子应用在流量风险识别维度的流量风险识别数据;
[0212] 和/或,
[0213] 第四确定单元,被配置为根据所述交易数据确定所述子应用的交易特征,以及根据所述图像数据确定所述子应用的图像特征,将所述交易特征和所述图像特征作为所述子应用在底线风险识别维度的底线风险识别数据。
[0214] 一个可选的实施例中,所述各个风险识别维度的风险识别数据包括:
[0215] 所述开发风险识别数据以及所述业务风险识别数据、所述文本风险识别数据、所述流量风险识别数据和/或所述底线风险识别数据;
[0216] 相应的,所述各个风险识别维度的风险识别模型,包括:
[0217] 开发风险识别模型以及业务风险识别模型、文本风险识别模型、流量风险识别模型和/或底线风险识别模型;
[0218] 相应的,所述各个风险识别维度的风险评分,包括:
[0219] 开发风险评分以及业务风险评分、文本风险评分、流量风险评分和/或底线风险评分。
[0220] 一个可选的实施例中,所述确定识别结果模块608,包括:
[0221] 确定风险权重单元,被配置为确定所述各个风险识别维度对应的风险权重;
[0222] 计算评分数值单元,被配置为计算所述各个风险识别维度对应的风险权重和所述各个风险识别维度的风险评分的乘积,获得所述各个风险识别维度的评分数值;
[0223] 计算风险总评分单元,被配置为对所述各个风险识别维度的评分数值进行求和,将求和结果作为所述风险总评分。
[0224] 一个可选的实施例中,所述子应用的风险识别装置,还包括:
[0225] 确定业务类型模块,被配置为根据所述风险识别结果确定所述子应用存在风险的情况下,基于所述子应用的所述属性数据确定所述子应用的业务类型;
[0226] 处罚模块,被配置为通过所述业务类型以及所述风险总评分确定针对所述子应用的处罚策略,并基于所述处罚策略对所述子应用进行处罚。
[0227] 一个可选的实施例中,所述处罚模块,包括:
[0228] 第一确定处罚策略单元,被配置为通过对所述风险总评分进行分析,确定所述开发风险评分在所述风险总评分中的占比最高的情况下,基于所述业务类型和所述开发风险评分确定应用下架策略作为针对所述子应用的所述处罚策略;
[0229] 第一处罚处理单元,被配置为根据所述应用下架策略对所述子应用进行下架审核处理,作为对所述子应用的处罚。
[0230] 一个可选的实施例中,所述处罚模块,包括:
[0231] 第二确定处罚策略单元,被配置为通过对所述风险总评分进行分析,确定所述业务风险评分在所述风险总评分中的占比最高的情况下,基于所述业务类型和所述业务风险评分确定版本下架策略作为针对所述子应用的所述处罚策略;
[0232] 第二处罚处理单元,被配置为根据所述版本下架策略对所述子应用进行版本下架处理,作为对所述子应用的处罚。
[0233] 一个可选的实施例中,所述确定识别结果模块608,包括:
[0234] 确定业务类型单元,被配置为根据所述子应用的所述属性数据确定所述子应用的业务类型;
[0235] 确定评分阈值单元,被配置为根据预先建立的业务类型和评分阈值的对应关系,确定所述子应用的所述业务类型对应的评分阈值;
[0236] 比较单元,被配置为将所述风险总评分与所述评分阈值进行比较,根据比较结果确定所述子应用的所述风险识别结果。
[0237] 一个可选的实施例中,所述子应用的风险识别装置,还包括:
[0238] 停止模块,被配置为根据所述风险识别结果确定所述子应用存在风险的情况下,停止运行所述子应用;
[0239] 发送模块,被配置为将所述风险识别数据转换为对应风险识别维度下的信息代码并发送至所述子应用的发布方,作为停止运行所述子应用的决策信息。
[0240] 一个可选的实施例中,所述各个风险识别维度对应的风险识别模型中,任意一个风险识别模型采用如下方式进行训练:
[0241] 采集搭载于所述第三方应用的样本子应用的属性数据;
[0242] 通过对所述样本子应用的属性数据进行风险识别,获得所述样本子应用的风险评分;
[0243] 将所述样本子应用的属性数据和所述样本子应用的风险评分作为训练样本对风险识别模型进行训练,确定所述样本子应用的属性数据和所述样本子应用的风险评分的关联关系。
[0244] 本说明书提供的子应用的风险识别装置,通过获取子应用的属性数据,再对属性数据进行预处理,获得各个风险识别维度的风险识别数据,通过各个风险识别维度对应的风险识别模型对各个风险识别数据进行风险识别,获得各个风险识别维度的风险评分,最后通过各个风险识别维度的风险评分计算子应用的风险总评分以确定子应用的风险识别结果,实现了可以精准的、高效率的对第三方应用中的子应用进行风险识别,避免出现子应用传播异常信息的情况发生,解决的子应用的风险防控滞后性问题,可以针对任意业务类型的子应用进行风险识别,具有更好的通用性和稳定性,并且在识别出所述子应用存在风险的情况下,可以结合所述子应用的风险总评分以及所述子应用的业务类型选择处罚策略,对所述子应用进行处罚,进一步实现了对所述子应用的风险防控,避免通过子应用传播异常信息的情况发生。
[0245] 上述为本实施例的一种子应用的风险识别装置的示意性方案。需要说明的是,该子应用的风险识别装置的技术方案与上述的子应用的风险识别方法的技术方案属于同一构思,子应用的风险识别装置的技术方案未详细描述的细节内容,均可以参见上述子应用的风险识别方法的技术方案的描述。
[0246] 图7示出了根据本说明书一实施例提供的一种计算设备700的结构框图。该计算设备700的部件包括但不限于存储器710和处理器720。处理器720与存储器710通过总线730相连接,数据库750用于保存数据。
[0247] 计算设备700还包括接入设备740,接入设备740使得计算设备700能够经由一个或多个网络760通信。这些网络的示例包括公用交换电话网(PSTN)、局域网(LAN)、广域网(WAN)、个域网(PAN)或诸如因特网的通信网络的组合。接入设备740可以包括有线或无线的任何类型的网络接口(例如,网络接口卡(NIC))中的一个或多个,诸如IEEE802.11无线局域网(WLAN)无线接口、全球微波互联接入(Wi-MAX)接口、以太网接口、通用串行总线(USB)接口、蜂窝网络接口、蓝牙接口、近场通信(NFC)接口,等等。
[0248] 在本说明书的一个实施例中,计算设备700的上述部件以及图7中未示出的其他部件也可以彼此相连接,例如通过总线。应当理解,图7所示的计算设备结构框图仅仅是出于示例的目的,而不是对本说明书范围的限制。本领域技术人员可以根据需要,增添或替换其他部件。
[0249] 计算设备700可以是任何类型的静止或移动计算设备,包括移动计算机或移动计算设备(例如,平板计算机、个人数字助理、膝上型计算机、笔记本计算机、上网本等)、移动电话(例如,智能手机)、可佩戴的计算设备(例如,智能手表、智能眼镜等)或其他类型的移动设备,或者诸如台式计算机或PC的静止计算设备。计算设备700还可以是移动式或静止式的服务器
[0250] 其中,处理器720用于执行如下计算机可执行指令:
[0251] 获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
[0252] 通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
[0253] 将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
[0254] 根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
[0255] 上述为本实施例的一种计算设备的示意性方案。需要说明的是,该计算设备的技术方案与上述的子应用的风险识别方法的技术方案属于同一构思,计算设备的技术方案未详细描述的细节内容,均可以参见上述子应用的风险识别方法的技术方案的描述。
[0256] 本说明书一实施例还提供一种计算机可读存储介质,其存储有计算机指令,该指令被处理器执行时以用于:
[0257] 获取搭载于第三方应用并依赖所述第三方应用运行的子应用的属性数据;
[0258] 通过对所述属性数据进行预处理,获得各个风险识别维度的风险识别数据;
[0259] 将所述各个风险识别维度的风险识别数据分别输入至所述各个风险识别维度对应的风险识别模型,对所述子应用在所述各个风险识别维度进行风险识别,获得所述各个风险识别模型输出的所述各个风险识别维度的风险评分;
[0260] 根据所述各个风险识别维度的风险评分计算所述子应用的风险总评分,并基于所述风险总评分确定所述子应用的风险识别结果。
[0261] 上述为本实施例的一种计算机可读存储介质的示意性方案。需要说明的是,该存储介质的技术方案与上述的子应用的风险识别方法的技术方案属于同一构思,存储介质的技术方案未详细描述的细节内容,均可以参见上述子应用的风险识别方法的技术方案的描述。
[0262] 上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
[0263] 所述计算机指令包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0264] 需要说明的是,对于前述的各方法实施例,为了简便描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本说明书并不受所描述的动作顺序的限制,因为依据本说明书,某些步骤可以采用其它顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定都是本说明书所必须的。
[0265] 在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其它实施例的相关描述。
[0266] 以上公开的本说明书优选实施例只是用于帮助阐述本说明书。可选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本说明书的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本说明书。本说明书仅受权利要求书及其全部范围和等效物的限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈