首页 / 专利库 / 控制系统 / 积分项 / 异常检测方法、装置、计算机设备及存储介质

异常检测方法、装置、计算机设备及存储介质

阅读:1012发布:2020-07-02

专利汇可以提供异常检测方法、装置、计算机设备及存储介质专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种 异常检测 方法、装置、计算机设备及存储介质,根据处理终端对 申请 数据集进行划分,通过对第一预设时间段的申请数据集的异常情况进行分析挑选出需要进行二次检测的处理终端,再根据抽检因子针对性地对处理终端中的待检测数据集进行检测。通过逐渐递进的 多重检测 方式和针对性设置的抽检因子可大大减少需要检测的申请数据集,提高了异常检测的效率,并且可以快速 锁 定需重点检测的处理终端,进一步提高了检测效率。,下面是异常检测方法、装置、计算机设备及存储介质专利的具体信息内容。

1.一种异常检测方法,其特征在于,包括:
获取第一预设时间段内的申请数据集;
将所述申请数据集根据处理终端进行划分得到与每一所述处理终端对应的待评估数据集;
对每一所述待评估数据集进行检测确定异常数据集;
根据所述异常数据集的数量和所述待评估数据集的数量计算每一所述处理终端中申请数据集的异常比例;
若所述异常比例大于第一预设值,则提取对应的所述处理终端中第二预设时间段内的申请数据集,作为历史数据集;
根据抽检因子从所述历史数据集中确定待检测数据集;
与第三方数据库建立连接,所述第三方数据库为与公安系统或行系统关联的数据库;
根据所述待检测数据集中的申请人信息从公安系统或银行系统调取对应的申请数据集的所有信息至所述第三方数据库中;
若所述待检测数据集中的待确认信息与所述第三方数据库中的信息不一致,则确定所述待检测数据集为历史性异常数据集。
2.如权利要求1所述的异常检测方法,其特征在于,所述对每一所述待评估数据集进行检测确定异常数据集,包括:
将所述待评估数据集根据用户唯一性信息进行分类得到每一所述用户唯一性信息对应的申请数据集,确定每一所述用户唯一性信息对应的所述申请数据集的数量;
将用户唯一性信息对应的申请数据集的数量大于第二预设值的申请数据集确定为异常数据集,并确定所述异常数据集中包含的申请人信息;
调取所述异常数据集中的手机号码;
根据所述异常数据集中的申请人姓名、身份证号码和所述手机号码形成拦截信息。
3.如权利要求1所述的异常检测方法,其特征在于,在所述确定所述待检测数据集为历史性异常数据集之后,所述异常检测方法还包括:
统计所述历史性异常数据集的数量;
根据所述历史性异常数据集的数量确定所述处理终端的预警强度并执行对应的预警操作。
4.如权利要求3所述的异常检测方法,其特征在于,所述根据所述历史性异常数据集的数量确定所述处理终端的预警强度并执行对应的预警操作,包括:
若所述历史性异常数据集的数量达到第一阈值,则将对应的处理终端定义为一级预警,并拒绝所述处理终端在所述第一预设时间段之后所有的申请数据集;
若所述历史性异常数据集的数量达到第二阈值,则将对应的处理终端定义为二级预警,并对所述处理终端在所述第一预设时间段之后所有的申请数据集进行标记;
若所述欺诈申请数据集的数量达到第三阈值,则将对应的处理终端列入三级预警,并对所述处理终端中的申请数据集按预设比例进行复核。
5.如权利要求1所述的异常检测方法,其特征在于,在所述根据所述异常数据集的数量和所述待评估数据集的数量计算所述处理终端的异常比例之后,所述异常检测方法还包括:
获取所有处理终端在所述第一预设时间段内的异常比例;
根据所述异常比例对所述处理终端的信誉度进行从高到低的排序;
通过信誉度排序对所述处理终端执行积分增减操作。
6.一种异常检测装置,其特征在于,包括:
申请数据集获取模,用于获取第一预设时间段内的申请数据集;
数据集划分模块,用于将所述申请数据集根据处理终端进行划分得到与每一所述处理终端对应的待评估数据集;
数据集检测模块,用于对每一所述待评估数据集进行检测确定异常数据集;
异常比例计算模块,用于根据所述异常数据集的数量和所述待评估数据集的数量计算每一所述处理终端中申请数据集的异常比例;
历史数据集确定模块,用于在所述异常比例大于第一预设值时,则提取对应的所述处理终端中第二预设时间段内的申请数据集,作为历史数据集;
待检测数据集确定模块,用于根据抽检因子从所述历史数据集中确定待检测数据集;
数据库连接模块,用于与第三方数据库建立连接,所述第三方数据库为与公安系统或银行系统关联的数据库;
数据导入模块,用于根据所述待检测数据集中的申请人信息从公安系统或银行系统调取对应的申请数据集的所有信息至所述第三方数据库中;
异常数据集确定模块,用于在所述待检测数据集中的待确认信息与所述第三方数据库中的信息不一致时,则确定所述待检测数据集为历史性异常数据集。
7.如权利要求6所述的异常检测装置,其特征在于,所述数据集检测模块包括:
数量确定单元,用于将所述待评估数据集根据用户唯一性信息进行分类得到每一所述用户唯一性信息对应的申请数据集,确定每一所述用户唯一性信息对应的所述申请数据集的数量;
异常数据集确定单元,用于将用户唯一性信息对应的申请数据集的数量大于第二预设值的申请数据集确定为异常数据集,并确定所述异常数据集中包含的申请人信息;
手机号码调取单元,用于调取所述异常数据集中的手机号码;
信息拦截单元,用于根据所述异常数据集中的申请人姓名、身份证号码和所述手机号码形成拦截信息。
8.如权利要求6所述的异常检测装置,其特征在于,所述异常检测装置还包括:
异常比例获取模块,用于获取所有处理终端在所述第一预设时间段内的异常比例;
排序模块,用于根据所述异常比例对所述处理终端的信誉度进行从高到低的排序;
积分调整模块,用于通过信誉度排序对所述处理终端执行积分增减操作。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至
5任一项所述异常检测方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述异常检测方法。

说明书全文

异常检测方法、装置、计算机设备及存储介质

技术领域

[0001] 本发明涉及数据分析领域,尤其涉及一种异常检测方法、装置、计算机设备及存储介质。

背景技术

[0002] 随着计算机技术的快速发展,越来越多的场景或者任务实现了从线下到线上的转化,为很多场景或者任务的进行提供了较大的便利,不需要用户到固定的场所中完成繁琐申请数据的录入。然而,由于用户都不是进行现场的实时交互,会存在由于缺乏有效的核实或验证机制而导致无法保证申请数据的真实有效的问题。其中,最关键的问题在于申请数据的真实性和有效性,在信息提交的过程中存在很多谎报虚假信息的情况,或者是申请人利用手机号码、身份证号码进行多次申请的不规范行为,因此需要对提供的数据或信息进行核验。而且,在很多任务或者项目中会涉及到不同的处理终端,这也导致了对于信息的真实性检测更加困难,难以较高效地判断申请数据是否异常。

发明内容

[0003] 本发明实施例提供一种异常检测方法、装置、计算机设备及存储介质,以解决对线上录入的数据的异常检测效率不高的问题。
[0004] 一种异常检测方法,包括:
[0005] 获取第一预设时间段内的申请数据集;
[0006] 将所述申请数据集根据处理终端进行划分得到与每一所述处理终端对应的待评估数据集;
[0007] 对每一所述待评估数据集进行检测确定异常数据集;
[0008] 根据所述异常数据集的数量和所述待评估数据集的数量计算每一所述处理终端中申请数据集的异常比例;
[0009] 若所述异常比例大于第一预设值,则提取对应的所述处理终端中第二预设时间段内的申请数据集,作为历史数据集;
[0010] 根据抽检因子从所述历史数据集中确定待检测数据集;
[0011] 与第三方数据库建立连接,所述第三方数据库为与公安系统或行系统关联的数据库;
[0012] 根据所述待检测数据集中的申请人信息从公安系统或银行系统调取对应的申请数据集的所有信息至所述第三方数据库中;
[0013] 若所述待检测数据集中的待确认信息与所述第三方数据库中的信息不一致,则确定所述待检测数据集为历史性异常数据集。
[0014] 一种异常检测装置,包括:
[0015] 申请数据集获取模,用于获取第一预设时间段内的申请数据集;
[0016] 数据集划分模块,用于将所述申请数据集根据处理终端进行划分得到与每一所述处理终端对应的待评估数据集;
[0017] 数据集检测模块,用于对每一所述待评估数据集进行检测确定异常数据集;
[0018] 异常比例计算模块,用于根据所述异常数据集的数量和所述待评估数据集的数量计算每一所述处理终端中申请数据集的异常比例;
[0019] 历史数据集确定模块,用于在所述异常比例大于第一预设值时,则提取对应的所述处理终端中第二预设时间段内的申请数据集,作为历史数据集;
[0020] 待检测数据集确定模块,用于根据抽检因子从所述历史数据集中确定待检测数据集;
[0021] 数据库连接模块,用于与第三方数据库建立连接,所述第三方数据库为与公安系统或银行系统关联的数据库;
[0022] 数据导入模块,用于根据所述待检测数据集中的申请人信息从公安系统或银行系统调取对应的申请数据集的所有信息至所述第三方数据库中;
[0023] 异常数据集确定模块,用于在所述待检测数据集中的待确认信息与所述第三方数据库中的信息不一致时,则确定所述待检测数据集为历史性异常数据集。
[0024] 一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述异常检测方法。
[0025] 一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述异常检测方法。
[0026] 上述异常检测方法、装置、计算机设备及存储介质中,服务端从客户端获取第一预设时间段内的申请数据集;将所述申请数据集根据处理终端进行划分得到与每一所述处理终端对应的待评估数据集;对所述待评估数据集进行检测确定异常数据集;根据所述异常数据集的数量和所述待评估数据集的数量计算每一所述处理终端中申请数据集的异常比例;若所述异常比例大于第一预设值,则提取对应的所述处理终端中第二预设时间段内的申请数据集,作为历史数据集;根据抽检因子从所述历史数据集中确定待检测数据集;与第三方数据库建立连接,所述第三方数据库为与公安系统或银行系统关联的数据库;根据所述待检测数据集中的申请人从公安系统或银行系统调取对应的申请数据集的所有信息至所述第三方数据库中;若所述待检测数据集中的待确认信息与所述第三方数据库中的信息不一致,则确定所述待检测数据集为历史性异常数据集。根据处理终端对申请数据集进行划分,通过对第一预设时间段的申请数据集的异常情况进行分析挑选出需要进行二次检测的处理终端,再根据抽检因子针对性地对处理终端中的待检测数据集进行检测。通过逐渐递进的多重检测方式和针对性设置的抽检因子可大大减少需要检测的申请数据集,提高了异常检测的效率,并且可以快速定需重点检测的处理终端,进一步提高了检测效率。附图说明
[0027] 为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0028] 图1是本发明一实施例中异常检测方法的一应用环境示意图;
[0029] 图2是本发明一实施例中异常检测方法的一流程图
[0030] 图3是本发明一实施例中异常检测方法的另一流程图;
[0031] 图4是本发明一实施例中异常检测方法的另一流程图;
[0032] 图5是本发明一实施例中异常检测方法的另一流程图;
[0033] 图6是本发明一实施例中异常检测方法的另一流程图;
[0034] 图7是本发明一实施例中异常检测装置的一示意图;
[0035] 图8是本发明一实施例中异常检测装置的另一示意图;
[0036] 图9是本发明一实施例中异常检测装置的另一示意图;
[0037] 图10是本发明一实施例中计算机设备的一示意图。

具体实施方式

[0038] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0039] 本发明实施例提供的异常检测方法,可应用在如图1的应用环境中,其中,客户端(计算机设备)通过网络与服务端进行通信。服务端从客户端获取第一预设时间段内的申请数据集;将所述申请数据集根据处理终端进行划分得到与每一所述处理终端对应的待评估数据集;对所述待评估数据集进行检测确定异常数据集;根据所述异常数据集的数量和所述待评估数据集的数量计算每一所述处理终端中申请数据集的异常比例;若所述异常比例大于第一预设值,则提取对应的所述处理终端中第二预设时间段内的申请数据集,作为历史数据集;根据抽检因子从所述历史数据集中确定待检测数据集;与第三方数据库建立连接,所述第三方数据库为与公安系统或银行系统关联的数据库;根据所述待检测数据集中的申请人从公安系统或银行系统调取对应的申请数据集的所有信息至所述第三方数据库中;若所述待检测数据集中的待确认信息与所述第三方数据库中的信息不一致,则确定所述待检测数据集为历史性异常数据集。其中,客户端(计算机设备)可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务端可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0040] 在一实施例中,如图2所示,提供一种异常检测方法,以该方法应用在图1中的服务端为例进行说明,包括如下步骤:
[0041] S10、获取第一预设时间段内的申请数据集。
[0042] 申请数据集为符合一定条件的数据集合,在该步骤中,将符合上述第一预设时间段内的数据提取出来,组成申请数据集。在该实施例中,这个条件则为第一预设时间段内的数据集。该申请数据集中的数据可以为各项业务、服务或者事件的申请数据。第一预设时间段为预先设定的一个时间区间,该第一预设时间段可以通过默认设置值存在,也可以在每次执行之时,输入一个时间段作为第一预设时间段,可选地,该第一预设时间段可以通过指令、选择或者编辑的方式进行输入。目前很多业务、服务或者事件的申请过程中,存在异常的数据(虚假信息和不规范数据),为了遏制不良事件的发生,需要对申请过程中的各个处理终端经手的数据的真实有效性进行审查。
[0043] 在一个具体实施方式中,本申请提供的异常检测方法可应用在软件平台中,通过应用程序获取用户提交的申请数据集,对通过处理终端提交的申请数据集进行抽检和评估,以此评判相关联的处理终端的信誉度。本申请中的申请数据集可以看成是针对某一项业务提交的一系列数据集合,包括申请事项和相关信息。
[0044] S20、将所述申请数据集根据处理终端进行划分得到与每一处理终端对应的待评估数据集。
[0045] 提交的申请数据集包含了处理该数据的处理终端等有关信息,因此本申请在获取预设时间段内的大量申请数据集后,可以根据处理终端将这些申请数据集进行划分,得到每一处理终端对应的申请数据集,即本申请中的待评估数据集。例如,将获取到的申请数据集进行划分,分别得到处理终端A对应的申请数据集、处理终端B对应的申请数据集等。可选地,具体地划分方式可以根据申请数据集中每一申请数据中的处理终端的标识、上传的终端、上传的位置信息或者其他信息来划分。
[0046] 根据处理终端划分数据集的目的是为了根据该处理终端申请数据集的质量情况评判其异常的可能性,如此一来做到有针对性地进行异常检测,避免对所有数据进行一一检测,提高检测效率。
[0047] S30、对每一所述待评估数据集进行检测确定异常数据集。
[0048] 在本步骤中,对每一处理终端的申请数据集分别进行检测分析,可以根据申请数据集的特点重点检测其中是否存在同一用户关联多个申请数据集的情况,而手机号码和身份证号码是与用户进行实名绑定的,因此可根据手机号码、身份证号码等具有唯一性的参数对待评估数据集进行分析,同一手机号码或身份证号码关联的多笔申请数据集均属于异常数据集。或者,根据申请数据集中的通讯地址来确定异常数据集,若同一通讯地址出现的次数超过一定的数量阈值,也可以将对应的数据确定为异常数据。可以理解地,通讯地址可能存在多人共用,所以数量阈值可以根据实际需要进行设置。
[0049] 需要说明的是,本申请中的检测方式并不仅仅只针对于手机号码、身份证号码和通讯地址,在实际场景中有不同的检测规则,对应有不同的检测参数,例如可根据申请数据集中的金额设置异常条件,若超过提前设置的合理金额,则将该申请数据集视为异常的申请数据集。
[0050] S40、根据所述异常数据集的数量和所述待评估数据集的数量计算每一所述处理终端中申请数据集的异常比例。
[0051] 具体地,假设通过某一处理终端提交的申请数据集的总量为50,其中有三个手机号码关联了多笔数据集,则申请的多笔数据集为异常数据集,利用第一个手机号码提交的申请数据集数量为5,利用第二个手机号码提交的申请数据集数量为6,利用第三个手机号码提交的申请数据集数量为9,那么根据异常申请的数据集的数量和对应的处理终端所有申请数据集的数量得到的异常比例是(5+6+9)/50,即异常比例为百分之四十。可以理解地,可以同时通过多个因素来检测异常数据集,例如同时考虑手机号码和身份证号码。
[0052] S50、若所述异常比例大于第一预设值,则提取对应的所述处理终端中第二预设时间段内的申请数据集,作为历史数据集。
[0053] 若根据步骤S40计算该处理终端的申请数据集的异常比例大于第一预设值时,说明该处理终端在这一时间段存在大量异常事件,应对该处理终端申请的历史数据集的情况进行进一步地检测。具体方法是提取该处理终端在第二预设时间段内的申请数据集,作为历史数据集。该第二预设时间段也是一个预设的时间区间,可以预先设置得到。可选地,该第二预设时间段和第一预设时间段具有关联。示例性地,第二预设时间段可以为第一预设时间段之前的时间段或者第一预设时间段之前的特定时间段。例如,如果提取申请数据集的第一预设时间段是5月1日至7月1日,且通过步骤S10至步骤S40统计出该段时间内某一处理终端的异常比例大于第一预设值,那么系统将自动提取5月1日之前的申请数据集,作为历史数据集,需要说明的是,历史申请数据集可以是5月1日之前所有的历史申请数据集,也可以对提取的历史数据集设置时间段,例如调取3月1日至5月1日之间发生的历史数据集。
[0054] 在实际中,处理终端的数量庞大,经手的申请数据集数量更是数不胜数,为了提高检测效率,本申请并不需要对处理终端中全部的申请数据集都进行审查评估,而是获取预设时间段内的申请数据集进行异常检测。另一方面,并不是对所有处理终端的申请数据集都进行异常检测,而是对异常比例较大的处理终端才调取历史申请数据集进行复核。此种方式节省了大量不必要的检测过程,大大提高了工作效率。并且本申请异常检测方法并不是片面定义在此期间内异常比例较高的处理终端为异常机构,还会结合该机构申请的历史数据集情况综合评判,减少了误判的概率,提高了异常检测的准确率。
[0055] S60、根据抽检因子从所述历史数据集中确定待检测数据集。
[0056] 在对异常比例较高的处理终端进行抽检时可以根据抽检因子抽取申请数据集进行检测,可选地,抽检因子可以为申请时的位置信息或申请方式。
[0057] 若对处理终端预设时间段内的异常数据集进行分析发现大多数异常数据集出自于同一地点,那么可以针对性地设置抽检因子为位置信息,将历史申请数据集中申请地点为该位置的数据集抽取出来进行检测。也可以根据随机抽取的方式确定待检测数据集,此时抽检因子为随机函数或者随机抽取策略。以此类推,可根据历史数据集中已被确定为异常数据集的基本信息分析异常数据集的倾向性,再利用其倾向性针对性地设置抽检因子可以有效获知异常的处理终端。
[0058] 除此之外,还可根据一定的抽检比例对某一处理终端的历史数据集进行抽取。示例性地,通过设定一定的抽检比例,然后根据一定的抽取策略从历史数据集中提取出对应数量的数据。该抽取策略可以为根据一定的时间间隔,或者根据不同的位置等。
[0059] S70、与第三方数据库建立连接,所述第三方数据库为与公安系统或银行系统关联的数据库。
[0060] 当从历史数据集中根据抽检因子确定待检测数据集后,进入检测步骤,首先建立与第三方数据库的连接,第三方数据库是与公安系统或银行系统相关联的数据库。其中,银行系统关联的数据库可以为安全性要求较高且需要对用户身份进行验证的数据库。
[0061] S80、根据所述待检测数据集中的申请人信息从公安系统或银行系统调取对应的申请数据集的所有信息至所述第三方数据库中。
[0062] 确定待检测数据集后,根据待检测数据集中的申请人信息从公安系统或银行系统将此人的全部相关信息导入到第三方数据库中,因此导入到第三方数据库中的信息全部是真实有效的。该申请人信息为可以唯一标识申请人的信息,例如,手机号码或者身份证号码等。在一种可能的方式当中,系统也可直接根据申请人从公安系统或银行系统的数据库进行查询。
[0063] S90、若所述待检测数据集中的待确认信息与所述第三方数据库中的信息不一致,则确定所述待检测数据集为历史性异常数据集。
[0064] 本申请中的待确认信息具体可以为待检测数据集中包括的姓名、性别、出生日期、工作单位,除此之外,待确认信息还可以包括其他任何需要验证的信息。数据库中导入的信息可以用来复查待检测数据集中申请人录入的信息是否属实,如果申请数据集中录入的信息与第三方数据库中的信息不一致,则确定该待检测数据集为历史异常数据集。
[0065] 本申请实施例中通过抽检因子对待检测数据集再次进行检测,通过相关权威系统中真实有效的信息判断待检测数据集的真实性,大大提高了异常检测的准确性,为后续处理终端整体的异常评判提供了准确、有的数据支持。
[0066] 进一步地,还可以辅助以抽检的方式进行检测,抽检可通过关联的第三方数据库对待检测数据集的真实有效性进行审查,调查用户的基本情况,包括申请人填写的信息是否和上报的信息有出入,还可以通过向用户发送询问信息进行复查,询问是否是本人申请的业务以及处理终端是否出现收费过高的情况等。或者,通过其他方式获取用户地真实信息来进行核实。其中,针对是否是本人申请业务的调查结果可以用来复查判断是否存在同一用户申请多笔申请数据集的情况。
[0067] 本申请实施例中的异常检测方法首先根据处理终端对申请数据集进行划分,通过对第一预设时间段的申请数据集的异常情况进行分析挑选出需要进行二次检测的处理终端,再根据抽检因子针对性地对处理终端中的待检测数据集进行检测。通过逐渐递进的多重检测方式和针对性设置的抽检因子可大大减少需要检测的申请数据集,快速锁定需重点检测的处理终端,提高了检测效率。
[0068] 在一个实施例中,如图3所示,对每一所述待评估数据集进行检测确定异常数据集,包括;
[0069] S301、将所述待评估数据集根据用户唯一性信息进行分类得到每一所述用户唯一性信息对应的申请数据集,确定每一所述用户唯一性信息对应的所述申请数据集的数量。
[0070] 在通过处理终端提交的申请数据集中的基本信息包括申请人姓名、手机号码、身份证号码等信息,每个申请人都有唯一对应的身份证号码或者手机号码,因此可以通过用户唯一性信息(手机号码或者身份证号码等)判断是否存在某人申请多笔申请数据集的欺诈事件,首先根据用户唯一性信息对待评估数据集进行分类,得到不同用户唯一性信息对应的申请数据集及其数量。示例性地,以身份证号码作为用户唯一性信息为例,假设某一处理终端某段时间接收的待评估数据集数量为30件,30件待评估数据集是分别通过10个身份证号码申请,经过统计发现通过第一个身份证号码申请的申请数据集数量为6,通过第二个身份证号码申请的数量为9,通过第三个身份证号码申请的数量为8个,其他身份证号码均只申请了一件。
[0071] S302、将用户唯一性信息对应的申请数据集的数量大于第二预设值的申请数据集确定为异常数据集,并确定所述异常数据集中包含的申请人信息。
[0072] 第二预设值是判断异常申请数据集的数量标准,具体可灵活设定,若对异常申请数据集的定义较为严格,那么该预设值可设为1,反之,也可放宽异常条件,预设值设定为较大的数值。
[0073] 若第二预设值设为1,则身份证号码对应的申请数据集数量大于1的申请数据集均视为异常申请数据集,那么通过第一、第二、第三个身份证号码申请的申请数据集均为异常申请数据集,然后确定出异常申请数据集中包含的申请人信息。
[0074] S303、调取所述异常数据集中的手机号码。
[0075] 虽然一个用户只对应一个身份证号码,但是一个用户却可以注册多个手机号码,如果该用户以及涉及异常申请数据集,那么该用户以及与此用户关联的多个手机号码都应受到监督,以便后续对包含该用户以及号码的申请数据集进行严格审核。
[0076] S304、根据所述异常数据集中的申请人姓名、身份证号码和所述手机号码形成拦截信息。
[0077] 将已经确定为异常数据集中的关键信息例如姓名、身份证号码和手机号码作为后续数据集的拦截信息,有助于再次快速检索到异常的数据集,为后续申请数据集提供可靠的检测标准,提高了检测的效率和准确性。
[0078] 在一个实施例中,如图4所示,在所述确定所述待检测数据集为历史性异常数据集之后,该异常检测方法还包括:
[0079] S100、统计所述历史性异常数据集的数量。
[0080] S110、根据所述历史性异常数据集的数量确定所述处理终端的预警强度并执行对应的预警操作。
[0081] 本步骤中,可根据历史性异常数据集数量的不同定义不同的预警强度,适用不同的预警措施,示例性地,预警强度从高到低分别设置成一级、二级、三级预警,适用不同的预警措施,异常数据集数量较多的处理终端列为一级预警,适用最严格的预警措施,以此类推。在确定了预警强度之后,再根据预警强度执行对应的预警操作。
[0082] 具体地,如图5所示,根据所述历史性异常数据集的数量确定所述处理终端的预警强度并执行对应的预警操作,包括:
[0083] S111、若所述历史性异常数据集的数量达到第一阈值,则将对应的处理终端确定为一级预警,并拒绝所述处理终端在所述第一预设时间段之后所有的申请数据集。
[0084] 本步骤中,如果历史异常数据集的数量特别多,达到设置的第一阈值,则将对应的处理终端确定为最强烈的一级预警,对应的预警措施为拒绝预设时间段此后所有的申请数据集。
[0085] S112、若所述历史性异常数据集的数量达到第二阈值,则将对应的处理终端确定为二级预警,并对所述处理终端在所述第一预设时间段之后所有的申请数据集进行标记。
[0086] 如果历史性异常数据集的数量小于第一阈值但大于第二阈值,则将其确定为二级预警,可对该处理终端此后的申请数据集都进行标记,以进行重点检测或者审核。
[0087] S113、若所述历史性异常数据集的数量达到第三阈值,则将对应的处理终端确定为三级预警,并对所述处理终端中的申请数据集按预设比例进行复核。
[0088] 如果历史性异常数据集数量较少,说明该处理终端的不规范行为较少,只需对其抽取一定比例的申请数据集进行复核即可。该预设比例可以根据不同场景或者需要进行设定。
[0089] 申请数据集复核的具体过程可参照步骤S301至S304,具体不再赘述。
[0090] 本申请实施例中的抽检方法通过对历史性异常数据集的评价情况决定对处理终端的处理措施,可对处理终端起到预警作用,有利于规范处理终端的行为。
[0091] 在一个实施例中,如图6所示,在所述根据所述异常数据集的数量和所述待评估数据集的数量计算所述处理终端的异常比例之后,所述方法还包括:
[0092] S401、获取所有处理终端在所述第一预设时间段内的异常比例。
[0093] 每一处理终端通过步骤S10至步骤S40计算得到预设时间段的异常比例,本步骤即获取所有处理终端在所述预设时间段内的异常比例。
[0094] S402、根据所述异常比例对所述处理终端的信誉度进行从高到低的排序。
[0095] 异常比例与信誉度成反比,异常比例越高的处理终端信誉度越低,异常比例越低的处理终端信誉度越高,因此可根据异常比例对信誉度进行排序。
[0096] S403、通过信誉度排序对所述处理终端执行积分增减操作。
[0097] 在根据异常比例对所有处理终端的信誉度进行排序后,可对顺序阶梯实行积分增减制度,该制度可根据实际情况进行设定,例如,每个处理终端都具有相同的原始基础积分。可选地,每次排序后,对于信誉度前三的处理终端增加一定积分,信誉度处于最后三位的处理终端扣除一定的积分。在一段时间后,可根据处理终端的整体积分情况执行对应的策略,当一处理终端的整体积分低于一定的分值时,可以将该处理终端确定为异常终端并采取对应地策略。
[0098] 在本实施例中,通过获取所有处理终端在所述预设时间段内的异常比例,再根据所述异常比例对所述所有处理终端的信誉度进行从高到低的排序,最终通过信誉度排序对所述所有处理终端执行积分增减操作。通过对数次检测情况的累计之后,根据信誉度对处理终端进行异常的判定,从多个维度进行异常检测,更好地保障了异常检测的精度
[0099] 应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0100] 在一实施例中,提供一种异常检测装置,该异常检测装置与上述实施例中异常检测方法一一对应。如图7所示,该异常检测装置包括申请数据集获取模块10、数据集划分模块20、数据集检测模块30、异常比例计算模块40、历史数据集确定模块50、待检测数据集确定模块60、数据库连接模块70、数据导入模块80和异常数据集确定模块90。各功能模块详细说明如下:
[0101] 申请数据集获取模块10,用于获取第一预设时间段内的申请数据集。
[0102] 数据集划分模块20,用于将所述申请数据集根据处理终端进行划分得到与每一所述处理终端对应的待评估数据集。
[0103] 数据集检测模块30,用于对每一所述待评估数据集进行检测确定异常数据集。
[0104] 异常比例计算模块40,用于根据所述异常数据集的数量和所述待评估数据集的数量计算每一所述处理终端中申请数据集的异常比例。
[0105] 历史数据集确定模块50,用于若所述异常比例大于第一预设值,则提取对应的所述处理终端中第二预设时间段内的申请数据集,作为历史数据集。
[0106] 待检测数据集确定模块60,用于根据抽检因子从所述历史数据集中确定待检测数据集。
[0107] 数据库连接模块70,用于与第三方数据库建立连接,所述第三方数据库为与公安系统或银行系统关联的数据库。
[0108] 数据导入模块80,用于根据所述待检测数据集中的申请人信息从公安系统或银行系统调取对应的申请数据集的所有信息至所述第三方数据库中。
[0109] 异常数据集确定模块90,用于在所述待检测数据集中的待确认信息与所述第三方数据库中的信息不一致时,则确定所述待检测数据集为历史性异常数据集。
[0110] 优选地,如图8所示,数据集检测模块30包括数量确定单元301、异常数据集确定单元302、手机号码调取单元303和信息拦截单元304。
[0111] 数量确定单元301,用于将所述待评估数据集根据用户唯一性信息进行分类得到每一所述用户唯一性信息对应的申请数据集,确定每一所述用户唯一性信息对应的所述申请数据集的数量。
[0112] 异常数据集确定单元302,用于将用户唯一性信息对应的申请数据集的数量大于第二预设值的申请数据集确定为异常数据集,并确定所述异常数据集中包含的申请人信息。
[0113] 手机号码调取单元303,用于调取所述异常数据集中的手机号码。
[0114] 信息拦截单元304,用于根据所述异常数据集中的申请人姓名、身份证号码和所述手机号码形成拦截信息。
[0115] 优选地,如图9所示,该异常检测装置还包括异常比例获取模块401、排序模块402和积分调整模块403。
[0116] 异常比例获取模块401,用于获取所有处理终端在所述第一预设时间段内的异常比例。
[0117] 排序模块402,用于根据所述异常比例对所述处理终端的信誉度进行从高到低的排序。
[0118] 积分调整模块403,用于通过信誉度排序对所述处理终端执行积分增减操作。
[0119] 优选地,该异常检测装置还用于统计所述历史性异常数据集的数量;根据所述历史性异常数据集的数量确定所述处理终端的预警强度并执行对应的预警操作。
[0120] 若所述历史性异常数据集的数量达到第一阈值,则将对应的处理终端确定为一级预警,并拒绝所述处理终端在所述第一预设时间段之后所有的申请数据集;若所述历史性异常数据集的数量达到第二阈值,则将对应的处理终端确定为二级预警,并对所述处理终端在所述第一预设时间段之后所有的申请数据集进行标记;若所述历史性异常数据集的数量达到第三阈值,则将对应的处理终端确定为三级预警,并对所述处理终端中的申请数据集按预设比例进行复核。
[0121] 关于异常检测装置的具体限定可以参见上文中对于异常检测方法的限定,在此不再赘述。上述异常检测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0122] 在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中的异常检测方法所使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常检测方法。
[0123] 在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的异常检测方法。
[0124] 在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中的异常检测方法。
[0125] 本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
[0126] 所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
[0127] 以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈