首页 / 专利库 / 赌博 / 赌博 / 一种训练模型的方法、装置、实现信息排查及装置

一种训练模型的方法、装置、实现信息排查及装置

阅读:997发布:2020-06-28

专利汇可以提供一种训练模型的方法、装置、实现信息排查及装置专利检索,专利查询,专利分析的服务。并且一种训练模型的方法、装置、实现信息排查的方法及装置,包括:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;基于获取的结构化数据的内容配置RIPPER规则;根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;其中,样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。本 发明 实施例 提升了对未依法完成强制戒毒对象的识别效率。,下面是一种训练模型的方法、装置、实现信息排查及装置专利的具体信息内容。

1.一种训练模型的方法,包括:
对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
2.根据权利要求1所述的方法,其特征在于,所述RIPPER规则包括基于以下一项或一项以上所述结构化数据的内容构建的规则:
年龄、有无稳定住所、有无稳定职业、有无经历高等教育、有无专业特长、娱乐场所的消费频次、是否有偷窃记录、是否有抢劫记录、是否有诈骗记录、是否有赌博记录、是否有打架斗殴记录、是否有信用卡逾期记录、最近一次作案的时间,预设时长内的犯罪次数、犯罪的时间周期、亲属有无吸毒前科及一度联系人有无强制戒毒的历史。
3.根据权利要求1或2所述的方法,其特征在于,所述从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则,包括:
根据各RIPPER规则的排查结果,计算各RIPPER规则的排查效率;
确定排查效率大于预设的第一排查效率阈值的RIPPER规则为用于构建排查模型的RIPPER规则;
其中,所述RIPPER规则的排查效率包括:第一覆盖率和/或第一准确率;所述第一覆盖率为:RIPPER规则所覆盖的样本数与所述预设数值的比值;所述第一准确率为:排查出正确的是否完成强制戒毒的对象的个数与RIPPER规则所覆盖的样本数的比值。
4.根据权利要求3所述的方法,其特征在于,所述获得用于对未完成强制戒毒的对象进行排查的排查模型之后,所述方法还包括:
确定所述排查模型的排查效率;
当所述排查模型的排查效率低于预设的第二排查效率阈值时,对于所述用于构建排查模型的RIPPER规则进行调整,直至所述排查模型的排查效率大于或等于所述第二排查效率阈值时停止;
其中,所述排查模型的排查效率包括第二覆盖率和/或第二准确率;所述第二覆盖率为:用于构建排查模型的所有RIPPER规则的所述第一覆盖率的平均值;所述第二准确率为:
用于构建排查模型的所有RIPPER规则的第一准确率的平均值;所述调整包括:增加和/或删除用于构建排查模型的RIPPER规则。
5.一种实现信息排查的方法,包括:
对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;
其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
6.一种训练模型的装置,包括:获取单元、配置单元、样本排查单元、确定单元及整合单元;其中,
获取单元用于:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
配置单元用于:基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
样本排查单元用于:根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
确定单元用于:根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
整合单元用于:将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
7.根据权利要求6所述的装置,其特征在于,所述RIPPER规则包括基于以下一项或一项以上所述结构化数据的内容构建的规则:
年龄、有无稳定住所、有无稳定职业、有无经历高等教育、有无专业特长、娱乐场所的消费频次、是否有偷窃记录、是否有抢劫记录、是否有诈骗记录、是否有赌博记录、是否有打架斗殴记录、是否有信用卡逾期记录、最近一次作案的时间,预设时长内的犯罪次数、犯罪的时间周期、亲属有无吸毒前科及一度联系人有无强制戒毒的历史。
8.根据权利要求6或7所述的装置,其特征在于,所述确定单元具体用于:根据各RIPPER规则的排查结果,计算各RIPPER规则的排查效率;
确定排查效率大于预设的第一排查效率阈值的RIPPER规则为用于构建排查模型的RIPPER规则;
其中,所述RIPPER规则的排查效率包括:第一覆盖率和/或第一准确率;所述第一覆盖率为:RIPPER规则所覆盖的样本数与所述预设数值的比值;所述第一准确率为:排查出正确的是否完成强制戒毒的对象的个数与RIPPER规则所覆盖的样本数的比值。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括调整单元,用于:
确定所述排查模型的排查效率;当所述排查模型的排查效率低于预设的第二排查效率阈值时,对于所述用于构建排查模型的RIPPER规则进行调整,直至所述排查模型的排查效率大于或等于所述第二排查效率阈值时停止;
其中,所述排查模型的排查效率包括第二覆盖率和/或第二准确率;所述第二覆盖率为:用于构建排查模型的所有RIPPER规则的所述第一覆盖率的平均值;所述第二准确率为:
用于构建排查模型的所有RIPPER规则的第一准确率的平均值;所述调整包括:增加和/或删除用于构建排查模型的RIPPER规则。
10.一种实现信息排查的装置,包括:获取单元、配置单元、样本排查单元、确定单元、整合单元及实数排查单元;其中,
获取单元用于:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
配置单元用于:基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
样本排查单元用于:根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
确定单元用于:根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
整合单元用于:将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
实数排查单元用于:根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;
其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。

说明书全文

一种训练模型的方法、装置、实现信息排查及装置

技术领域

[0001] 本文涉及但不限于信息处理技术,尤指一种训练模型的方法、装置、实现信息排查及装置。

背景技术

[0002] 近年来随着公安机关禁毒工作的不断发展,公安机关对吸毒人员的监管度日益加大,因吸毒成瘾严重被依法强制隔离戒毒的人员日益增多。但是由于吸毒人员往往罪行较多,刑行交叉情况较多,因此被依法裁决强制隔离的戒毒对象在被采用其他刑事强制措施或刑罚执行完毕后,由于执法业务数据不通畅或更新不及时往往会导致戒毒人员的两年强制隔离戒毒期限没有依法及时执行。导致部分涉毒对象流落社会继续违法犯罪,对社会治安管理带来较大的安全隐患。
[0003] 目前未依法完成强制戒毒对象的识别主要是通过线人举报、警务人员人工排查的方式进行排查,耗时长、效率低,如何提升对未依法完成强制戒毒对象的识别效率,成为一个有待解决的技术问题。发明内容
[0004] 以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
[0005] 本发明实施例提供一种训练模型的方法、装置、实现信息排查及装置,能够提升对未依法完成强制戒毒对象的识别效率。
[0006] 本发明实施例提供了一种训练模型的方法,包括:
[0007] 对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
[0008] 基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
[0009] 根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
[0010] 根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
[0011] 将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
[0012] 其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
[0013] 在一种示例性实施例中,所述RIPPER规则包括基于以下一项或一项以上所述结构化数据的内容构建的规则:
[0014] 年龄、有无稳定住所、有无稳定职业、有无经历高等教育、有无专业特长、娱乐场所的消费频次、是否有偷窃记录、是否有抢劫记录、是否有诈骗记录、是否有赌博记录、是否有打架斗殴记录、是否有信用卡逾期记录、最近一次作案的时间,预设时长内的犯罪次数、犯罪的时间周期、亲属有无吸毒前科及一度联系人有无强制戒毒的历史。
[0015] 在一种示例性实施例中,所述从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则,包括:
[0016] 根据各RIPPER规则的排查结果,计算各RIPPER规则的排查效率;
[0017] 确定排查效率大于预设的第一排查效率阈值的RIPPER规则为用于构建排查模型的RIPPER规则;
[0018] 其中,所述RIPPER规则的排查效率包括:第一覆盖率和/或第一准确率;所述第一覆盖率为:RIPPER规则所覆盖的样本数与所述预设数值的比值;所述第一准确率为:排查出正确的是否完成强制戒毒的对象的个数与RIPPER规则所覆盖的样本数的比值。
[0019] 在一种示例性实施例中,所述获得用于对未完成强制戒毒的对象进行排查的排查模型之后,所述方法还包括:
[0020] 确定所述排查模型的排查效率;
[0021] 当所述排查模型的排查效率低于预设的第二排查效率阈值时,对于所述用于构建排查模型的RIPPER规则进行调整,直至所述排查模型的排查效率大于或等于所述第二排查效率阈值时停止;
[0022] 其中,所述排查模型的排查效率包括第二覆盖率和/或第二准确率;所述第二覆盖率为:用于构建排查模型的所有RIPPER规则的所述第一覆盖率的平均值;所述第二准确率为:用于构建排查模型的所有RIPPER规则的第一准确率的平均值;所述调整包括:增加和/或删除用于构建排查模型的RIPPER规则。
[0023] 另一方面,本发明实施例还提供实现信息排查的方法,包括:
[0024] 对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
[0025] 基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
[0026] 根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
[0027] 根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
[0028] 将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
[0029] 根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;
[0030] 其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
[0031] 再一方面,本发明实施例还提供一种训练模型的装置,包括:获取单元、配置单元、样本排查单元、确定单元及整合单元;其中,
[0032] 获取单元用于:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
[0033] 配置单元用于:基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
[0034] 样本排查单元用于:根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
[0035] 确定单元用于:根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
[0036] 整合单元用于:将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
[0037] 其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
[0038] 在一种示例性实施例中,所述RIPPER规则包括基于以下一项或一项以上所述结构化数据的内容构建的规则:
[0039] 年龄、有无稳定住所、有无稳定职业、有无经历高等教育、有无专业特长、娱乐场所的消费频次、是否有偷窃记录、是否有抢劫记录、是否有诈骗记录、是否有赌博记录、是否有打架斗殴记录、是否有信用卡逾期记录、最近一次作案的时间,预设时长内的犯罪次数、犯罪的时间周期、亲属有无吸毒前科及一度联系人有无强制戒毒的历史。
[0040] 在一种示例性实施例中,所述确定单元具体用于:根据各RIPPER规则的排查结果,计算各RIPPER规则的排查效率;
[0041] 确定排查效率大于预设的第一排查效率阈值的RIPPER规则为用于构建排查模型的RIPPER规则;
[0042] 其中,所述RIPPER规则的排查效率包括:第一覆盖率和/或第一准确率;所述第一覆盖率为:RIPPER规则所覆盖的样本数与所述预设数值的比值;所述第一准确率为:排查出正确的是否完成强制戒毒的对象的个数与RIPPER规则所覆盖的样本数的比值。
[0043] 在一种示例性实施例中,所述装置还包括调整单元,用于:
[0044] 确定所述排查模型的排查效率;当所述排查模型的排查效率低于预设的第二排查效率阈值时,对于所述用于构建排查模型的RIPPER规则进行调整,直至所述排查模型的排查效率大于或等于所述第二排查效率阈值时停止;
[0045] 其中,所述排查模型的排查效率包括第二覆盖率和/或第二准确率;所述第二覆盖率为:用于构建排查模型的所有RIPPER规则的所述第一覆盖率的平均值;所述第二准确率为:用于构建排查模型的所有RIPPER规则的第一准确率的平均值;所述调整包括:增加和/或删除用于构建排查模型的RIPPER规则。
[0046] 还一方面,本发明实施例还提供实现信息排查的装置,包括:获取单元、配置单元、样本排查单元、确定单元、整合单元及实数排查单元;其中,
[0047] 获取单元用于:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
[0048] 配置单元用于:基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
[0049] 样本排查单元用于:根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
[0050] 确定单元用于:根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
[0051] 整合单元用于:将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
[0052] 实数排查单元用于:根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;
[0053] 其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
[0054] 与相关技术相比,本申请技术方案包括:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;其中,样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。本发明实施例通过RIPPER规则构建排查模型,提升了对未依法完成强制戒毒对象的识别效率。
[0055] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。

附图说明

[0056] 附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
[0057] 图1为本发明实施例训练模型的方法的流程图
[0058] 图2为本发明实施例实现信息排查的方法的流程图;
[0059] 图3为本发明实施例训练模型的装置的结构框图
[0060] 图4为本发明实施例实现信息排查的装置的结构框图。

具体实施方式

[0061] 为使本发明的目的、技术方案和优点更加清楚明白,下文中将结合附图对本发明的实施例进行详细说明。需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互任意组合。
[0062] 在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行。并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
[0063] 图1为本发明实施例训练模型的方法的流程图,如图1所示,包括:
[0064] 步骤101、对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;这里,需强制隔离戒毒对象包括:强制戒毒期限(两年)内被认定为需要进行强制隔离戒毒的社会成员;
[0065] 其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
[0066] 步骤102、基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;RIPPER是相关技术中已有算法,主框架分为两个部分:生成规则与优化规则两个部分;
[0067] 需要说明的是,本发明实施例可以根据结构化数据的内容,结合本领域技术人员对戒毒对象的信息分析,遍历确定多项RIPPER规则。
[0068] 在一种示例性实施例中,所述RIPPER规则包括基于以下一项或一项以上所述结构化数据的内容构建的规则:
[0069] 年龄、有无稳定住所、有无稳定职业、有无经历高等教育、有无专业特长、娱乐场所的消费频次、是否有偷窃记录、是否有抢劫记录、是否有诈骗记录、是否有赌博记录、是否有打架斗殴记录、是否有信用卡逾期记录、最近一次作案的时间,预设时长内的犯罪次数、犯罪的时间周期、亲属有无吸毒前科及一度联系人有无强制戒毒的历史。
[0070] 需要说明的是,RIPPER规则可以由上述结构化数据的内容枚举产生,根据排查对象的特征,本发明实施例可以增删用于构建RIPPER规则结构化数据的内容,例如、增加:收入是否大于所在城市的最低生活保障、是否有信用卡套现行为、是否有征信问题、是否有贷款等。
[0071] 在一种示例性实施例中,本发明实施例RIPPER规则的表达式可以为:
[0072] (A1 op V1)∧(A2 op V2)∧…(Ai op Vi)Then(Target=Ti)。
[0073] 其中,A1…Ai表示基于结构化数据的内容确定的用于确定排查覆盖范围的需强制隔离戒毒的属性,V1…Vi表示属性对应的值,op表示≤、≥、≠、=、>、<等。Then之后表示排查内容及取值,例如、Then之后为:是否为未及时完成强制戒毒的人员=是,表示排查内容是确定排查覆盖范围内未及时完成强制戒毒的人员。
[0074] 步骤103、根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
[0075] 步骤104、根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
[0076] 在一种示例性实施例中,所述从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则,包括:
[0077] 根据各RIPPER规则的排查结果,计算各RIPPER规则的排查效率;
[0078] 确定排查效率大于预设的第一排查效率阈值的RIPPER规则为用于构建排查模型的RIPPER规则;
[0079] 其中,所述RIPPER规则的排查效率包括:第一覆盖率和/或第一准确率;所述第一覆盖率为:RIPPER规则所覆盖的样本数与所述预设数值的比值;所述第一准确率为:排查出正确的是否完成强制戒毒的对象的个数与RIPPER规则所覆盖的样本数的比值。
[0080] 在一种示例性实施例中,其中,覆盖率的计算公式可以表达为:准确率的表达式为 表达式中,Rx中的X为各RIPPER规则的区分标识,N
为RIPPER规则所覆盖的样本数,N正确为排查出正确的是否完成强制戒毒的对象的个数。
[0081] 需要说明的是,本发明实施例排查效率同时包含第一覆盖率和第一准确率时,第一覆盖率和第一准确率对应的第一排查效率阈值分别设置;本发明实施例可以由本领域技术人员对排查结果进行分析,为每一个RIPPER规则分别设置相应的第一排查效率阈值,也可以为所有RIPPER规则设置相同的第一排查效率阈值;本发明实施例通过第一排查效率阈值的设定,可以对排查效果不理想的RIPPER规则进行删除,以提升排查模型的运算性能。
[0082] 步骤105、将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
[0083] 需要说明的是,本发明实施例用于构建排查模型的RIPPER规则的整合可以包括:用于构建排查模型的RIPPER规则的叠加。即将确定的用于构建排查模型的RIPPER规则整合为一个集合,通过整合获得的集合对未完成强制戒毒的对象进行排查。
[0084] 在一种示例性实施例中,所述获得用于对未完成强制戒毒的对象进行排查的排查模型之后,本发明实施例方法还包括:
[0085] 确定所述排查模型的排查效率;
[0086] 当所述排查模型的排查效率低于预设的第二排查效率阈值时,对于所述用于构建排查模型的RIPPER规则进行调整,直至所述排查模型的排查效率大于或等于所述第二排查效率阈值时停止;
[0087] 其中,所述排查模型的排查效率包括第二覆盖率和/或第二准确率;所述第二覆盖率为:用于构建排查模型的所有RIPPER规则的所述第一覆盖率的平均值;所述第二准确率为:用于构建排查模型的所有RIPPER规则的第一准确率的平均值。
[0088] 所述调整包括:增加和/或删除用于构建排查模型的RIPPER规则。
[0089] 需要说明的是,本发明实施例排查效率同时包含第二覆盖率和第二准确率时,第二覆盖率和第二准确率对应的第二排查效率阈值分别设置;本发明实施例可以由本领域技术人员对排查结果进行分析,为各RIPPER规则分别设置相应的第二排查效率阈值;本发明实施例通过第二排查效率阈值的设定,可以对排查模型的排查效果进行校验;
[0090] 在一种示例性实施例中,当排查模型的排查效率不满足要求时,可以调整第一排查效率阈值,从而删除部分排查效率低的RIPPER规则;也可以通过增加满足第一排查效率阈值的RIPPER规则来提升排查模型的运算性能,进而以提升排查模型的运算性能。
[0091] 与相关技术相比,本申请技术方案包括:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;其中,样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。本发明实施例实现了对未依法完成强制戒毒对象的排查模型的训练,为提升了对未依法完成强制戒毒对象的识别效率提供了技术支持。
[0092] 图2为本发明实施例实现信息排查的方法的流程图,如图2所示,包括:
[0093] 步骤201、对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
[0094] 其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
[0095] 步骤202、基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
[0096] 需要说明的是,本发明实施例可以根据结构化数据的内容,结合本领域技术人员对戒毒对象的信息分析,遍历确定多项RIPPER规则。
[0097] 在一种示例性实施例中,所述RIPPER规则包括基于以下一项或一项以上所述结构化数据的内容构建的规则:
[0098] 年龄、有无稳定住所、有无稳定职业、有无经历高等教育、有无专业特长、娱乐场所的消费频次、是否有偷窃记录、是否有抢劫记录、是否有诈骗记录、是否有赌博记录、是否有打架斗殴记录、是否有信用卡逾期记录、最近一次作案的时间,预设时长内的犯罪次数、犯罪的时间周期、亲属有无吸毒前科及一度联系人有无强制戒毒的历史。
[0099] 在一种示例性实施例中,本发明实施例RIPPER规则的表达式可以为:
[0100] (A1 op V1)∧(A2 op V2)∧…(Ai op Vi)Then(Target=Ti)。
[0101] 其中,A1…Ai表示基于结构化数据的内容确定的用于确定排查覆盖范围的需强制隔离戒毒的属性,V1…Vi表示属性对应的值,op表示≤、≥、≠、=、>、<等。Then之后表示排查内容及取值,例如、Then之后为:是否为未及时完成强制戒毒的人员=是,表示排查内容是确定排查覆盖范围内未及时完成强制戒毒的人员。
[0102] 步骤203、根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
[0103] 步骤204、根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
[0104] 在一种示例性实施例中,所述从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则,包括:
[0105] 根据各RIPPER规则的排查结果,计算各RIPPER规则的排查效率;
[0106] 确定排查效率大于预设的第一排查效率阈值的RIPPER规则为用于构建排查模型的RIPPER规则;
[0107] 其中,所述RIPPER规则的排查效率包括:第一覆盖率和/或第一准确率;所述第一覆盖率为:RIPPER规则所覆盖的样本数与所述预设数值的比值;所述第一准确率为:排查出正确的是否完成强制戒毒的对象的个数与RIPPER规则所覆盖的样本数的比值。
[0108] 在一种示例性实施例中,其中,覆盖率的计算公式可以表达为:准确率的表达式为 表达式中,Rx中的X为各RIPPER规则的区分标识,N
为RIPPER规则所覆盖的样本数,N正确为排查出正确的是否完成强制戒毒的对象的个数。
[0109] 需要说明的是,本发明实施例排查效率同时包含第一覆盖率和第一准确率时,第一覆盖率和第一准确率对应的第一排查效率阈值分别设置;本发明实施例可以由本领域技术人员对排查结果进行分析,为每一个RIPPER规则分别设置相应的第一排查效率阈值,也可以为所有RIPPER规则设置相同的第一排查效率阈值;本发明实施例通过第一排查效率阈值的设定,可以对排查效果不理想的RIPPER规则进行删除,以提升排查模型的运算性能。
[0110] 步骤205、将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
[0111] 步骤206、根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;
[0112] 在一种示例性实施例中,所述获得用于对未完成强制戒毒的对象进行排查的排查模型之后,本发明实施例方法还包括:
[0113] 确定所述排查模型的排查效率;
[0114] 当所述排查模型的排查效率低于预设的第二排查效率阈值时,对于所述用于构建排查模型的RIPPER规则进行调整,直至所述排查模型的排查效率大于或等于所述第二排查效率阈值时停止;
[0115] 其中,所述排查模型的排查效率包括第二覆盖率和/或第二准确率;所述第二覆盖率为:用于构建排查模型的所有RIPPER规则的所述第一覆盖率的平均值;所述第二准确率为:用于构建排查模型的所有RIPPER规则的第一准确率的平均值。
[0116] 所述调整包括:增加和/或删除用于构建排查模型的RIPPER规则。
[0117] 需要说明的是,本发明实施例排查效率同时包含第二覆盖率和第二准确率时,第二覆盖率和第二准确率对应的第二排查效率阈值分别设置;本发明实施例可以由本领域技术人员对排查结果进行分析,为各RIPPER规则分别设置相应的第二排查效率阈值;本发明实施例通过第二排查效率阈值的设定,可以对排查模型的排查效果进行校验;
[0118] 在一种示例性实施例中,当排查模型的排查效率不满足要求时,可以调整第一排查效率阈值,从而删除部分排查效率低的RIPPER规则;也可以通过增加满足第一排查效率阈值的RIPPER规则来提升排查模型的运算性能,进而以提升排查模型的运算性能。
[0119] 与相关技术相比,本申请技术方案包括:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;其中,样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。本发明实施例通过RIPPER规则构建排查模型,提升了对未依法完成强制戒毒对象的识别效率。
[0120] 图3为本发明实施例训练模型的装置的结构框图,包括:获取单元、配置单元、样本排查单元、确定单元及整合单元;其中,
[0121] 获取单元用于:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
[0122] 配置单元用于:基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
[0123] 样本排查单元用于:根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
[0124] 确定单元用于:根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
[0125] 整合单元用于:将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
[0126] 其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
[0127] 需要说明的是,本发明实施例可以根据结构化数据的内容,结合本领域技术人员对戒毒对象的信息分析,遍历确定多项RIPPER规则。
[0128] 在一种示例性实施例中,所述RIPPER规则包括基于以下一项或一项以上所述结构化数据的内容构建的规则:
[0129] 年龄、有无稳定住所、有无稳定职业、有无经历高等教育、有无专业特长、娱乐场所的消费频次、是否有偷窃记录、是否有抢劫记录、是否有诈骗记录、是否有赌博记录、是否有打架斗殴记录、是否有信用卡逾期记录、最近一次作案的时间,预设时长内的犯罪次数、犯罪的时间周期、亲属有无吸毒前科及一度联系人有无强制戒毒的历史。
[0130] 在一种示例性实施例中,本发明实施例RIPPER规则的表达式可以为:
[0131] (A1 op V1)∧(A2 op V2)∧…(Ai op Vi)Then(Target=Ti)。
[0132] 其中,A1…Ai表示基于结构化数据的内容确定的用于确定排查覆盖范围的需强制隔离戒毒的属性,V1…Vi表示属性对应的值,op表示≤、≥、≠、=、>、<等。
[0133] 在一种示例性实施例中,所述确定单元具体用于:根据各RIPPER规则的排查结果,计算各RIPPER规则的排查效率;
[0134] 确定排查效率大于预设的第一排查效率阈值的RIPPER规则为用于构建排查模型的RIPPER规则;
[0135] 其中,所述RIPPER规则的排查效率包括:第一覆盖率和/或第一准确率;所述第一覆盖率为:RIPPER规则所覆盖的样本数与所述预设数值的比值;所述第一准确率为:排查出正确的是否完成强制戒毒的对象的个数与RIPPER规则所覆盖的样本数的比值。
[0136] 在一种示例性实施例中,其中,覆盖率的计算公式可以表达为:准确率的表达式为 表达式中,Rx中的X为各RIPPER规则的区分标识,N
为RIPPER规则所覆盖的样本数,N正确为排查出正确的是否完成强制戒毒的对象的个数。
[0137] 需要说明的是,本发明实施例排查效率同时包含第一覆盖率和第一准确率时,第一覆盖率和第一准确率对应的第一排查效率阈值分别设置;本发明实施例可以由本领域技术人员对排查结果进行分析,为每一个RIPPER规则分别设置相应的第一排查效率阈值,也可以为所有RIPPER规则设置相同的第一排查效率阈值;本发明实施例通过第一排查效率阈值的设定,可以对排查效果不理想的RIPPER规则进行删除,以提升排查模型的运算性能。
[0138] 在一种示例性实施例中,所述装置还包括调整单元,用于:
[0139] 确定所述排查模型的排查效率;当所述排查模型的排查效率低于预设的第二排查效率阈值时,对于所述用于构建排查模型的RIPPER规则进行调整,直至所述排查模型的排查效率大于或等于所述第二排查效率阈值时停止;
[0140] 其中,所述排查模型的排查效率包括第二覆盖率和/或第二准确率;所述第二覆盖率为:用于构建排查模型的所有RIPPER规则的所述第一覆盖率的平均值;所述第二准确率为:用于构建排查模型的所有RIPPER规则的第一准确率的平均值。
[0141] 所述调整包括:增加和/或删除用于构建排查模型的RIPPER规则。
[0142] 需要说明的是,本发明实施例排查效率同时包含第二覆盖率和第二准确率时,第二覆盖率和第二准确率对应的第二排查效率阈值分别设置;本发明实施例可以由本领域技术人员对排查结果进行分析,为各RIPPER规则分别设置相应的第二排查效率阈值;本发明实施例通过第二排查效率阈值的设定,可以对排查模型的排查效果进行校验;
[0143] 在一种示例性实施例中,当排查模型的排查效率不满足要求时,可以调整第一排查效率阈值,从而删除部分排查效率低的RIPPER规则;也可以通过增加满足第一排查效率阈值的RIPPER规则来提升排查模型的运算性能,进而以提升排查模型的运算性能。
[0144] 与相关技术相比,本申请技术方案包括:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;其中,样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。本发明实施例实现了对未依法完成强制戒毒对象的排查模型的训练,为提升了对未依法完成强制戒毒对象的识别效率提供了技术支持。
[0145] 图4为本发明实施例实现信息排查的装置的结构框图,如图4所示,包括:获取单元、配置单元、样本排查单元、确定单元、整合单元及实数排查单元;其中,[0146] 获取单元用于:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;
[0147] 配置单元用于:基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;
[0148] 样本排查单元用于:根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;
[0149] 确定单元用于:根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;
[0150] 整合单元用于:将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;
[0151] 实数排查单元用于:根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;
[0152] 其中,所述样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。
[0153] 需要说明的是,本发明实施例可以根据结构化数据的内容,结合本领域技术人员对戒毒对象的信息分析,遍历确定多项RIPPER规则。
[0154] 在一种示例性实施例中,所述RIPPER规则包括基于以下一项或一项以上所述结构化数据的内容构建的规则:
[0155] 年龄、有无稳定住所、有无稳定职业、有无经历高等教育、有无专业特长、娱乐场所的消费频次、是否有偷窃记录、是否有抢劫记录、是否有诈骗记录、是否有赌博记录、是否有打架斗殴记录、是否有信用卡逾期记录、最近一次作案的时间,预设时长内的犯罪次数、犯罪的时间周期、亲属有无吸毒前科及一度联系人有无强制戒毒的历史。
[0156] 在一种示例性实施例中,本发明实施例RIPPER规则的表达式可以为:
[0157] (A1 op V1)∧(A2 op V2)∧…(Ai op Vi)Then(Target=Ti)。
[0158] 其中,A1…Ai表示基于结构化数据的内容确定的用于确定排查覆盖范围的需强制隔离戒毒的属性,V1…Vi表示属性对应的值,op表示≤、≥、≠、=、>、<等。
[0159] 在一种示例性实施例中,所述确定单元具体用于:根据各RIPPER规则的排查结果,计算各RIPPER规则的排查效率;
[0160] 确定排查效率大于预设的第一排查效率阈值的RIPPER规则为用于构建排查模型的RIPPER规则;
[0161] 其中,所述RIPPER规则的排查效率包括:第一覆盖率和/或第一准确率;所述第一覆盖率为:RIPPER规则所覆盖的样本数与所述预设数值的比值;所述第一准确率为:排查出正确的是否完成强制戒毒的对象的个数与RIPPER规则所覆盖的样本数的比值。
[0162] 在一种示例性实施例中,其中,覆盖率的计算公式可以表达为:准确率的表达式为 表达式中,Rx中的X为各RIPPER规则的区分标识,N
为RIPPER规则所覆盖的样本数,N正确为排查出正确的是否完成强制戒毒的对象的个数。
[0163] 需要说明的是,本发明实施例排查效率同时包含第一覆盖率和第一准确率时,第一覆盖率和第一准确率对应的第一排查效率阈值分别设置;本发明实施例可以由本领域技术人员对排查结果进行分析,为每一个RIPPER规则分别设置相应的第一排查效率阈值,也可以为所有RIPPER规则设置相同的第一排查效率阈值;本发明实施例通过第一排查效率阈值的设定,可以对排查效果不理想的RIPPER规则进行删除,以提升排查模型的运算性能。
[0164] 在一种示例性实施例中,所述装置还包括调整单元,用于:
[0165] 确定所述排查模型的排查效率;当所述排查模型的排查效率低于预设的第二排查效率阈值时,对于所述用于构建排查模型的RIPPER规则进行调整,直至所述排查模型的排查效率大于或等于所述第二排查效率阈值时停止;
[0166] 其中,所述排查模型的排查效率包括第二覆盖率和/或第二准确率;所述第二覆盖率为:用于构建排查模型的所有RIPPER规则的所述第一覆盖率的平均值;所述第二准确率为:用于构建排查模型的所有RIPPER规则的第一准确率的平均值。
[0167] 所述调整包括:增加和/或删除用于构建排查模型的RIPPER规则。
[0168] 需要说明的是,本发明实施例排查效率同时包含第二覆盖率和第二准确率时,第二覆盖率和第二准确率对应的第二排查效率阈值分别设置;本发明实施例可以由本领域技术人员对排查结果进行分析,为各RIPPER规则分别设置相应的第二排查效率阈值;本发明实施例通过第二排查效率阈值的设定,可以对排查模型的排查效果进行校验;
[0169] 在一种示例性实施例中,当排查模型的排查效率不满足要求时,可以调整第一排查效率阈值,从而删除部分排查效率低的RIPPER规则;也可以通过增加满足第一排查效率阈值的RIPPER规则来提升排查模型的运算性能,进而以提升排查模型的运算性能。
[0170] 与相关技术相比,本申请技术方案包括:对预设数值个需强制隔离戒毒对象的样本,获取各样本的结构化数据;基于获取的结构化数据的内容配置一项或一项以上的RIPPER规则;根据配置的各RIPPER规则,对样本中未完成强制戒毒的对象进行排查;根据各RIPPER规则的排查结果,从配置的所有RIPPER规则中确定用于构建排查模型的一项或一项以上RIPPER规则;将确定的用于构建排查模型的RIPPER规则进行整合,获得用于对未完成强制戒毒的对象进行排查的排查模型;根据获得的排查模型,对待排查的需强制隔离戒毒对象进行排查;其中,样本包括:对需强制隔离戒毒对象,添加是否完成强制戒毒标记的样本。本发明实施例通过RIPPER规则构建排查模型,提升了对未依法完成强制戒毒对象的识别效率。
[0171] 本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现上述训练模型的方法。
[0172] 本发明实施例还提供一种终端,包括:存储器和处理器,所述存储中保存有计算机程序;其中,
[0173] 处理器被配置为执行存储器中的计算机程序;
[0174] 所述计算机程序被所述处理器执行时实现如上述训练模型的方法。
[0175] 本发明实施例还提供一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现上述实现信息排查的方法。
[0176] 本发明实施例还提供一种终端,包括:存储器和处理器,所述存储中保存有计算机程序;其中,
[0177] 处理器被配置为执行存储器中的计算机程序;
[0178] 所述计算机程序被所述处理器执行时实现如上述实现信息排查的方法。
[0179] “本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模/单元可以被实施为软件固件硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于RAM、ROM、EEPROM、闪存或其他存储器技术、CD-ROM、数字多功能盘(DVD)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。”。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈