首页 / 专利库 / 电脑零配件 / 固件 / 软件 / 家长控制软件 / 一种基于运营商数据识别大学生网贷风险的分析方法与系统

一种基于运营商数据识别大学生网贷险的分析方法与系统

阅读:242发布:2020-05-12

专利汇可以提供一种基于运营商数据识别大学生网贷险的分析方法与系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于运营商数据识别大学生网贷 风 险的分析方法与系统,采集的是运营商已采集的用户上网日志与用户轨迹行为,结合基准库通过URL解析目标对象的上网APP,同时通过URL解析用户的电商购物行为,结合爬虫爬取商品详细信息,分析目标对象大宗消费情况及APP使用情况;更能体现通过 大数据 方式分析用户上网行为的分析,提高分析目标的灵活性和分析结果的准确性。分析的目标客户群体更加明确,能根据客户群体减少用户上网日志数据的采集;设定疑似网贷大学生监控及预警机制,实时分析目前用户群体的上网行为与轨迹行为数据,分析的特征更全面,结果也更准确。,下面是一种基于运营商数据识别大学生网贷险的分析方法与系统专利的具体信息内容。

1.一种基于运营商数据识别大学生网贷险的分析方法,其特征在于,根据对以往发生的大学生网贷事件分析,获取大学生网贷的基础特征为:经常使用网贷APP,线上大宗消费信息,经常搜索贷款、还贷类关键词,线下出现商圈频次,经常拨打网贷机构客服电话;其分析方法包括以下步骤:
建立基准库:
APP库:对网贷APP、电商APP及其对应的HOST域名进行分类;
网贷电话库:对贷款类客服电话实现汇总;
位置库:汇总高校及商场的位置POI信息;
网贷搜索词库:汇集运营商用户网络贷款搜索词;
目标群体识别:通过高校的位置POI信息,结合高校覆盖范围内的基站工参数据,采集运营商用户轨迹行为数据,比对运营商用户资料数据,实现对大学生群体的识别;
目标群体行为数据解析:
将目标用户上网日志、基准库数据加载到HDFS,采用M/R实现海量数据快速高效匹配,解析出用户上网具体URL行为、APP行为、网贷APP点击次数;获取用户购买商品数据通过电商APP深度解析出来的用户购买商品编号,通过爬虫实现内容爬取识别商品的详细信息;解析用户的搜索词信息,将APP站内搜索与主流搜索引擎搜索词进行汇总;
通过商场的位置POI信息,结合商场覆盖范围内的基站工参数据,采集目标用户轨迹行为数据,解析目标群体在商场出现的频率
结合网贷电话库,获取目标用户网贷电话拨打记录;
所述基站工参数据包括基站名称、LAC/CI、经纬度、基站类型;运营商用户轨迹行为数据包括电话号码、开始基站、结束基站、开始时间、结束时间、信令动作;运营商用户资料数据包括电话号码、年龄、性别、网龄、机龄;目标用户上网日志包括上网开始时间、结束时间、电话号码、HOST、URL;
网贷风险模型建立:
通过贝叶斯分类实现对具备大学生网贷特征的用户群体实现特征分析,输出具备网贷风险的特征,建立模型分析维度:
其中规则总分100分,按照分数输出网贷风险等级;风险等级=规则总数/30;风险等级>1为高风险等级;0.5<风险等级<1为中等风险等级;0<风险等级<0.5低风险等级。
2.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,还包括将高风险等级消息通知高校管理员或家长。
3.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,还包括目标用户上网日志数据清,洗掉HTTP/WAP协议的URL和域名不符合、对应的URL包括有扩展名和没有扩展名形式的地址数据。
4.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,还包括用户资料数据清洗,洗掉外省注册的号码。
5.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,所述高校为本省高校;所述商圈为本省重点商圈。
6.根据权利要求1所述一种基于运营商数据识别大学生网贷风险的分析方法,其特征在于,所述高校及商场的位置POI信息通过百度地图,实现区域范围的经纬度爬取。
7.一种基于运营商数据识别大学生网贷风险的分析系统,其特征在于,包括:
数据采集服务器,用于采集运营商自有数据与互联网数据;所述运营商自有数据:用户资料数据、基站工参数据、用户轨迹行为数据、用户上网行为日志数据;互联网数据包括:网贷电话、APP、网络贷款搜索词、用户购买商品数据、高校及商场的位置POI信息;
数据处理服务器,用于对采集结果数据进行数据清洗、建立模型运算、输出模型结果数据,并对结果数据进行保存,通过分发程序将结果数据分发至数据库服务器;
数据库服务器,为应用服务提供数据支撑
应用服务器,通过数据库服务器获取数据处理服务器的运算结果数据,通过WEB展示;
所述数据采集服务器与互联网通过网络策略控制实现公网访问,数据处理服务器与数据采集服务器通过内网连接,数据处理服务器与数据库服务器通过内网连接,数据库服务器与应用服务器通过内网连接,应用服务器与各个用户PC终端通过专线网络连接;
所述用户资料数据为电话号码、年龄、性别、网龄、机龄;用户轨迹行为数据为电话号码、开始基站、结束基站、开始时间、结束时间、信令动作等;用户上网行为日志数据为上网开始时间、结束时间、电话号码、HOST、URL;基站工参数据为基站名称、LAC/CI、经纬度、基站类型。
8.根据权利要求7所述一种基于运营商数据识别大学生网贷风险的分析系统,其特征在于,
所述数据处理服务器安装hadoop软件,版本号:2.6.0;hive组件,版本号:2.0;
数据采集服务器组件安装:Flume,版本号:1.9.0;
数据库服务器数据库软件安装:mysql 6.0;
应用服务器安装软件:jdk 1.7;Tomcat 7.0。
9.根据权利要求7所述一种基于运营商数据识别大学生网贷风险的分析系统,其特征在于,所述数据清洗包括用户上网行为日志数据清,洗掉HTTP/WAP协议的URL和域名不符合、对应的URL包括有扩展名和没有扩展名形式的地址数据。
10.根据权利要求7所述一种基于运营商数据识别大学生网贷风险的分析系统,其特征在于,所述数据清洗包括用户资料清洗掉外省注册的号码数据。

说明书全文

一种基于运营商数据识别大学生网贷险的分析方法与系统

技术领域

[0001] 本发明涉及无线通讯技术领域,尤其涉及一种基于运营商数据识别大学生网贷风险的分析方法与系统。

背景技术

[0002] 目前在校大学生涉世尚浅,不能准确认识网贷的风险,经受不住社会上高消费、高品质的生活诱惑,加之对自我经济情况及还贷情况没有清晰的预估,怀着侥幸的心理从网贷平台进行高息贷款,在不能偿还贷款的情况下,又通过其他贷款平台进行“拆东墙、补西墙”式生活,最终贷款就像滚球一样越来越多,造成个人,乃至家庭无法偿还。自此,此类大学生将无法正常上学,甚至会做出一些违法的事情。因此,建设一套识别大学生网贷风险的分析系统,可以在大学生有贷款意向时,通过教育、劝阻、普法、帮助等多重手段进行制止,防止悲剧发生。
[0003] 目前,基于运营商数据采集、上网行为数据解析(包括:行为解析、搜索词解析等)、用户轨迹数据解析等技术均已成熟,而且在自有运营商有很多案例,合理融合这些技术完全可以识别大学生客群、该客群的上网行为、以及该群体的网贷风险。

发明内容

[0004] 针对现有技术的不足,本发明提供了一种基于运营商数据识别大学生网贷风险的分析方法与系统,旨在利用运营商与互联网数据解决大学生网贷风险识别、贷款归因分析等问题
[0005] 为实现上述目的,本发明提供如下技术方案:一种基于运营商数据识别大学生网贷风险的分析方法,根据对以往发生的大学生网贷事件分析,获取大学生网贷的基础特征为:经常使用网贷APP,线上大宗消费信息,经常搜索贷款、还贷类关键词,线下出现商圈频次,经常拨打网贷机构客服电话;其分析方法包括以下步骤:
[0006] 建立基准库:
[0007] APP库:对网贷APP、电商APP及其对应的HOST域名进行分类;
[0008] 网贷电话库:对贷款类客服电话实现汇总;
[0009] 位置库:汇总高校及商场的位置POI信息;
[0010] 网贷搜索词库:汇集运营商用户网络贷款搜索词;
[0011] 目标群体识别:通过高校的位置POI信息,结合高校覆盖范围内的基站工参数据,采集运营商用户轨迹行为数据,比对运营商用户资料数据,实现对大学生群体的识别;
[0012] 目标群体行为数据解析:
[0013] 将目标用户上网日志、基准库数据加载到HDFS,采用M/R实现海量数据快速高效匹配,解析出用户上网具体URL行为、APP行为、网贷APP点击次数;获取用户购买商品数据通过电商APP深度解析出来的用户购买商品编号,通过爬虫实现内容爬取识别商品的详细信息;解析用户的搜索词信息,将APP站内搜索与主流搜索引擎搜索词进行汇总;
[0014] 通过商场的位置POI信息,结合商场覆盖范围内的基站工参数据,采集目标用户轨迹行为数据,解析目标群体在商场出现的频率
[0015] 结合网贷电话库,获取目标用户网贷电话拨打记录;
[0016] 所述基站工参数据包括基站名称、LAC/CI、经纬度、基站类型;运营商用户轨迹行为数据包括电话号码、开始基站、结束基站、开始时间、结束时间、信令动作;运营商用户资料数据包括电话号码、年龄、性别、网龄、机龄;目标用户上网日志包括上网开始时间、结束时间、电话号码、HOST、URL;
[0017] 网贷风险模型建立:
[0018] 通过贝叶斯分类实现对具备大学生网贷特征的用户群体实现特征分析,输出具备网贷风险的特征,建立模型分析维度:
[0019]
[0020]
[0021] 其中规则总分100分,按照分数输出网贷风险等级;风险等级=规则总数/30;风险等级>1为高风险等级;0.5<风险等级<1为中等风险等级;0<风险等级<0.5低风险等级。
[0022] 进一步的操作,还包括将高风险等级消息通知高校管理员或家长。
[0023] 作为一种优选的方式,还包括目标用户上网日志数据清,洗掉HTTP/WAP协议的URL和域名不符合、对应的URL包括有扩展名和没有扩展名形式的地址数据。
[0024] 作为一种优选的方式,还包括用户资料数据清洗,洗掉外省注册的号码。
[0025] 作为一种优选的方式,所述高校为本省高校;所述商圈为本省重点商圈。
[0026] 作为一种优选的方式,所述高校及商场的位置POI信息通过百度地图,实现区域范围的经纬度爬取。
[0027] 一种基于运营商数据识别大学生网贷风险的分析系统,包括:
[0028] 数据采集服务器,用于采集运营商自有数据与互联网数据;所述运营商自有数据:用户资料数据、基站工参数据、用户轨迹行为数据、用户上网行为日志数据;互联网数据包括:网贷电话、APP、网络贷款搜索词、用户购买商品数据、高校及商场的位置POI信息;
[0029] 数据处理服务器,用于对采集结果数据进行数据清洗、建立模型运算、输出模型结果数据,并对结果数据进行保存,通过分发程序将结果数据分发至数据库服务器;
[0030] 数据库服务器,为应用服务提供数据支撑
[0031] 应用服务器,通过数据库服务器获取数据处理服务器的运算结果数据,通过WEB展示;
[0032] 所述数据采集服务器与互联网通过网络策略控制实现公网访问,数据处理服务器与数据采集服务器通过内网连接,数据处理服务器与数据库服务器通过内网连接,数据库服务器与应用服务器通过内网连接,应用服务器与各个用户PC终端通过专线网络连接;
[0033] 所述用户资料数据为电话号码、年龄、性别、网龄、机龄;用户轨迹行为数据为电话号码、开始基站、结束基站、开始时间、结束时间、信令动作等;用户上网行为日志数据为上网开始时间、结束时间、电话号码、HOST、URL;基站工参数据为基站名称、LAC/CI、经纬度、基站类型。
[0034] 作为一种优选的方式,所述数据处理服务器安装hadoop软件,版本号:2.6.0;hive组件,版本号:2.0;
[0035] 数据采集服务器组件安装:Flume,版本号:1.9.0;
[0036] 数据库服务器数据库软件安装:mysql 6.0;
[0037] 应用服务器安装软件:jdk 1.7;Tomcat 7.0。
[0038] 作为一种优选的方式,所述数据清洗包括用户上网行为日志数据清,洗掉HTTP/WAP协议的URL和域名不符合、对应的URL包括有扩展名和没有扩展名形式的地址数据;
[0039] 作为一种优选的方式,所述数据清洗包括用户资料清洗掉外省注册的号码数据。
[0040] 本发明的有益效果:采集的是运营商已采集的用户上网日志与用户轨迹行为,结合基准库通过URL解析目标对象的上网APP,包括点击次数、频率、产生流量等,同时通过URL解析用户的电商购物行为,结合爬虫爬取商品详细信息,分析目标对象大宗消费情况及APP使用情况;更能体现通过大数据方式分析用户上网行为的分析,提高分析目标的灵活性和分析结果的准确性。
[0041] 分析的目标客户群体更加明确,能根据客户群体减少用户上网日志数据的采集;设定疑似网贷大学生监控及预警机制,实时分析目前用户群体的上网行为与轨迹行为数据,分析的特征更全面,结果也更准确;一旦系统发现新的信号,将传递给对应高校老师;更能体现针对高校大学生疑似网贷用户群体的风险识别与分析。
附图说明
[0042] 图1本发明的系统原理图。
[0043] 图2本发明的程序结构图。

具体实施方式

[0044] 如图1、2所示,一种基于运营商数据识别大学生网贷风险的分析系统,包括:
[0045] 数据采集服务器,用于采集运营商自有数据与互联网数据;所述运营商自有数据:用户资料数据、基站工参数据、用户轨迹行为数据、用户上网行为日志数据;互联网数据包括:网贷电话、APP、网络贷款搜索词、用户购买商品数据、高校及商场的位置POI信息;
[0046] 数据处理服务器,用于对采集结果数据进行数据清洗、建立模型运算、输出模型结果数据,并对结果数据进行保存,通过分发程序将结果数据分发至数据库服务器;
[0047] 数据库服务器,为应用服务提供数据支撑;
[0048] 应用服务器,通过数据库服务器获取数据处理服务器的运算结果数据,通过WEB展示;
[0049] 所述数据处理服务器安装hadoop软件,版本号:2.6.0;hive组件,版本号:2.0;
[0050] 数据采集服务器组件安装:Flume,版本号:1.9.0;
[0051] 数据库服务器数据库软件安装:mysql 6.0;
[0052] 应用服务器安装软件:jdk 1.7;Tomcat 7.0。
[0053] 所述数据采集服务器与互联网通过网络策略控制实现公网访问,数据处理服务器与数据采集服务器通过内网连接,数据处理服务器与数据库服务器通过内网连接,数据库服务器与应用服务器通过内网连接,应用服务器与各个用户PC终端通过专线网络连接;
[0054] 根据对以往发生的大学生网贷事件分析,获取大学生网贷的基础特征为:经常使用网贷APP,线上大宗消费信息,经常搜索贷款、还贷类关键词,线下出现商圈频次,经常拨打网贷机构客服电话;其分析方法包括以下步骤:
[0055] 建立基准库:
[0056] APP库:对网贷APP、电商APP及其对应的HOST域名进行分类;
[0057] 网贷电话库:对贷款类客服电话实现汇总;
[0058] 位置库:汇总省内高校及商场的位置POI信息;
[0059] 网贷搜索词库:汇集运营商用户网络贷款搜索词;
[0060] 目标群体识别:通过省内高校的位置POI信息,结合高校覆盖范围内的基站工参数据,采集运营商用户轨迹行为数据,比对运营商用户资料数据(洗掉外省注册的号码后),实现对大学生群体的识别;
[0061] 目标群体行为数据解析:
[0062] 将目标用户上网日志(洗掉HTTP/WAP协议的URL和域名不符合、对应的URL包括有扩展名和没有扩展名形式的地址数据)、基准库数据加载到HDFS,,采用M/R实现海量数据快速高效匹配,解析出用户上网具体URL行为、APP行为、网贷APP点击次数;获取用户购买商品数据通过电商APP深度解析出来的用户购买商品编号,通过爬虫实现内容爬取识别商品的详细信息;解析用户的搜索词信息,将APP站内搜索与主流搜索引擎搜索词进行汇总;
[0063] 通过省内商场的位置POI信息,结合商场覆盖范围内的基站工参数据,采集目标用户轨迹行为数据,解析目标群体在商场出现的频率;
[0064] 结合网贷电话库,获取目标用户网贷电话拨打记录;
[0065] 所述基站工参数据包括基站名称、LAC/CI、经纬度、基站类型;运营商用户轨迹行为数据包括电话号码、开始基站、结束基站、开始时间、结束时间、信令动作;运营商用户资料数据包括电话号码、年龄、性别、网龄、机龄;目标用户上网日志包括上网开始时间、结束时间、电话号码、HOST、URL;
[0066] 网贷风险模型建立:
[0067] 通过贝叶斯分类实现对具备大学生网贷特征的用户群体实现特征分析,输出具备网贷风险的特征,建立模型分析维度:
[0068]
[0069]
[0070] 其中规则总分100分,按照分数输出网贷风险等级;风险等级=规则总数/30;风险等级>1为高风险等级;0.5<风险等级<1为中等风险等级;0<风险等级<0.5低风险等级;还包括将高风险等级消息通知高校管理员或家长。
[0071] 表一为模型运算输出结果信息示例:
[0072]
[0073]
[0074] 表1
[0075] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换或改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈