专利汇可以提供互联网金融平台网络借贷欺诈检测系统专利检索,专利查询,专利分析的服务。并且一种网络借贷欺诈检测系统,嵌入于互联网网络借贷审核系统,连接网络借贷记录数据供应模 块 ,包括网络构建与更新模块、网络学习表征模块、特征构建模块、欺诈检测模型。网络构建与更新模块,包括关系借贷网络构建与更新模块、同质借贷网络的构建与更新模块,关系借贷网络构建与更新模块与同质借贷网络的构建与更新模块连接;网络 表征学习 模块,包括静态网络表征学习模块和增量式网络表征学习模块;特征构建模块,包括数据向量化模块和时序特征构造模块,数据向量化模块输出与时序特征构造模块输入连接,静态网络表征学习模块和增量式网络表征学习模块的输出分别与数据向量化模块的输入连接;所述欺诈检测模块,对测试数据实现欺诈检测。,下面是互联网金融平台网络借贷欺诈检测系统专利的具体信息内容。
1.一种网络借贷欺诈检测系统,嵌入于互联网网络借贷审核系统,其特征在于,连接网络借贷记录数据供应模块,本发明系统包括网络构建与更新模块、网络学习表征模块、特征构建模块、欺诈检测模型,其中:
所述数据供应模块可以针对不同的数据实现初始数据供应和流式数据供应;
所述网络构建与更新模块,与数据供应模块连接,包括关系借贷网络构建与更新模块、同质借贷网络的构建与更新模块,关系借贷网络构建与更新模块与同质借贷网络的构建与更新模块连接;
所述网络表征学习模块,与同质借贷网络的构建与更新模块连接,包括静态网络表征学习模块和增量式网络表征学习模块;
所述特征构建模块,实现将借贷数据转化为新特征的功能,包括数据向量化模块和时序特征构造模块,数据向量化模块输出与时序特征构造模块输入连接,静态网络表征学习模块和增量式网络表征学习模块的输出分别与数据向量化模块的输入连接;
所述欺诈检测模块,与特征构建模块连接,先通过对输入样本数据进行训练建立检测模块,再对测试数据实现欺诈检测,为互联网网络借贷审核系统提供检测判断。
2.如权利要求1所述的网络借贷欺诈检测系统,其特征在于,具体为:
一、网络借贷记录数据供应模块
所述数据供应模块连接互联网金融平台借贷数据集,获得初始数据和流式数据,针对不同阶段向本发明系统供应训练用数据和测试数据;
二、网络构建与更新模块
关系借贷网络构建与更新模块:
从数据供应模块的原始借贷数据中筛选出可利用的原始字段(如表1所示),进行字段类型转换和空值去除填充数据预处理操作;将原始借贷数据划分为单号(APPLYNO)与属性(ATTRIBUTE)两种类型,所述属性(ATTRIBUTE)为借贷数据中除去单号(APPLYNO)以外的其他数据;针对一笔借贷数据,将其记为(bi,ATT(bi)),bi是借贷数据b的单号,ATT(bi)是借贷数据b对应的属性集合,attk(bi)是ATT(bi)中第k个元素;
基于原始借贷数据建立关系借贷网络Nr=(V,E),V是节点集,E是边集,其中边e=(u,v),u与v属于节点集V(包含多种类型节点);针对借贷数据b中的每一笔数据bi,首先bi加入节点集V,将ATT(bi)中每一个元素依次加入节点集V,最后将边(bi,attk(bi))加入边集E,attk(bi)是ATT(bi)中第k个元素;提供给同质借贷网络的构建与更新模块;
同质借贷网络的构建与更新模块:
基于关系借贷网络构建与更新模块建立同质借贷网络Nh=(Vh,Eh),Vh是节点集,Eh是边集,其中边e=(u,v,w),u与v属于节点集Vh(仅包含类型为借贷单号的节点);当attk(bi)=h
attk(bj)时,关系借贷网络中一对边(bi,attk(bi))和(bj,attk(bj))被视为边集E 中的边(bi,bj),w为边(bi,bj)出现的次数,作为同质借贷网络Nh中的权重;基于关系借贷网络Nr,将节点集V中所有类型为借贷单号的节点加入节点集Vh;然后遍历每一对边(bi,attk(bi))和(bj,attk(bj)),当attk(bi)=attk(bj)时,将边(bi,bj)加入边集Eh;得到同质借贷网络Nh=h h
(V ,E);输出提供给网络表征学习模块;
三、网络学习表征模块
所述网络表征学习模块,与同质借贷网络的构建与更新模块连接,包括静态网络表征学习模块和增量式网络表征学习模块,分别在训练阶段和测试阶段完成网络表征学习;
所述静态网络表征学习模块:
基于同质借贷网络的构建与更新模块已构建的同质借贷网络Nh,静态网络表征学习模块采用网络表征学习方法NetWalk来学习同质借贷网络Nh中全部网络节点的向量表征;网络表征学习方法NetWalk学习向量表征的主要参数如表2所示;将网络表征学习方法NetWalk针对同质借贷网络Nh得到在初始时刻t时网络中节点v与其对应的向量表征γ,建立映射关系γ=Ft(v);依据映射关系γ=Ft(v),将初始借贷数据表示为向量表征形式,一笔由若干具体字段值组成借贷数据转变为一组固定维度的向量表征;
所述增量式网络表征学习模块进行生成增量式的网络表征,包括第一子模块、第二子模块、第三子模块、第四子模块,它们顺序连接:
所述第一子模块:依据数据集Btrain(tk)时间戳顺序,选取与数据集Btest(tk+1)同样数量的最早数据放入数据集B′test(tk+1);将数据集Btest(tk+1)与B′test(tk+1)采用与关系借贷网络构建与更新模块中相同的预处理操作,将处理后的数据集Btest(tk+1)与B′test(tk+1)基于数据集Btrain(tk)进行关系借贷网络的更新;基于关系借贷网络构建与更新模块的定义,分别处理网络借贷数据Btest(tk+1)与B′test(tk+1)得到关系借贷网络中的节点集Vtest(tk+1)和V′test(tk+1)与边集Etest(tk+1)和E′test(tk+1),Etest(tk+1)是流式到达的借贷数据中单号与上一时刻关系借贷网络Nr中现有节点之间的存在关系的边集,E′test(tk+1)是关系借贷网络Nr即将删除的过期边集;令V=V∪Vtest(tk+1)-V′test(tk+1)和E=E∪Etest(tk+1)-E′test(tk+1),更新关系借贷网络Nr=(V,E);
所述第二子模块:基于更新后的关系借贷网络Nr=(V,E),采用同质借贷网络的构建与更新模块获得更新后的同质借贷网络Nh=(Vh,Eh);
所述第三子模块:基于时刻tk对应的节点v与对应向量γ的映射关系 分别设
置边集Etest(tk+1)和E′test(tk+1)为新到来的边集和待删除的边集,运用网络表征学习方法NetWalk,对涉及到边集Etest(tk+1)和E′test(tk+1)中的节点和边进行增量式的网络表征学习,得到时刻tk+1对应的节点v与对应向量γ的映射关系
所述第四子模块:将第三子模块针对同质借贷网络Nh得到在时刻tk时网络中节点v与其对应的向量表征γ之间的映射关系 依据映射关系γ=Ft(v),将流式借贷数据
重新表示为向量表征形式,一笔由若干具体字段值组成借贷数据转变为一组固定维度的向量表征;
四、特征构建模块
所述特征构建模块,实现将借贷数据转化为新特征的功能,包括数据向量化模块和时序特征构造模块,数据向量化模块输出与时序特征构造模块输入连接,静态网络表征学习模块和增量式网络表征学习模块的输出分别与数据向量化模块的输入连接。
所述数据向量化模块:一笔含有n个可用原始字段的借贷数据Btrain(tk)在同质借贷网络中可对应n个相应的节点,基于tk时刻节点和映射关系 借贷数据变换为每个
借贷单号所对应的维数为dim的向量,在得到向量后即可直接输入分类模型进行节点分类后续任务;
时序特征构造模块:在基于数据向量化模块所得到的向量表征,针对每一笔借贷数据依次先计算每个单号与在数据集(单号按生成时间排序)中前h项单号的欧氏距离,并按照从小到大的顺序排序这h项,将其作为对应单号的所构造的时序特征;然后,再引入待检测单号与其前h项单号所对应向量相似度作为欺诈检测模型的输入;时序特征构造模块使用向量相似度,增强了后续欺诈检测模型的泛化能力,面对向量X=(x1,····,xdim)、Y=(y1,····,ydim),其欧氏距离的计算如下所示
基于时序特征构造模块中构造好的时序特征,依据分类器参数集Wc设置分类器,将tk时刻借贷数据对应的时序特征作为数据,对应借贷数据是否为欺诈交易作为标签,导入分类器进行训练,进而将训练好的二分类模型视为欺诈检测模型
五、欺诈检测模块
所述欺诈检测模块,与特征构建模块连接,先通过对输入样本数据进行训练建立检测模块,再对测试数据实现欺诈检测,为互联网网络借贷审核系统提供检测判断;
在训练阶段,采用python中机器学习集成库scikit-learn中的XGBoost分类器为本发明的欺诈检测模型;
在测试阶段,基于特征构建模块的时序特征构造模块中构造好的时序特征,依据分类器参数集Wc设置分类器,将tk时刻借贷数据对应的时序特征作为数据,对应借贷数据是否为欺诈交易作为标签,导入分类器进行训练,进而将训练好的二分类模型视为欺诈检测模型
3.如权利要求2所述的网络借贷欺诈检测系统,其特征在于,所述欺诈检测模型 将tk时刻的测试数据对应的时序特征输入欺诈检测模型 得到测试借贷数据的集合Btest(tk)中每一笔借贷数据的欺诈概率p(bi),输出测试数据为欺诈的概率集合P,其中p(bi)∈P。
4.如权利要求3所述的网络借贷欺诈检测系统,其特征在于,判断时刻tk+1+t0是否大于周期T,若大于,则将tk时刻的借贷数据集Btrain(tk)视为初始借贷数据集,执行关系借贷网络构建与更新模块重新构建关系借贷网络;若小于,令 Btrain(tk+1)=Btrain(tk)∪Btest(tk+1)-B`test(tk+1);在时刻tk+1时执行增量式网络表征学习模块第一子模块,根据到来的流式借贷数据,增量式地更新网络表征。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于倾向性异质装袋算法的钢材质量预测方法 | 2020-05-08 | 500 |
一种基于医疗服务的集成信息管理方法 | 2020-05-08 | 729 |
一种声乐转换钢琴曲的钢琴学习方法 | 2020-05-08 | 807 |
构建基于PU学习的恶意流量检测模型的方法及装置 | 2020-05-12 | 149 |
一种汽车无线充电的方法及系统 | 2020-05-12 | 743 |
基于长短期记忆网络的梯级水电站发电量预测方法 | 2020-05-13 | 794 |
一种基于深度学习的多时相SAR图像变化检测方法 | 2020-05-08 | 459 |
一种声乐转换钢琴曲的钢琴学习系统 | 2020-05-08 | 467 |
软件众包的任务型对话系统及方法 | 2020-05-11 | 468 |
一种基于心率变异性的睡眠分期方法 | 2020-05-11 | 316 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。