首页 / 专利库 / 化妆品和香水 / 覆盖 / 一种基于级联神经网络的高置信改造质量和减假暂量化评估方法

一种基于级联神经网络的高置信改造质量和减假暂量化评估方法

阅读:541发布:2024-01-10

专利汇可以提供一种基于级联神经网络的高置信改造质量和减假暂量化评估方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及一种基于级联神经网络的高置信改造 质量 和减假暂量化评估方法,用于对服刑人员的信息 数据库 进行数据分析和提取,对狱中服刑人员的改造质量进行评估。该方法以罪犯危险性评估量表为指导,通过全面利用服刑人员的全周期多维度的相关数据,构造具有相互 支撑 效果的级联神经网络和迁移重构神经网络,并以预处理的结构化数据进行训练,获得了具有 精度 高、实用性强的改造质量评估方法。与不使用基于此类神经网络的传统模型和 算法 相比,本发明提出的方法更能适合多维非线性原始数据、预测准确率和效率更高,表明本发明提出的方法是有效、实用的。,下面是一种基于级联神经网络的高置信改造质量和减假暂量化评估方法专利的具体信息内容。

1.一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,包括步骤如下:
(1)对原始数据进行预处理;原始数据是指从服刑人员数据库抽取的所需信息,包括服刑人员的六大维度信息,六大维度信息包括人口数据维度、社会关系维度、生理维度、心理维度、犯罪信息维度和改造教育维度,服刑人员数据库包括服刑人员在狱中的所有记录信息,覆盖服刑人员的入监阶段、服刑阶段和出监阶段数据信息;
对原始数据进行预处理,是指对原始数据即数据集实现数据结构化,是指对数据集中的离散类别字段和连续数值型字段分别处理,构造结构化数据,对离散类别字段进行标签编码,对连续数值型字段进行归一化,使得每个服刑人员的信息都处理为对应的一维特征向量
(2)对步骤(1)预处理后得到的数据集中的离散无序数据进行预处理:
针对服刑人员改造质量评估的关联属性包括离散类别字段的无序属性及连续数值型字段的连续有序属性;在连续有序属性中,直接在属性值上计算闵可夫斯基距离;在无序属性中,采用VDM算法在属性值上计算VDM距离;将闵可夫斯基距离和VDM距离结合处理混合属性,即服刑人员改造质量评估的关联属性,若在数据集X′有nc个连续有序属性,n-nc个无序属性,给出数据集中服刑人员的样本xi=(xi1;xi2;…;xin)与xj=(xj1;xj2;…;xjn),xi1;
xi2;…;xin是样本xi在所有混合属性中的取值,xj1;xj2;…;xjn是样本xj在所有混合属性中的取值,通过式(I)计算出xi和xj混合属性的距离:
式(I)中,MinkovDMP(xi,xj)是xi和xj混合属性的距离,xiu和xju分别是样本xi和xj在第u个属性上的取值,nc是有序属性的个数,p≥1,n是属性的总个数,VDM算法公式如式(II)所示:
式(II)中,mu,a表示在属性u上取值为a的样本数,mu,a,i表示在第i个样本中在属性u上取值为a的样本数,k是样本个数,VDMP(a,b)表示在属性u上两个离散值a和b之间的VDM距离;
(3)改造质量关键影响因子挖掘:
采用Relief F算法,基于特征对近距离样本的区分能评估特征,进而进行特征选择,即相关特征使同类样本接近,异类样本远离;
基于Relief F算法得到的10个有效影响因子作为服刑人员的特征向量,输入到神经网络,对神经网络进行训练;
(4)搭建级联神经网络模型
在神经网络模型中,集成BP神经网络的数据压缩能力与RBF神经网络任意精度的泛函逼近能力,即将BP神经网络与RBF神经网络串联,构成BP-RBF混合神经网络,BP神经网络、RBF神经网络的层与层之间没有连接,层间神经元全连接;
BP神经网络依次包括第一输入层、第一隐藏层、第一输出层
RBF神经网络依次包括第二输入层、第二隐藏层、第二输出层;
BP神经网络第一输入层接收步骤(1)预处理后得到的数据集,作为网络输入特征向量,第一输入层和第一隐藏层之间的权重矩阵W的第i行代表网络输入特征向量的第i个维度的权重,权重矩阵是神经网络训练学习时要优化的目标,权重矩阵的元素值代表了输入特征向量的权重信息;第一隐藏层用于BP神经网络的第一输入层和第一输出层的映射,第一隐藏层到第一输出层完成输入数据的压缩,压缩后的维度即为第一输出层的维度;
BP神经网络第一输出层的输出向量再作为RBF神经网络的输入向量进行分类,完成改造质量评估;经过Relief F算法提取的10个有效影响因子作为BP神经网络的输入,BP神经网络的第一输入层节点数为服刑人员数据集的特征维度数目,即10个有效影响因子的维度;RBF神经网络的第二输入层的节点数为BP神经网络输出节点数目,即2,第二隐藏层中神经元的变换函数即径向基函数,是对中心点径向对称且衰减的非负线性函数,对输入向量进行空间映射的变换,即为非线性优化,第二输出层对第二隐藏层进行线性加权调整,即为线性优化;第二隐藏层采用非线性优化策略对第一隐藏层的激活函数的参数进行调整,第二输出层采用线性优化策略对第二隐藏层的输出进行线性加权优化调整;
神经网络模型评估结果为服刑人员5个社会化维度,包括认知社会化、人格社会化、关系社会化、知识社会化和技能社会化,对服刑人员每个社会化维度的评估都采用二分类,以刑满释放人员的出狱数据在五个社会化评估维度的量化指标为标签,刑满释放人员的出狱数据即为出狱后的5个社会化维度的能力指标,分为强弱两个等级,标注信息分别由0、1表示社会化的能力强弱,故RBF神经网络的第二输出层节点数为1;
通过神经网络模型训练得出的误差最小值来确定隐层节点数目;
(5)训练阶段:
把步骤(3)中得到的包含10个有效影响因子的服刑人员数据集随机分为训练集和测试集两部分,训练集依次经过上述BP-RBF级联神经网络的输入层、隐藏层,第二隐藏层的输出为X,经过sigmoid激活函数操作y=sigmoid(WX),W表示第二隐藏层到第二输出层之间的连接权重,最终输出y为在第二输出层中得到对服刑人员的5个社会化维度的二分类指标,即强弱两个等级,分别由0、1来表示;重复上述训练数据的输入,直至神经网络训练过程中的损失函数不再下降后为止,损失函数采用交叉熵形式,进行性能评估与实际应用;
(6)迁移学习:
以上述步骤建模形成的改造质量评估模型,即步骤(5)的训练阶段保存的神经网络模型改造质量评估模型为预训练模型,民警及安置帮教机构综合评价数据为标签,民警及安置帮教机构综合评价数据为在试点监狱入监采集的数据,包含狱中民警和安置帮教机构对服刑人员的减假暂评估方案,利用迁移学习技术,冻结预训练模型中的前k个层中的权重,重新训练后面的n-k个层,得到减假暂量化评估模型。
2.根据权利要求1所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,所述步骤(6)之后,执行以下步骤:
利用信息抽取和知识表示技术,抽取包括“减刑”、“假释”和“暂予监外执行”的关键字,建立结构化数据库,作为减假暂量化评估模型的输出端过滤模,即在试点监狱入监采集的数据和结构化数据库中的关键字匹配程度高于设定的阈值,则正常输出减假暂量化评估模型的评估结果,若在试点监狱入监采集的数据和结构化数据库中的关键字匹配程度低于设定的阈值,则对减假暂量化评估模型的输出加入否决性约束;
以上述预训练模型的输入层和隐藏层作为迁移后模型的输入层和隐藏层,并根据与标签相应的输出格式采用二分类分类器层作为输出层,构建多维度减假暂量化评估级联神经网络模型。
3.根据权利要求1所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,所述步骤(3),改造质量关键影响因子挖掘:包括步骤如下:
把步骤(1)预处理后得到的数据集随机分为两部分,大的数据集部分作为训练集D,小的数据集部分作为测试集;
从训练集D中随机选择一个样本R,从和R同类的样本中寻找k最近邻样本H,从和R不同类的样本中寻找k最近邻样本M,按照公式(III)更新特征权重,A表示需要计算权重的特征:
式(III)中,diff(A,R1,R2)表示样本R1和样本R2在特征A上的差,R1[A]表示样本R1在特征A上的取值,R2[A]表示样本R2在特征A上的取值,max(A)表示在特征A上所有样本中的最大值,min(A)表示在特征A上所有样本中的最小值;
按照每个特征的权重从大到小进行排序,选择最有效的影响因子,即特征权重最大的
10个有效影响因子。
4.根据权利要求1所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,所述第一隐藏层的激活函数采用sigmoid函数,如公式(IV)所示:
式(IV)中,z是指从第一输入层传递到第一隐藏层的特征向量,σ(z)是第一隐藏层的输出,第一隐藏层和第一输出层之间同样有一个权重矩阵包含特征向量的权重信息。
5.根据权利要求1所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,BP神经网络的第一隐藏层节点数根据经验公式(V)求得:
式(V)中,h是第一隐藏层节点数,m和n分别是第一输入层和第一输出层节点的数目,a为1~10之间的调节常数。
6.根据权利要求1所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,径向基函数是局部响应函数,如公式(VI)所示:
式(VI)中,R(||dist||)表示神经网络的输入数据到中心点之间径向基距离的单调函数,dist表示采用的径向基函数,常用高斯径向基函数。
7.根据权利要求1所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,径向基函数采用高斯核函数,如公式(VII)所示:
式(VII)中,K(||X-Xc||)表示神经网络的输入数据X到中心点Xc的高斯距离;Xc为核函数中心,即RBF神经网络的第二隐藏层的节点,σ为函数的宽度参数,控制函数的径向作用范围;第二输入层和第二隐藏层之间是连接权值为1的连接。
8.根据权利要求1所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,在网络训练过程中通过网络预测误差来选择最优的径向基函数的分布常数,分布常数为 dmax是神经网络输入数据中心之间的最大距离,M是数据中心的数目。
9.根据权利要求1所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,采用Dropout技术对神经网络的输入数据的分布进行估计,让第一层隐藏层的节点在每次迭代时有概率失效,第一层隐藏层节点数目drop失效的比例值p=0.5。
10.根据权利要求1-9任一所述的一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,其特征在于,设定的阈值为0.75-0.9。

说明书全文

一种基于级联神经网络的高置信改造质量和减假暂量化评估

方法

技术领域

[0001] 本发明涉及一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,属于神经网络技术领域,具体涉及一种监狱改造质量评估和减假暂量化评估的研究方法。

背景技术

[0002] 对服刑人员进行改造目的是通过多种矫正和培训手段,实现服刑人员在刑满释放后,重新融入社会,成为守法的社会公民,改造质量评估应以服刑人员刑满释放后融入社会并不再发生犯罪为衡量标准。
[0003] 传统服刑人员改造质量评价多采用主观评价或者访谈的方式。传统改造评估模型多利用危险性评估量表进行打分。这种方法是通过参考一个险因素的列表,每一项目都有一个依据干警评估经验给予的标准分值形式,评估者根据实际逐项打分。由于量表的影响因子不合理不全面,影响因子的权重采用简单地打分方式不准确,司法人员根据法律的规定和自己的经验,推估服刑人员的再犯可能性,必然会表现出不同程度的随意性和非科学性,最终导致最终的罪犯危险性得分不合理。危险性评估量表需要罪犯访谈、手工填写和计算,工作较为繁琐、效率低。传统评估模型的评估维度不全面,存在重视犯罪倾向性评估、忽视技能培训和服刑人员社会再融入能评估等问题。如果服刑人员出狱后,缺乏生活技能,找不到工作,家庭关系破裂等,无法在社会生存,仍然会重新犯罪,给社会造成危害。
[0004] 相比以上改造质量评估方法,采用统计分析、二元logistic回归分析等评估的方法,以服刑人员信息数据为自变量,再犯信息为因变量,然后通过logistic回归分析,可以得到自变量的权重,从而可以大致了解到底哪些因素是再犯的危险因素,提取预测罪犯出监前重新犯罪风险预测因子。基于logistic回归的评估方法虽然克服了传统危险性评估量表采用的影响因子和权重的主观性、手工填写计算等缺点,在对服刑人员再犯风险的预测中取得了不错的结果。但目前采用的二元logistic回归模型,局限于预测结果为二分类的任务,无法解决影响因子的多维度非线性问题,导致评估不准确。服刑人员数据库的数据维度较高,数据类型较复杂,二元logistic回归对模型中自变量多重共线性较为敏感,两个高度相关自变量同时放入模型,可能导致较弱的一个自变量回归符号不符合预期,符号被扭转。
[0005] 因此,如何有效、合理地对服刑人员的危险性和在狱中的改造质量做出正确的评估,是现在要解决的重要问题。

发明内容

[0006] 针对现有技术的不足,本发明构建了基于服刑人员信息的全维度再社会化数据库和减假暂量刑规则结构化数据库,同时提供了一种基于BP(Back Propagation)神经网络和RBF(Radical Basis Function)神经网络两种异构神经网络融合的级联神经网络改造质量评估模型,集成BP神经网络的数据压缩能力和RBF神经网络任意精度的泛函逼近能力,从而解决评估数据的多维非线性问题。并利用迁移学习技术,以改造质量评估模型为预训练模型,训练并构建多维度减假暂量化评估级联神经网络模型。
[0007] 本发明可以有效的利用建立的改造评估全周期多维度数据库,利用关联数据神经网络优化技术,来提高服刑人员改造质量评估的准确性。
[0008] 术语解释:
[0009] 1、异构神经网络:是指两种结构不同的神经网络。
[0010] 2、网络融合:将两种不同的神经网络搭建成前后级联的结构,前级神经网络的输入是整个网络的输入,其输出作为后级神经网络的输入,后级神经网络的输出作为整个网络结构的输出。
[0011] 3、迁移学习:已学训练好的网络模型的结构和参数迁移到新的模型来帮助新模型训练。
[0012] 本发明的技术方案为:
[0013] 一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,包括步骤如下:
[0014] (1)对原始数据进行预处理;构建基于再社会化模型的改造评估体系:
[0015] 原始数据是指从服刑人员数据库中抽取的所需信息,包括服刑人员的六大维度信息,六大维度信息包括人口数据维度、社会关系维度、生理维度、心理维度、犯罪信息维度和改造教育维度,服刑人员数据库包括服刑人员在狱中的所有记录信息,覆盖服刑人员的入监阶段、服刑阶段和出监阶段数据信息;
[0016] 对原始数据进行预处理,是指对原始数据即数据集实现数据结构化,是指对数据集中的离散类别字段和连续数值型字段分别处理,构造结构化数据,对离散类别字段进行标签编码,对连续数值型字段进行归一化,使得每个服刑人员的信息都处理为对应的一维特征向量
[0017] (2)对步骤(1)预处理后得到的数据集中的离散无序数据进行预处理:
[0018] 针对服刑人员改造质量评估的关联属性包括离散类别字段的无序属性及连续数值型字段的连续有序属性;在连续有序属性中,直接在属性值上计算闵可夫斯基距离;例如,“1”与“2”更接近,与“3”距离较远,此时采用闵可夫斯基距离计算;在无序属性中,如职业的“无业”、“商人”、“农民”等不能直接在属性值上计算距离,采用VDM(Value Difference Metric)算法在属性值上计算VDM距离;将闵可夫斯基距离和VDM距离结合处理混合属性,即服刑人员改造质量评估的关联属性,若在数据集X′有nc个连续有序属性,n-nc个无序属性,给出数据集中服刑人员的样本xi=(xi1;xi2;…;xin)与xj=(xj1;xj2;…;xjn),xi1;xi2;…;xin是样本xi在所有混合属性中的取值,xj1;xj2;…;xjn是样本xj在所有混合属性中的取值,通过式(Ⅰ)计算出xi和xj混合属性的距离:
[0019]
[0020] 式(Ⅰ)中,MinkovDMP(xi,xj)是xi和xj混合属性的距离,xiu和xju分别是样本xi和xj在第u个属性上的取值,nc是有序属性的个数,p≥1,n是属性的总个数,VDM算法公式如式(Ⅱ)所示:
[0021]
[0022] 式(Ⅱ)中,mu,a表示在属性u上取值为a的样本数,mu,a,i表示在第i个样本中在属性u上取值为a的样本数,k是样本个数,VDMP(a,b)表示在属性u上两个离散值a和b之间的VDM距离;
[0023] (3)改造质量关键影响因子挖掘:
[0024] 采用Relief F算法,基于特征对近距离样本的区分能力评估特征,进而进行特征选择,即相关特征应该使同类样本接近,异类样本远离;包括步骤如下:
[0025] 把步骤(1)预处理后得到的数据集随机分为两部分,比例为8:2,大的数据集部分作为训练集D,小的数据集部分作为测试集;
[0026] Relief F算法的基本内容是从训练集D中随机选择一个样本R,从和R同类的样本中寻找k最近邻样本H,从和R不同类的样本中寻找k最近邻样本M,按照公式(Ⅲ)更新特征权重,A表示需要计算权重的特征:
[0027]
[0028] 式(Ⅲ)中,diff(A,R1,R2)表示样本R1和样本R2在特征A上的差,R1[A]表示样本R1在特征A上的取值,R2[A]表示样本R2在特征A上的取值,max(A)表示在特征A上所有样本中的最大值,min(A)表示在特征A上所有样本中的最小值;
[0029] 按照每个特征的权重从大到小进行排序,选择最有效的影响因子,即特征权重最大的10个有效影响因子;
[0030] 基于Relief F算法得到的10个有效影响因子作为服刑人员的特征向量,输入到神经网络,对神经网络进行训练;
[0031] (4)搭建级联神经网络模型
[0032] 在神经网络模型中,集成BP神经网络的数据压缩能力与RBF神经网络任意精度的泛函逼近能力,即将BP神经网络与RBF神经网络串联,构成BP-RBF混合神经网络,BP神经网络、RBF神经网络的层与层之间没有连接,层间神经元全连接;
[0033] BP神经网络依次包括第一输入层、第一隐藏层、第一输出层
[0034] RBF神经网络依次包括第二输入层、第二隐藏层、第二输出层;
[0035] BP神经网络第一输入层接收步骤(1)预处理后得到的数据集,作为网络输入特征向量,第一输入层和第一隐藏层之间的权重矩阵W的第i行代表网络输入特征向量的第i个维度的权重,权重矩阵是神经网络训练学习时要优化的目标,权重矩阵的元素值代表了输入特征向量的权重信息;第一隐藏层用于BP神经网络的第一输入层和第一输出层的映射,第一隐藏层到第一输出层完成输入数据的压缩,压缩后的维度即为第一输出层的维度;
[0036] BP神经网络第一输出层的输出向量再作为RBF神经网络的输入向量进行分类,完成改造质量评估;经过Relief F算法提取的10个有效影响因子作为BP神经网络的输入,BP神经网络的第一输入层节点数为服刑人员数据集的特征维度数目,即10个有效影响因子的维度;RBF神经网络的第二输入层的节点数为BP神经网络输出节点数目,即2,第二隐藏层中神经元的变换函数即径向基函数,是对中心点径向对称且衰减的非负线性函数,对输入向量进行空间映射的变换,即为非线性优化,第二输出层对第二隐藏层进行线性加权调整,即为线性优化;第二隐藏层采用非线性优化策略对第一隐藏层的激活函数(高斯函数)的参数(分布常数)进行调整,第二输出层采用线性优化策略对第二隐藏层的输出进行线性加权优化调整;因而学习速度较快。
[0037] 神经网络模型评估结果为服刑人员5个社会化维度,包括认知社会化、人格社会化、关系社会化、知识社会化和技能社会化,对服刑人员每个社会化维度的评估都采用二分类,以刑满释放人员的出狱数据在五个社会化评估维度的量化指标为标签,刑满释放人员的出狱数据即为出狱后的5个社会化维度的能力指标,分为强弱两个等级,标注信息分别由0、1表示社会化的能力强弱,故RBF神经网络的第二输出层节点数为1;
[0038] 通过神经网络模型训练得出的误差最小值来确定隐层节点数目;搭建的神经网络模型如图2所示;
[0039] (5)训练阶段:
[0040] 把步骤(3)中得到的包含10个有效影响因子的服刑人员数据集随机分为训练集和测试集两部分,训练集依次经过上述BP-RBF级联神经网络的输入层、隐藏层,第二隐藏层的输出为X,经过sigmoid激活函数操作y=sigmoid(WX),W表示第二隐藏层到第二输出层之间的连接权重,最终输出y为在第二输出层中得到对服刑人员的5个社会化维度的二分类指标,即强弱两个等级,分别由0、1来表示;重复上述训练数据的输入,直至神经网络训练过程中的损失函数不再下降后为止,损失函数采用交叉熵形式,进行性能评估与实际应用。
[0041] (6)迁移学习:
[0042] 以上述步骤建模形成的改造质量评估模型,即步骤(5)的训练阶段保存的神经网络模型改造质量评估模型为预训练模型,民警及安置帮教机构综合评价数据为标签,民警及安置帮教机构综合评价数据为在试点监狱入监采集的数据,包含狱中民警和安置帮教机构对服刑人员的减假暂评估方案,利用迁移学习技术,冻结预训练模型中的前k个层中的权重,重新训练后面的n-k个层,得到减假暂量化评估模型,预训练模型即为步骤(5)的训练阶段保存的神经网络模型;基于国家减假暂法律法规,利用信息抽取和知识表示技术,抽取包括“减刑”、“假释”和“暂予监外执行”的关键字,建立结构化数据库,作为减假暂量化评估模型的输出端过滤模,即在试点监狱入监采集的数据和结构化数据库中的关键字匹配程度高于设定的阈值,则正常输出减假暂量化评估模型的评估结果,若在试点监狱入监采集的数据和结构化数据库中的关键字匹配程度低于设定的阈值,则对减假暂量化评估模型的输出加入否决性约束;即若减假暂量化评估模型输出结果为某犯人满足减刑,但根据基于国家减假暂法律法规建立的结构化数据库,该犯人还未完全符合减刑标准,则将输出结果修改为不满足减刑,以此来实现否决性约束,提高减假暂评估结论的严谨程度。
[0043] 以上述预训练模型的输入层和隐藏层作为迁移后模型的输入层和隐藏层,并根据与标签相应的输出格式采用二分类分类器层作为输出层,构建多维度减假暂量化评估级联神经网络模型。
[0044] 进一步优选的,设定的阈值为0.75-0.9。
[0045] 根据本发明优选的,所述第一隐藏层的激活函数采用sigmoid函数,如公式(Ⅳ)所示:
[0046]
[0047] 式(Ⅳ)中,z是指从第一输入层传递到第一隐藏层的特征向量,σ(z)是第一隐藏层的输出,第一隐藏层和第一输出层之间同样有一个权重矩阵包含特征向量的权重信息。
[0048] 根据本发明优选的,BP神经网络的第一隐藏层节点数根据经验公式(Ⅴ)求得:
[0049]
[0050] 式(Ⅴ)中,h是第一隐藏层节点数,m和n分别是第一输入层和第一输出层节点的数目,a为1~10之间的调节常数。输出节点数为2;
[0051] 根据本发明优选的,径向基函数是局部响应函数,如公式(Ⅵ)所示:
[0052]
[0053] 式(Ⅵ)中,R(||dist||)表示神经网络的输入数据到中心点之间径向基距离的单调函数,dist表示采用的径向基函数,常用高斯径向基函数。
[0054] 根据本发明优选的,径向基函数采用高斯核函数,如公式(Ⅶ)所示:
[0055]
[0056] 式(Ⅶ)中,K(||X-Xc||)表示神经网络的输入数据X到中心点Xc的高斯距离。
[0057] Xc为核函数中心,即RBF神经网络的第二隐藏层的节点,σ为函数的宽度参数,控制函数的径向作用范围;第二输入层和第二隐藏层之间是连接权值为1的连接。
[0058] 根据本发明优选的,在RBF神经网络中最重要的参数是径向基函数(采用高斯函数)的分布常数,在网络训练过程中通过网络预测误差来选择最优的径向基函数的分布常数,分布常数为 dmax是神经网络输入数据中心之间的最大距离,M是数据中心的数目。通过在训练神经网络的过程中选择不同大小的分布常数得出不同大小的网络预测误差,预测误差越小,其对应的分布常数就最优。
[0059] 针对改造样本数量有限的问题,利用自助采样法,使用有放回重复采样的方式进行数据采样。
[0060] 根据本发明优选的,采用Dropout技术对神经网络的输入数据的分布进行估计,让第一层隐藏层的节点在每次迭代时(包括正向和反向传播)有一定概率(keep-prob)失效,第一层隐藏层节点数目drop失效的比例值p=0.5。即通过动态修改隐藏层的神经元个数来防止过拟合,提高模型泛化能力和模型准确率;
[0061] 本发明的有益效果为:
[0062] 1、针对服刑人员改造数据具有高维度、高噪声的特点,本发明提出了一种级联异构级联神经网络,结合BP神经网络和RBF神经网络的数据压缩能力和任意精度的泛函逼近能力,该模型结合了BP神经网络的学习能力强、自适应度高以及RBF神经网络收敛快、群分类性能好的优点,实现系统模型训练的局部梯度端到端的高效传递。
[0063] 2、本发明借助刑满释放人员的五个社会化维度信息构建服刑人员信息的全维度再社会化数据库,基于知识抽取和表示技术,通过获取狱中民警和安置帮教机构对服刑人员的减假暂评估方案构建减假暂量刑规则结构化数据库,是进行高置信改造质量评估和减假暂量化评估的数据基础,在一定程度上对最终目标的提高起到了促进作用。
[0064] 3、本发明提供一种关键影响因子挖掘的方法,度量服刑人员信息数据的混合属性间距离,采用Relief F算法提取出对服刑人员改造质量评估的10个关键影响因子,一方面能减小计算量和模型复杂度,另一方面能为监狱改造质量评估的管理工作提供理论依据。
[0065] 4、本发明提供一种基于迁移学习的模型训练方法,将改造质量评估的级联神经网络模型迁移到减假暂量化评估模型中,在小样本数量的减假暂结构化数据库中训练得到较好的模型。附图说明
[0066] 图1是基于级联神经网络的高置信改造质量和减假暂量化评估方法的工作流程示意图;
[0067] 图2是BP-RBF混合神经网络的结构框图
[0068] 图3是本发明的服刑人员数据预处理和特征向量构建方法示意图;

具体实施方式

[0069] 下面结合说明书附图和实施例对本发明作进一步限定,但不限于此。
[0070] 实施例1
[0071] 一种基于级联神经网络的高置信改造质量和减假暂量化评估方法,如图1所示,包括步骤如下:
[0072] (1)对原始数据进行预处理;构建基于再社会化模型的改造评估体系:
[0073] 原始数据是指从服刑人员数据库中抽取的所需信息,包括服刑人员的六大维度信息,六大维度信息包括人口数据维度、社会关系维度、生理维度、心理维度、犯罪信息维度和改造教育维度,人口数据维度包括服刑人员的性别、年龄、受教育情况、职业就业、特殊技能、是否为三无人员;社会关系维度包括服刑人员的家庭结构、家庭经济平、家庭教育程度、家庭变故、婚姻状况、社会交往对象、个人债务情况;生理维度包括身体健康状况(有无疾病、残疾)、成瘾状况、成瘾程度;心理维度包括情绪稳定指标、说谎指标、冲动性指标、认知状况、人格障碍、性格缺陷、报复性心理;犯罪信息维度包括刑期、犯罪类型、罪行危害程度、特定犯罪史、突发犯罪与预谋犯罪;改造教育维度包括亲情帮教、服刑信念、认罪悔罪、遵规守纪、劳动积分考评、学习形态、生活食宿、狱中人际交往;服刑人员数据库包括服刑人员在狱中的所有记录信息,覆盖服刑人员的入监阶段、服刑阶段和出监阶段数据信息;
[0074] 对原始数据进行预处理,如图3所示,是指对原始数据即数据集实现数据结构化,是指对数据集中的离散类别字段和连续数值型字段分别处理,构造结构化数据,对离散类别字段进行标签编码,对连续数值型字段进行归一化,使得每个服刑人员的信息都处理为对应的一维特征向量;
[0075] 对数据集中的离散类别字段,包括:性别、受教育情况、职业就业、特殊技能、是否为三无人员、家庭结构、家庭教育程度、家庭变故、婚姻状况、社会交往对象、身体健康状况、成瘾状况、成瘾程度、情绪稳定指标、说谎指标、冲动性指标、认知状况、人格障碍、性格缺陷、报复性心理、犯罪类型、罪行危害程度、特定犯罪史、突发犯罪与预谋犯罪、亲情帮教、服刑信念、认罪悔罪、遵规守纪、学习形态、生活食宿、狱中人际交往,进行数字化离散编码处理,针对每个字段的所有取值都用数字0、1、2等表示,即进行标签编码;性别包括男、女,受教育情况包括文盲、小学、初中、高中、大学、研究生及以上,职业就业包括无业、农民、商人,身体健康状况包括有无疾病、残疾;
[0076] 对数据集中的连续数值型字段进行归一化处理,数据集中的连续数值型字段包括年龄、个人债务、家庭经济水平、刑期、劳动积分考评,如下式所示:
[0077]
[0078] X为输入数据,Xmax为输入数据的最大值,Xmin为输入数据的方差,X′为归一化处理后的数据;
[0079] (2)对步骤(1)预处理后得到的数据集中的离散无序数据进行预处理:
[0080] 离散无序数据包括数据集中对离散类别字段进行标签编码后的数值型数据(0,1,2等)和对连续数值型字段进行归一化处理后的数据X′;
[0081] 针对服刑人员改造质量评估的关联属性包括离散类别字段的无序属性及连续数值型字段的连续有序属性;在连续有序属性中,直接在属性值上计算闵可夫斯基距离;例如,“1”与“2”更接近,与“3”距离较远,此时采用闵可夫斯基距离计算;在无序属性中,如职业的“无业”、“商人”、“农民”等不能直接在属性值上计算距离,采用VDM(Value Difference Metric)算法在属性值上计算VDM距离;将闵可夫斯基距离和VDM距离结合处理混合属性,即服刑人员改造质量评估的关联属性,若在数据集X′有nc个连续有序属性,n-nc个无序属性,给出数据集中服刑人员的样本xi=(xi1;xi2;…;xin)与xj=(xj1;xj2;…;xjn),xi1;xi2;…;xin是样本xi在所有混合属性中的取值,xj1;xj2;…;xjn是样本xj在所有混合属性中的取值,通过式(Ⅰ)计算出xi和xj混合属性的距离:
[0082]
[0083] 式(Ⅰ)中,MinkovDMP(xi,xj)是xi和xj混合属性的距离,xiu和xju分别是样本xi和xj在第u个属性上的取值,nc是有序属性的个数,p≥1,n是属性的总个数,VDM算法公式如式(Ⅱ)所示:
[0084]
[0085] 式(Ⅱ)中,mu,a表示在属性u上取值为a的样本数,mu,a,i表示在第i个样本中在属性u上取值为a的样本数,k是样本个数,VDMP(a,b)表示在属性u上两个离散值a和b之间的VDM距离;
[0086] (3)改造质量关键影响因子挖掘:
[0087] 采用Relief F算法,基于特征对近距离样本的区分能力评估特征,进而进行特征选择,即相关特征应该使同类样本接近,异类样本远离;包括步骤如下:
[0088] 把步骤(1)预处理后得到的数据集随机分为两部分,比例为8:2,大的数据集部分作为训练集D,小的数据集部分作为测试集;
[0089] Relief F算法的基本内容是从训练集D中随机选择一个样本R,从和R同类的样本中寻找k最近邻样本H,从和R不同类的样本中寻找k最近邻样本M,按照公式(Ⅲ)更新特征权重,A表示需要计算权重的特征:
[0090]
[0091] 式(Ⅲ)中,diff(A,R1,R2)表示样本R1和样本R2在特征A上的差,R1[A]表示样本R1在特征A上的取值,R2[A]表示样本R2在特征A上的取值,max(A)表示在特征A上所有样本中的最大值,min(A)表示在特征A上所有样本中的最小值;
[0092] 按照每个特征的权重从大到小进行排序,选择最有效的影响因子,即特征权重最大的10个有效影响因子;
[0093] 基于Relief F算法得到的10个有效影响因子作为服刑人员的特征向量,输入到神经网络,对神经网络进行训练;
[0094] (4)搭建级联神经网络模型
[0095] 在神经网络模型中,集成BP神经网络的数据压缩能力与RBF神经网络任意精度的泛函逼近能力,即将BP神经网络与RBF神经网络串联,构成BP-RBF混合神经网络,如图2所示,BP神经网络、RBF神经网络的层与层之间没有连接,层间神经元全连接;
[0096] BP神经网络依次包括第一输入层、第一隐藏层、第一输出层;
[0097] RBF神经网络依次包括第二输入层、第二隐藏层、第二输出层;
[0098] BP神经网络第一输入层接收步骤(1)预处理后得到的数据集,作为网络输入特征向量,第一输入层和第一隐藏层之间的权重矩阵W的第i行代表网络输入特征向量的第i个维度的权重,权重矩阵是神经网络训练学习时要优化的目标,权重矩阵的元素值代表了输入特征向量的权重信息;第一隐藏层用于BP神经网络的第一输入层和第一输出层的映射,第一隐藏层到第一输出层完成输入数据的压缩,压缩后的维度即为第一输出层的维度;
[0099] BP神经网络第一输出层的输出向量再作为RBF神经网络的输入向量进行分类,完成改造质量评估;经过Relief F算法提取的10个有效影响因子作为BP神经网络的输入,BP神经网络的第一输入层节点数为服刑人员数据集的特征维度数目,即10个有效影响因子的维度;RBF神经网络的第二输入层的节点数为BP神经网络输出节点数目,即2,第二隐藏层中神经元的变换函数即径向基函数,是对中心点径向对称且衰减的非负线性函数,对输入向量进行空间映射的变换,即为非线性优化,第二输出层对第二隐藏层进行线性加权调整,即为线性优化;第二隐藏层采用非线性优化策略对第一隐藏层的激活函数(高斯函数)的参数(分布常数)进行调整,第二输出层采用线性优化策略对第二隐藏层的输出进行线性加权优化调整;因而学习速度较快。
[0100] 神经网络模型评估结果为服刑人员5个社会化维度,包括认知社会化、人格社会化、关系社会化、知识社会化和技能社会化,对服刑人员每个社会化维度的评估都采用二分类,以刑满释放人员的出狱数据在五个社会化评估维度的量化指标为标签,刑满释放人员的出狱数据即为出狱后的5个社会化维度的能力指标,分为强弱两个等级,标注信息分别由0、1表示社会化的能力强弱,故RBF神经网络的第二输出层节点数为1;
[0101] 通过神经网络模型训练得出的误差最小值来确定隐层节点数目;搭建的神经网络模型如图2所示;
[0102] (5)训练阶段:
[0103] 把步骤(3)中得到的包含10个有效影响因子的服刑人员数据集随机分为训练集和测试集两部分,比例为8:2,大的部分数据集打乱后分成N份,每次取N-1份做训练数据,1份做验证,做N次交叉验证,评估神经网络模型性能,小的部分数据集作为测试数据集;将每次取得的N-1份训练数据作为神经网络的输入,训练集依次经过上述BP-RBF级联神经网络的输入层、隐藏层,第二隐藏层的输出为X,经过sigmoid激活函数操作y=sigmoid(WX),W表示第二隐藏层到第二输出层之间的连接权重,最终输出y为在第二输出层中得到对服刑人员的5个社会化维度的二分类指标,即强弱两个等级,分别由0、1来表示;重复上述训练数据的输入,直至神经网络训练过程中的损失函数不再下降后为止,损失函数采用交叉熵形式,进行性能评估与实际应用。
[0104] (6)迁移学习:
[0105] 以上述步骤建模形成的改造质量评估模型,即步骤(5)的训练阶段保存的神经网络模型改造质量评估模型为预训练模型,民警及安置帮教机构综合评价数据为标签,民警及安置帮教机构综合评价数据为在试点监狱入监采集的数据,包含狱中民警和安置帮教机构对服刑人员的减假暂评估方案,利用迁移学习技术,冻结预训练模型中的前k个层中的权重,重新训练后面的n-k个层,得到减假暂量化评估模型,预训练模型即为步骤(5)的训练阶段保存的神经网络模型;基于国家减假暂法律法规,利用信息抽取和知识表示技术,抽取包括“减刑”、“假释”和“暂予监外执行”的关键字,建立结构化数据库,作为减假暂量化评估模型的输出端过滤模块,即在试点监狱入监采集的数据和结构化数据库中的关键字匹配程度高于设定的阈值(阈值设置为0.75-0.9),则正常输出减假暂量化评估模型的评估结果,若在试点监狱入监采集的数据和结构化数据库中的关键字匹配程度低于设定的阈值,则对减假暂量化评估模型的输出加入否决性约束,即若减假暂量化评估模型输出结果为某犯人满足减刑,但根据基于国家减假暂法律法规建立的结构化数据库,该犯人还未完全符合减刑标准,则将输出结果修改为不满足减刑,以此来实现否决性约束,提高减假暂评估结论的严谨程度。
[0106] 以上述预训练模型的输入层和隐藏层作为迁移后模型的输入层和隐藏层,并根据与标签相应的输出格式采用二分类分类器层作为输出层,构建多维度减假暂量化评估级联神经网络模型。
[0107] 第一隐藏层的激活函数采用sigmoid函数,如公式(Ⅳ)所示:
[0108]
[0109] 式(Ⅳ)中,z是指从第一输入层传递到第一隐藏层的特征向量,σ(z)是第一隐藏层的输出,第一隐藏层和第一输出层之间同样有一个权重矩阵包含特征向量的权重信息。
[0110] BP神经网络的第一隐藏层节点数根据经验公式(Ⅴ)求得:
[0111]
[0112] 式(Ⅴ)中,h是第一隐藏层节点数,m和n分别是第一输入层和第一输出层节点的数目,a为1~10之间的调节常数。输出节点数为2;
[0113] 径向基函数是局部响应函数,如公式(Ⅵ)所示:
[0114]
[0115] 式(Ⅵ)中,R(||dist||)表示神经网络的输入数据到中心点之间径向基距离的单调函数,dist表示采用的径向基函数,常用高斯径向基函数。
[0116] 径向基函数采用高斯核函数,如公式(Ⅶ)所示:
[0117]
[0118] 式(Ⅶ)中,K(||X-Xc||)表示神经网络的输入数据X到中心点Xc的高斯距离。
[0119] Xc为核函数中心,即RBF神经网络的第二隐藏层的节点,σ为函数的宽度参数,控制函数的径向作用范围;第二输入层和第二隐藏层之间是连接权值为1的连接。
[0120] 在RBF神经网络中最重要的参数是径向基函数(采用高斯函数)的分布常数,在网络训练过程中通过网络预测误差来选择最优的径向基函数的分布常数,分布常数为dmax是神经网络输入数据中心之间的最大距离,M是数据中心的数目。通过在训练
神经网络的过程中选择不同大小的分布常数得出不同大小的网络预测误差,预测误差越小,其对应的分布常数就最优。
[0121] 针对改造样本数量有限的问题,利用自助采样法,使用有放回重复采样的方式进行数据采样。
[0122] 采用Dropout技术对神经网络的输入数据的分布进行估计,让第一层隐藏层的节点在每次迭代时(包括正向和反向传播)有一定概率(keep-prob)失效,第一层隐藏层节点数目drop失效的比例值p=0.5。即通过动态修改隐藏层的神经元个数来防止过拟合,提高模型泛化能力和模型准确率;
[0123] 本实施例在某监狱中采取的数据集上做了实验验证,将入监采集的数据集样本随机分割,选其中80%作为训练集,20%作为测试集,每个服刑人员样本都会对应一个标签,按照前述模型结构在训练方式,本模型在采集的结构化数据集的训练集上训练,在测试集上的分类准确率达到了85%。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈