首页 / 专利库 / 电信 / 输出节点 / 一种基于深度学习的在校大学生信用评估方法及装置

一种基于深度学习的在校大学生信用评估方法及装置

阅读:122发布:2024-02-28

专利汇可以提供一种基于深度学习的在校大学生信用评估方法及装置专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于 深度学习 的在校大学生信用评估方法及装置,方法包括:A:获取待评估学生的信用数据;B:使用word2vec 框架 将信用数据样本中的文本信息转换为词向量,再使用预先训练好的LSTM模型针对待评估学生对应的词向量进行处理得到文本特征指标数据;C:将待评估学生的信用数据中除文本信息以外的其他信用数据进行特征赋值并进行归一化处理,得到非文本特征指标数据;D:利用预先训练的BP神经网络将学生文本特征指标数据和非文本特征指标数据作为连续性输入映射到连续性输出,得到待评估学生的目标信用评估结果。应用本发明 实施例 ,可以提高针对学生的信用评估的效率及准确性。,下面是一种基于深度学习的在校大学生信用评估方法及装置专利的具体信息内容。

1.一种基于深度学习的在校大学生信用评估方法,其特征在于,所述方法包括:
A:获取待评估学生的信用数据,所述信用数据包括:所述学生的上课考勤数据、所述学生的考试成绩数据、所述学生的学费数据、所述学生的助学贷款数据中的一种或组合;
B:使用word2vec框架将所述信用数据样本中的文本信息转换为词向量,再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到文本特征指标数据;
C:将待评估学生的信用数据中除文本信息以外的其他信用数据进行特征赋值并进行归一化处理,得到非文本特征指标数据;
D:利用预先训练的BP神经网络将学生文本特征指标数据和非文本特征指标数据作为连续性输入映射到连续性输出,得到所述待评估学生的目标信用评估结果。
2.根据权利要求1所述的一种基于深度学习的在校大学生信用评估方法,其特征在于,所述B步骤,包括:
B1:针对每一个待评估学生,获取待评估学生的同学和老师针对所述待评估学生的非结构化文本评价信息;
B2:去除所述评价信息中与情感倾向分析无关的部分;采用分词工具将所述评价信息行切分,得到分词,对分词使用word2vec框架进行转换得到词向量,将各个分词的词向量组合得到关于所述分词的矩阵;
B3:再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到针对所述文本信息的文本特征指标数据。
3.根据权利要求1所述的一种基于深度学习的在校大学生信用评估方法,其特征在于,所述步骤C,包括:
对所述待评估学生的除文本信息以外的数据信息进行赋值处理,并采用最大值归一化方法对所述待评估学生的除文本信息以外的数据信息进行归一化处理,得到非文本特征指标数据。
4.根据权利要求1所述的一种基于深度学习的在校大学生信用评估方法,其特征在于,所述BP神经网络的训练过程,包括:
D1:构建BP人工神经网络:所述BP神经网络包括输入层,隐含层和输出层,采用ReLU作为输出映射函数;
D2:将第一数量个样本数据作为训练集,将第二数量个样本数据作为测试集,其中,样本数据包括:学生的文本特征指标数据、非文本特征指标数据以及所述学生的信用评估结果;
D3:根据输入输出序列(x,y),输入层节点数,隐含层节点数,输出层节点数,初始化输入层,隐含层和输出层神经元之间的链接权值,初始化隐含层阈值,输出层阈值,给定学习速率和神经元激励函数ReLU,最大容忍误差E;设置学习速率和神经元激励函数f=ReLU(=max(x,0)),最大容忍误差E,其中,
f为激励;ReLU()为激活函数;max(,)为最大值求值函数;x为输入的向量;y为输出的训练结果;
D4:依据输入向量,输入层和隐含层之间以权值ω以及隐含层阈值a,利用公式,计算隐含层输出,其中,
Hj为第j个隐含层节点输出的结果; 为求和函数;n为输入向量的个数;aj为第j个隐含层节点的偏置;ωij为第i个输入向量针对第j个隐含层节点的权重;xi为第i个输入向量;
D5:依据隐含层输出H,权重和设定阈值,利用公式, 计算输出O,其中,Ok为第k个输出层节点输出的结果;∑为求和函数;ωjk为第k个输出层节点相对于第j个隐含层节点的权重;l为隐含层包含的节点数量;b为设定阈值;
D6:使用均方根误差对网络输出与真实值之间的差距进行度量;
D7:根据所述D6步骤的结果判断构建的BP人工神经网络是否收敛,若是,利用训练好的BP人工神经网络模型对待评估学生的信用数据进行处理,获取所述待评估学生的信用评估结果;若否,执行D8步骤;
D8:,利用公式, 更新第i个输入向
量针对第j个隐含层节点的权重以及,第k个输出层节点相对于第j个隐含层节点的权重,其中,
η为学习率;e为均方根误差;
D9:利用公式, 更新节点的设定阈值,并返回执
所述D4步骤,其中,
aj为第j个隐含层节点的偏置;bk为输出层第k个节点的设定阈值。
5.一种基于深度学习的在校大学生信用评估装置,其特征在于,所述装置包括:
获取模,用于获取待评估学生的信用数据,所述信用数据包括:所述学生的上课考勤数据、所述学生的考试成绩数据、所述学生的学费数据、所述学生的助学贷款数据中的一种或组合;
转换模块,用于使用word2vec框架将所述信用数据样本中的文本信息转换为词向量,再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到针对所述文本信息的文本特征数据;
归一化模块,用于将待评估学生的信用数据中除文本信息以外的其他信用数据进行特征赋值并进行归一化处理,得到非文本特征指标数据;
获得模块,用于利用预先训练的BP神经网络将学生文本特征指标数据和非文本特征指标数据作为连续性输入映射到连续性输出,得到所述待评估学生的目标信用评估结果。
6.根据权利要求5所述的一种基于深度学习的在校大学生信用评估装置,其特征在于,所述转换模块,用于:
B1:针对每一个待评估学生,获取待评估学生的同学和老师针对所述待评估学生的非结构化文本的评价信息;
B2:去除所述评价信息中与情感倾向分析无关的部分;采用分词工具将所述评价信息行切分,得到分词,对分词使用word2vec框架进行转换得到词向量,将各个分词的词向量组合得到关于所述分词的矩阵;
B3:再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到针对所述文本信息的文本特征指标数据。
7.根据权利要求5所述的一种基于深度学习的在校大学生信用评估装置,其特征在于,所述归一化模块,用于:
对所述待评估学生的除文本信息以外的数据信息进行赋值处理,并采用最大值归一化方法对所述待评估学生的除文本信息以外的数据信息进行归一化处理,得到非文本特征指标数据。
8.根据权利要求5所述的一种基于深度学习的在校大学生信用评估装置,其特征在于,所述BP神经网络的训练过程,包括:
D1:构建BP人工神经网络:所述BP神经网络包括输入层,隐含层和输出层,采用ReLU作为输出映射函数;
D2:将第一数量个样本数据作为训练集,将第二数量个样本数据作为测试集,其中,样本数据包括:学生的文本特征指标数据、非文本特征指标数据以及所述学生的信用评估结果;
D3:根据输入输出序列(x,y),输入层节点数,隐含层节点数,输出层节点数,初始化输入层,隐含层和输出层神经元之间的链接权值,初始化隐含层阈值,输出层阈值,给定学习速率和神经元激励函数ReLU,最大容忍误差E;设置学习速率和神经元激励函数f=ReLU(=max(x,0)),最大容忍误差E,其中,
f为激励;ReLU()为激活函数;max(,)为最大值求值函数;x为输入的向量;y为输出的训练结果;
D4:依据输入向量,输入层和隐含层之间以权值ω以及隐含层阈值a,利用公式,计算隐含层输出,其中,
Hj为第j个隐含层节点输出的结果; 为求和函数;n为输入向量的个数;aj为第j个隐含层节点的偏置;ωij为第i个输入向量针对第j个隐含层节点的权重;xi为第i个输入向量;
D5:依据隐含层输出H,权重和设定阈值,利用公式, 计算输出O,其中,Ok为第k个输出层节点输出的结果;∑为求和函数;ωjk为第k个输出层节点相对于第j个隐含层节点的权重;l为隐含层包含的节点数量;b为设定阈值;
D6:使用均方根误差对网络输出与真实值之间的差距进行度量;
D7:根据所述D6步骤的结果判断构建的BP人工神经网络是否收敛,若是,利用训练好的BP人工神经网络模型对待评估学生的信用数据进行评估,获取所述待评估学生的目标信用评估结果;若否,执行D8步骤;
D8:,利用公式, 更新第i个输入向
量针对第j个隐含层节点的权重以及,第k个输出层节点相对于第j个隐含层节点的权重,其中,
η为学习率;e为均方根误差;
D9:利用公式, 更新节点的设定阈值,并返回执行
所述D4步骤,其中,
aj为第j个隐含层节点的偏置;bk为输出层第k个节点的设定阈值。

说明书全文

一种基于深度学习的在校大学生信用评估方法及装置

技术领域

[0001] 本发明涉及一种基于深度学习的在校大学生信用评估方法及装置,更具体涉及一种基于深度学习的在校大学生信用评估方法及装置。

背景技术

[0002] 近些年来,大学生在学业、学术、就业中失信事件频发,如学术造假,毕业生助学贷款拖欠等,大学生信用的缺失不仅损害了大学生的整体形象,不利于大学生自身的健康成长,而且也给社会造成了不良的影响,使社会公众对大学教育产生了诸多的质疑。通过对在校大学生的学习和生活方面的信息进行分析,有助于形成较为完善的符合大学生群体特点的信用评定方法,因此大学生信用评定方法的研究对于约束大学生行为,引导学生发展具有重要的科研价值和应用价值。
[0003] 现有的信用评定方法大多基于个体的经济行为即履约情况,然而大学生群体存在特殊性,其在校期间活动以学习技能为主,独立完成的与社会群体间的经济活动较少,采用以往的信用评定方法无法对在校大学生的信用平进行准确评定。此外,在校大学生的日常活动中也包含着类似于经济活动中的履约行为,如按时上课,合理通过考试,按时缴纳学费等,这些信息都可以作为学生信用评定的辅助信息,而目前高校学生的信用水平判定对这些信息未进行充分利用,其判定手段主要可分为人工评定的方法和基于多属性权重分析的方法两种。基于人工判定的方法依赖于同学之间的相互评定以及辅导员和任课老师的综合评定结果,这种方法以个体之间的直接交互主观感受为依据,致使评定结果难以表现真实的信用水平,进而导致得到的评定结果与真实结果之间存在偏差。多属性权重的分析方法基于学生成绩信息库,以学生成绩与学分的加权平均作为学生信用评定结果,这种方法仅以学生成绩作为信用评定的依据过于片面,对学生的其它行为信息利用不足,评定效果不佳。
[0004] 综上,现有技术存在针对学生的信用评估结果不够准确的技术问题。

发明内容

[0005] 本发明所要解决的技术问题在于提供了一种基于深度学习的在校大学生信用评估方法及装置,以提高针对学生的信用评估结果的准确性。
[0006] 本发明是通过以下技术方案解决上述技术问题的:
[0007] 本发明实施例提供了一种基于深度学习的在校大学生信用评估方法,所述方法包括:
[0008] A:获取待评估学生的信用数据,所述信用数据包括:所述学生的上课考勤数据、所述学生的考试成绩数据、所述学生的学费数据、所述学生的助学贷款数据中的一种或组合;
[0009] B:使用word2vec框架将所述信用数据样本中的文本信息转换为词向量,再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到文本特征指标数据;
[0010] C:将待评估学生的信用数据中除文本信息以外的其他信用数据进行特征赋值并进行归一化处理,得到非文本特征指标数据;
[0011] D:利用预先训练的BP神经网络将学生文本特征指标数据和非文本特征指标数据作为连续性输入映射到连续性输出,得到所述待评估学生的目标信用评估结果。
[0012] 可选的,所述B步骤,包括:
[0013] B1:针对每一个待评估学生,获取待评估学生的同学和老师针对所述待评估学生的非结构化文本的评价信息;
[0014] B2:去除所述评价信息中与情感倾向分析无关的部分;采用分词工具将所述评价信息行切分,得到分词,对分词使用word2vec框架进行转换得到词向量,将各个分词的词向量组合得到关于所述分词的矩阵;
[0015] B3:再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到文本特征指标数据。
[0016] 可选的,所述步骤C,包括:
[0017] 对所述待评估学生的除文本信息以外的数据信息进行赋值处理,并采用最大值归一化方法对所述待评估学生的除文本信息以外的数据信息进行归一化处理,得到非文本特征指标数据。
[0018] 可选的,所述BP神经网络的训练过程,包括:
[0019] D1:构建BP人工神经网络:所述BP神经网络包括输入层,隐含层和输出层,采用ReLU作为输出映射函数;
[0020] D2:将第一数量个样本数据作为训练集,将第二数量个样本数据作为测试集,其中,样本数据包括:学生的文本特征指标数据、非文本特征指标数据以及所述学生的信用评估结果;
[0021] D3:根据输入输出序列(x,y),输入层节点数,隐含层节点数,输出层节点数,初始化输入层,隐含层和输出层神经元之间的链接权值,初始化隐含层阈值,输出层阈值,给定学习速率和神经元激励函数ReLU,最大容忍误差E;设置学习速率和神经元激励函数f=ReLU(=max(x,0)),最大容忍误差E,其中,
[0022] f为激励;ReLU()为激活函数;max(,)为最大值求值函数;x为输入的向量;y为输出的训练结果;
[0023] D4:依据输入向量,输入层和隐含层之间以权值ω以及隐含层阈值a,利用公式,计算隐含层输出,其中,
[0024] Hj为第j个隐含层节点输出的结果; 为求和函数;n为输入向量的个数;aj为第j个隐含层节点的偏置;ωij为第i个输入向量针对第j个隐含层节点的权重;xi为第i个输入向量;
[0025] D5:依据隐含层输出H,权重和设定阈值,利用公式, 计算输出O,其中,
[0026] Ok为第k个输出层节点输出的结果;∑为求和函数;ωjk为第k个输出层节点相对于第j个隐含层节点的权重;l为隐含层包含的节点数量;b为设定阈值;
[0027] D6:使用均方根误差对网络输出与真实值之间的差距进行度量;
[0028] D7:根据所述D6步骤的结果判断构建的BP人工神经网络是否收敛,若是,利用训练好的BP人工神经网络模型对待评估学生的信用数据进行评估,获取所述待评估学生的目标信用评估结果;若否,执行D8步骤;
[0029] D8:,利用公式, 更新第i个输入向量针对第j个隐含层节点的权重以及,第k个输出层节点相对于第j个隐含层节点的权重,其中,
[0030] η为学习率;e为均方根误差;
[0031] D9:利用公式, 更新节点的设定阈值,并返回执行所述D4步骤,其中,
[0032] aj为第j个隐含层节点的偏置;bk为输出层第k个节点的设定阈值。
[0033] 本发明实施例提供了一种基于深度学习的在校大学生信用评估装置,所述装置包括:
[0034] 获取模,用于获取待评估学生的信用数据,所述信用数据包括:所述学生的上课考勤数据、所述学生的考试成绩数据、所述学生的学费数据、所述学生的助学贷款数据中的一种或组合;
[0035] 转换模块,用于使用word2vec框架将所述信用数据样本中的文本信息转换为词向量,再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到针对所述文本信息特征指标数据;
[0036] 归一化模块,用于将所述待评估学生的信用数据中除文本信息以外的其他信用数据进行归一化处理,得到针对所述其他非文本信用数据的特征指标数据;
[0037] 获得模块,用于利用预先训练的BP神经网络将学生文本特征指标数据和非文本特征指标数据作为连续性输入映射到连续性输出,得到所述待评估学生的目标信用评估结果。
[0038] 可选的,所述转换模块,用于:
[0039] B1:针对每一个待评估学生,获取待评估学生的同学和老师针对所述待评估学生的非结构化文本的评价信息;
[0040] B2:去除所述评价信息中与情感倾向分析无关的部分;采用分词工具将所述评价信息行切分,得到分词,对分词使用word2vec框架进行转换得到词向量,将各个分词的词向量组合得到关于所述分词的矩阵;
[0041] B3:再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到针对所述文本信息的文本特征指标数据。
[0042] 可选的,所述归一化模块,用于:
[0043] 对所述待评估学生的除文本信息以外的数据信息进行赋值处理,并采用最大值归一化方法对所述待评估学生的除文本信息以外的数据信息进行归一化处理,得到非文本特征指标数据。
[0044] 可选的,所述BP神经网络的训练过程,包括:
[0045] D1:构建BP人工神经网络:所述BP神经网络包括输入层,隐含层和输出层,采用ReLU作为输出映射函数;
[0046] D2:将第一数量个样本数据作为训练集,将第二数量个样本数据作为测试集,其中,样本数据包括:学生的文本特征指标数据、非文本特征指标数据以及所述学生的信用评估结果;
[0047] D3:根据输入输出序列(x,y),输入层节点数,隐含层节点数,输出层节点数,初始化输入层,隐含层和输出层神经元之间的链接权值,初始化隐含层阈值,输出层阈值,给定学习速率和神经元激励函数ReLU,最大容忍误差E;设置学习速率和神经元激励函数f=ReLU(=max(x,0)),最大容忍误差E,其中,
[0048] f为激励;ReLU()为激活函数;max(,)为最大值求值函数;x为输入的向量;y为输出的训练结果;
[0049] D4:依据输入向量,输入层和隐含层之间以权值ω以及隐含层阈值a,利用公式,计算隐含层输出,其中,
[0050] Hj为第j个隐含层节点输出的结果; 为求和函数;n为输入向量的个数;aj为第j个隐含层节点的偏置;ωij为第i个输入向量针对第j个隐含层节点的权重;xi为第i个输入向量;
[0051] D5:依据隐含层输出H,权重和设定阈值,利用公式, 计算输出O,其中,
[0052] Ok为第k个输出层节点输出的结果;∑为求和函数;ωjk为第k个输出层节点相对于第j个隐含层节点的权重;l为隐含层包含的节点数量;b为设定阈值;
[0053] D6:使用均方根误差对网络输出与真实值之间的差距进行度量;
[0054] D7:根据所述D6步骤的结果判断构建的BP人工神经网络是否收敛,若是,利用训练好的BP人工神经网络模型对待评估学生的信用数据进行评估,获取所述待评估学生的目标信用评估结果;若否,执行D8步骤;
[0055] D8:,利用公式, 更新第i个输入向量针对第j个隐含层节点的权重以及,第k个输出层节点相对于第j个隐含层节点的权重,其中,
[0056] η为学习率;e为均方根误差;
[0057] D9:利用公式, 更新节点的设定阈值,并返回执行所述D4步骤,其中,
[0058] aj为第j个隐含层节点的偏置;bk为输出层第k个节点的设定阈值。
[0059] 本发明相比现有技术具有以下优点:
[0060] 应用本发明实施例,使用LSTM模型对文本信息进行处理,得到待评估学生的文本特征指标数据,然后将除文本数据以外的其他非文本特征指标数据输入到BP神经网络中,应用本发明实施例,涵盖的信用数据类型更多更客观,相对于现有技术可以提高针对学生的信用评估的效率和准确性。附图说明
[0061] 图1为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法的流程示意图;
[0062] 图2为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法的原理示意图;
[0063] 图3为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法中LSTM网络以及word2vec的网络结构示意图;
[0064] 图4为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法中LSTM网络各层之间的结构图;
[0065] 图5为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法中BP网络的训练原理示意图;
[0066] 图6为本发明实施例提供的一种基于深度学习的在校大学生信用评估装置的结构示意图。

具体实施方式

[0067] 下面对本发明的实施例作详细说明,本实施例在以本发明技术方案为前提下进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0068] 本发明实施例提供了一种基于深度学习的在校大学生信用评估方法及装置,下面首先就本发明实施例提供的一种基于深度学习的在校大学生信用评估方法进行介绍。
[0069] 图1为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法的流程示意图;图2为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法的原理示意图,如图1和图2所示,所述方法包括:
[0070] S101:获取待评估学生的信用数据,所述信用数据包括:所述学生的上课考勤数据、所述学生的考试成绩数据、所述学生的学费数据、所述学生的助学贷款数据中的一种或组合;
[0071] 在实际应用中,可以依托学校教务部,学工部,财务部,后勤部,图书馆的学生数据,其中,
[0072] 教务部包含了学生上课考勤信息,包括应到课时与签到课时情况。
[0073] 学生各科目考试成绩及对应学分。
[0074] 学工部信息中包含了学生基本情况信息如处分情况,包括纪律处分级别。
[0075] 学生干部信息,包括学生干部级别。
[0076] 同学和老师的评价信息,这部分内容为文本信息。
[0077] 财务部包含了学生学费缴纳情况,助学贷款偿还情况信息。
[0078] 后勤部包含了学生一卡通消费情况,水电费缴纳情况。
[0079] 图书馆中包含了学生的图书借阅信息,构建学生基本信息数据库
[0080] S102:使用word2vec框架将所述信用数据样本中的文本信息转换为词向量,再使用预先训练好的LSTM(Long Short-Term Memory,长短期记忆)模型针对所述待评估学生对应的词向量进行处理得到针对所述文本信息的文本特征指标数据。
[0081] 具体的,S102步骤,包括:B1:针对每一个待评估学生,获取待评估学生的同学和老师针对所述待评估学生的非结构化文本的评价信息;B2:去除所述评价信息中与情感倾向分析无关的部分;采用分词工具将所述评价信息行切分,得到分词,对分词使用word2vec框架进行转换得到词向量,将各个分词的词向量组合得到关于所述分词的矩阵;B3:再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到针对所述文本信息的文本特征指标数据。
[0082] 图3为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法中LSTM网络以及word2vec的网络结构示意图,如图3所示,参照图3中的框架,对数据样本先进行清理去除与情感倾向分析无关的部分如标点符号,停用词。采用jieba分词工具将文本进行切分,词与词之间用空格分开,同时导入公开数据集中的停用词词典,去除与文本情感内容无关的部分。
[0083] 然后,对采集到的不同学生所得到的同学和老师的评价文本内容进行分级,使用word2vec框架将师生评价的文本信息转化为词向量,例如,对处理后的文本使用word2vec框架进行训练得到词向量,将词向量维度设置为200,如文本内容s有n个词语构成,最终每条文本信息可表示为n*200的矩阵,再利用LSTM网络得到针对不同学生个体的评价分级结果。
[0084] 由于这部分内容为文字信息,同学和老师的评价以文本信息为主,评价数量多,评价好坏不一,采用人工的方式对这些文本内容进行整理效率较为低下,本发明实施例采用word2vec框架将文本内容向量化,采用分类器来对文本情感倾向作出判断,进而得到与评价相对的5个定量级别:rank1:0;rank2:+25;rank3:+50;rank4:+75;rank5:+100。例如,在待评估学生对应的级别为rank1时,该学生对应的文本特征指标数据为0;待评估学生对应的级别为rank2时,该学生对应的文本特征指标数据为25,依此类推。
[0085] 图4为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法中LSTM网络各层之间的结构图,如图4所示,图4为LSTM网络的运行机制。
[0086] LSTM网络的训练过程如下,本步骤的目的是依据文本评价的内容将评价信息按照从最优评价到最差评价的5个层级,将文本信息映射为数值结果;
[0087] 所构建的LSTM长短期记忆人工神经网络包括输入层,LSTM层和全连接层;
[0088] LSTM长短期记忆人工神经网络模型的训练过程是监督训练的,训练LSTM长短期记忆人工神经网络的样本来自于公开数据集中已经分好类的句子,在每次迭代计算中放弃一部分训练参数,设置丢弃率为0.5,采用随机梯度下降完成权重系数更新,迭代次数为100;
[0089] 将m条评价所组成的m个n*200矩阵由输入层输入LSTM,特征提取分为正向传播特征提取和反向传播特征提取两个部分,将正向和反向LSTM最后一个单元的输出进行连接作为最终的结果输出,具体计算公式如下:
[0090] 其中,
[0091] ft为遗忘限;σ为sigmod函数;Wf为关于前一单元输出与当前单元输入之间的函数;ht-1为前单元的输出;xt为当前单元的输入;bf为常数;it为输入门限,决定哪些信息需要更新;Wi为输入门中关于前一单元输出与当前单元输入之间的函数;bi为常数; 为备选的用来更新的信息,;tanh()为激活函数;WC为备选更新信息中关于前一单元输出与当前单元输入之间的函数;bC为常数;Ct为当前单元状态;ft与旧单元状态Ct-1相乘,丢弃掉确定需要丢弃的信息,加上it与 的乘积得到新的候选值;ot为输出门限;Wo为输出门中关于前一单元输出与当前单元输入之间的函数;bo为常数;ht为当前单元的输出。
[0092] 将LSTM输出结果输入到全连接层进行特征降维,送入到Tanh激活函数中,将输出结果映射到[-1,1]区间,据此得到情感分析概率表达结果,rank1,P∈[-1,-0.6);rank2,P∈[-0.6,-0.2);rank3,P∈[-0.2,0.2);rank4,P∈[0.2,0.6);rank5,P∈[0.6,1),其中,P为概率。
[0093] S103:将待评估学生的信用数据中除文本信息以外的其他信用数据进行特征赋值并进行归一化处理,得到非文本特征指标数据。
[0094] 具体的,所述步骤C,包括:采用最大值归一化方法对所述待评估学生的除文本信息以外的数据信息进行归一化处理,得到非文本特征指标数据。
[0095] 示例性的,本发明实施例对所采集到的10种学生信息做不同的指标权重赋值,不同类型信息采用不同的赋值策略具体如下:
[0096] 上课考勤指标(e1)赋值策略:e1=(签到课时/应到总课时)*100;
[0097] 考试成绩指标(e2)赋值策略:e2=(单科成绩*单科学分)/总学分;
[0098] 学费缴纳指标(f3)赋值策略:f3=100-10*延期缴纳天数,最低为0;
[0099] 助学贷款偿还情况(f4)赋值策略:f4,正常还款或无贷款为100,未正常还款为0;
[0100] 一卡通消费指标(c5)赋值策略:c5=消费总额
[0101] 水电费缴纳指标(c6)赋值策略:c6=水电费消费总额
[0102] 图书借阅信息指标(c7)赋值策略:l7=100-10*未按期还书次数
[0103] 处分情况指标(w8)赋值策略,处分分为五种,总分100,警告-20,严重警告-40,记过-60,留校察看-80,开出学籍-100,处分可累计,最低为0
[0104] 学生干部信息指标(w9)赋值策略,无0,班级+25,院系+50,校级+75,校级以上+100,兼任多职只取最高职级。
[0105] 不同指标赋值方案中除了c5和c6,其余指标均处于[0,100]区间范围,对c5和c6德尔指标数据进行归一化。
[0106] 所采用最大最小值归一化计算方法如下:
[0107] 利用公式, 计算数据信息归一化后的结果,其中,
[0108] x为所计算的数据信息的值;x*为数据信息归一化后的对应的值;max为所计算的数据信息中的最大值;min为所计算的数据信息中的最小值。
[0109] 经过处理后可得数据矩阵XN×10,N为当前学生总数,同时对标签值也采用该方法做归一化处理得到处理后数据TN。在模型训练完成后,网络输出结果仍未归一化后的数据,需要再次通过该函数还原为正常值。
[0110] S104:利用预先训练的BP神经网络将学生文本特征指标数据和非文本特征指标数据作为连续性输入映射到连续性输出,得到所述待评估学生的目标信用评估结果。
[0111] 具体的,图5为本发明实施例提供的一种基于深度学习的在校大学生信用评估方法中BP网络的训练原理示意图,如图5所示,所述BP(back propagation,反向传播)神经网络的训练过程,包括:
[0112] D1:构建BP人工神经网络:所述BP神经网络包括输入层,隐含层和输出层,采用ReLU作为输出映射函数;
[0113] D2:将第一数量个如其中的40%的样本数据作为训练集,将第二数量个,如其中的60%的样本数据作为测试集,其中,样本数据包括:学生的文本特征指标数据、非文本特征指标数据以及所述学生的信用评估结果;
[0114] D3:根据输入输出序列(x,y),输入层节点数为10,隐含层节点数为12,输出层节点数为1,初始化输入层,隐含层和输出层神经元之间的链接权值,初始化隐含层阈值a,输出层阈值b,给定学习速率和神经元激励函数ReLU,最大容忍误差E;设置学习速率和神经元激励函数f=ReLU(=max(x,0)),最大容忍误差E,其中,
[0115] f为激励;ReLU()为激活函数;max(,)为最大值求值函数;x为输入的向量;y为输出的训练结果;
[0116] D4:依据输入向量,输入层和隐含层之间以权值ω以及隐含层阈值a,利用公式,计算隐含层输出,其中,
[0117] Hj为第j个隐含层节点输出的结果; 为求和函数;n为输入向量的个数;aj为第j个隐含层节点的偏置;ωij为第i个输入向量针对第j个隐含层节点的权重;xi为第i个输入向量;
[0118] D5:依据隐含层输出H,权重和设定阈值,利用公式, 计算输出O,其中,
[0119] Ok为第k个输出层节点输出的结果;∑为求和函数;ωjk为第k个输出层节点相对于第j个隐含层节点的权重;l为隐含层包含的节点数量;b为设定阈值;
[0120] D6:使用均方根误差对网络输出与真实值之间的差距进行度量;
[0121] 可以使用使用RMSE(Root Mean Squared Error,均方根误差)对网络输出与真实值之间的差距进行度量,计算方法如下:
[0122] 利用公式, 计算网络输出与真实值之间的差距,其中,
[0123] e为均方根误差;N为样本数量;∑()为求和函数;Oi为输出值;Yi为真实值。
[0124] D7:根据所述D6步骤的结果判断构建的BP人工神经网络是否收敛,若是,利用训练好的BP人工神经网络模型对待评估学生的信用数据进行处理,获取所述待评估学生的目标信用评估结果;若否,执行D8步骤;
[0125] D8:,利用公式, 更新第i个输入向量针对第j个隐含层节点的权重以及,第k个输出层节点相对于第j个隐含层节点的权重,其中,
[0126] η为学习率;e为均方根误差;
[0127] D9:利用公式, 更新节点的设定阈值,并返回执行所述D4步骤,其中,
[0128] aj为第j个隐含层节点的偏置;bk为输出层第k个节点的设定阈值。
[0129] 最后,使用预先训练好的BP网络对待评估学生的目标信用结果进行评估。
[0130] 应用本发明图1所示,实施例,使用LSTM模型对文本信息进行处理,得到待评估学生的文本特征指标数据,然后将针对除文本数据以外的其他信用数据的非文本特征指标数据输入到BP神经网络中,应用本发明实施例,涵盖的信用数据类型更多更客观,相对于现有技术可以提高针对学生的信用评估的效率和准确性。
[0131] 应用本发明实施例,引入LSTM记忆神经网络构建非结构化文本分类器,能够有效提取文本特征,提高文本情感分级的效率,避免了采用人工分级所存在的主观性强,分级不准确的问题。
[0132] 引入多种学生信息数据,并采用不同的指标赋值方法对指标进行定量描述,充分发挥了不同指标在信用评估中的互补作用,增强了信用评估结果的可靠性,降低了数据信息的稀疏性,提高了信用评估结果的准确性
[0133] 引入BP神经网络,其结构简单,实现了从多维数据输入到连续数据输出的非线性映射,在训练时,能够通过学习自动提取输入输出数据间的合理规则,并且自适应的将学习内容记忆与网络的权值中,在训练完成后可自行完成在校学生信用评估,大大节省了人资源,提高了评估效率。
[0134] 与本发明图1所示实施例相对应,本发明实施例还提供了一种基于深度学习的在校大学生信用评估装置。
[0135] 图6为本发明实施例提供的一种基于深度学习的在校大学生信用评估装置的结构示意图,如图6所示,所述装置包括:
[0136] 获取模块601,用于获取待评估学生的信用数据,所述信用数据包括:所述学生的上课考勤数据、所述学生的考试成绩数据、所述学生的学费数据、所述学生的助学贷款数据中的一种或组合;
[0137] 转换模块602,用于使用word2vec框架将所述信用数据样本中的文本信息转换为词向量,再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行评价得到针对所述文本特征指标数据;
[0138] 归一化模块603,用于将待评估学生的信用数据中除文本信息以外的其他信用数据进行特征赋值并进行归一化处理,得到非文本特征指标数据;
[0139] 获得模块604,用于利用预先训练的BP神经网络将学生文本特征指标数据和非文本特征指标数据作为连续性输入映射到连续性输出,得到所述待评估学生的目标信用评估结果。
[0140] 应用本发明图6所示实施例,使用LSTM模型对文本信息进行处理,得到待评估学生的文本特征指标数据,然后将针对除文本数据以外的其他信用数据的特征指标数据以及文本特征指标数据输入到BP神经网络中,应用本发明实施例,涵盖的信用数据类型更多更客观,相对于现有技术可以提高针对学生的信用评估的准确性。
[0141] 在本发明实施例的一种具体实施方式中,所述转换模块602,用于:
[0142] B1:针对每一个待评估学生,获取待评估学生的同学和老师针对所述待评估学生的非结构化文本的评价信息;
[0143] B2:去除所述评价信息中与情感倾向分析无关的部分;采用分词工具将所述评价信息行切分,得到分词,对分词使用word2vec框架进行转换得到词向量,将各个分词的词向量组合得到关于所述分词的矩阵;
[0144] B3:再使用预先训练好的LSTM模型针对所述待评估学生对应的词向量进行处理得到针对所述文本信息的文本特征指标数据。
[0145] 在本发明实施例的一种具体实施方式中,所述归一化模块603,用于:
[0146] 对所述待评估学生的除文本信息以外的数据信息进行赋值处理,并采用最大值归一化方法对所述待评估学生的除文本信息以外的数据信息进行归一化处理,得到非文本特征指标数据。
[0147] 在本发明实施例的一种具体实施方式中,所述BP神经网络的训练过程,包括:
[0148] D1:构建BP人工神经网络:所述BP神经网络包括输入层,隐含层和输出层,采用ReLU作为输出映射函数;
[0149] D2:将第一数量个样本数据作为训练集,将第二数量个样本数据作为测试集,其中,样本数据包括:学生的文本特征指标数据、非文本特征指标数据以及所述学生的信用评估结果;
[0150] D3:根据输入输出序列(x,y),输入层节点数,隐含层节点数,输出层节点数,初始化输入层,隐含层和输出层神经元之间的链接权值,初始化隐含层阈值,输出层阈值,给定学习速率和神经元激励函数ReLU,最大容忍误差E;设置学习速率和神经元激励函数f=ReLU(=max(x,0)),最大容忍误差E,其中,
[0151] f为激励;ReLU()为激活函数;max(,)为最大值求值函数;x为输入的向量;y为输出的训练结果;
[0152] D4:依据输入向量,输入层和隐含层之间以权值ω以及隐含层阈值a,利用公式,计算隐含层输出,其中,
[0153] Hj为第j个隐含层节点输出的结果; 为求和函数;n为输入向量的个数;aj为第j个隐含层节点的偏置;ωij为第i个输入向量针对第j个隐含层节点的权重;xi为第i个输入向量;
[0154] D5:依据隐含层输出H,权重和设定阈值,利用公式, 计算输出O,其中,
[0155] Ok为第k个输出层节点输出的结果;∑为求和函数;ωjk为第k个输出层节点相对于第j个隐含层节点的权重;l为隐含层包含的节点数量;b为设定阈值;
[0156] D6:使用均方根误差对网络输出与真实值之间的差距进行度量;
[0157] D7:根据所述D6步骤的结果判断构建的BP人工神经网络是否收敛,若是,利用训练好的BP人工神经网络模型对待评估学生的信用数据进行评估,获取所述待评估学生的目标信用评估结果;若否,执行D8步骤;
[0158] D8:,利用公式, 更新第i个输入向量针对第j个隐含层节点的权重以及,第k个输出层节点相对于第j个隐含层节点的权重,其中,
[0159] η为学习率;e为均方根误差;
[0160] D9:利用公式, 更新节点的设定阈值,并返回执行所述D4步骤,其中,
[0161] aj为第j个隐含层节点的偏置;bk为输出层第k个节点的设定阈值。
[0162] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈