首页 / 专利库 / 图形技术 / 可视化 / 知识可视化 / 思维导图 / 一种基于认知诊断的实践效果评估及学习路径推荐系统和方法

一种基于认知诊断的实践效果评估及学习路径推荐系统和方法

阅读:59发布:2020-05-12

专利汇可以提供一种基于认知诊断的实践效果评估及学习路径推荐系统和方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于认知诊断的实践效果评估及学习路径推荐方法,包括拓展特征预处理模型,深度知识追踪模型,知识网络构建模型和基于认知能 力 的路径推荐 算法 。拓展特征预处理模型根据学习者测验过程中的技能属性进行认知能力的初次评估,将个性化差异信息引入诊断模型。深度知识追踪模型根据测验序列与隐式编码的异构特征预测学习者的知识掌握能力,作为学习引导的 基础 。习题与知识网络构建模型提供了科学思维的全局导图,结合认知诊断为学习者推荐学习路径不但考虑到学习过程中的认知能力差异,而且遵循知识结构的逻辑。,下面是一种基于认知诊断的实践效果评估及学习路径推荐系统和方法专利的具体信息内容。

1.一种基于认知诊断的实践效果评估及学习路径推荐系统,其特征在于,包括拓展特征预处理模型、深度学习追踪模型、知识网络构建模型和路径推荐模型;
所述的拓展特征预处理模型采用树模型根据学习者的历史交互记录预测学习者在异构特征条件下的习题回答情况,得到学习者的认知能的初步预测,并将预测结果与原始的习题答案序列联合作为深度学习追踪模型的输入;
所述的深度学习追踪模型根据拓展特征预处理模型输出的信息输入至循环神经网络学习学习者的知识状态,经过神经网络的sigmoid激活函数将隐藏单元ht传递至全连接层获得输出yt,其表现出学习者对知识概念的认知能力,得到学习者的认知能力诊断;
所述的知识网络构建模型根据学习者的历史交互记录构建知识网络,其中,自动发掘习题所对应知识概念是通过利用深度知识追踪模型探索习题间作答正确概率关系以及习题的题面经向量化后聚类两方面互相参照而形成;知识概念自身关联关系则根据总体习题得分率并适当参照学习者测验顺序和教材结构进行构建;
所述的路径推荐模型根据上述模型所得的学习者的认知能力的初步预测、学习者的认知能力诊断和知识网络确定学习路径的最终元素,生成个性化学习路径。
2.一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,包括以下步骤:
S1.拓展特征预处理模型根据学习者的历史交互记录预测学习者在异构特征条件下的习题回答情况,得到学习者的认知能力的初步预测,并将预测结果与原始的习题答案序列作为深度学习追踪模型的输入;
S2.深度学习追踪模型根据拓展特征预处理模型输出的信息输入至神经循环网络学习学习者的知识状态,经过sigmoid激活函数将隐藏单元ht传递至全连接层获得输出yt,其表现出学习者对知识概念的认知能力,得到学习者的认知能力诊断;
S3.知识网络构建模型根据学习者的历史交互记录构建知识网络,其中,自动发掘习题所对应知识概念是通过利用深度知识追踪模型探索习题间作答正确概率关系以及习题的题面经向量化后聚类两方面互相参照而形成;知识概念自身关联关系则根据总体习题得分率并适当参照学习者测验顺序和教材结构进行构建;
S4.路径推荐模型根据上述模型所得的学习者的认知能力的初步预测、学习者的认知能力诊断和知识网络确定学习路径的最终元素,生成个性化学习路径。
3.根据权利要求2所述的一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,所述的S1包括以下步骤:
S11.给定一个学习者在第t时间步测验习题,令at表示拓展的异构特征,将at作为预处理步骤中分类模型的输入,并预测学习者是否会在引入拓展特征的条件下正确作答,利用a′t表示分类模型预测的答题情况;
S12.拓展特征预处理模型的树节点处的集合D包含了拓展的异构特征at∈R以及其对应的答案标签ct∈{0,1},则将H定义为由交叉熵函数所评估的特征空间的不纯度,则对于具有N个观察值的区域R,其交叉熵由如下公式定义:
H(X)=-∑kpklog(pk),             (1-1)
其中
其中k为标签集合,在二分类问题中用{0,1}或{-1,+1}表示,pk代表当异构特征at对应的答案标签ct=k时,其在观察值中所占的比例。
S13.利用交叉熵得到节点中作为划分特征空间条件的分裂变量及阈值,两者定义如下:
其中y是通过最小化信息增益而确定的特征空间分裂阈值,而x是分裂变量,G表示基尼指数或信息增益的计算,而|·|定义集合中的元素数量;Dl和Dr为集合D的子集;
S14.依据分裂变量x和分裂阈值y将集合D划分为两个子集Dl和Dr:
Dl={(at,ct)|at,x<y},                (1-4)
Dr=D-Dl                  (1-5)
通过最小化交叉熵学习到一组分类规则,在时间步t,扩充的异构特征at将被送入模型的根节点并遵循由上述分类规则分配的路径直到获得预测作答a′t。
4.根据权利要求3所述的一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,在S2的具体步骤如下:
S21.生成特定的学习任务交互x0......xt,则交互预测学习者下一次交互的结果xt+1,习题集合的数量为M,则将xt设置为交互元组O(et,ct)∈{0,1}2M的独热编码表示,令et和ct分别表示习题的标签和学习者真实的作答表现,即ct=1意味着学习者正确回答该习题,否则ct=0;
S22.当第i习题被正确回答时将O(et,ct)的第i位设置为1,其余设置为0;而当回答错误时第i+M位将设置为1;
S23.将交互元组O(et,ct)与拓展向量O(a′t,ct)连接作为深度知识追踪模型DKT的输入xt;
S24.神经网络将输入序列xt通过计算隐藏状态序列ht传递到全连接层获得输出序列yt,即为学习者的认知诊断。
5.根据权利要求4所述的一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,所述的S24的具体步骤如下:
S241.通过单元和来模型具有长期依赖性的神经网络,单元状态由门控制以决定是否存储或移除信息,其隐藏状态和输出由以下方程组定义:
it=σ(Wxixt+Whiht-1+Wcict-1+bi)              (2-3)
ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)            (2-4)
ct=ftct-1+ittanh(Wxcxt+Whcht+bc)            (2-5)
ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo)             (2-6)
ht=ottanh(ct)                                (2-7)
其中σ代表sigmoid函数,而it、ft、ct、ot和ht分别表示LSTM网络中的输入门、遗忘门、单元激活向量、输出门以及隐藏状态,W和b分别表示网络中门及状态的各项参数和偏移。
S242.训练深度知识追踪模型时,假设给定一组N个训练序列 则通
过最小化以下目标函数来进行参数估计:
其中θ表示上述等式中所定义的W和b变量,R(·)表示xt经拓展的深度知识追踪模型输出的预测作答正确概率,l(x,y)则表示x与y之间预定义的差异度量;
S243.将平均损失以交叉熵形式计算则定义如下:
其中N代表训练集包含学习者数目,T表示第n个学习者从习题t0开始进行测验的习题数目,同时 定义为学习者在t+1时间步测验的习题的预测正确率,表示为模型预测的输出与习题序列独热编码的内积形式,即 表示t+1时间步中学习者
真实的作答情况;
S244.根据 判断学习者对知识概念的认知能力,分为三个认知等
级。
6.根据权利要求5所述的一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,所述的S3包括以下步骤:
S31.测验集合中每一对习题组合成的习题对中,每个习题定向的顺序表示为习题i和习题j,为每个习题对分配一个影响能力Wij,其定义如下:
其中p(j|i)表示一个时间步t中,当习题i被正确回答时,深度知识追踪模型对习题j的正确率预测,则∑kp(j|k)针对所有习题k作答正确时累加习题j的预测概率,两者占比突显出习题对内部的定向影响能力;
S32.应用Word2vec针对习题的文本题面进行词嵌入操作,得到习题题面向量;
S33.使用K-Means聚类算法将习题自动划分为习题簇;
S34.在K-Means聚类算法中使用二维向量表示的样本距离的计算公式如下:
dij=|xi-xj|+|yi-yj|             (3-6)
其中i与j表示距离计算的两个样本,x与y则表示二维距离向量对应的数值,K-Means聚类算法从样本集中随机选择k个样本作为质心,随后针对样本集中每个样本计算其与质心的距离,将该样本分配到最近的质心所属的集合,所有样本划分后则迭代重新计算集合的质心并根据距离重新分配集合,当质心更新的范围小于阈值则终止算法;
S35.簇将划分为(C1,C2,...Ck),则聚类目标是最小化以下平方误差E:
其中μi表示簇Ci的均值向量,也称为质心,其表达式为:
S36.确定习题簇类关系后,通过计算每个知识概念簇内习题的总体得分率,与其余簇进行比较得到知识点对应习题难度序列,并结合学习者的答题顺序构建知识概念间的关联关系,则某个知识簇内习题总体得分率表达如下:
并且
其中Ck为知识簇中涉及习题种类数量,c0为该簇中第一个习题索引,N表示习题i在学习者测验习题集合中的交互数量,ex,i则代表该习题i在第x次交互中的结果;利用All(·)表示交互序列中若习题被完成则记录为1,否则为0;而Corr(·)表示已完成交互中习题是否正确作答;
S37.统计出某知识簇总体的习题得分率,结合教材知识体系能够构建出知识概念的网络结构。
7.根据权利要求6所述的一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,所述的S4的步骤如下:
S41.G可以表示为G=(V,R),其中V表示知识概念集合,R表示关联关系集合;将G分割成子图{G1,G2,...,Gn},对于每个子图Gi=(Vi,Ri)定义如下:
G=G1∪G2∪...∪Gn
对于1≤i,j≤n且i≠j,有 目 并且子图Gi中至少有一个知识
概念自身出度为0,即其不存在后继知识概念;
S42.生成学习路径序列Lcandidate,搜索子图Gi中没有前驱知识概念的节点k并添加到学习路径序列Lcandidate;
S43.将所有节点k为前驱节点的邻居节点入度减一,并迭代寻找不存在前驱节点的知识概念追加入学习路径序列Lcandidate,直到子图Gic中所有知识概念均被访问
S44.生成的学习路径序列Lcandidate={L1,L2,...,Lm},其中m为Gic(序列中)知识概念数量,且序列末尾知识概念为目标知识c;
S45.针对步骤S44所得的学习路径序列Lcandidate,为其赋予经由拓展深度知识追踪模型预测的认知能力并将知识认知情况划分层级,而学习路径的引导也应结合学习者当前掌握的知识状态,并根据学习者历史的实际交互情况进行调整;
S46.遍历Lcandidate中知识概念涉及的认知情况,并根据认知层级更新序列最终得到推荐的学习路径 遍历Lcandidate中知识概念涉及的认知情况,认知状
态若判定为较低等级则表示学习者未接触过或未掌握该知识概念,此时保留其作为待学习知识并推荐对应学习资源;若层级为中等则代表对该知识应处于承前启后状态,则在路径中保留知识并同时推荐难度等于和大于该层级的资料;若学习者以较高概率掌握知识则可以为其跳过该知识概念。
8.根据利要求7所述的一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,所述的Wordvec模型包括CBOW连续词袋模型和skip-gram模型。
9.根据利要求8所述的一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,所述的CBOW连续词袋模型对目标词的条件概率定义如下:
CBOW模型具体最大化目标函数如下:
∑(w,c)∈DlogP(w,c)                 (3-3)。
10.根据利要求8所述的一种基于认知诊断的实践效果评估及学习路径推荐方法,其特征在于,所述的skip-gram模型从目标词wt的上下文中选择一个词并将其词向量组成上下文的表示,即利用中间词预测周围词,该模型遵循的目标函数表达如下:

说明书全文

一种基于认知诊断的实践效果评估及学习路径推荐系统和

方法

技术领域

[0001] 本发明涉及认知诊断、智慧教育和个性化学习领域,更具体地,涉及一种基于认知诊断的实践效果评估及学习路径推荐方法。

背景技术

[0002] 互联网教育的模式拓宽改进了传统教育的形式与内容,降低了受教育的槛,但同时其在教学的后续更进、评估和监督方面却体现出弊端。传统教育通过教师的教授、监督与评估流程确保更进学习者较为完整的知识获取过程,然而笼统的依靠测验分数难以捕捉学习者对各项知识的精确认知情况,教师也无法针对具体每位学生的基础差异提供完全个性化的指导;而在线教育也因缺乏对学科学习的后续监督引导工作,使得学习完成度大幅降低。因此,在互联网教育中结合丰富的教学资源与个性化的认知评估、教学引导过程才能真正体现智慧教育的意义。如何根据学习者与教学资源的历史交互情况诊断出具备个人特征的认知平,并结合原有知识体系为学习者提供合适的学习路径指导将是在现有教育平台上值得受到重视的问题。
[0003] 认知诊断结合学习路径推荐构成了较为完整的教学监督与引导工作,认知诊断根据学习者的测验表现评估其对知识的掌握能,以此为基础进行符合科学思维方式的学习路径推荐。针对认知诊断领域,传统的认知诊断可以依据属性数目、潜变量相互作用关系和属性掌握表征方式等划分为多种模型,其中DINA(Deterministic Input,Noisy“And”Gate model,确定性输入噪声与门模型)在教育测试语境中应用广泛。IRT(Item Response Theory,项目反应理论)模型也通过分析测验数据确定潜在心理特征。然而目前更倾向于利用知识追踪进行认知的评估,主要的方法可以概括为:BKT(Bayesian Knowledge Tracing,贝叶斯知识追踪)定义了多项测验参数,利用隐尔科夫模型追踪知识点掌握情况的变化;基于神经网络的知识追踪则利用深度学习预测潜在的知识状态。认知诊断能捕捉到学习者当前的个体基础差异,结合原有知识体系的构建能够推荐科学和个性化的学习路径,继而提供相应的学习资源以巩固教学。
[0004] 综上所述,针对教学对象的认知能力评估与后续教学引导在互联网教育中占据重要位置,利用知识追踪考察个体基础能力差异,通过知识网络构建科学思维方式,结合二者进行学习路径推荐能够体现出灵活且智能的教育模式。

发明内容

[0005] 为了解决现有技术中在线教育平台缺乏对学习者课程完成过程的监督,也鲜有对学习者的认知能力进行评估进入给予个性化的学习引导的不足,本发明提供了一种基于认知诊断的实践效果评估及学习路径推荐方法。
[0006] 为解决上述技术问题,本发明的技术方案如下:
[0007] 本发明第一方面公开一种基于认知诊断的实践效果评估及学习路径推荐系统,包括拓展特征预处理模型、深度学习追踪模型、知识网络构建模型和路径推荐模型;
[0008] 所述的拓展特征预处理模型采用树模型根据学习者的历史交互记录预测学习者在异构特征条件下的习题回答情况,得到学习者的认知能力的初步预测,并将预测结果与原始的习题答案序列作为深度学习追踪模型的输入;
[0009] 所述的深度学习追踪模型根据拓展特征预处理模型输出的信息输入至神经循环网络学习学习者的知识状态,经过神经网络的sigmoid激活函数将隐藏单元ht传递至全连接层获得输出yt,其表现出学习者对知识概念的认知能力,得到学习者的认知能力诊断;
[0010] 所述的知识网络构建模型根据学习者的历史交互记录构建知识网络,其中,自动发掘习题所对应知识概念是通过利用深度知识追踪模型探索习题间作答正确概率关系以及习题的题面经向量化后聚类两方面互相参照而形成;知识概念自身关联关系则根据总体习题得分率并适当参照学习者测验顺序和教材结构进行构建;
[0011] 所述的路径推荐模型根据上述模型所得的学习者的认知能力的初步预测、学习者的认知能力诊断和知识网络确定学习路径的最终元素,生成个性化学习路径。
[0012] 本发明第二方面提供一种基于认知诊断的实践效果评估及学习路径推荐方法,包括以下步骤:
[0013] S1.拓展特征预处理模型根据学习者的历史交互记录预测学习者在异构特征条件下的习题回答情况,得到学习者的认知能力的初步预测,并将预测结果与原始的习题答案序列作为深度学习追踪模型的输入;
[0014] S2.深度学习追踪模型根据拓展特征预处理模型输出的信息输入至神经循环网络学习学习者的知识状态,经过sigmoid激活函数将隐藏单元ht传递至全连接层获得输出yt,其表现出学习者对知识概念的认知能力,得到学习者的认知能力诊断;
[0015] S3.知识网络构建模型根据学习者的历史交互记录构建知识网络,其中,自动发掘习题所对应知识概念是通过利用深度知识追踪模型探索习题间作答正确概率关系以及习题的题面经向量化后聚类两方面互相参照而形成;知识概念自身关联关系则根据总体习题得分率并适当参照学习者测验顺序和教材结构进行构建;
[0016] S4.路径推荐模型根据上述模型所得的学习者的认知能力的初步预测、学习者的认知能力诊断和知识网络确定学习路径的最终元素,生成个性化学习路径。
[0017] 在一种优选方案中,所述的S1包括以下步骤:
[0018] S11.给定一个学习者在第t时间步测验习题,令at表示拓展的异构特征,将at作为预处理步骤中分类模型的输入,并预测学习者是否会在引入拓展特征的条件下正确作答,利用a′t表示分类模型预测的答题情况;
[0019] S12.拓展特征预处理模型的树节点处的集合D包含了拓展的异构特征at∈R以及其对应的答案标签ct∈{0,1},则将H定义为由交叉熵函数所评估的特征空间的不纯度,则对于具有N个观察值的区域R,其交叉熵由如下公式定义:
[0020] H(X)=-∑kpklog(pk),  (1-1)
[0021] 其中
[0022] 其中k为标签集合,在二分类问题中用{0,1}或{-1,+1}表示,pk代表当异构特征at对应的答案标签ct=k时,其在观察值中所占的比例。
[0023] S13.利用交叉熵得到节点中作为划分特征空间条件的分裂变量及阈值,两者定义如下:
[0024]
[0025] 其中y是通过最小化信息增益而确定的特征空间分裂阈值,而x是分裂变量,G表示基尼指数或信息增益的计算,而|·|定义集合中的元素数量;Dl和Dr为集合D的子集;
[0026] S14.依据分裂变量x和分裂阈值y将集合D划分为两个子集Dl和Dr:
[0027] Dl={(at,ct)|at,x<y},  (1-4)
[0028] Dr=D-Dl  (1-5)
[0029] 通过最小化交叉熵学习到一组分类规则,在时间步t,扩充的异构特征at将被送入模型的根节点并遵循由上述分类规则分配的路径直到获得预测作答a′t。
[0030] 在一种优选方案中,在S2的具体步骤如下:
[0031] S21.生成特定的学习任务交互x0......xt,则交互预测学习者下一次交互的结果xt+1,习题集合的数量为M,则将xt设置为交互元组0(et,ct)∈{0,1}2M的独热编码表示,令et和ct分别表示习题的标签和学习者真实的作答表现,即ct=1意味着学习者正确回答该习题,否则ct=0;
[0032] S22.当第i习题被正确回答时将O(et,ct)的第i位设置为1,其余设置为0;而当回答错误时第i+M位将设置为1;
[0033] S23.将交互元组O(et,ct)与拓展向量O(a′t,ct)连接作为深度知识追踪模型DKT的输入xt;
[0034] S24.神经网络将输入序列xt通过计算隐藏状态序列ht传递到全连接层获得输出序列yt,即为学习者的认知诊断。
[0035] 在一种优选方案中,所述的S24的具体步骤如下:
[0036] S241.通过单元状态(cell state)和门来模型具有长期依赖性的神经网络,单元状态由门控制以决定是否存储或移除信息,其隐藏状态和输出由以下方程组定义:
[0037] it=σ(Wxixt+Whiht-1+Wcict-1+bi)  (2-3)
[0038] ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)  (2-4)
[0039] ct=ftct-1+ittanh(Wxcxt+Whcht+bc)  (2-5)
[0040] ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo)  (2-6)
[0041] ht=ottanh(ct)  (2-7)
[0042] 其中σ代表sigmoid函数,而it、ft、ct、ot和ht分别表示LSTM网络中的输入门、遗忘门、单元激活向量、输出门以及隐藏状态,W和b分别表示网络中门及状态的各项参数和偏移。
[0043] S242.训练深度知识追踪模型时,假设给定一组N个训练序列则通过最小化以下目标函数来进行参数估计:
[0044]
[0045] 其中θ表示上述等式中所定义的W和b变量,R(·)表示xt经拓展的深度知识追踪模型输出的预测作答正确概率,l(x,y)则表示x与y之间预定义的差异度量;
[0046] S243.将平均损失以交叉熵形式计算则定义如下:
[0047]
[0048] 其中N代表训练集包含学习者数目,T表示第n个学习者从习题t0开始进行测验的习题数目,同时 定义为学习者在t+1时间步测验的习题的预测正确率,表示为模型预测的输出与习题序列独热编码的内积形式,即 表示t+1时间步中学习者真实的作答情况;
[0049] S244.根据 判断学习者对知识概念的认知能力,分为三个认知等级。
[0050] 在一种优选方案中,所述的S3包括以下步骤:
[0051] S31.测验集合中每一对习题组合成的习题对中,每个习题定向的顺序表示为习题i和习题j,为每个习题对分配一个影响能力Wij,其定义如下:
[0052]
[0053] 其中p(i|i)表示一个时间步t中,当习题i被正确回答时,深度知识追踪模型对习题j的正确率预测,则∑kp(j|k)针对所有习题k作答正确时累加习题j的预测概率,两者占比突显出习题对内部的定向影响能力;
[0054] S32.应用Word2vec针对习题的文本题面进行词嵌入操作,得到习题题面向量;
[0055] S33.使用K-Means聚类算法将习题自动划分为习题簇;
[0056] S34.在K-Means聚类算法中使用二维向量表示的样本距离的计算公式如下:
[0057]
[0058] dij=|xi-xj|+|yi-yj|  (3-6)
[0059]
[0060] 其中i与j表示距离计算的两个样本,x与y则表示二维距离向量对应的数值,K-Means聚类算法从样本集中随机选择k个样本作为质心,随后针对样本集中每个样本计算其与质心的距离,将该样本分配到最近的质心所属的集合,所有样本划分后则迭代重新计算集合的质心并根据距离重新分配集合,当质心更新的范围小于阈值则终止算法;
[0061] S35.簇将划分为(C1,C2,...Ck),则聚类目标是最小化以下平方误差E:
[0062]
[0063] 其中μi表示簇Ci的均值向量,也称为质心,其表达式为:
[0064]
[0065] S36.确定习题簇类关系后,通过计算每个知识概念簇内习题的总体得分率,与其余簇进行比较得到知识点对应习题难度序列,并结合学习者的答题顺序构建知识概念间的关联关系,则某个知识簇内习题总体得分率表达如下:
[0066]
[0067]
[0068] 并且
[0069] 其中Ck为知识簇中涉及习题种类数量,cn为该簇中第一个习题索引,N表示习题i在学习者测验习题集合中的交互数量,ex,i则代表该习题i在第x次交互中的结果;利用All(·)表示交互序列中若习题被完成则记录为1,否则为0;而Corr(·)表示己完成交互中习题是否正确作答;
[0070] S37.统计出某知识簇总体的习题得分率,结合教材知识体系能够构建出知识概念的网络结构。
[0071] 在一种优选方案中,所述的S4的步骤如下:
[0072] S41.G可以表示为G=(V,R),其中V表示知识概念集合,R表示关联关系集合;将G分割成子图{G1,G2,...,Gn},对于每个子图Gi=(Vi,Ri)定义如下:
[0073] G=G1UG2U...UGn
[0074] 对于1≤i,j≤n且i≠j,有 目且 并且子图Gi中至少有一个知识概念自身出度为0,即其不存在后继知识概念;
[0075] S42.生成学习路径序列Lcandidate,搜索子图Gi中没有前驱知识概念的节点k并添加到学习路径序列Lcandidate;
[0076] S43.将所有节点k为前驱节点的邻居节点入度减一,并迭代寻找不存在前驱节点的知识概念追加入学习路径序列Lcandidate,直到子图Gic中所有知识概念均被访问
[0077] S44.生成的学习路径序列Lcandidate={L1,L2,...,Lm},其中m为Gic(序列中)知识概念数量,且序列末尾知识概念为目标知识c;
[0078] S45.针对步骤S44所得的学习路径序列Lcandidate,为其赋予经由拓展深度知识追踪模型预测的认知能力并将知识认知情况划分层级,而学习路径的引导也应结合学习者当前掌握的知识状态,并根据学习者历史的实际交互情况进行调整;
[0079] S46.遍历Lcandidate中知识概念涉及的认知情况,并根据认知层级更新序列最终得到推荐的学习路径
[0080] 在一种优选方案中,所述的S46包括以下步骤:
[0081] 遍历Lcandidate中知识概念涉及的认知情况,认知状态若判定为较低等级则表示学习者未接触过或未掌握该知识概念,此时保留其作为待学习知识并推荐对应学习资源;若层级为中等则代表对该知识应处于承前启后状态,则在路径中保留知识并同时推荐难度等于和大于该层级的资料;若学习者以较高概率掌握知识则可以为其跳过该知识概念。
[0082] 在一种优选方案中,所述的Wordvec模型包括CBOW连续词袋模型和skip-gram模型。
[0083] 在一种优选方案中,所述的CBOW连续词袋模型对目标词的条件概率定义如下:
[0084]
[0085] CBOW模型具体最大化目标函数如下:
[0086] ∑(w,c)∈DlogP(w,c)  (3-3)。
[0087] 在一种优选方案中,所述的skip-gram模型从目标词wt的上下文中选择一个词并将其词向量组成上下文的表示,即利用中间词预测周围词,该模型遵循的目标函数表达如下:
[0088]
[0089] 与现有技术相比,本发明技术方案的有益效果是:
[0090] 本发明通过构建深度知识追踪模型、知识网络构建模型以及学习路径推荐模型,根据学习者历史学习情况评估其认知能力,并结合知识网络提供科学且个性化的学习路线引导的思维体系。附图说明
[0091] 图1为本发明的步骤流程图
[0092] 图2为实施例中路径推荐算法的学习路径生成图示。

具体实施方式

[0093] 附图仅用于示例性说明,不能理解为对本专利的限制;
[0094] 为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
[0095] 对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
[0096] 下面结合附图和实施例对本发明的技术方案做进一步的说明。
[0097] 实施例1
[0098] 本发明第一方面公开一种基于认知诊断的实践效果评估及学习路径推荐系统,如图1所示,包括拓展特征预处理模型、深度学习追踪模型、知识网络构建模型和路径推荐模型;
[0099] 所述的拓展特征预处理模型采用树模型根据学习者的历史交互记录预测学习者在异构特征条件下的习题回答情况,得到学习者的认知能力的初步预测,并将预测结果与原始的习题答案序列作为深度学习追踪模型的输入;
[0100] 所述的深度学习追踪模型根据拓展特征预处理模型输出的信息输入至神经循环网络学习学习者的知识状态,经过神经网络的sigmoid激活函数将隐藏单元ht传递至全连接层获得输出yt,其表现出学习者对知识概念的认知能力,得到学习者的认知能力诊断;
[0101] 所述的知识网络构建模型根据学习者的历史交互记录构建知识网络,其中,自动发掘习题所对应知识概念是通过利用深度知识追踪模型探索习题间作答正确概率关系以及习题的题面经向量化后聚类两方面互相参照而形成;知识概念自身关联关系则根据总体习题得分率并适当参照学习者测验顺序和教材结构进行构建;
[0102] 所述的路径推荐模型根据上述模型所得的学习者的认知能力的初步预测、学习者的认知能力诊断和知识网络确定学习路径的最终元素,生成个性化学习路径。
[0103] 实施例2
[0104] 本发明第二方面提供一种基于认知诊断的实践效果评估及学习路径推荐方法,包括以下步骤:
[0105] S1.拓展特征预处理模型根据学习者的历史交互记录预测学习者在异构特征条件下的习题回答情况,得到学习者的认知能力的初步预测,并将预测结果与原始的习题答案序列作为深度学习追踪模型的输入;
[0106] S2.深度学习追踪模型根据拓展特征预处理模型输出的信息输入至神经循环网络学习学习者的知识状态,经过sigmoid激活函数将隐藏单元ht传递至全连接层获得输出yt,其表现出学习者对知识概念的认知能力,得到学习者的认知能力诊断;
[0107] S3.知识网络构建模型根据学习者的历史交互记录构建知识网络,其中,自动发掘习题所对应知识概念是通过利用深度知识追踪模型探索习题间作答正确概率关系以及习题的题面经向量化后聚类两方面互相参照而形成;知识概念自身关联关系则根据总体习题得分率并适当参照学习者测验顺序和教材结构进行构建;
[0108] S4.路径推荐模型根据上述模型所得的学习者的认知能力的初步预测、学习者的认知能力诊断和知识网络确定学习路径的最终元素,生成个性化学习路径,如图2所示。
[0109] 在一种优选方案中,所述的S1包括以下步骤:
[0110] S11.给定一个学习者在第t时间步测验习题,令at表示拓展的异构特征,将at作为预处理步骤中分类模型的输入,并预测学习者是否会在引入拓展特征的条件下正确作答,利用a′t表示分类模型预测的答题情况;
[0111] S12.拓展特征预处理模型的树节点处的集合D包含了拓展的异构特征at∈R以及其对应的答案标签ct∈{0,1},则将H定义为由交叉熵函数所评估的特征空间的不纯度,则对于具有N个观察值的区域R,其交叉熵由如下公式定义:
[0112] H(X)=-∑kpklog(pk),  (1-1)
[0113] 其中
[0114] 其中k为标签集合,在二分类问题中用{0,1}或{-1,+1}表示,pk代表当异构特征at对应的答案标签ct=k时,其在观察值中所占的比例。
[0115] S13.利用交叉熵得到节点中作为划分特征空间条件的分裂变量及阈值,两者定义如下:
[0116]
[0117] 其中y是通过最小化信息增益而确定的特征空间分裂阈值,而x是分裂变量,G表示基尼指数或信息增益的计算,而|·|定义集合中的元素数量;Dl和Dr为集合D的子集;
[0118] S14.依据分裂变量x和分裂阈值y将集合D划分为两个子集Dl和Dr:
[0119] Dl={(at,ct)|at,x<y},  (1-4)
[0120] Dr=D-Dl  (1-5)
[0121] 通过最小化交叉熵学习到一组分类规则,在时间步t,扩充的异构特征at将被送入模型的根节点并遵循由上述分类规则分配的路径直到获得预测作答a′t。
[0122] 在一种优选方案中,在S2的具体步骤如下:
[0123] S21.生成特定的学习任务交互x0......xt,则交互预测学习者下一次交互的结果xt+1,习题集合的数量为M,则将xt设置为交互元组O(et,ct)∈{0,1}2M的独热编码表示,令et和ct分别表示习题的标签和学习者真实的作答表现,即ct=1意味着学习者正确回答该习题,否则ct=0;
[0124] S22.当第i习题被正确回答时将O(et,ct)的第i位设置为1,其余设置为0;而当回答错误时第i+M位将设置为1;
[0125] S23.将交互元组O(et,ct)与拓展向量O(a′t,ct)连接作为深度知识追踪模型DKT的输入xt;
[0126] S24.神经网络将输入序列xt通过计算隐藏状态序列ht传递到全连接层获得输出序列yt,即为学习者的认知诊断。
[0127] 在一种优选方案中,所述的S24的具体步骤如下:
[0128] S241.通过单元和门来模型具有长期依赖性的神经网络,单元状态由门控制以决定是否存储或移除信息,其隐藏状态和输出由以下方程组定义:
[0129] it=σ(Wxixt+Whiht-1+Wcict-1+bi)  (2-3)
[0130] ft=σ(Wxfxt+Whfht-1+Wcfct-1+bf)  (2-4)
[0131] ct=ftct-1+ittanh(Wxcxt+Whcht+bc)  (2-5)
[0132] ot=σ(Wxoxt+Whoht-1+Wcoct-1+bo)  (2-6)
[0133] ht=ottanh(ct)  (2-7)
[0134] 其中σ代表sigmoid函数,而it、ft、ct、ot和ht分别表示LSTM网络中的输入门、遗忘门、单元激活向量、输出门以及隐藏状态,W和b分别表示网络中门及状态的各项参数和偏移。
[0135] S242.训练深度知识追踪模型时,假设给定一组N个训练序列则通过最小化以下目标函数来进行参数估计:
[0136]
[0137] 其中θ表示上述等式中所定义的W和b变量,R(·)表示xt经拓展的深度知识追踪模型输出的预测作答正确概率,l(x,y)则表示x与y之间预定义的差异度量;
[0138] S243.将平均损失以交叉熵形式计算则定义如下:
[0139]
[0140] 其中N代表训练集包含学习者数目,T表示第n个学习者从习题t0开始进行测验的习题数目,同时 定义为学习者在t+1时间步测验的习题的预测正确率,表示为模型预测的输出与习题序列独热编码的内积形式,即 表示t+1时间步中学习者真实的作答情况;
[0141] S244.根据 判断学习者对知识概念的认知能力,分为三个认知等级。
[0142] 在一种优选方案中,所述的S3包括以下步骤:
[0143] S31.测验集合中每一对习题组合成的习题对中,每个习题定向的顺序表示为习题i和习题j,为每个习题对分配一个影响能力Wij,其定义如下:
[0144]
[0145] 其中p(j|i)表示一个时间步t中,当习题i被正确回答时,深度知识追踪模型对习题j的正确率预测,则∑kp(j|k)针对所有习题k作答正确时累加习题j的预测概率,两者占比突显出习题对内部的定向影响能力;
[0146] S32.应用Word2vec针对习题的文本题面进行词嵌入操作,得到习题题面向量;
[0147] S33.使用K-Means聚类算法将习题自动划分为习题簇;
[0148] S34.在K-Means聚类算法中使用二维向量表示的样本距离的计算公式如下:
[0149]
[0150] dij=|xi-xj|+|yi-yj|  (3-6)
[0151]
[0152] 其中i与j表示距离计算的两个样本,x与y则表示二维距离向量对应的数值,K-Means聚类算法从样本集中随机选择k个样本作为质心,随后针对样本集中每个样本计算其与质心的距离,将该样本分配到最近的质心所属的集合,所有样本划分后则迭代重新计算集合的质心并根据距离重新分配集合,当质心更新的范围小于阈值则终止算法;
[0153] S35.簇将划分为(C1,C2,...Ck),则聚类目标是最小化以下平方误差E:
[0154]
[0155] 其中μi表示簇Ci的均值向量,也称为质心,其表达式为:
[0156]
[0157] S36.确定习题簇类关系后,通过计算每个知识概念簇内习题的总体得分率,与其余簇进行比较得到知识点对应习题难度序列,并结合学习者的答题顺序构建知识概念间的关联关系,则某个知识簇内习题总体得分率表达如下:
[0158]
[0159]
[0160] 并且
[0161] 其中Ck为知识簇中涉及习题种类数量,cn为该簇中第一个习题索引,N表示习题i在学习者测验习题集合中的交互数量,ex,i则代表该习题i在第x次交互中的结果;利用All(·)表示交互序列中若习题被完成则记录为1,否则为0;而Corr(·)表示已完成交互中习题是否正确作答;
[0162] S37.统计出某知识簇总体的习题得分率,结合教材知识体系能够构建出知识概念的网络结构。
[0163] 在一种优选方案中,所述的S4的步骤如下:
[0164] S41.G可以表示为G=(V,R),其中V表示知识概念集合,R表示关联关系集合;将G分割成子图{G1,G2,...,Gn},对于每个子图Gi=(Vi,Ri)定义如下:
[0165] G=G1UG2U...UGn
[0166] 对于1≤i,j≤n且i≠j,有 且 并且子图Gi中至少有一个知识概念自身出度为0,即其不存在后继知识概念;
[0167] S42.生成学习路径序列Lcandidate,搜索子图Gi中没有前驱知识概念的节点k并添加到学习路径序列Lcandidate;
[0168] S43.将所有节点k为前驱节点的邻居节点入度减一,并迭代寻找不存在前驱节点的知识概念追加入学习路径序列Lcandidate,直到子图Gic中所有知识概念均被访问;
[0169] S44.生成的学习路径序列Lcandidate={L1,L2,...,Lm},其中m为Gic(序列中)知识概念数量,且序列末尾知识概念为目标知识c;
[0170] S45.针对步骤S44所得的学习路径序列Lcandidate,为其赋予经由拓展深度知识追踪模型预测的认知能力并将知识认知情况划分层级,而学习路径的引导也应结合学习者当前掌握的知识状态,并根据学习者历史的实际交互情况进行调整;
[0171] S46.遍历Lcandidate中知识概念涉及的认知情况,并根据认知层级更新序列最终得到推荐的学习路径
[0172] 在一种优选方案中,所述的S46包括以下步骤:
[0173] 遍历Lcandidate中知识概念涉及的认知情况,认知状态若判定为较低等级则表示学习者未接触过或未掌握该知识概念,此时保留其作为待学习知识并推荐对应学习资源;若层级为中等则代表对该知识应处于承前启后状态,则在路径中保留知识并同时推荐难度等于和大于该层级的资料;若学习者以较高概率掌握知识则可以为其跳过该知识概念。
[0174] 在一种优选方案中,所述的Wordvec模型包括CBOW连续词袋模型和skip-gram模型。
[0175] 在一种优选方案中,所述的CBOW连续词袋模型对目标词的条件概率定义如下:
[0176]
[0177] CBOW模型具体最大化目标函数如下:
[0178] ∑(w,c)∈DlogP(w,c)  (3-3)。
[0179] 在一种优选方案中,所述的skip-gram模型从目标词wt的上下文中选择一个词并将其词向量组成上下文的表示,即利用中间词预测周围词,该模型遵循的目标函数表达如下:
[0180]
[0181] 附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;
[0182] 显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈