首页 / 专利库 / 数学与统计 / 解析法 / 文本分析 / 一种电子答卷中作文部分的防抄袭识别方法

一种电子答卷中作文部分的防抄袭识别方法

阅读:1发布:2020-10-27

专利汇可以提供一种电子答卷中作文部分的防抄袭识别方法专利检索,专利查询,专利分析的服务。并且一种 电子 答卷中作文部分的防抄袭识别方法,包括:获取某一学生递交的第一电子答卷;检测所述第一电子答卷中的作文部分是否包括的第一作答文本;若包括所述第一作答文本,根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷;其中,所述第一电子答卷对应的考试科目与所述第二电子答卷的考试科目相同;将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比;若对比表明所述第一作答文本与所述第二作答文本近似,分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记。实施本 发明 实施例 ,能够减少阅卷评分花费的时间,提升阅卷评分的效率。,下面是一种电子答卷中作文部分的防抄袭识别方法专利的具体信息内容。

1.一种电子答卷中作文部分的防抄袭识别方法,其特征在于,所述方法包括:
获取某一学生递交的第一电子答卷;
检测所述第一电子答卷中的作文部分是否包括的第一作答文本;
若包括所述第一作答文本,根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷;其中,所述第一电子答卷对应的考试科目与所述第二电子答卷的考试科目相同;
将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比;
若对比表明所述第一作答文本与所述第二作答文本近似,分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记。
2.根据权利要求1所述的防抄袭识别方法,其特征在于,所述根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷,包括:
根据所述第一电子答卷中包括的所述学生的班级信息,获取所述学生所在班级的座位分布图;所述座位分布图中的每一个座位分布标注有所述座位对应的学生姓名;
根据所述第一电子答卷中包括的所述学生的姓名,从所述座位分布图中确定出所述学生的相邻座位对应的同学姓名;
获取所述相邻座位对应的同学姓名所属同学递交的第二电子答卷。
3.根据权利要求2所述的防抄袭识别方法,其特征在于,所述分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记之后,所述方法还包括:
根据所述第一电子答卷中包括的所述学生的班级信息和所述考试科目,确定出与所述学生的班级信息和所述考试科目同时匹配的科目教师;
将所述第一电子答卷和所述第二电子答卷发送至所述科目教师对应的教师客户端,以使所述科目教师通过所述教师客户端进一步确认所述第一电子答卷和所述第二电子答卷之间是否存在抄袭嫌疑。
4.根据权利要求1-3任一项所述的防抄袭识别方法,其特征在于,所述将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比,包括:
将所述第一作答文本进行拆解得到各候选句子;
确定所述各候选句子的重要性分数;
从所述各候选句子中提取所述重要性分数大于预设值的目标句子作为所述第一作答文本的关键信息;
将所述第一作答文本的关键信息与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比。
5.根据权利要求4所述的防抄袭识别方法,其特征在于,所述将所述第一作答文本进行拆解得到各候选句子,包括:
获取预设的文本拆解规则,所述预设的文本拆解规则包括分号、逗号、句号要进行拆解,而顿号、冒号、引号不进行拆解;
按照所述预设的文本拆解规则,将所述第一作答文本进行拆解,以得到各候选句子。
6.根据权利要求4或5所述的防抄袭识别方法,其特征在于,所述确定所述各候选句子的重要性分数,包括:
针对所述各候选句子中的每一候选句子,如果所述候选句子为中文句子,则按照语义分析的方式将所述中文句子拆分为若干个词组;
对拆分得到的每个词组进行全文遍历计算,得到每个词组的出现次数;
按照所述出现次数由高到低的顺序对拆分得到的所有词组进行排序,并且每个词组按照所述出现次数赋予相应的权值,所述出现次数越高,所述权值越高;
计算每一中文句子的重要性分数,所述重要性分数即为所述中文句子拆分得到的若干个词组的权值之和。
7.根据权利要求6所述的防抄袭识别方法,其特征在于,还包括:
如果所述候选句子为网页链接地址,则在后台开启所述网页链接地址对应的目标网页;
根据所述目标网页中,指向所述目标网页的链接确定所述目标网页的重要性分数,所述目标网页的重要性分数即是所述候选句子的重要性分数。
8.根据权利要求7所述的防抄袭识别方法,其特征在于,所述确定所述目标网页的重要性分数的过程为:
其中,S(Vi)是目标网页的重要性分数,d是阻尼系数,In(Vi)是存在指向目标网页的链接的网页集合,out(Vj)是网页j中的链接存在的链接指向的网页集合,out(Vj)取绝对值是用以表示所述网页集合中元素的个数,S(Vj)是网页j的重要性分数。
9.根据权利要求4-7任一项所述的防抄袭识别方法,其特征在于,所述将所述第一作答文本的关键信息与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比,包括:
计算所述第一作答文本的关键信息中的第一句子与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息的第二句子的余弦相似度;
若所述余弦相似度高于指定值,则确定所述第一作答文本与所述第二作答文本近似。
10.根据权利要求9所述的防抄袭识别方法,其特征在于,所述余弦相似度的计算过程为:
将所述第一句子拆分为若干个词组,以获得一组词组;
将所述第二句子拆分为若干个词组,以获得另一组词组;
将两组词组中的词组进行逐一对比,若存在,则记录为1,若不存在,则记录为0,以得到第一序列和第二序列;
计算所述第一序列和所述第二序列之间的余弦相似度,并作为所述第一句子和所述第二句子之间的余弦相似度;
其中,所述计算所述第一序列和所述第二序列之间的余弦相似度为:
其中,ab表示a序列中的元素与b序列中相应的元素相乘后整体相加,分母表示a序列中所有元素的平方和开根号后乘以b序列中所有元素的平方和开根号;其中,a序列表示所述第一序列,b序列表示所述第二序列。

说明书全文

一种电子答卷中作文部分的防抄袭识别方法

技术领域

[0001] 本发明涉及防作弊技术领域,尤其涉及一种电子答卷中作文部分的防抄袭识别方法。

背景技术

[0002]
[0003] 目前,利用平板电脑、个人计算机(Personal Computer,PC)等电子设备来进行考试的学校、培训机构的数量越来越多。其中,利用平板电脑、个人计算机等电子设备来进行考试时,服务设备可以收集到学生递交的电子答卷,从而可以有效的省去纸张的浪费,实现无纸化考试。
[0004] 在实践中发现,服务设备收集到的学生递交的电子答卷包括的部分内容有时仍需要人工进行阅卷评分。例如,服务设备收集到的学生递交的电子答卷包括的作文部分的作答文本通常需要阅卷人以人工方式进行阅卷评分。对于阅卷人而言,既要对某一学生递交的电子答卷包括的作文部分的作答文本进行人工阅卷,又要对比该学生递交的电子答卷包括的作文部分的作答文本是否与其他学生递交的电子答卷包括的作文部分的作答文本有抄袭嫌疑,导致阅卷评分需要花费大量的时间,影响了阅卷评分的效率。

发明内容

[0005] 本发明实施例公开了一种电子答卷中作文部分的防抄袭识别方法,能够减少阅卷评分花费的时间,提升阅卷评分的效率。
[0006] 其中,一种电子答卷中作文部分的防抄袭识别方法,所述方法包括:
[0007] 获取某一学生递交的第一电子答卷;
[0008] 检测所述第一电子答卷中的作文部分是否包括的第一作答文本;
[0009] 若包括所述第一作答文本,根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷;其中,所述第一电子答卷对应的考试科目与所述第二电子答卷的考试科目相同;
[0010] 将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比;
[0011] 若对比表明所述第一作答文本与所述第二作答文本近似,分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记。
[0012] 作为一种可选的实施方式,本发明实施例中,所述根据所述第一电子答卷中包括的所述学生的姓名和班级信息,获取所述学生的相邻同学递交的第二电子答卷,包括:
[0013] 根据所述第一电子答卷中包括的所述学生的班级信息,获取所述学生所在班级的座位分布图;所述座位分布图中的每一个座位分布标注有所述座位对应的学生姓名;
[0014] 根据所述第一电子答卷中包括的所述学生的姓名,从所述座位分布图中确定出所述学生的相邻座位对应的同学姓名;
[0015] 获取所述相邻座位对应的同学姓名所属同学递交的第二电子答卷。
[0016] 作为一种可选的实施方式,本发明实施例中,所述分别在所述第一电子答卷和所述第二电子答卷上标注用于表示存在抄袭嫌疑的标记之后,所述方法还包括:
[0017] 根据所述第一电子答卷中包括的所述学生的班级信息和所述考试科目,确定出与所述学生的班级信息和所述考试科目同时匹配的科目教师;
[0018] 将所述第一电子答卷和所述第二电子答卷发送至所述科目教师对应的教师客户端,以使所述科目教师通过所述教师客户端进一步确认所述第一电子答卷和所述第二电子答卷之间是否存在抄袭嫌疑。
[0019] 作为一种可选的实施方式,本发明实施例中,所述将所述第一作答文本与所述第二电子答卷中的作文部分包括的第二作答文本进行对比,包括:
[0020] 将所述第一作答文本进行拆解得到各候选句子;
[0021] 确定所述各候选句子的重要性分数;
[0022] 从所述各候选句子中提取所述重要性分数大于预设值的目标句子作为所述第一作答文本的关键信息;
[0023] 将所述第一作答文本的关键信息与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比。
[0024] 作为一种可选的实施方式,本发明实施例中,所述将所述第一作答文本进行拆解得到各候选句子,包括:
[0025] 获取预设的文本拆解规则,所述预设的文本拆解规则包括分号、逗号、句号要进行拆解,而顿号、冒号、引号不进行拆解;
[0026] 按照所述预设的文本拆解规则,将所述第一作答文本进行拆解,以得到各候选句子。
[0027] 作为一种可选的实施方式,本发明实施例中,所述确定所述各候选句子的重要性分数,包括:
[0028] 针对所述各候选句子中的每一候选句子,如果所述候选句子为中文句子,则按照语义分析的方式将所述中文句子拆分为若干个词组;
[0029] 对拆分得到的每个词组进行全文遍历计算,得到每个词组的出现次数;
[0030] 按照所述出现次数由高到低的顺序对拆分得到的所有词组进行排序,并且每个词组按照所述出现次数赋予相应的权值,所述出现次数越高,所述权值越高;
[0031] 计算每一中文句子的重要性分数,所述重要性分数即为所述中文句子拆分得到的若干个词组的权值之和。
[0032] 作为一种可选的实施方式,本发明实施例中,所述防抄袭识别方法还包括:
[0033] 如果所述候选句子为网页链接地址,则在后台开启所述网页链接地址对应的目标网页;
[0034] 根据所述目标网页中,指向所述目标网页的链接确定所述目标网页的重要性分数,所述目标网页的重要性分数即是所述候选句子的重要性分数。
[0035] 作为一种可选的实施方式,本发明实施例中,所述确定所述目标网页的重要性分数的过程为:
[0036]
[0037] 其中,S(Vi)是目标网页的重要性分数,d是阻尼系数,In(Vi)是存在指向目标网页的链接的网页集合,out(Vj)是网页j中的链接存在的链接指向的网页集合,out(Vj)取绝对值是用以表示所述网页集合中元素的个数,S(Vj)是网页j 的重要性分数。
[0038] 作为一种可选的实施方式,本发明实施例中,所述将所述第一作答文本的关键信息与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比,包括:
[0039] 计算所述第一作答文本的关键信息中的第一句子与所述第二电子答卷中的作文部分包括的第二作答文本的关键信息的第二句子的余弦相似度;
[0040] 若所述余弦相似度高于指定值,则确定所述第一作答文本与所述第二作答文本近似。
[0041] 作为一种可选的实施方式,本发明实施例中,所述余弦相似度的计算过程为:
[0042] 将所述第一句子拆分为若干个词组,以获得一组词组;
[0043] 将所述第二句子拆分为若干个词组,以获得另一组词组;
[0044] 将两组词组中的词组进行逐一对比,若存在,则记录为1,若不存在,则记录为0,以得到第一序列和第二序列;
[0045] 计算所述第一序列和所述第二序列之间的余弦相似度,并作为所述第一句子和所述第二句子之间的余弦相似度;
[0046] 其中,所述计算所述第一序列和所述第二序列之间的余弦相似度为:
[0047]
[0048] 其中,ab表示a序列中的元素与b序列中相应的元素相乘后整体相加,分母表示a序列中所有元素的平方和开根号后乘以b序列中所有元素的平方和开根号;其中,a序列表示所述第一序列,b序列表示所述第二序列。
[0049] 本发明实施例中,在检测到某一学生递交的第一电子答卷中的作文部分包括第一作答文本时,可以根据第一电子答卷中包括的该学生的姓名和班级信息,获取该学生的相邻同学递交的第二电子答卷,第一电子答卷对应的考试科目与第二电子答卷的考试科目相同;而且,若对比第一作答文本与第二电子答卷中的作文部分包括的第二作答文本近似,分别在第一电子答卷和第二电子答卷上标注用于表示存在抄袭嫌疑的标记。实施本发明实施例,对于未标注有用于表示存在抄袭嫌疑的标记的电子答卷,阅卷人可以省去对比该电子答卷包括的作文部分的作答文本是否与其他学生递交的电子答卷包括的作文部分的作答文本有抄袭嫌疑的作业,而仅需对比那些标注有用于表示存在抄袭嫌疑的标记的电子答卷之间的作答文本是否有抄袭嫌疑即可,从而可以减少阅卷评分花费的时间,提升阅卷评分的效率。附图说明
[0050] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0051] 图1为本发明实施例公开的一种电子答卷中作文部分的防抄袭识别方法的流程示意图;
[0052] 图2为本发明实施例公开的第一电子答卷中的作文部分包括的第一作答文本与第二电子答卷中的作文部分包括的第二作答文本进行对比的流程示意图;
[0053] 图3为本发明实施例公开的另一种电子答卷中作文部分的防抄袭识别方法的流程示意图。

具体实施方式

[0054] 下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0055] 需要说明的是,本发明实施例的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0056] 本发明实施例公开了一种电子答卷中作文部分的防抄袭识别方法,能够减少阅卷评分花费的时间,提升阅卷评分的效率。以下进行结合附图进行详细描述。
[0057] 请参阅图1,图1为本发明实施例公开的一种电子答卷中作文部分的防抄袭识别方法的流程示意图。如图1所示,该电子答卷中作文部分的防抄袭识别方法可以包括以下步骤:
[0058] 101、服务设备获取某一学生递交的第一电子答卷。
[0059] 本发明实施例中,服务设备可以是设置在学校、培训机构的服务器,其中,服务设备可以与学校、培训机构设置的用于供学生进行无纸化考试的平板电脑、个人计算机等电子设备进行通讯连接(如有线通讯连接或无线通讯连接)。
[0060] 作为一种可选的实施方式,某一学生在利用平板电脑、个人计算机等电子设备进行无纸化考试完毕时,该学生可以通过平板电脑、个人计算机等电子设备将自己作答的电子答卷作为第一电子答卷递交给服务设备。
[0061] 作为另一种可选的实施方式,当阅卷人(如教师)在服务设备上选择某一学生时,服务设备可以从电子答卷库中获取该学生递交的电子答卷作为第一电子答卷。
[0062] 举例来说,当阅卷人(如教师)在服务设备上选择某一学生时,服务设备可以先采集该阅卷人的人脸图像,并将该阅卷人的人脸图像与该学生所在班级的各个科目对应的教师的人脸图像进行校验,若校验发现该阅卷人的人脸图像与该学生所在班级的各个科目中的目标科目对应的教师的人脸图像相匹配,那么服务设备可以从电子答卷库中获取该学生递交的目标科目对应的最新的电子答卷作为第一电子答卷。例如,若校验发现该阅卷人的人脸图像与该学生所在班级的各个科目中的语文科目对应的语文教师的人脸图像相匹配,那么服务设备可以从电子答卷库中获取该学生递交的语文科目对应的最新的电子答卷作为第一电子答卷;例如,若校验发现该阅卷人的人脸图像与该学生所在班级的各个科目中的政治科目对应的政治教师的人脸图像相匹配,那么服务设备可以从电子答卷库中获取该学生递交的政治科目对应的最新的电子答卷作为第一电子答卷。其中,实施这种实施方式,可以安全、准确的获取某一学生递交的第一电子答卷。
[0063] 102、服务设备检测第一电子答卷中的作文部分是否包括的第一作答文本,若包括第一作答文本,执行步骤103;若未包括第一作答文本,结束本流程。
[0064] 作为一种可选的实施方式,服务设备在执行步骤101之后,以及服务设备在执行步骤102之前,服务设备还可以先执行以下步骤:
[0065] 服务设备可以识别步骤101中获取到的某一学生递交的第一电子答卷所属的科目;
[0066] 以及,服务设备可以根据第一电子答卷所属的科目,判断第一电子答卷中的作文部分是否属于指定的人工阅卷评分的部分,如果属于指定的人工阅卷评分的部分,服务设备才执行步骤102;否则,如果不属于指定的人工阅卷评分的部分,服务设备可以结束本流程。
[0067] 举例来说,如果服务设备识别出步骤101中获取到的某一学生递交的第一电子答卷所属的科目为语文,相应地,服务设备可以判断第一电子答卷中的作文部分属于人工阅卷评分的指定部分,服务设备才执行步骤102。
[0068] 103、服务设备根据第一电子答卷中包括的该学生的姓名和班级信息,获取该学生的相邻同学递交的第二电子答卷;其中,第一电子答卷对应的考试科目与第二电子答卷的考试科目相同。
[0069] 作文一种可选的实施方式,服务设备根据第一电子答卷中包括的该学生的姓名和班级信息,获取该学生的相邻同学递交的第二电子答卷,包括:
[0070] 服务设备根据第一电子答卷中包括的该学生的班级信息,获取该学生所在班级的座位分布图;其中,该座位分布图中的每一个座位分布标注有座位对应的学生姓名;
[0071] 以及,服务设备根据第一电子答卷中包括的该学生的姓名,从该座位分布图中确定出该学生的相邻座位对应的同学姓名;
[0072] 以及,服务设备获取相邻座位对应的同学姓名所属同学递交的第二电子答卷。
[0073] 其中,该学生的相邻座位可以包括前、后、左、右中的任一或多个相邻座位,也即是说,服务设备获取到的相邻座位对应的同学姓名所属同学递交的第二电子答卷可以是一份或多份。
[0074] 其中,实施上述实施方式,服务设备可以准确的识别出某一学生递交的第一电子答卷是否有抄袭其相邻座位对应的同学递交的第二电子答卷的嫌疑。
[0075] 104、服务设备将第一作答文本与第二电子答卷中的作文部分包括的第二作答文本进行对比。
[0076] 105、若对比表明第一作答文本与第二作答文本近似,服务设备分别在第一电子答卷和第二电子答卷上标注用于表示存在抄袭嫌疑的标记。
[0077] 作为一种可选的实施方式,本发明实施例中,上述步骤104中,服务设备将第一作答文本与第二电子答卷中的作文部分包括的第二作答文本进行对比,可以包括以下步骤:
[0078] 201、服务设备将第一作答文本进行拆解得到各候选句子。
[0079] 202、服务设备确定各候选句子的重要性分数。
[0080] 203、服务设备从各候选句子中提取重要性分数大于预设值的目标句子作为第一作答文本的关键信息。
[0081] 204、服务设备将第一作答文本的关键信息与第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比。
[0082] 作为一种可选的实施方式,上述步骤201中,服务设备将第一作答文本进行拆解得到各候选句子,可以包括:
[0083] 服务设备获取预设的文本拆解规则,该预设的文本拆解规则包括分号、逗号、句号要进行拆解,而顿号、冒号、引号不进行拆解;
[0084] 以及,服务设备按照预设的文本拆解规则,将第一作答文本进行拆解,以得到各候选句子。
[0085] 作为一种可选的实施方式,上述步骤202中,服务设备确定各候选句子的重要性分数,可以包括:
[0086] 针对各候选句子中的每一候选句子,如果该候选句子为中文句子,服务设备按照语义分析的方式将该中文句子拆分为若干个词组;
[0087] 以及,服务设备对拆分得到的每个词组进行全文遍历计算,得到每个词组的出现次数;
[0088] 以及,服务设备按照出现次数由高到低的顺序对拆分得到的所有词组进行排序,并且每个词组按照出现次数赋予相应的权值,出现次数越高,权值越高;
[0089] 以及,服务设备计算每一中文句子的重要性分数,该重要性分数即为该中文句子拆分得到的若干个词组的权值之和。
[0090] 例如,第一作答文本为:
[0091] 今天XX协会在北京召开了工作会议,天气不错,大概有30摄氏度,没有下雨,交通情况也良好,在工作会议上,张会长对XX协会去年的工作进行了总结,还表彰了XX协会的优秀员工。
[0092] 相应地,服务设备按照预设的文本拆解规则,将第一作答文本进行拆解,得到的各候选句子包括:
[0093] A、今天XX协会在北京召开了工作会议;
[0094] B、天气不错;
[0095] C、大概有30摄氏度;
[0096] D、没有下雨;
[0097] E、交通情况也良好;
[0098] F、在工作会议上;
[0099] G、张会长对XX协会去年的工作进行了总结;
[0100] H、还表彰了XX协会的优秀员工。
[0101] 相应的,服务设备拆解得到的所有词组包括:
[0102] 今天:出现1次,其权值可以为1;
[0103] XX协会:出现3次,其权值可以为3;
[0104] 北京:1次,其权值可以为1;
[0105] 召开:1次,其权值可以为1;
[0106] 工作会议:2次,其权值可以为2;
[0107] 天气:1次,其权值可以为1;
[0108] 30摄氏度:1次,其权值可以为1;
[0109] 下雨:1次,其权值可以为1;
[0110] 交通情况:1次,其权值可以为1;
[0111] 张会长:1次,其权值可以为1;
[0112] 去年的工作:1次,其权值可以为1;
[0113] 总结:1次,其权值可以为1;
[0114] 表彰:1次,其权值可以为1;
[0115] 优秀员工:1次,其权值可以为1;
[0116] 相应地,上面的候选句子的重要性分数分别为:A号8分,B号1分,C 号1分,D号1分,E号1分,F号2分,G号6分,H号5分。
[0117] 进一步地,假设预设值为2分,那么目标句子为A号,F号,G号和H号,相应地,第一作答文本的关键信息为:
[0118] 今天XX协会在北京召开了工作会议;在工作会议上;张会长对XX协会去年的工作进行了总结;还表彰了XX协会的优秀员工。
[0119] 作为一种可选的实施上述,如果该候选句子不是中文句子,而是网页链接地址,那么服务设备可以在后台开启该网页链接地址对应的目标网页;以及,服务设备可以根据目标网页中,指向目标网页的链接确定目标网页的重要性分数,该目标网页的重要性分数即是该候选句子的重要性分数。
[0120] 其中,确定目标网页的重要性分数的过程为:
[0121]
[0122] 其中,S(Vi)是目标网页的重要性分数,d是阻尼系数,In(Vi)是存在指向目标网页的链接的网页集合,out(Vj)是网页j中的链接存在的链接指向的网页集合,out(Vj)取绝对值是用以表示网页集合中元素的个数,S(Vj)是网页j的重要性分数。
[0123] 作为一种可选的实施方式,第一作答文本的关键信息实际上就是句子的集合,对关键信息的对比实际上就是对句子进行对比。因此,上述步骤204 中,服务设备将第一作答文本的关键信息与第二电子答卷中的作文部分包括的第二作答文本的关键信息进行对比,可以包括:
[0124] 服务设备计算第一作答文本的关键信息中的第一句子与第二电子答卷中的作文部分包括的第二作答文本的关键信息的第二句子的余弦相似度;
[0125] 以及,若余弦相似度高于指定值,服务设备可以确定第一作答文本与第二作答文本近似。
[0126] 本发明实施例中,上述的余弦相似度的计算过程为:
[0127] 服务设备将第一句子拆分为若干个词组,以获得一组词组;
[0128] 以及,服务设备将第二句子拆分为若干个词组,以获得另一组词组;
[0129] 以及,服务设备将两组词组中的词组进行逐一对比,若存在,则记录为1,若不存在,则记录为0,以得到第一序列和第二序列;
[0130] 以及,服务设备计算第一序列和第二序列之间的余弦相似度,并作为第一句子和第二句子之间的余弦相似度。
[0131] 举例来说,假设:
[0132] 第一句子为:今天协会在北京召开会议;
[0133] 第二句子为:协会在北京召开了普法会议;
[0134] 那么,第一句子和第二句子拆分成的两组词组的对比如表1所示,即:
[0135] 表1
[0136]
[0137] 如表1所示,第一序列a为(1,1,1,1,0,1),而第二序列b为(0, 1,1,1,1,1)。
[0138] 其中,服务设备计算第一序列和第二序列之间的余弦相似度为:
[0139]
[0140] 其中,ab表示a序列中的元素与b序列中相应的元素相乘后整体相加,分母表示a序列中所有元素的平方和开根号后乘以b序列中所有元素的平方和开根号;其中,a序列表示第一序列,b序列表示第二序列。
[0141] 例如,上述的第一句子和第二句子计算的结果为:
[0142]
[0143] 最终的计算结果为0.8,当0.8高于指定值,服务设备可以确定第一作答文本与第二作答文本近似。
[0144] 其中,实施图1所描述的防抄袭识别方法,对于未标注有用于表示存在抄袭嫌疑的标记的电子答卷,阅卷人可以省去对比该电子答卷包括的作文部分的作答文本是否与其他学生递交的电子答卷包括的作文部分的作答文本有抄袭嫌疑的作业,而仅需对比那些标注有用于表示存在抄袭嫌疑的标记的电子答卷之间的作答文本是否有抄袭嫌疑即可,从而可以减少阅卷评分花费的时间,提升阅卷评分的效率。
[0145] 请参阅图3,图3为本发明实施例公开的另一种电子答卷中作文部分的防抄袭识别方法的流程示意图。如图3所示,该电子答卷中作文部分的防抄袭识别方法可以包括以下步骤:
[0146] 301、服务设备获取某一学生递交的第一电子答卷。
[0147] 本发明实施例中,服务设备可以是设置在学校、培训机构的服务器,其中,服务设备可以与学校、培训机构设置的用于供学生进行无纸化考试的平板电脑、个人计算机等电子设备进行通讯连接(如有线通讯连接或无线通讯连接)。
[0148] 作为一种可选的实施方式,某一学生在利用平板电脑、个人计算机等电子设备进行无纸化考试完毕时,该学生可以通过平板电脑、个人计算机等电子设备将自己作答的电子答卷作为第一电子答卷递交给服务设备。
[0149] 作为另一种可选的实施方式,当阅卷人(如教师)在服务设备上选择某一学生时,服务设备可以从电子答卷库中获取该学生递交的电子答卷作为第一电子答卷。
[0150] 举例来说,当阅卷人(如教师)在服务设备上选择某一学生时,服务设备可以先采集该阅卷人的人脸图像,并将该阅卷人的人脸图像与该学生所在班级的各个科目对应的教师的人脸图像进行校验,若校验发现该阅卷人的人脸图像与该学生所在班级的各个科目中的目标科目对应的教师的人脸图像相匹配,那么服务设备可以从电子答卷库中获取该学生递交的目标科目对应的最新的电子答卷作为第一电子答卷。例如,若校验发现该阅卷人的人脸图像与该学生所在班级的各个科目中的语文科目对应的语文教师的人脸图像相匹配,那么服务设备可以从电子答卷库中获取该学生递交的语文科目对应的最新的电子答卷作为第一电子答卷;例如,若校验发现该阅卷人的人脸图像与该学生所在班级的各个科目中的政治科目对应的政治教师的人脸图像相匹配,那么服务设备可以从电子答卷库中获取该学生递交的政治科目对应的最新的电子答卷作为第一电子答卷。其中,实施这种实施方式,可以安全、准确的获取某一学生递交的第一电子答卷。
[0151] 302、服务设备检测第一电子答卷中的作文部分是否包括的第一作答文本,若包括第一作答文本,执行步骤303-步骤309;若未包括第一作答文本,结束本流程。
[0152] 作为一种可选的实施方式,服务设备在执行步骤301之后,以及服务设备在执行步骤302之前,服务设备还可以先执行以下步骤:
[0153] 服务设备可以识别步骤301中获取到的某一学生递交的第一电子答卷所属的科目;
[0154] 以及,服务设备可以根据第一电子答卷所属的科目,判断第一电子答卷中的作文部分是否属于指定的人工阅卷评分的部分,如果属于指定的人工阅卷评分的部分,服务设备才执行步骤302;否则,如果不属于指定的人工阅卷评分的部分,服务设备可以结束本流程。
[0155] 举例来说,如果服务设备识别出步骤301中获取到的某一学生递交的第一电子答卷所属的科目为语文,相应地,服务设备可以判断第一电子答卷中的作文部分属于人工阅卷评分的指定部分,服务设备才执行步骤302。
[0156] 303、服务设备根据第一电子答卷中包括的该学生的班级信息,获取该学生所在班级的座位分布图;其中,该座位分布图中的每一个座位分布标注有座位对应的学生姓名。
[0157] 304、服务设备根据第一电子答卷中包括的该学生的姓名,从该座位分布图中确定出该学生的相邻座位对应的同学姓名。
[0158] 305、服务设备获取相邻座位对应的同学姓名所属同学递交的第二电子答卷服务设备根据第一电子答卷中包括的该学生的姓名和班级信息,获取该学生的相邻同学递交的第二电子答卷;其中,第一电子答卷对应的考试科目与第二电子答卷的考试科目相同。
[0159] 其中,该学生的相邻座位可以包括前、后、左、右中的任一或多个相邻座位,也即是说,服务设备获取到的相邻座位对应的同学姓名所属同学递交的第二电子答卷可以是一份或多份。
[0160] 其中,实施上述实施方式,服务设备可以准确的识别出某一学生递交的第一电子答卷是否有抄袭其相邻座位对应的同学递交的第二电子答卷的嫌疑。
[0161] 306、服务设备将第一作答文本与第二电子答卷中的作文部分包括的第二作答文本进行对比。
[0162] 307、若对比表明第一作答文本与第二作答文本近似,服务设备分别在第一电子答卷和第二电子答卷上标注用于表示存在抄袭嫌疑的标记。
[0163] 308、服务设备根据第一电子答卷中包括的该学生的班级信息和该考试科目,确定出与该学生的班级信息和该考试科目同时匹配的科目教师。
[0164] 309、服务设备将第一电子答卷和第二电子答卷发送至该科目教师对应的教师客户端,以使该科目教师通过教师客户端进一步确认第一电子答卷和第二电子答卷之间是否存在抄袭嫌疑。
[0165] 作为一种可选的实施方式,本发明实施例中,服务设备在执行步骤308 之后,以及服务设备执行步骤309之前,服务设备可以先执行以下步骤:
[0166] 服务设备可以以第一电子答卷中包括的该学生的班级信息和该考试科目为依据,确定出与该学生的班级信息和该考试科目同时匹配的阅卷人;
[0167] 以及,服务设备可以判断确定出的该阅卷人与步骤308中确定出的该科目教师是否为同一个人,若为同一个人,执行步骤309;反之,若不是同一个人,获取确定出的该阅卷人的阅卷权限;其中,该阅卷人的阅卷权限至少包括指定阅卷地址和指定阅卷时间段;
[0168] 以及,服务设备可以判断当前时间是否落入该指定阅卷时间段内,如果否,结束本流程;如果是,服务设备可以控制指定阅卷地址对应的摄像装置抓拍第一人像;
[0169] 以及,服务设备判断第一人像包含的人脸图像是否与该阅卷人对应的第二人像包含的人脸图像相匹配;
[0170] 若第一人像包含的人脸图像与该阅卷人对应的第二人像包含的人脸图像相匹配,服务设备利用人像属性算法对第一人像进行前向计算,得到第一人像的属性信息
[0171] 以及,服务设备判断第一人像的属性信息是否与该阅卷人对应的第二人像的属性信息相匹配;
[0172] 若第一人像的属性信息与该阅卷人对应的第二人像的属性信息相匹配,服务设备可以安全的将第一电子答卷和第二电子答卷发送至该阅卷人,以使该阅卷人进一步确认第一电子答卷和第二电子答卷之间是否存在抄袭嫌疑。
[0173] 其中,实施上述实施方式,可以防止第一电子答卷和第二电子答卷被除该阅卷人之后的其他非法用户看到,从而造成第一电子答卷和第二电子答卷发生泄露,提高第一电子答卷和第二电子答卷的阅卷安全性。
[0174] 其中,人像属性算法是基于多个样本人像图像以及多个样本人像图像的多个属性信息的识别结果按照属性信息的不同类型进行训练得到;其中,属性信息包括年龄、性别以及身高。
[0175] 本发明实施例中,人像属性算法通过以下方式训练得到,即:
[0176] 服务设备读取预先录入的样本人像数据,每个样本人像数据中包含样本人像图像以及样本人像图像的多个属性信息;
[0177] 服务设备从预先录入的样本人像图像中提取人像特征;
[0178] 服务设备根据初始模型中的不同属性信息对应的子模型对每个样本人像图像的人像特征进行前向计算,得到每个样本人像图像的多个属性信息的预测值;
[0179] 服务设备根据预测值与属性信息的值,按照属性信息的不同类型计算得到多个属性信息的损耗;
[0180] 服务设备将多个属性信息的损耗求和,得到多个属性信息的总损耗;
[0181] 服务设备对初始模型中的不同属性信息对应的子模型的参数进行调整,直到调整后的参数使得多个属性信息的总损耗小于或等于预设阈值时,停止调整得到人像属性算法;
[0182] 其中,服务设备根据预测值与属性信息的值,按照属性信息的不同类型计算得到多个属性信息的损耗,包括:
[0183] 服务设备对于多个属性信息中每一个属性信息,若该属性信息为回归属性,按照如下公式对该属性信息的预测值和属性信息的值进行计算,得到该属性信息的损耗:
[0184]
[0185] 其中,s表示该属性信息在多个属性信息中的编号, 表示初始模型计算得到的预测值, 表示该属性信息的值,I表示回归维度,J表示回归维度的标,L表示该属性信息对应的损耗。
[0186] 或者,服务设备根据预测值与属性信息的值,按照属性信息的不同类型计算得到多个属性信息的损耗,包括:
[0187] 服务设备对于多个属性信息中每一个属性信息,若该属性信息不为回归属性,按照如下公式对该属性信息的预测向量和属性信息向量进行计算,得到该属性信息的损耗:
[0188]
[0189] 其中,s表示该属性信息在多个属性信息中的编号,x表示该属性信息的值,q表示初始模型计算得到的预测值,D表示该属性信息的识别结果数目, h表示该属性信息的识别结果的标识,L表示该属性信息对应的损耗。
[0190] 其中,实施图3所描述的防抄袭识别方法,对于未标注有用于表示存在抄袭嫌疑的标记的电子答卷,阅卷人可以省去对比该电子答卷包括的作文部分的作答文本是否与其他学生递交的电子答卷包括的作文部分的作答文本有抄袭嫌疑的作业,而仅需对比那些标注有用于表示存在抄袭嫌疑的标记的电子答卷之间的作答文本是否有抄袭嫌疑即可,从而可以减少阅卷评分花费的时间,提升阅卷评分的效率。
[0191] 本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质包括只读存储器(Read-Only Memory,ROM)、随机存储器(Random Access Memory,RAM)、可编程只读存储器(Programmable Read-only Memory,PROM)、可擦除可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、一次可编程只读存储器(One-time Programmable Read-Only Memory,OTPROM)、电子抹除式可复写只读存储器 (Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(Compact Disc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
[0192] 以上对本发明实施例公开的一种电子答卷中作文部分的防抄袭识别方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈