技术领域
[0001] 本
发明属于
人工智能技术领域,具体涉及一种面向在线教育的实时反作弊检测和预警方法。
背景技术
[0002] 微软2018年专
门设计了一套
机器学习型人工智能来从游戏外检测作弊行为,并且为它
申请了
专利。利用了微软这套技术,可以查询各个游戏之间、游戏与平台之间的各种数据,以此来追踪玩家的成就、分数、排名等信息,然后人工智能就会分析这些数据,并寻找是否有作弊的证据;同时微软还添加了一些其它的技术来支持这个检测人工智能,比如“目标管理模
块”等,这些会与人工智能一起分析总结数据,判断是否有作弊情况发生,然后依此决定该如何给予玩家奖品、成就、分数,或者警告、处罚等。在实时反作弊检测这一块,北京某科技有限公司发明了一种接收实时日志文件来转
化成时序数据,并根据时序
异常检测结果生成监控策略的方法,主要应用于互联网平台公司的
风险控制场景。
[0003] 但是,现有这些技术在监控检测体系中大多依赖人工处理,对于新发现的异常需要人工分析判断并操作,以及无法直接给出作弊的影响范围及数量。反作弊系统的固定化,难以针对不同的作弊对象做针对性的处理乃至灵敏度的设置。因此,目前亟需一种能够解决上述问题的反作弊方法。
发明内容
[0004] 为了解决
现有技术存在的上述问题,本发明目的在于提供一种面向在线教育的实时反作弊检测和预警方法,用于解决现有技术存在的依赖人工处理、无法直接给出作弊的影响范围及数量以及反作弊系统的固定化的问题。
[0005] 本发明所采用的技术方案为:
[0006] 一种面向在线教育的实时反作弊检测和预警方法,包括如下步骤:
[0007] S1:根据预设院校和预设课程开启反作弊系统,并设置对应的防作弊参数;
[0008] S2:使用反作弊系统实时获取考生考试的日志文件,并提取考生历史的学习行为数据,获取解码后的实时特征数据和离线特征数据;
[0009] S3:根据考生历史的学习行为数据建立
知识库,并建立机器学习模型;
[0010] S4:根据步骤实时特征数据和离线特征数据,使用知识库和机器学习模型对考生的考试行为进行综合预估和异常检测,获取并储存作弊数据;
[0011] S5:判断作弊数据是否超过预设作弊数据
阈值,若是则记录当前异常学生的作弊行为,将其反馈给知识库中的作弊
数据库,并向当前异常考生终端发出预警提醒信息,并进入步骤S6,否则返回步骤S4;
[0012] S6:判断当前异常考生终端的预警提醒信息数量是否达到预设数量阈值,若是则停止当前异常考生终端的作答工作并进行封号处理,并进入步骤S7,否则返回步骤S4;
[0013] S7:根据所有作弊数据并结合作弊的课程类型分布、作弊区域分布以及作弊院校分布进行周期性分析,获取分析结果。
[0014] 进一步地,步骤S1中,防作弊参数包括作弊灵敏性、防作弊院校范围以及防作弊课程范围。
[0015] 进一步地,步骤S2中,使用ELK日志分析工具实时获取考生考试的日志文件。
[0016] 进一步地,日志文件用于存储考生终端的登陆和出勤、视频学习、课程笔记、学生提问、作业、单元测试以及考试的操作而实时产生并不断更新的数据。
[0017] 进一步地,步骤S2中,将考生考试的日志文件和考生历史的学习行为数据,进行预处理和特征工程处理,即进行加工、清洗、过滤和特征提取,获取解码后的实时特征数据和离线特征数据。
[0018] 进一步地,预处理和特征工程处理包括:
[0019] 使用针对规则模型对实时获取到的日志文件数据进行加工和清洗,过滤出实时特征数据;
[0020] 使用针对
算法模型,过滤出考生历史的学习行为数据中的异常行为数据,即对考生历史的学习行为数据进行挖掘分析,提取相关特征数据。
[0021] 进一步地,步骤S3和步骤S4之间,还包括步骤S3.5:更新考生在线行为数据库,并将已发现的异常IP、异常账号以及作弊的规则存储到知识库中。
[0022] 进一步地,步骤S3.5中,更新考生在线行为数据库的具体方法为:根据考生唯一号对在线行为对应考生的行为记录进行更新,并将更新的行为记录记入考生在线行为数据库。
[0023] 进一步地,步骤S3中,建立机器学习模型的具体方法为:将知识库中历史的作弊行为数据和作弊标签进行训练,获取机器学习模型。
[0024] 本发明的有益效果为:
[0025] 1)本发明基于反作弊系统自动进行实时反作弊检测和和预警,减少了人
力投入,对于新发现的异常进行自动化分析判断并操作;
[0026] 2)本发明具有较强的灵活性,反作弊系统的作弊灵敏性可以实现配制;可针对课程、院校独立配制是否开启防作弊流程限制和灵敏性限制,可以按作弊灵敏度获取学生的列表,比如90%疑似作弊的学生名单,实现了针对不同的作弊对象做针对性的处理以及灵敏度的设置;
[0027] 3)根据所有作弊数据并结合作弊的课程类型分布、作弊区域分布以及作弊院校分布进行分析,能够直接给出作弊的影响范围及数量,更清晰地反馈给平台和老师,从而促使平台方和教学方优化教学
质量和教学方法。
附图说明
[0028] 为了更清楚地说明本发明
实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0029] 图1是面向在线教育的实时反作弊检测和预警方法的
流程图。
具体实施方式
[0030] 下面结合附图及具体实施例来对本发明作进一步阐述。在此需要说明的是,对于这些实施例方式的说明虽然是用于帮助理解本发明,但并不构成对本发明的限定。本发明公开的功能细节仅用于描述本发明的示例实施例。然而,可用很多备选的形式来体现本发明,并且不应当理解为本发明限制在本发明阐述的实施例中。
[0031] 应当理解,本发明使用的术语仅用于描述特定实施例,并不意在限制本发明的示例实施例。若术语“包括”、“包括了”、“包含”和/或“包含了”在本发明中被使用时,
指定所
声明的特征、整数、步骤、操作、单元和/或组件的存在性,并且不排除一个或多个其他特征、数量、步骤、操作、单元、组件和/ 或他们的组合存在性或增加。
[0032] 应当理解,还应当注意到在一些备选实施例中,所出现的功能/动作可能与附图出现的顺序不同。例如,取决于所涉及的功能/动作,实际上可以实质上并发地执行,或者有时可以以相反的顺序来执行连续示出的两个图。
[0033] 应当理解,在下面的描述中提供了特定的细节,以便于对示例实施例的完全理解。然而,本领域普通技术人员应当理解可以在没有这些特定细节的情况下实现示例实施例。
例如可以在
框图中示出系统,以避免用不必要的细节来使得示例不清楚。在其他实例中,可以不以不必要的细节来示出众所周知的过程、结构和技术,以避免使得示例实施例不清楚。
[0034] 实施例1:
[0035] 如图1所示,一种面向在线教育的实时反作弊检测和预警方法,自动进行实时反作弊检测和和预警,减少了人力投入,对于新发现的异常进行自动化分析判断并操作,包括如下步骤:
[0036] S1:根据预设院校和预设课程开启反作弊系统,并设置对应的防作弊参数;
[0037] 防作弊参数包括作弊灵敏性、防作弊院校范围以及防作弊课程范围;提高了反作弊系统的灵活性,其中反作弊系统的作弊灵敏性可以实现配制;可针对课程、院校独立配制是否开启防作弊流程限制和灵敏性限制;
[0038] S2:使用ELK日志分析工具实时获取考生考试的日志文件,并提取考生历史的学习行为数据,获取解码后的实时特征数据和离线特征数据;
[0039] 日志文件用于存储考生终端的登陆和出勤、视频学习、课程笔记、学生提问、作业、单元测试以及考试的操作而实时产生并不断更新的数据,从日志文件中能够清楚准确的提取到考生的历史的学习行为数据以及当前的实时在线行为数据,便于后续对考生的考试行为进行综合预估和异常检测,提高了反作弊检测的准确性和及时性;
[0040] 将考生考试的日志文件和考生历史的学习行为数据,进行预处理和特征工程处理,即进行加工、清洗、过滤和特征提取,获取解码后的实时特征数据和离线特征数据;
[0041] 预处理和特征工程处理包括:
[0042] 使用针对规则模型对实时获取到的日志文件数据进行加工和清洗,过滤出最能反应考生作弊行为的实时特征数据,根据当前的实时特征数据,能够准确的作为判别考生是否进行作弊行为的依据;
[0043] 使用针对算法模型,过滤出考生历史的学习行为数据中的异常行为数据,该部分数据的量级非常大,即通过
数据挖掘技术对海量的考生历史的学习行为数据进行挖掘分析,提取相关特征数据,便于寻找是否有作弊的证据;
[0044] S3:根据考生历史的学习行为数据建立知识库,并建立机器学习模型;
[0045] 建立机器学习模型的具体方法为:将知识库中历史的作弊行为数据和作弊标签进行训练,获取最优的机器学习模型,该机器学习模型能够对对新来的考生进行预测,并进行实时的更新,保存新来的考生的在线行为数据库,实现了反作弊系统的自我更新与升级;
[0046] S3.5:更新考生在线行为数据库,并将已发现的异常IP、异常账号以及作弊的规则存储到知识库中,以便后续模型的调用;
[0047] 更新考生在线行为数据库的具体方法为:根据考生唯一号对在线行为对应考生的行为记录进行更新,并将更新的行为记录记入考生在线行为数据库;
[0048] S4:根据步骤实时特征数据和离线特征数据,使用知识库和机器学习模型,即通过加工好的实时特征数据,利用知识库设定好的作弊规则,对考生的考试行为进行综合预估和异常检测,获取并储存作弊数据,即综合规则模型和算法模型输出作弊考生的名单,可以按作弊灵敏度获取学生的列表,比如90%疑似作弊的学生名单,同时将作弊信息存储到知识库中,作后续分析和优化;
[0049] S5:判断作弊数据是否超过预设作弊数据阈值,若是则记录当前异常学生的作弊行为,将其反馈给知识库中的作弊数据库,并向当前异常考生终端发出预警提醒信息,并进入步骤S6,否则返回步骤S4;
[0050] S6:判断当前异常考生终端的预警提醒信息数量是否达到预设数量阈值,若是则停止当前异常考生终端的作答工作并进行封号处理,从而达到实时异常记录和监控预警的双重效果,并进入步骤S7,否则返回步骤S4;
[0051] S7:根据所有作弊数据并结合作弊的课程类型分布、作弊区域分布以及作弊院校分布进行周期性分析,获取分析结果;
[0052] 反作弊系统利用
可视化分析技术对学生的作弊数据进行深入挖掘和呈现,进行周期性分析,即分析一段时间内(一个学期或者一个月)的所有作弊数据以及作弊的课程类型分布、作弊区域分布以及作弊院校分布,将分析结果更清晰地反馈给平台和老师,从而促使平台方和教学方优化教学质量和教学方法。
[0053] 以上所描述的实施例仅仅是示意性的,若涉及到作为分离部件说明的单元,其可以是或者也可以不是物理上分开的;若涉及到作为单元显示的部件,其可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
[0054] 以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行
修改,或者对其中部分技术特征进行等同替换。而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
[0055] 最后应说明的是,本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以
权利要求书中界定的为准,并且
说明书可以用于解释权利要求书。