专利汇可以提供一种结合BERT的用于教学任务的跨平台智能问答实现方法专利检索,专利查询,专利分析的服务。并且本 发明 提出一种结合BERT的用于教学任务的跨平台智能问答实现方法,首先构建智能问答的问答对 知识库 ,然后利用现代汉语语料库和面向对象课程的领域知识构建智能问答词典,并对知识库中的问题语句进行切分;之后构建基于多个双向Transformer 编码器 的BERT模型,利用现代汉语语料库对BERT模型进行预训练,得到语言模型M0;再利用问答对知识库中的问题语句构建语料样本集,微调BERT模型M0生成智能问答模型M1;最后利用智能问答模型M1计算提问语句与问答对知识库问题的语义相似度,并结合实际情况设计答案选择策略。本发明利用BERT模型高效的并行运算和准确的上下文信息分析和提取能 力 以及Web 框架 的平台无关特性,提高了智能问答模型的训练效率和分析 精度 以及跨平台能力。,下面是一种结合BERT的用于教学任务的跨平台智能问答实现方法专利的具体信息内容。
1.一种结合BERT的用于教学任务的跨平台智能问答实现方法,其特征在于:包括以下步骤:
步骤1:构建智能问答的问答对知识库:
将人工和信息分析脚本相结合生成问答对知识库,并基于应用情况实时更新问答对知识库;
步骤2:切分中文提问语句:
利用现代汉语语料库和面向对象课程的领域知识构建智能问答词典;根据建立的智能问答词典,采用双向最大匹配法对问答对知识库中的问题语句进行切分;
步骤3:构建基于多个双向Transformer编码器的BERT模型,利用现代汉语语料库对BERT模型进行预训练,得到语言模型M0;在语言模型M0的输出位置,添加一层连接网络W和一个softmax层,生成智能问答模型M1;其中连接网络W的输入为语言模型M0中特殊分类标记[CLS]对应的输出向量C,softmax层用于对网络W的输出进行语义相似度计算;采用问答对知识库中切分后的问题语句作为语料样本集,以智能问答模型M1的输出准确率最大化为目标函数,利用误差反向传播算法对智能问答模型M1进行调整,得到基于BERT的智能问答模型M1;
步骤4:接收实际的中文提问语句,采用双向最大匹配法对中文提问语句进行切分;将切分后的中文提问语句和问答对知识库中切分后的问题语句输入智能问答模型M1,分别计算中文提问语句与问答对知识库中各个问题语句的语义相似度,对各语义相似度计算结果进行排名;取其中语义相似度较高的前若干个问题语句的答案作为提问语句的预选答案。
2.根据权利要求1所述一种结合BERT的用于教学任务的跨平台智能问答实现方法,其特征在于:
步骤1中将人工和信息分析脚本相结合生成问答对知识库的具体过程为:
步骤1.1:收集面向对象课程的信息,包括专业术语、关键词和课程问题;以收集的信息为检索基础,通过信息分析脚本从网络上采集网页信息,对网页信息进行解析,获得原始文本信息;对原始文本信息进行噪音消除操作后从原始文本信息中提取文字,划分出问题和答案信息,生成初始问答对知识库;
步骤1.2:根据已收集到的问题人工生成衍生信息,包括新的专业术语、关键词以及衍生问题;以衍生信息作为检索基础,从网络上获得衍生文本信息,对衍生文本信息进行噪音消除操作后从衍生文本信息中提取文字,划分出问题和答案信息,补充到问答对知识库中;
步骤1.3:重复步骤1.2,直至问答对知识库规模达到设定阈值。
3.根据权利要求1所述一种结合BERT的用于教学任务的跨平台智能问答实现方法,其特征在于:
步骤1中基于应用情况实时更新问答对知识库的具体过程为:
在面向对象课程的教学过程中,当出现问题匹配程度低于设定的语义相似度阈值时,以出现的新问题或问题中的新关键词作为检索基础,从网络上获得对应问题的文本信息,对对应问题的文本信息进行噪音消除操作后从对应问题的文本信息中提取文字,划分出问题和答案信息,补充到问答对知识库中。
4.根据权利要求1所述一种结合BERT的用于教学任务的跨平台智能问答实现方法,其特征在于:
步骤4中设置知识库更新阈值S0和答案选择阈值S1,其中0≤S0≤0.5,0.5
若计算得到的语义相似度最大值大于S1,则将与提问语句语义相似度最高的问题语句对应的答案作为推荐答案;若计算得到的语义相似度最大值不大于S1,则将所有预选答案作为推荐答案。
5.根据权利要求1所述一种结合BERT的用于教学任务的跨平台智能问答实现方法,其特征在于:利用Web开发框架搭建跨平台系统,将步骤4得到的基于BERT的智能问答模型M1嵌入系统,构建跨平台智能问答系统。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种基于机器学习的井间连通性评价方法 | 2020-05-11 | 576 |
一种基于BP神经网络的过渡电阻预测方法 | 2020-05-11 | 880 |
一种降雨预测方法、系统及电子设备 | 2020-05-13 | 779 |
一种计及需求响应资源的新能源储能系统调度优化方法 | 2020-05-18 | 755 |
基于非均匀投影的三维模型检索 | 2020-05-15 | 174 |
基于EMD-CNN深度神经网络的光伏配电网电压预测方法 | 2020-05-16 | 752 |
基于多模态深度学习的Sn-Bi合金延伸率和抗拉强度的预测方法 | 2020-05-12 | 1010 |
基于局部动态能量函数FCN-CRF模型的生态变化监测方法 | 2020-05-12 | 517 |
胶凝砂砾石配合比关键指标预测抗压强度的BP神经网络分析方法 | 2020-05-11 | 764 |
基于长短时记忆网络的水泥成品比表面积预测方法及系统 | 2020-05-08 | 599 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。