专利汇可以提供一种混合长短期记忆网络和卷积神经网络的文本分类方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种混合长短期记忆网络和 卷积神经网络 的 文本分类 方法,通过充分结合双向长短期记忆网络在学习文本的上下文信息方面的优势以及卷积神经网络在学习文本局部特征方面的优势,利用双向长短期记忆网络学习词的上下文信息后,再通过卷积神经网络进一步学习提取上下文信息的词向量的局部特征,接着再利用双向长短期记忆网络学习这些局部特征的上下文,形成固定维度的输出,最后通过一个多层 感知 器进行分类输出。可以进一步提高模型分类的准确率,并具有较好的通用性,在测试的多个语料库上都取得了很好的效果。,下面是一种混合长短期记忆网络和卷积神经网络的文本分类方法专利的具体信息内容。
1.一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于,所述方法包括以下步骤:
步骤1、对文本中的句子进行预处理,结合训练语料集中句子的长度分布及均方差,确定句子的长度阈值后形成统一的句子长度,利用预训练好的词向量表获取输入文本中每一个词的向量化表示,形成连续和稠密的实数向量矩阵;
步骤2、对于输入的句子词向量,分别通过一个正向的LSTM网络学习各个词的上文信息和一个逆向的LSTM网络学习各个词的下文信息,并将学习的结果进行串联合并,从而将包含语义信息的句子词向量表示转化为同时包含语义及上下文信息的表示;
步骤3、使用多个不同宽度、包含不同权值的核矩阵分别对双向LSTM网络输出的词向量矩阵进行二维卷积运算,提取局部卷积特征,并生成多层局部卷积特征矩阵;
步骤4、使用一维最大值池化算法对多层局部卷积特征矩阵进行下采样,得到句子的多层全局特征矩阵,并将结果进行串联合并;
步骤5、使用两个相反方向的LSTM网络分别学习句子局部特征间的长期依赖关系,并将最后的学习结果进行输出;
步骤6、将步骤5的输出结果先通过一个全连接隐层,接着再经过一个softmax层对句子的类别进行预测。
2.根据权利要求1所述的一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于:所述一种混合长短期记忆网络和卷积神经网络的文本分类方法是在一个多层神经网络中完成的,所述步骤1在第一层输入层中完成,步骤2在第二层双向LSTM层中完成,步骤3在第三层CNN层中完成,步骤4在第四层池化层中完成,步骤5在第五层双向LSTM层中完成,步骤6在第六层输出层中完成。
3.根据权利要求2所述的一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于:所述第二层双向LSTM层用于学习原始输入句子中各个词的上下文信息,并且把每个词的学习结果进行串联后输出,所述第五层双向LSTM层学习卷积后句子特征间的上下文信息,并且只输出最后一步的学习结果。
4.根据权利要求1所述的一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于:步骤1中,所述对句子进行预处理包括标点符号过滤、缩写补齐、删除空格、对句子进行分词和非法字符过滤。
5.根据权利要求1所述的一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于:所述步骤3为局部特征学习过程,通过多个不同词步长的二维卷积窗口和卷积核对包含上下文信息的词向量进行学习,从而得到不同粒度的短语信息。
6.根据权利要求1所述的一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于:所述步骤4为采样和降维过程,通过一维最大值池化算法对多层局部卷积特征矩阵进行下采样,得到句子中每一个池化窗口内最重要的特征值,并作为局部窗口中的特征表示。
7.根据权利要求1所述的一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于:所述步骤5为局部特征的上下文学习,通过双向LSTM学习局部特征之间的上下文信息,并输出最后一个词向量的学习结果,同时形成固定维度的一维输出。
8.根据权利要求1所述的一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于:所述步骤6为分类输出,通过一个全连接的多层感知器进行分类判断,并根据指定分类体系上的概率分布情况得到最终的输出。
9.根据权利要求1所述的一种混合长短期记忆网络和卷积神经网络的文本分类方法,其特征在于:所述步骤6在一个多层感知器中完成,包括一个全连接隐层和一个softmax层,步骤6的输出结果为对应文本的预测类别。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种利用卷积多层注意力网络机制生成面向查询的视频摘要的方法 | 2020-05-13 | 356 |
自动自适应气候控制 | 2020-05-14 | 125 |
模块化神经网络的直接定位方法 | 2020-05-17 | 607 |
用于叠加的笔迹的识别技术的系统和方法 | 2020-05-16 | 311 |
一种基于特征选择和集成学习的软件缺陷个数预测方法 | 2020-05-18 | 531 |
一种基于三维空间时序建模的深度视频人体行为识别方法 | 2020-05-19 | 456 |
基于伪标签方法和弱监督学习的过程数据故障分类方法 | 2020-05-08 | 385 |
基于外部知识增强的机器阅读理解方法、系统、装置 | 2020-05-08 | 974 |
一种基于对抗生成网络的人脑效应连接识别方法 | 2020-05-16 | 365 |
一种深度递归心血管图像显示方法 | 2020-05-18 | 192 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。