专利汇可以提供一种多层次的文本情感特征提取方法和模型专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种多层次的文本情感特征提取方法和模型,将文本中的词进行实数化向量表示。通过利用word2vec工具训练出分布式词向量,在分布式词向量中增加词的情感信息和词性信息形成新的词向量,并引入Bi‑LSTM网络提取词的上下文信息,形成融合词的语义信息、情感信息、词性信息和上下文信息的 特征向量 ,将获得的特征向量输入到注意 力 机制中,通过训练注意力权重参数,自适应的选择出与当前输出相关的显著信息,累加求和生成句子向量,将句子向量并行的输入到CNN网络中,利用其高度位移不变性的优势,提取句子的结构信息。本发明实现了同时提取词序列和句子间信息,有效的减少文本信息的丢失,实现了多层次提取文本特征,提高了文本情感分类的准确率。,下面是一种多层次的文本情感特征提取方法和模型专利的具体信息内容。
1.一种多层次的文本情感特征提取方法,其特征在于包括如下步骤:
1)将经过预处理后的词序列表示为特征向量;
利用word2vec工具中的Skip-gram模型训练出包含词的语义信息的低维实数向量W;
利用词性标注工具标注词的词性信息
利用情感词典(5)标注词的情感倾向,并用0/1值抽象化表示为特征向量P;
2)将W和P进行拼接操作,形成包含词的语义信息、情感信息以及词性信息的词向量(8),
3)将该词向量(8)输入到Bi-LSTM网络中,提取词的上下文信息,从而使词序列层输出融合词的语义信息、情感信息、词性信息和上下文信息的特征向量;
4)将步骤3)获得的特征向量输入到注意力机制中,通过训练注意力权重参数,自适应的选择出与当前输出相关的显著信息,累加求和生成句子向量,将句子向量并行的输入到CNN网络中,利用其高度位移不变性的优势,提取句子的结构信息。
2.根据权利要求1所述的多层次的文本情感特征提取方法,其特征在于所述的词的词性信息包括否定词、动词、名词、形容词、转折词以及程度副词。
3.根据权利要求1所述的多层次的文本情感特征提取方法,其特征在于所述的预处理包括消除文本格式、分词处理和去噪声词。
4.一种多层次的文本情感特征提取模型,其特征在于包括词序列层(1)和句子结构层(2);
所述的词序列层(1)将经过预处理后的词序列表示为特征向量,利用word2vec工具(3)中的Skip-gram模型训练出包含词的语义信息的低维实数向量W(6);利用词性标注工具(4)标注词的词性信息,,同时利用情感词典(5)标注词的情感倾向,并用0/1值抽象化表示为P(7);将W(6)和P(7)进行拼接操作,形成包含词的语义信息、情感信息以及词性信息的词向量(8),将该词向量(8)输入到Bi-LSTM网络中,来提取词的上下文信息,从而使词序列层(1)输出融合词的语义信息、情感信息、词性信息和上下文信息的特征向量;
所述的句子结构层(2)在词序列层(1)的基础上提取句子间结构特征,实现多层次提取文本信息,句子结构层(2)将词序列层(1)的特征向量输入到注意力机制中,通过训练注意力权重参数,自适应的选择出与当前输出相关的显著信息,累加求和生成句子向量(9),将句子向量(9)并行的输入到CNN网络中,利用其高度位移不变性的优势,提取句子的结构信息。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
基于深度问答的答案检索方法及装置 | 2020-05-13 | 567 |
一种智能文本处理方法、装置、电子设备及存储介质 | 2020-05-11 | 5 |
一种针对电力巡检文本的错误识别方法 | 2020-05-11 | 765 |
一种处理文本的方法和装置 | 2020-05-12 | 181 |
一种电商产品竞争分析方法及系统 | 2020-05-14 | 221 |
基于物理距离和语义距离的双向LSTM模型的构建方法 | 2020-05-08 | 713 |
一种面向金融事件的混合型因果关系发现方法 | 2020-05-11 | 513 |
基于XML的领域要素提取配置语言系统 | 2020-05-08 | 55 |
一种公司形象提升系统的社交网络数据提取方法及系统 | 2020-05-11 | 985 |
一种基于大数据的国防科技热词发现方法及系统 | 2020-05-08 | 800 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。