首页 / 专利库 / 人工智能 / 情感极性 / 表情符与文本的情感交互机制表示与识别模型建立方法

表情符与文本的情感交互机制表示与识别模型建立方法

阅读:291发布:2020-05-15

专利汇可以提供表情符与文本的情感交互机制表示与识别模型建立方法专利检索,专利查询,专利分析的服务。并且本 发明 提供表情符与文本的情感交互机制表示与识别模型建立方法,属于 自然语言处理 与社会学技术领域。该表情符与文本的情感交互机制表示与识别模型建立方法包括如下步骤:S1:建立用以描述表情符与文本情感的交互机制表示的四元组结构;S2:建立用以将文本信息转换为四元组矩阵的转换模型;S3:建立基于 深度学习 的交互机制识别模型,通过表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题训练所述识别模型。本发明训练 精度 较高,使得识别模型正确率较高。,下面是表情符与文本的情感交互机制表示与识别模型建立方法专利的具体信息内容。

1.表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于,包括如下步骤:
S1:建立用以描述表情符与文本情感的交互机制表示的四元组结构,所述四元组结构为<表情符,交互类型,交互强度,交互文本>;
S2:建立用以将文本信息转换为四元组矩阵的转换模型,所述四元组矩阵内包括多个四元组结构,所述四元组矩阵分别表示表情符识别、交互文本识别、交互类型识别、交互强度检测四个计算问题;
S3:建立基于深度学习的交互机制识别模型,通过表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题训练所述识别模型。
2.如权利要求1所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于:所述转换模型的输入为文本信息 ,转换模型的输出为 ,其中
为一个四元组 ,其中 表示表情符, 表示交互类型, 表示交互
强度, 表示交互文本。
3.如权利要求1或2所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于:步骤S1中交互类型为五类,所述交互类型包括情感表达、矛盾表达、情感增强、情感减弱、无情感,情感表达:无情感的文本中加入表情符后,使得文本具有情感,矛盾表达:
有情感的文本在遇到表情符后其情感极性发生改变,如正向变为负性,负性变为正性,情感增强:有情感的文本在遇到表情符后其情感极性未发生改变,但情感强度增加,情感减弱:
有情感的文本在遇到表情符后其情感极性未发生改变,但情感强度减弱,无情感:表情符不影响文本的情感。
4.如权利要求1或2所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于:步骤S3中的识别模型包括输入层、特征抽取层、序列输出层、关系抽取层。
5.如权利要求4所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于,所述输入层具体包括:输入信息包括文本的每一个词 及表情符 每个元素,特征包括词、词性、情感及句法特征,每个特征采用嵌入表示,即每个特征采用实数低维向量表示,其中 。
6.如权利要求4所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于:所述特征抽取层采用双向长短记忆网络来学习社交媒体文本中间表示,对每一个LSTM单元由多个实向量组合而成,所述特征抽取层包括入向量 、忘记门向量 、输出门向量 、内存单元 和隐藏状态 ,其中 , 、
表示神经元的激活函数, 、 表示权重矩阵, 表示偏差向量,对于第一个门,其输入数据为 、输出为 ,在双向长短记忆网络中,其输出向量为 。
7.如权利要求4所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于:所述序列输出层包括检测表情符及其交互文本、标注表情符及其交互文本,标注类别分为三类:NOB、OB、S,其中NOB表示非交互文本,OB表示交互文本,S表示表情符,标注设置在序列输出层的顶层,标注包括两个神经网络层:隐藏层 和输出层 ,其中。
8.如权利要求4所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于,所述关系抽取层具体包括:根据得到的表情符 及其交互文本
判断其交互类型及交互强度,首先将交互文本压缩为与表情符同维度的文本向量,然后将文本向量输入隐藏层得到文本隐藏结果,最后将文本隐藏结果输入判断层得到输出结果,具体公式包括: ,其中式中 为压缩函数、 为表
情符与文本的交互函数。
9.如权利要求1或2所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于,模型训练具体包括:通过对表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题采用基于梯度下降的前向和后向传播算法训练所述识别模型进行,训练过程采用BPTT方法或者Adam梯度下降方法。
10.如权利要求1或2所述的表情符与文本的情感交互机制表示与识别模型建立方法,其特征在于:所述识别模型采用长短记忆网络进行学习序列标注,所述识别模型通过神经网络学习关系抽取。

说明书全文

表情符与文本的情感交互机制表示与识别模型建立方法

技术领域

[0001] 本发明属于自然语言处理与社会学技术领域,涉及表情符与文本的情感交互机制表示与识别模型建立方法。

背景技术

[0002] 社交媒体如论坛、微博、即时通信等已成为人们信息交流的重要方式之一。表情符广泛应用于这些社交媒体中,主要用于表达人们的情感。已有的研究显示,表情符对社媒信息的理解,特别是社媒信息的情感分析、信息消歧及网络舆情监控等方面起着重要的作用。因此表情符已成为社媒信息处理的一个重要研究对象。社会存在理论从基于认知的度认为表情符类似于人际交流中的非语言成份,它能与文本相互交互、相互作用,共同完成社媒的情感信息表达。表情符与文本的情感交互机制研究有助于从交互的、动态的、深层的角度理解和分析社交媒体语言。

发明内容

[0003] 本发明针对现有的技术存在的上述问题,提供表情符与文本的情感交互机制表示与识别模型建立方法,本发明所要解决的技术问题是:如何提供表情符与文本的情感交互机制表示与识别模型建立方法。
[0004] 本发明的目的可通过下列技术方案来实现:表情符与文本的情感交互机制表示与识别模型建立方法,包括如下步骤:
S1:建立用以描述表情符与文本情感的交互机制表示的四元组结构,所述四元组结构为<表情符,交互类型,交互强度,交互文本>;
S2:建立用以将文本信息转换为四元组矩阵的转换模型,所述四元组矩阵内包括多个四元组结构,所述四元组矩阵分别表示表情符识别、交互文本识别、交互类型识别、交互强度检测四个计算问题;
S3:建立基于深度学习的交互机制识别模型,通过表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题训练所述识别模型。
[0005] 优选的,所述转换模型的输入为文本信息 ,转换模型的输出为 ,其中 为一个四元组 ,其中 表示表情符, 表示交互类型, 表示交互强度, 表示交互文本。
[0006] 优选的,步骤S1中交互类型为五类,所述交互类型包括情感表达、矛盾表达、情感增强、情感减弱、无情感,情感表达:无情感的文本中加入表情符后,使得文本具有情感,矛盾表达:有情感的文本在遇到表情符后其情感极性发生改变,如正向变为负性,负性变为正性,情感增强:有情感的文本在遇到表情符后其情感极性未发生改变,但情感强度增加,情感减弱:有情感的文本在遇到表情符后其情感极性未发生改变,但情感强度减弱,无情感:表情符不影响文本的情感。
[0007] 优选的,步骤S3中的识别模型包括输入层、特征抽取层、序列输出层、关系抽取层。
[0008] 优选的,所述输入层具体包括:输入信息包括文本的每一个词 及表情符 每个元素,特征包括词、词性、情感及句法特征,每个特征采用嵌入表示,即每个特征采用实数低维向量表示,其中 。
[0009] 优选的,所述特征抽取层采用双向长短记忆网络来学习社交媒体文本中间表示,对每一个LSTM单元由多个实向量组合而成,所述特征抽取层包括入向量 、忘记门向量、输出门向量 、内存单元 和隐藏状态 ,其中 ,、 表示神经元的激活函数, 、 表示权重矩阵, 表示偏差向量,对于第一个门,其输入数据为 、输出为 ,在双向长短记忆网络中,其输出向量为 。
[0010] 优选的,所述序列输出层包括检测表情符及其交互文本、标注表情符及其交互文本,标注类别分为三类:NOB、OB、S,其中NOB表示非交互文本,OB表示交互文本,S表示表情符,标注设置在序列输出层的顶层,标注包括两个神经网络层:隐藏层 和输出层 ,其中 。
[0011] 优选的,所述关系抽取层具体包括:根据得到的表情符 及其交互文本判断其交互类型及交互强度,首先将交互文本压缩为与表情符同维度的文本向量,然后将文本向量输入隐藏层得到文本隐藏结果,最后将文本隐藏结果输入判断层得到输出结果,具体公式包括: ,其中式
中 为压缩函数、 为表情符与文本的交互函数。
[0012] 优选的,模型训练具体包括:通过对表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题采用基于梯度下降的前向和后向传播算法训练所述识别模型进行,训练过程采用BPTT方法或者Adam梯度下降方法。
[0013] 优选的,所述识别模型采用长短记忆网络进行学习序列标注,所述识别模型通过神经网络学习关系抽取。
[0014] 本发明中首先建立用以描述表情符与文本情感的交互机制表示的四元组结构,四元组结构为<表情符,交互类型,交互强度,交互文本>,然后建立用以将文本信息转换为四元组矩阵的转换模型,四元组矩阵内包括多个四元组结构,四元组矩阵分别表示表情符识别、交互文本识别、交互类型识别、交互强度检测四个计算问题,便于进行分类文本信息,最后建立基于深度学习的交互机制识别模型,通过表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题训练识别模型,训练精度较高,使得识别模型正确率较高。附图说明
[0015] 图1是本发明的流程示意图;图2是本发明中的识别模型的流程示意图;
图3是本发明中的一个例子的示意图。

具体实施方式

[0016] 以下是本发明的具体实施例并结合附图,对本发明的技术方案作进一步的描述,但本发明并不限于这些实施例。
[0017] 请参阅图1、图2和图3,本实施例中的表情符与文本的情感交互机制表示与识别模型建立方法,包括如下步骤:S1:建立用以描述表情符与文本情感的交互机制表示的四元组结构,四元组结构为<表情符,交互类型,交互强度,交互文本>;
S2:建立用以将文本信息转换为四元组矩阵的转换模型,四元组矩阵内包括多个四元组结构,四元组矩阵分别表示表情符识别、交互文本识别、交互类型识别、交互强度检测四个计算问题;
S3:建立基于深度学习的交互机制识别模型,通过表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题训练识别模型。
[0018] 此处,首先建立用以描述表情符与文本情感的交互机制表示的四元组结构,四元组结构为<表情符,交互类型,交互强度,交互文本>,然后建立用以将文本信息转换为四元组矩阵的转换模型,四元组矩阵内包括多个四元组结构,四元组矩阵分别表示表情符识别、交互文本识别、交互类型识别、交互强度检测四个计算问题,便于进行分类文本信息,最后建立基于深度学习的交互机制识别模型,通过表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题训练识别模型,训练精度较高,使得识别模型正确率较高。
[0019] 给定一个社交媒体文本信息(例如一个微博、一段即时通话内容等),转换模型要自动分析出交互机制。即要识别出表情符及其交互文本,判定两者的交互类型及交互强度。转换模型的输入可以为文本信息 ,转换模型的输出为 ,其中 为一个
四元组 ,其中 表示表情符, 表示交互类型, 表示交互强度,
表示交互文本。因此交互机制可划分四个子计算问题:(1)表情符识别,(1)交互文本识别,(3)交互类型识别,及(4)交互强度检测显然四个子问题是相互依存的,表情符、交互文本的识别影响交互关系及交互强度的结果,反过来,交互关系的判断也可以修正交互文本的识别。
[0020] 步骤S1中从认知的角度分析提出了表情符与文本的交互类别,交互类型为五类,交互类型包括情感表达、矛盾表达、情感增强、情感减弱、无情感,情感表达:无情感的文本中加入表情符后,使得文本具有情感,矛盾表达:有情感的文本在遇到表情符后其情感极性发生改变,如正向变为负性,负性变为正性,情感增强:有情感的文本在遇到表情符后其情感极性未发生改变,但情感强度增加,情感减弱:有情感的文本在遇到表情符后其情感极性未发生改变,但情感强度减弱,无情感:表情符不影响文本的情感。
[0021] 步骤S3中的识别模型包括输入层、特征抽取层、序列输出层、关系抽取层。
[0022] 输入层具体可以包括:输入信息包括文本的每一个词 及表情符 每个元素,特征包括词、词性、情感及句法特征,每个特征采用嵌入表示,即每个特征采用实数低维向量表示,其中 。
[0023] 特征抽取层可以采用双向长短记忆网络(LSTM)来学习社交媒体文本中间表示,对每一个LSTM单元由多个实向量组合而成,特征抽取层包括入门向量 、忘记门向量 、输出门向量 、内存单元 和隐藏状态 ,其中 ,、 表示神经元的激活函数, 、 表示权重矩阵, 表示偏差向量,对于第一个门,其输入数据为 、输出为 ,在双向长短记忆网络(Bi-LSTM网络)中,其输出向量为。
[0024] 序列输出层可以包括检测表情符及其交互文本、标注表情符及其交互文本,标注类别分为三类:NOB、OB、S,其中NOB表示非交互文本,OB表示交互文本,S表示表情符,标注设置在序列输出层的顶层,标注包括两个神经网络(NN)层:隐藏层 和输出层 ,其中。
[0025] 关系抽取层具体可以包括:根据得到的表情符 及其交互文本判断其交互类型及交互强度,首先将交互文本压缩为与表情符同维度的文本向量,然后将文本向量输入隐藏层得到文本隐藏结果,最后将文本隐藏结果输入判断层得到输出结果,具体公式包括: ,其中式中 为压缩函数、 为表
情符与文本的交互函数。
[0026] 模型训练可以具体包括:通过对表情符识别计算问题、交互文本识别计算问题、交互类型识别计算问题、交互强度检测计算问题采用基于梯度下降的前向和后向传播算法训练识别模型进行,训练过程采用BPTT(随时间反向传播算法)方法或者Adam(自适应时刻估计方法)梯度下降方法。
[0027] 识别模型训练算法过程如下:从未标注语料中训练单词及表情符表示
While (满足收敛条件)
  For 每一批处理数据
      1)Bi-LSTM 前向传播
         LSTM左-右前向传播
         LSTM右-左前向传播
       2)Relation-NN前向传播
3)误差计算
5)relation-NN后向传播
       6)Bi-LSTM 后向传播
         LSTM右-左后向传播
 LSTM左-右后向传播
       7)参数更新
  EndFor
ENDWhile。
[0028] 识别模型采用长短记忆网络进行学习序列标注,识别模型通过神经网络学习关系抽取。
[0029] 为了测试识别模型,可以采用以下方法进行评估:评估分析
本项目的评估主要包括二类:单项评估及交互结构评估。
[0030] 单项评估:分别对每个子任务评估包括表情符与交互文本识别,交互类型与交互强度检测。主要评估指标包括精度、召回率及F1值。精确率(Precision)为TP/(TP+FP),即实际是正类并且被预测为正类的样本占所有预测为正类的比例,精确率更为关注将负样本错分为正样本(FP)的情况。召回率(Recall)为TP/(TP+FN),即实际是正类并且被预测为正类的样本占所有实际为正类样本的比例,召回率更为关注将正样本分类为负样本(FN)的情况。F1值是精确率和召回率的调和均值,即F1=2PR/(P+R) (P代表精确率,R代表召回率),相当于精确率和召回率的综合评价指标。
[0031] 交互结构评估:对整个交互机制表示结果进行评估。主要评估指标包括精度、召回率及F1值。
[0032] 分析:比较分析识别模型与管道线模型的性能差异,模型的健壮性分析等。
[0033] 本文中所描述的具体实施例仅仅是对本发明精神作举例说明。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,但并不会偏离本发明的精神或者超越所附权利要求书所定义的范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈