首页 / 专利库 / 电脑图像 / 抽取 / 事件确认方法、装置及电子设备

事件确认方法、装置及电子设备

阅读:699发布:2020-05-08

专利汇可以提供事件确认方法、装置及电子设备专利检索,专利查询,专利分析的服务。并且本 申请 公开了事件确认方法和装置,事件类型 预测模型 构建方法和装置,以及 电子 设备。事件确认方法包括:获取文章中的待检测词、及与待检测词对应的句子 片段 ;将文章相关的词向量、句子片段相关的词向量和句子片段中的词的词 位置 向量作为事件类型预测模型的输入数据,通过文章级事件特征 抽取 子网络,根据文章相关的词向量抽取文章级事件特征,并通过上下文级事件特征抽取子网络,根据句子片段相关的词向量和词位置向量抽取上下文级事件特征;通过事件类型预测子网络,根据文章级及上下文级事件特征,预测待检测词的事件类型。采用这种处理方式,使得结合待检测词所在文章的信息和周边文本的信息进行事件识别;因此,可以有效提升事件识别的准确度。,下面是事件确认方法、装置及电子设备专利的具体信息内容。

1.一种事件确认方法,其特征在于,包括:
获取文章中的待检测词;以及,获取与所述待检测词对应的句子片段
对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
将所述第一词向量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;
通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量抽取上下文级事件特征;
通过所述事件类型预测子网络,至少根据所述文章级事件特征和所述上下文级事件特征,获取与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
2.根据权利要求1所述的方法,其特征在于,还包括:
获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型,作为相邻词的事件类型;
对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;
所述通过所述事件类型预测子网络,并至少根据所述文章级事件特征和所述上下文级事件特征,并获取所述待检测词对应的事件类型的预测值,包括:
通过所述事件类型预测子网络,根据所述文章级事件特征、所述上下文级事件特征和所述事件类型向量,获取所述预测值。
3.根据权利要求1所述的方法,其特征在于,
所述文章级事件特征抽取子网络包括:句子级事件特征确定子网络,段落级事件类型特征确定子网络,文章级事件特征确定子网络;
所述通过所述文章级事件特征抽取子网络,并根据所述第一词向量抽取文章级事件特征,包括:
通过所述句子级事件特征确定子网络,根据所述第一词向量,获取所述文章包括的句子对应的句子级事件特征;
通过所述段落级事件类型特征确定子网络,根据所述文章包括的句子对应的句子级事件特征,获取所述文章包括的段落对应的段落级事件类型特征;
通过所述文章级事件特征确定子网络,根据所述段落级事件类型特征,获取所述文章级事件特征。
4.根据权利要求3所述的方法,其特征在于,
所述句子级事件特征确定子网络的网络结构包括双向长短期记忆网络结构Bi-LSTM;
所述通过所述句子级事件特征确定子网络,根据所述第一词向量,获取所述文章包括的句子对应的句子级事件特征,包括:
将所述句子相关的第一词向量的正向序列作为第一LSTM的输入数据,通过所述第一LSTM获取所述句子的正向句子级事件特征;以及,将所述句子相关的第一词向量的反向序列作为第二LSTM的输入数据,通过所述第二LSTM获取所述句子的反向句子级事件特征;
根据所述正向句子级事件特征和所述反向句子级事件特征,获取所述文章包括的句子对应的句子级事件特征。
5.根据权利要求4所述的方法,其特征在于,
所述句子级事件特征确定子网络的网络结构还包括注意层;
所述根据所述正向句子级事件特征和所述反向句子级事件特征,获取所述文章包括的句子对应的句子级事件特征,包括:
通过所述注意力层,根据所述正向句子级事件特征和所述反向句子级事件特征,获取所述文章包括的句子对应的句子级事件特征。
6.根据权利要求1所述的方法,其特征在于,所述上下文级事件特征抽取子网络基于卷积神经网络结构。
7.根据权利要求1所述的方法,其特征在于,还包括:
从训练样本集中学习得到所述事件类型预测模型;
其中,所述训练样本包括训练用待检测词对应的文章、句子片段、所述句子片段中的词对应的词位置信息与事件类型之间的对应关系。
8.根据权利要求7所述的方法,其特征在于,还包括:
获取在所述训练用待检测词之前或之后出现的至少一个词分别对应的事件类型,作为训练用相邻词的事件类型;
所述从训练样本集中学习得到所述事件类型预测子网络,包括:
根据所述训练样本集和所述训练用待检测词对应的所述训练用相邻词的事件类型,学习得到所述事件类型预测模型。
9.一种事件确认方法,其特征在于,包括:
获取文章中的待检测词;以及,获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第一相邻词的事件类型;以及,获取在所述待检测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词的事件类型;以及,获取与所述待检测词对应的句子片段;
对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词向量;以及,对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
将所述第一词向量、所述第一事件类型向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;
通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量抽取上下文级事件特征;
通过所述第一事件类型预测子网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;以及,通过所述第二事件类型预测子网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;
通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
10.一种事件确认方法,其特征在于,包括:
获取文章中的待检测词;以及,获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第一相邻词的事件类型;以及,获取在所述待检测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词的事件类型;以及,获取与所述待检测词对应的句子片段;
对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;
通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征;
通过所述第一事件类型预测子网络,至少根据所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对应各种事件类型的第一概率;以及,通过所述第二事件类型预测子网络,至少根据所述上下文级事件特征和所述第二事件类型向量,获取所述待检测词对应各种事件类型的第二概率;
通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
11.一种事件确认方法,其特征在于,包括:
获取文章中的待检测词;以及,获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型,作为相邻词的事件类型;以及,获取与所述待检测词对应的句子片段;
对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
将所述事件类型向量、所述词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子网络和事件类型预测子网络;
通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征;
通过所述事件类型预测子网络,至少根据所述上下文级事件特征和所述事件类型向量,获取与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
12.一种事件类型预测模型构建方法,其特征在于,包括:
获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息与事件类型之间的对应关系;
根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述文章级事件特征和所述上下文级事件特征,获取所述待检测词的事件类型的预测值;
对所述文章执行词向量嵌入,得到所述第一词向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
将所述第一词向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
13.根据权利要求12所述的方法,其特征在于,还包括:
获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型,作为相邻词的事件类型;
对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;
所述事件类型预测子网络,具体用于根据所述文章级事件特征、所述上下文级事件特征和所述事件类型向量,获取所述预测值;
所述深度神经网络的输入数据还包括所述事件类型向量。
14.一种事件类型预测模型构建方法,其特征在于,包括:
获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后出现的至少一个词;
根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词的事件类型的预测值;
对所述文章执行词向量嵌入,得到所述第一词向量;以及,对所述第一相邻词的事件类型执行事件类型向量嵌入,得到所述第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到所述第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
将所述第一词向量、所述第一事件类型向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
15.一种事件类型预测模型构建方法,其特征在于,包括:
获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后出现的至少一个词;
根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络,用于根据所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词的事件类型的预测值;
对所述第一相邻词的事件类型执行事件类型向量嵌入,得到所述第一事件类型向量;
以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到所述第二事件类型向量;
以及,对所述句子片段执行词向量嵌入,得到所述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
16.一种事件类型预测模型构建方法,其特征在于,包括:
获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述相邻词包括在所述待检测词之前或之后出现的至少一个词;
根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括上下文级事件特征抽取子网络和事件类型预测子网络;所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述上下文级事件特征和所述相邻词的事件类型对应的事件类型向量,获取所述待检测词的事件类型的预测值;
对所述相邻词的事件类型执行事件类型向量嵌入,得到所述事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
将所述事件类型向量、所述词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
17.一种事件确认装置,其特征在于,包括:
待检测词获取单元,用于获取文章中的待检测词;
句子片段获取单元,用于获取与所述待检测词对应的句子片段;
第一词嵌入单元,用于对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词向量;
第二词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量,作为第二词向量;
词位置向量嵌入单元,用于对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
模型输入单元,用于将所述第一词向量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;
第一特征抽取单元,用于通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征;
第二特征抽取单元,用于通过所述上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量抽取上下文级事件特征;
事件类型预测单元,用于通过所述事件类型预测子网络,至少根据所述文章级事件特征和所述上下文级事件特征,获取与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
18.一种事件确认装置,其特征在于,包括:
待检测词获取单元,用于获取文章中的待检测词;
句子片段获取单元,用于获取与所述待检测词对应的句子片段;
第一事件类型获取单元,用于获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第一相邻词的事件类型;
第二事件类型获取单元,用于获取在所述待检测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词的事件类型;
第一词嵌入单元,用于对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词向量;
第二词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量,作为第二词向量;
词位置向量嵌入单元,用于对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
第一事件类型向量嵌入单元,用于对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第一事件类型向量;
第二事件类型向量嵌入单元,用于对所述第二相邻词的事件类型执行事件类型向量嵌入,得到第二事件类型向量;
模型输入单元,用于将所述第一词向量、所述第一事件类型向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;
第一特征抽取单元,用于通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征;
第二特征抽取单元,用于通过所述上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量抽取上下文级事件特征;
第一事件类型预测单元,用于通过所述第一事件类型预测子网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;
第二事件类型预测单元,用于通过所述第二事件类型预测子网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;
事件类型确定单元,用于通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
19.一种事件确认装置,其特征在于,包括:
待检测词获取单元,用于获取文章中的待检测词;
句子片段获取单元,用于获取与所述待检测词对应的句子片段;
第一事件类型获取单元,用于获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第一相邻词的事件类型;
第二事件类型获取单元,用于获取在所述待检测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词的事件类型;
第一事件类型向量嵌入单元,用于对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第一事件类型向量;
第二事件类型向量嵌入单元,用于对所述第二相邻词的事件类型执行事件类型向量嵌入,得到第二事件类型向量;
词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量;
词位置向量嵌入单元,用于对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
模型输入单元,用于将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;
特征抽取单元,用于通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征;
第一事件类型预测单元,用于通过所述第一事件类型预测子网络,至少根据所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对应各种事件类型的第一概率;
第二事件类型预测单元,用于通过所述第二事件类型预测子网络,至少根据所述上下文级事件特征和所述第二事件类型向量,获取所述待检测词对应各种事件类型的第二概率;
事件类型确定单元,用于通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
20.一种事件确认装置,其特征在于,包括:
待检测词获取单元,用于获取文章中的待检测词;
句子片段获取单元,用于获取与所述待检测词对应的句子片段;
事件类型获取单元,用于获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型,作为相邻词的事件类型;
事件类型向量嵌入单元,用于对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;
词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量;
词位置向量嵌入单元,用于对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
模型输入单元,用于将所述事件类型向量、所述词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子网络和事件类型预测子网络;
特征抽取单元,用于通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征;
事件类型预测单元,用于通过所述事件类型预测子网络,至少根据所述上下文级事件特征和所述事件类型向量,获取与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
21.一种事件类型预测模型构建装置,其特征在于,包括:
训练样本获取单元,用于获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息与事件类型之间的对应关系;
网络构建单元,用于根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述文章级事件特征和所述上下文级事件特征,获取所述待检测词的事件类型的预测值;
第一词嵌入单元,用于对所述文章执行词向量嵌入,得到所述第一词向量;
第二词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述第二词向量;
词位置向量嵌入单元,用于对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
模型训练单元,用于将所述第一词向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
22.一种事件类型预测模型构建装置,其特征在于,包括:
训练样本获取单元,用于获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后出现的至少一个词;
网络构建单元,用于根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词的事件类型的预测值;
第一词嵌入单元,用于对所述文章执行词向量嵌入,得到所述第一词向量;
第一事件类型向量嵌入单元,用于对所述第一相邻词的事件类型执行事件类型向量嵌入,得到所述第一事件类型向量;
第二事件类型向量嵌入单元,用于对所述第二相邻词的事件类型执行事件类型向量嵌入,得到所述第二事件类型向量;
第二词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述第二词向量;
词位置向量嵌入单元,用于对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
模型训练单元,用于将所述第一词向量、所述第一事件类型向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
23.一种事件类型预测模型构建装置,其特征在于,包括:
训练样本获取单元,用于获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后出现的至少一个词;
网络构建单元,用于根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络,用于根据所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词的事件类型的预测值;
第一事件类型向量嵌入单元,用于对所述第一相邻词的事件类型执行事件类型向量嵌入,得到所述第一事件类型向量;
第二事件类型向量嵌入单元,用于对所述第二相邻词的事件类型执行事件类型向量嵌入,得到所述第二事件类型向量;
词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述词向量;
词位置向量嵌入单元,用于对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
模型训练单元,用于将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
24.一种事件类型预测模型构建装置,其特征在于,包括:
训练样本获取单元,用于获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述相邻词包括在所述待检测词之前或之后出现的至少一个词;
网络构建单元,用于根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括上下文级事件特征抽取子网络和事件类型预测子网络;所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述上下文级事件特征和所述相邻词的事件类型对应的事件类型向量,获取所述待检测词的事件类型的预测值;
事件类型向量嵌入单元,用于对所述相邻词的事件类型执行事件类型向量嵌入,得到所述事件类型向量;
词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述词向量;
词位置向量嵌入单元,用于对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
模型训练单元,用于将所述事件类型向量、所述词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
25.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以及,获取与所述待检测词对应的句子片段;对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;将所述第一词向量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量抽取上下文级事件特征;通过所述事件类型预测子网络,至少根据所述文章级事件特征和所述上下文级事件特征,获取与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
26.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以及,获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第一相邻词的事件类型;以及,获取在所述待检测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词的事件类型;以及,获取与所述待检测词对应的句子片段;对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词向量;以及,对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;将所述第一词向量、所述第一事件类型向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量抽取上下文级事件特征;通过所述第一事件类型预测子网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;以及,通过所述第二事件类型预测子网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
27.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以及,获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第一相邻词的事件类型;以及,获取在所述待检测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词的事件类型;以及,获取与所述待检测词对应的句子片段;对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征;通过所述第一事件类型预测子网络,至少根据所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对应各种事件类型的第一概率;以及,通过所述第二事件类型预测子网络,至少根据所述上下文级事件特征和所述第二事件类型向量,获取所述待检测词对应各种事件类型的第二概率;通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
28.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以及,获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型,作为相邻词的事件类型;以及,获取与所述待检测词对应的句子片段;对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;将所述事件类型向量、所述词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子网络和事件类型预测子网络;通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征;通过所述事件类型预测子网络,至少根据所述上下文级事件特征和所述事件类型向量,获取与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件类型。
29.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤:获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息与事件类型之间的对应关系;根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述文章级事件特征和所述上下文级事件特征,获取所述待检测词的事件类型的预测值;对所述文章执行词向量嵌入,得到所述第一词向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;将所述第一词向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
30.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤:获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后出现的至少一个词;根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词的事件类型的预测值;对所述文章执行词向量嵌入,得到所述第一词向量;以及,对所述第一相邻词的事件类型执行事件类型向量嵌入,得到所述第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到所述第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;将所述第一词向量、所述第一事件类型向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
31.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤:获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后出现的至少一个词;根据多个待预测事件类型,构建深度神经网络;
其中,所述深度神经网络包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络,用于根据所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;
所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词的事件类型的预测值;对所述第一相邻词的事件类型执行事件类型向量嵌入,得到所述第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到所述第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
32.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤:获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述相邻词包括在所述待检测词之前或之后出现的至少一个词;根据多个待预测事件类型,构建深度神经网络;
其中,所述深度神经网络包括上下文级事件特征抽取子网络和事件类型预测子网络;所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述上下文级事件特征和所述相邻词的事件类型对应的事件类型向量,获取所述待检测词的事件类型的预测值;对所述相邻词的事件类型执行事件类型向量嵌入,得到所述事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;将所述事件类型向量、所述词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。

说明书全文

事件确认方法、装置及电子设备

技术领域

[0001] 本申请涉及自然语言处理技术领域,具体涉及事件确认方法和装置,事件 类型预测模型构建方法和装置,以及电子设备。

背景技术

[0002] 事件提取(event extraction)技术是自然语言领域的一个研究热点, 通过该项技术可实现自动从文章中检测出预先设定的事件。
[0003] 一种典型的事件确认方法的处理过程如下所述。首先,获取已标注事件类 型的文本数据,作为训练数据;然后,通过机器学习算法从训练数据中学习得 到事件类型预测模型;最后,将待检测文本作为事件类型预测模型的输入数据, 通过该模型自动识别出文本包括的事件。
[0004] 然而,在实现本发明过程中,发明人发现现有技术方案至少存在如下问题: 由于只是简单地从待检测词周边有限的文本范围内提取信息,而忽略了整篇文 章的信息,因此导致事件识别的准确度较低。

发明内容

[0005] 本申请提供事件确认方法,以解决现有技术存在的事件识别准确度低的问 题。本申请另外提供事件确认装置,事件类型预测模型构建方法和装置,以及 电子设备。
[0006] 本申请提供一种事件确认方法,包括:
[0007] 获取文章中的待检测词;以及,获取与所述待检测词对应的句子片段
[0008] 对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词向 量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量, 作为第二词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置 向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0009] 将所述第一词向量、所述第二词向量和所述词位置向量作为事件类型预测 模型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上 下文级事件特征抽取子网络和事件类型预测子网络;
[0010] 通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事 件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词向量和所 述词位置向量抽取上下文级事件特征;
[0011] 通过所述事件类型预测子网络,至少根据所述文章级事件特征和所述上下 文级事件特征,获取与所述待检测词对应的事件类型的预测值,作为所述文章 包括的事件类型。
[0012] 可选的,还包括:
[0013] 获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型, 作为相邻词的事件类型;
[0014] 对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;
[0015] 所述通过所述事件类型预测子网络,并至少根据所述文章级事件特征和所 述上下文级事件特征,并获取所述待检测词对应的事件类型的预测值,包括:
[0016] 通过所述事件类型预测子网络,根据所述文章级事件特征、所述上下文级 事件特征和所述事件类型向量,获取所述预测值。
[0017] 可选的,所述文章级事件特征抽取子网络包括:句子级事件特征确定子网 络,段落级事件类型特征确定子网络,文章级事件特征确定子网络;
[0018] 所述通过所述文章级事件特征抽取子网络,并根据所述第一词向量抽取文 章级事件特征,包括:
[0019] 通过所述句子级事件特征确定子网络,根据所述第一词向量,获取所述文 章包括的句子对应的句子级事件特征;
[0020] 通过所述段落级事件类型特征确定子网络,根据所述文章包括的句子对应 的句子级事件特征,获取所述文章包括的段落对应的段落级事件类型特征;
[0021] 通过所述文章级事件特征确定子网络,根据所述段落级事件类型特征,获 取所述文章级事件特征。
[0022] 可选的,所述句子级事件特征确定子网络的网络结构包括双向长短期记忆 网络结构Bi-LSTM;
[0023] 所述通过所述句子级事件特征确定子网络,根据所述第一词向量,获取所 述文章包括的句子对应的句子级事件特征,包括:
[0024] 将所述句子相关的第一词向量的正向序列作为第一LSTM的输入数据,通过 所述第一LSTM获取所述句子的正向句子级事件特征;以及,将所述句子相关的 第一词向量的反向序列作为第二LSTM的输入数据,通过所述第二LSTM获取所 述句子的反向句子级事件特征;
[0025] 根据所述正向句子级事件特征和所述反向句子级事件特征,获取所述文章 包括的句子对应的句子级事件特征。
[0026] 可选的,所述句子级事件特征确定子网络的网络结构还包括注意层;
[0027] 所述根据所述正向句子级事件特征和所述反向句子级事件特征,获取所述 文章包括的句子对应的句子级事件特征,包括:
[0028] 通过所述注意力层,根据所述正向句子级事件特征和所述反向句子级事件 特征,获取所述文章包括的句子对应的句子级事件特征。
[0029] 可选的,所述上下文级事件特征抽取子网络基于卷积神经网络结构。
[0030] 可选的,还包括:
[0031] 从训练样本集中学习得到所述事件类型预测模型;
[0032] 其中,所述训练样本包括训练用待检测词对应的文章、句子片段、所述句 子片段中的词对应的词位置信息与事件类型之间的对应关系。
[0033] 可选的,还包括:
[0034] 获取在所述训练用待检测词之前或之后出现的至少一个词分别对应的事件 类型,作为训练用相邻词的事件类型;
[0035] 所述从训练样本集中学习得到所述事件类型预测子网络,包括:
[0036] 根据所述训练样本集和所述训练用待检测词对应的所述训练用相邻词的事 件类型,学习得到所述事件类型预测模型。
[0037] 本申请还提供一种事件确认方法,包括:
[0038] 获取文章中的待检测词;以及,获取在所述待检测词之前出现的至少一个 词分别对应的事件类型,作为第一相邻词的事件类型;以及,获取在所述待检 测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词的事件类型; 以及,获取与所述待检测词对应的句子片段;
[0039] 对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词向 量;以及,对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第一事 件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得 到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子 片段相关的词向量,作为第二词向量;以及,对所述句子片段中的词对应的词 位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0040] 将所述第一词向量、所述第一事件类型向量、所述第二事件类型向量、所 述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件 类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络、 第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预测子网 络;
[0041] 通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事 件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词向量和所 述词位置向量抽取上下文级事件特征;
[0042] 通过所述第一事件类型预测子网络,至少根据所述文章级事件特征、所述 上下文级事件特征和所述第一事件类型向量,获取所述待检测词对应的各种事 件类型的第一概率;以及,通过所述第二事件类型预测子网络,至少根据所述 文章级事件特征、所述上下文级事件特征和所述第二事件类型向量,获取所述 待检测词对应的各种事件类型的第二概率;
[0043] 通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第二概 率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件 类型。
[0044] 本申请还提供一种事件确认方法,包括:
[0045] 获取文章中的待检测词;以及,获取在所述待检测词之前出现的至少一个 词分别对应的事件类型,作为第一相邻词的事件类型;以及,获取在所述待检 测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词的事件类型; 以及,获取与所述待检测词对应的句子片段;
[0046] 对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第一事件类型 向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到第二 事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相 关的词向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量 嵌入,得到所述句子片段中的词对应的词位置向量;
[0047] 将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词 位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下 文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网 络和第三事件类型预测子网络;
[0048] 通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词对应的 所述词向量和所述词位置向量抽取上下文级事件特征;
[0049] 通过所述第一事件类型预测子网络,至少根据所述上下文级事件特征和所 述第一事件类型向量,获取所述待检测词对应各种事件类型的第一概率;以及, 通过所述第二事件类型预测子网络,至少根据所述上下文级事件特征和所述第 二事件类型向量,获取所述待检测词对应各种事件类型的第二概率;
[0050] 通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第二概 率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的事件 类型。
[0051] 本申请还提供一种事件确认方法,包括:
[0052] 获取文章中的待检测词;以及,获取在所述待检测词之前或之后出现的至 少一个词分别对应的事件类型,作为相邻词的事件类型;以及,获取与所述待 检测词对应的句子片段;
[0053] 对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;以 及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量;以及, 对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子 片段中的词对应的词位置向量;
[0054] 将所述事件类型向量、所述词向量和所述词位置向量作为事件类型预测模 型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子网络和事 件类型预测子网络;
[0055] 通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词对应的 所述词向量和所述词位置向量抽取上下文级事件特征;
[0056] 通过所述事件类型预测子网络,至少根据所述上下文级事件特征和所述事 件类型向量,获取与所述待检测词对应的事件类型的预测值,作为所述文章包 括的事件类型。
[0057] 本申请还提供一种事件类型预测模型构建方法,包括:
[0058] 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、 句子片段、所述句子片段中的词的词位置信息与事件类型之间的对应关系;
[0059] 根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络 包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预 测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词 向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子 片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件 特征;所述事件类型预测子网络,用于根据所述文章级事件特征和所述上下文 级事件特征,获取所述待检测词的事件类型的预测值;
[0060] 对所述文章执行词向量嵌入,得到所述第一词向量;以及,对所述句子片 段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信息执行词位 置向量嵌入,得到所述词位置向量;
[0061] 将所述第一词向量、所述第二词向量和所述词位置向量作为所述深度神经 网络的输入数据,将所述事件类型作为所述深度神经网络的输出数据,根据所 述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
[0062] 可选的,还包括:
[0063] 获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型, 作为相邻词的事件类型;
[0064] 对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;
[0065] 所述事件类型预测子网络,具体用于根据所述文章级事件特征、所述上下 文级事件特征和所述事件类型向量,获取所述预测值;
[0066] 所述深度神经网络的输入数据还包括所述事件类型向量。
[0067] 本申请还提供一种事件类型预测模型构建方法,包括:
[0068] 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、 句子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二 相邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻 词包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待 检测词之后出现的至少一个词;
[0069] 根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络 包括文章级事件特征抽取子网络、上下文级事件特征抽取子网络、第一事件类 型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述文 章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文章级事 件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的第二词 向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述第一事 件类型预测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和 所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待检测词对应 的各种事件类型的第一概率;所述第二事件类型预测子网络,用于根据所述文 章级事件特征、所述上下文级事件特征和所述第二相邻词的事件类型对应的第 二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第 三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待 检测词的事件类型的预测值;
[0070] 对所述文章执行词向量嵌入,得到所述第一词向量;以及,对所述第一相 邻词的事件类型执行事件类型向量嵌入,得到所述第一事件类型向量;以及, 对所述第二相邻词的事件类型执行事件类型向量嵌入,得到所述第二事件类型 向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向量;以及, 对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
[0071] 将所述第一词向量、所述第一事件类型向量、所述第二事件类型向量、所 述第二词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待 检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对 所述深度神经网络进行训练,得到事件类型预测模型。
[0072] 本申请还提供一种事件类型预测模型构建方法,包括:
[0073] 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子 片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻 词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包 括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测 词之后出现的至少一个词;
[0074] 根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络 包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型 预测子网络和第三事件类型预测子网络;所述上下文级事件特征抽取子网络, 用于根据句子片段相关的词向量和所述词位置信息对应的词位置向量抽取上下 文级事件特征;所述第一事件类型预测子网络,用于根据所述上下文级事件特 征和所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待检测词 对应的各种事件类型的第一概率;所述第二事件类型预测子网络,用于根据所 述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件类型向量, 获取所述待检测词对应的各种事件类型的第二概率;所述第三事件类型预测子 网络,用于根据所述第一概率和所述第二概率,确定所述待检测词的事件类型 的预测值;
[0075] 对所述第一相邻词的事件类型执行事件类型向量嵌入,得到所述第一事件 类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到 所述第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述词 向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;
[0076] 将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词 位置向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为 所述深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行 训练,得到事件类型预测模型。
[0077] 本申请还提供一种事件类型预测模型构建方法,包括:
[0078] 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子 片段、所述句子片段中的词的词位置信息、相邻词的事件类型与所述待检测词 的事件类型之间的对应关系;所述相邻词包括在所述待检测词之前或之后出现 的至少一个词;
[0079] 根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络 包括上下文级事件特征抽取子网络和事件类型预测子网络;所述上下文级事件 特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词 位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述上 下文级事件特征和所述相邻词的事件类型对应的事件类型向量,获取所述待检 测词的事件类型的预测值;
[0080] 对所述相邻词的事件类型执行事件类型向量嵌入,得到所述事件类型向量; 以及,对所述句子片段执行词向量嵌入,得到所述词向量;以及,对所述词位 置信息执行词位置向量嵌入,得到所述词位置向量;
[0081] 将所述事件类型向量、所述词向量和所述词位置向量作为所述深度神经网 络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据, 根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
[0082] 本申请还提供一种事件确认装置,包括:
[0083] 待检测词获取单元,用于获取文章中的待检测词;
[0084] 句子片段获取单元,用于获取与所述待检测词对应的句子片段;
[0085] 第一词嵌入单元,用于对所述文章执行词向量嵌入,得到所述文章相关的 词向量,作为第一词向量;
[0086] 第二词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述句子片 段相关的词向量,作为第二词向量;
[0087] 词位置向量嵌入单元,用于对所述句子片段中的词对应的词位置信息执行 词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0088] 模型输入单元,用于将所述第一词向量、所述第二词向量和所述词位置向 量作为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件 特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;
[0089] 第一特征抽取单元,用于通过所述文章级事件特征抽取子网络,根据所述 第一词向量抽取文章级事件特征;
[0090] 第二特征抽取单元,用于通过所述上下文级事件特征抽取子网络,根据所 述第二词向量和所述词位置向量抽取上下文级事件特征;
[0091] 事件类型预测单元,用于通过所述事件类型预测子网络,至少根据所述文 章级事件特征和所述上下文级事件特征,获取与所述待检测词对应的事件类型 的预测值,作为所述文章包括的事件类型。
[0092] 本申请还提供一种事件确认装置,包括:
[0093] 待检测词获取单元,用于获取文章中的待检测词;
[0094] 句子片段获取单元,用于获取与所述待检测词对应的句子片段;
[0095] 第一事件类型获取单元,用于获取在所述待检测词之前出现的至少一个词 分别对应的事件类型,作为第一相邻词的事件类型;
[0096] 第二事件类型获取单元,用于获取在所述待检测词之后出现的至少一个词 分别对应的事件类型,作为第二相邻词的事件类型;
[0097] 第一词嵌入单元,用于对所述文章执行词向量嵌入,得到所述文章相关的 词向量,作为第一词向量;
[0098] 第二词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述句子片 段相关的词向量,作为第二词向量;
[0099] 词位置向量嵌入单元,用于对所述句子片段中的词对应的词位置信息执行 词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0100] 第一事件类型向量嵌入单元,用于对所述第一相邻词的事件类型执行事件 类型向量嵌入,得到第一事件类型向量;
[0101] 第二事件类型向量嵌入单元,用于对所述第二相邻词的事件类型执行事件 类型向量嵌入,得到第二事件类型向量;
[0102] 模型输入单元,用于将所述第一词向量、所述第一事件类型向量、所述第 二事件类型向量、所述第二词向量和所述词位置向量作为事件类型预测模型的 输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级 事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和 第三事件类型预测子网络;
[0103] 第一特征抽取单元,用于通过所述文章级事件特征抽取子网络,根据所述 第一词向量抽取文章级事件特征;
[0104] 第二特征抽取单元,用于通过所述上下文级事件特征抽取子网络,根据所 述第二词向量和所述词位置向量抽取上下文级事件特征;
[0105] 第一事件类型预测单元,用于通过所述第一事件类型预测子网络,至少根 据所述文章级事件特征、所述上下文级事件特征和所述第一事件类型向量,获 取所述待检测词对应的各种事件类型的第一概率;
[0106] 第二事件类型预测单元,用于通过所述第二事件类型预测子网络,至少根 据所述文章级事件特征、所述上下文级事件特征和所述第二事件类型向量,获 取所述待检测词对应的各种事件类型的第二概率;
[0107] 事件类型确定单元,用于通过所述第三事件类型预测子网络,至少根据所 述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测值, 作为所述文章包括的事件类型。
[0108] 本申请还提供一种事件确认装置,包括:
[0109] 待检测词获取单元,用于获取文章中的待检测词;
[0110] 句子片段获取单元,用于获取与所述待检测词对应的句子片段;
[0111] 第一事件类型获取单元,用于获取在所述待检测词之前出现的至少一个词 分别对应的事件类型,作为第一相邻词的事件类型;
[0112] 第二事件类型获取单元,用于获取在所述待检测词之后出现的至少一个词 分别对应的事件类型,作为第二相邻词的事件类型;
[0113] 第一事件类型向量嵌入单元,用于对所述第一相邻词的事件类型执行事件 类型向量嵌入,得到第一事件类型向量;
[0114] 第二事件类型向量嵌入单元,用于对所述第二相邻词的事件类型执行事件 类型向量嵌入,得到第二事件类型向量;
[0115] 词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述句子片段相 关的词向量;
[0116] 词位置向量嵌入单元,用于对所述句子片段中的词对应的词位置信息执行 词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0117] 模型输入单元,用于将所述第一事件类型向量、所述第二事件类型向量、 所述词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类 型预测模型包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第 二事件类型预测子网络和第三事件类型预测子网络;
[0118] 特征抽取单元,用于通过所述上下文级事件特征抽取子网络,根据所述句 子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征;
[0119] 第一事件类型预测单元,用于通过所述第一事件类型预测子网络,至少根 据所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对应各 种事件类型的第一概率;
[0120] 第二事件类型预测单元,用于通过所述第二事件类型预测子网络,至少根 据所述上下文级事件特征和所述第二事件类型向量,获取所述待检测词对应各 种事件类型的第二概率;
[0121] 事件类型确定单元,用于通过所述第三事件类型预测子网络,至少根据所 述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测值, 作为所述文章包括的事件类型。
[0122] 本申请还提供一种事件确认装置,包括:
[0123] 待检测词获取单元,用于获取文章中的待检测词;
[0124] 句子片段获取单元,用于获取与所述待检测词对应的句子片段;
[0125] 事件类型获取单元,用于获取在所述待检测词之前或之后出现的至少一个 词分别对应的事件类型,作为相邻词的事件类型;
[0126] 事件类型向量嵌入单元,用于对所述相邻词的事件类型执行事件类型向量 嵌入,得到事件类型向量;
[0127] 词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述句子片段相 关的词向量;
[0128] 词位置向量嵌入单元,用于对所述句子片段中的词对应的词位置信息执行 词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0129] 模型输入单元,用于将所述事件类型向量、所述词向量和所述词位置向量 作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件 特征抽取子网络和事件类型预测子网络;
[0130] 特征抽取单元,用于通过所述上下文级事件特征抽取子网络,根据所述句 子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征;
[0131] 事件类型预测单元,用于通过所述事件类型预测子网络,至少根据所述上 下文级事件特征和所述事件类型向量,获取与所述待检测词对应的事件类型的 预测值,作为所述文章包括的事件类型。
[0132] 本申请还提供一种事件类型预测模型构建装置,包括:
[0133] 训练样本获取单元,用于获取训练样本集;其中,所述训练样本包括与训 练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息与事 件类型之间的对应关系;
[0134] 网络构建单元,用于根据多个待预测事件类型,构建深度神经网络;其中, 所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽取子 网络和事件类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述 文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网 络,用于根据句子片段相关的第二词向量和所述词位置信息对应的词位置向量 抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述文章级事件 特征和所述上下文级事件特征,获取所述待检测词的事件类型的预测值;
[0135] 第一词嵌入单元,用于对所述文章执行词向量嵌入,得到所述第一词向量;
[0136] 第二词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述第二词 向量;
[0137] 词位置向量嵌入单元,用于对所述词位置信息执行词位置向量嵌入,得到 所述词位置向量;
[0138] 模型训练单元,用于将所述第一词向量、所述第二词向量和所述词位置向 量作为所述深度神经网络的输入数据,将所述事件类型作为所述深度神经网络 的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类 型预测模型。
[0139] 本申请还提供一种事件类型预测模型构建装置,包括:
[0140] 训练样本获取单元,用于获取训练样本集;其中,所述训练样本包括与训 练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息、第 一相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间 的对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所 述第二相邻词包括在所述待检测词之后出现的至少一个词;
[0141] 网络构建单元,用于根据多个待预测事件类型,构建深度神经网络;其中, 所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽取子 网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预 测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词 向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子 片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件 特征;所述第一事件类型预测子网络,用于根据所述文章级事件特征、所述上 下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取 所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络, 用于根据所述文章级事件特征、所述上下文级事件特征和所述第二相邻词的事 件类型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第 二概率;所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概 率,确定所述待检测词的事件类型的预测值;
[0142] 第一词嵌入单元,用于对所述文章执行词向量嵌入,得到所述第一词向量;
[0143] 第一事件类型向量嵌入单元,用于对所述第一相邻词的事件类型执行事件 类型向量嵌入,得到所述第一事件类型向量;
[0144] 第二事件类型向量嵌入单元,用于对所述第二相邻词的事件类型执行事件 类型向量嵌入,得到所述第二事件类型向量;
[0145] 第二词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述第二词 向量;
[0146] 词位置向量嵌入单元,用于对所述词位置信息执行词位置向量嵌入,得到 所述词位置向量;
[0147] 模型训练单元,用于将所述第一词向量、所述第一事件类型向量、所述第 二事件类型向量、所述第二词向量和所述词位置向量作为所述深度神经网络的 输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据,根 据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
[0148] 本申请还提供一种事件类型预测模型构建装置,包括:
[0149] 训练样本获取单元,用于获取训练样本集;其中,所述训练样本包括与训 练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、第一相邻 词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间的对应 关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述第二 相邻词包括在所述待检测词之后出现的至少一个词;
[0150] 网络构建单元,用于根据多个待预测事件类型,构建深度神经网络;其中, 所述深度神经网络包括上下文级事件特征抽取子网络、第一事件类型预测子网 络、第二事件类型预测子网络和第三事件类型预测子网络;所述上下文级事件 特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词 位置向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所 述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量, 获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子 网络,用于根据所述上下文级事件特征和所述第二相邻词的事件类型对应的第 二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第 三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待 检测词的事件类型的预测值;
[0151] 第一事件类型向量嵌入单元,用于对所述第一相邻词的事件类型执行事件 类型向量嵌入,得到所述第一事件类型向量;
[0152] 第二事件类型向量嵌入单元,用于对所述第二相邻词的事件类型执行事件 类型向量嵌入,得到所述第二事件类型向量;
[0153] 词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述词向量;
[0154] 词位置向量嵌入单元,用于对所述词位置信息执行词位置向量嵌入,得到 所述词位置向量;
[0155] 模型训练单元,用于将所述第一事件类型向量、所述第二事件类型向量、 所述词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检 测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所 述深度神经网络进行训练,得到事件类型预测模型。
[0156] 本申请还提供一种事件类型预测模型构建装置,包括:
[0157] 训练样本获取单元,用于获取训练样本集;其中,所述训练样本包括与训 练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、相邻词的 事件类型与所述待检测词的事件类型之间的对应关系;所述相邻词包括在所述 待检测词之前或之后出现的至少一个词;
[0158] 网络构建单元,用于根据多个待预测事件类型,构建深度神经网络;其中, 所述深度神经网络包括上下文级事件特征抽取子网络和事件类型预测子网络; 所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词 位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测子网络, 用于根据所述上下文级事件特征和所述相邻词的事件类型对应的事件类型向 量,获取所述待检测词的事件类型的预测值;
[0159] 事件类型向量嵌入单元,用于对所述相邻词的事件类型执行事件类型向量 嵌入,得到所述事件类型向量;
[0160] 词嵌入单元,用于对所述句子片段执行词向量嵌入,得到所述词向量;
[0161] 词位置向量嵌入单元,用于对所述词位置信息执行词位置向量嵌入,得到 所述词位置向量;
[0162] 模型训练单元,用于将所述事件类型向量、所述词向量和所述词位置向量 作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度 神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得 到事件类型预测模型。
[0163] 本申请还提供一种电子设备,包括:
[0164] 处理器;以及
[0165] 存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理 器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以 及,获取与所述待检测词对应的句子片段;对所述文章执行词向量嵌入,得到 所述文章相关的词向量,作为第一词向量;以及,对所述句子片段执行词向量 嵌入,得到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子 片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词 对应的词位置向量;将所述第一词向量、所述第二词向量和所述词位置向量作 为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征 抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;通过所述 文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征,并通 过所述上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量 抽取上下文级事件特征;通过所述事件类型预测子网络,至少根据所述文章级 事件特征和所述上下文级事件特征,获取与所述待检测词对应的事件类型的预 测值,作为所述文章包括的事件类型。
[0166] 本申请还提供一种电子设备,包括:
[0167] 处理器;以及
[0168] 存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理 器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以 及,获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第 一相邻词的事件类型;以及,获取在所述待检测词之后出现的至少一个词分别 对应的事件类型,作为第二相邻词的事件类型;以及,获取与所述待检测词对 应的句子片段;对所述文章执行词向量嵌入,得到所述文章相关的词向量,作 为第一词向量;以及,对所述第一相邻词的事件类型执行事件类型向量嵌入, 得到第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向 量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得 到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子片段中的 词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词 位置向量;将所述第一词向量、所述第一事件类型向量、所述第二事件类型向 量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所 述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取 子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型 预测子网络;通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取 文章级事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词 向量和所述词位置向量抽取上下文级事件特征;通过所述第一事件类型预测子 网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述第一事件 类型向量,获取所述待检测词对应的各种事件类型的第一概率;以及,通过所 述第二事件类型预测子网络,至少根据所述文章级事件特征、所述上下文级事 件特征和所述第二事件类型向量,获取所述待检测词对应的各种事件类型的第 二概率;通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第 二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的 事件类型。
[0169] 本申请还提供一种电子设备,包括:
[0170] 处理器;以及
[0171] 存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理 器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以 及,获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第 一相邻词的事件类型;以及,获取在所述待检测词之后出现的至少一个词分别 对应的事件类型,作为第二相邻词的事件类型;以及,获取与所述待检测词对 应的句子片段;对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第 一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入, 得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句 子片段相关的词向量;以及,对所述句子片段中的词对应的词位置信息执行词 位置向量嵌入,得到所述句子片段中的词对应的词位置向量;将所述第一事件 类型向量、所述第二事件类型向量、所述词向量和所述词位置向量作为事件类 型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子 网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预 测子网络;通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词 对应的所述词向量和所述词位置向量抽取上下文级事件特征;通过所述第一事 件类型预测子网络,至少根据所述上下文级事件特征和所述第一事件类型向量, 获取所述待检测词对应各种事件类型的第一概率;以及,通过所述第二事件类 型预测子网络,至少根据所述上下文级事件特征和所述第二事件类型向量,获 取所述待检测词对应各种事件类型的第二概率;通过所述第三事件类型预测子 网络,至少根据所述第一概率和所述第二概率,确定与所述待检测词对应的事 件类型的预测值,作为所述文章包括的事件类型。
[0172] 本申请还提供一种电子设备,包括:
[0173] 处理器;以及
[0174] 存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理 器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以 及,获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型, 作为相邻词的事件类型;以及,获取与所述待检测词对应的句子片段;对所述 相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;以及,对所述 句子片段执行词向量嵌入,得到所述句子片段相关的词向量;以及,对所述句 子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的 词对应的词位置向量;将所述事件类型向量、所述词向量和所述词位置向量作 为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特 征抽取子网络和事件类型预测子网络;通过所述上下文级事件特征抽取子网络, 根据所述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事 件特征;通过所述事件类型预测子网络,至少根据所述上下文级事件特征和所 述事件类型向量,获取与所述待检测词对应的事件类型的预测值,作为所述文 章包括的事件类型。
[0175] 本申请还提供一种电子设备,包括:
[0176] 处理器;以及
[0177] 存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并 通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤: 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句 子片段、所述句子片段中的词的词位置信息与事件类型之间的对应关系;根据 多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章 级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络; 所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文 章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的 第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述 事件类型预测子网络,用于根据所述文章级事件特征和所述上下文级事件特征, 获取所述待检测词的事件类型的预测值;对所述文章执行词向量嵌入,得到所 述第一词向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向量; 以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;将所述 第一词向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入 数据,将所述事件类型作为所述深度神经网络的输出数据,根据所述训练样本 集对所述深度神经网络进行训练,得到事件类型预测模型。
[0178] 本申请还提供一种电子设备,包括:
[0179] 处理器;以及
[0180] 存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并 通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤: 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句 子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相 邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词 包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检 测词之后出现的至少一个词;根据多个待预测事件类型,构建深度神经网络; 其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征 抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件 类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的 第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根 据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文 级事件特征;所述第一事件类型预测子网络,用于根据所述文章级事件特征、 所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向 量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预 测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第二 相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事 件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和 所述第二概率,确定所述待检测词的事件类型的预测值;对所述文章执行词向 量嵌入,得到所述第一词向量;以及,对所述第一相邻词的事件类型执行事件 类型向量嵌入,得到所述第一事件类型向量;以及,对所述第二相邻词的事件 类型执行事件类型向量嵌入,得到所述第二事件类型向量;以及,对所述句子 片段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信息执行词 位置向量嵌入,得到所述词位置向量;将所述第一词向量、所述第一事件类型 向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为所述深 度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的 输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型 预测模型。
[0181] 本申请还提供一种电子设备,包括:
[0182] 处理器;以及
[0183] 存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并 通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤: 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、 所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事 件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所 述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后 出现的至少一个词;根据多个待预测事件类型,构建深度神经网络;其中,所 述深度神经网络包括上下文级事件特征抽取子网络、第一事件类型预测子网络、 第二事件类型预测子网络和第三事件类型预测子网络;所述上下文级事件特征 抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置 向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述上 下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取 所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络, 用于根据所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件 类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第三事件 类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词 的事件类型的预测值;对所述第一相邻词的事件类型执行事件类型向量嵌入, 得到所述第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类 型向量嵌入,得到所述第二事件类型向量;以及,对所述句子片段执行词向量 嵌入,得到所述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到 所述词位置向量;将所述第一事件类型向量、所述第二事件类型向量、所述词 向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的 事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度 神经网络进行训练,得到事件类型预测模型。
[0184] 本申请还提供一种电子设备,包括:
[0185] 处理器;以及
[0186] 存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并 通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤: 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、 所述句子片段中的词的词位置信息、相邻词的事件类型与所述待检测词的事件 类型之间的对应关系;所述相邻词包括在所述待检测词之前或之后出现的至少 一个词;根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经 网络包括上下文级事件特征抽取子网络和事件类型预测子网络;所述上下文级 事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应 的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所 述上下文级事件特征和所述相邻词的事件类型对应的事件类型向量,获取所述 待检测词的事件类型的预测值;对所述相邻词的事件类型执行事件类型向量嵌 入,得到所述事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所 述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向 量;将所述事件类型向量、所述词向量和所述词位置向量作为所述深度神经网 络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据, 根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
[0187] 本申请还提供一种计算机可读存储介质,所述计算机可读存储介质中存储 有指令,当其在计算机上运行时,使得计算机执行上述各种方法。
[0188] 本申请还提供一种包括指令的计算机程序产品,当其在计算机上运行时, 使得计算机执行上述各种方法。
[0189] 与现有技术相比,本申请具有以下优点:
[0190] 本申请实施例提供的事件确认方法,通过获取文章中的待检测词;以及, 获取与所述待检测词对应的句子片段;对所述文章执行词向量嵌入,得到所述 文章相关的词向量,作为第一词向量;以及,对所述句子片段执行词向量嵌入, 得到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子片段中 的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的 词位置向量;将所述第一词向量、所述第二词向量和所述词位置向量作为事件 类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子 网络、上下文级事件特征抽取子网络和事件类型预测子网络;通过所述文章级 事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征,并通过所述 上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量抽取上 下文级事件特征;通过所述事件类型预测子网络,至少根据所述文章级事件特 征和所述上下文级事件特征,获取与所述待检测词对应的事件类型的预测值, 作为所述文章包括的事件类型;这种处理方式,使得结合待检测词所在文章的 信息和周边文本的信息进行事件识别;因此,可以有效提升事件识别的准确度。
[0191] 本申请实施例提供的事件类型预测模型构建方法,通过获取训练样本集; 其中,所述训练样本包括与训练用待检测词对应的文章、句子片段、所述句子 片段中的词的词位置信息与事件类型之间的对应关系;根据多个待预测事件类 型,构建深度神经网络;其中,所述深度神经网络包括文章级事件特征抽取子 网络、上下文级事件特征抽取子网络和事件类型预测子网络;所述文章级事件 特征抽取子网络,用于根据所述文章相关的第一词向量抽取文章级事件特征; 所述上下文级事件特征抽取子网络,用于根据句子片段相关的第二词向量和所 述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测子 网络,用于根据所述文章级事件特征和所述上下文级事件特征,获取所述待检 测词的事件类型的预测值;对所述文章执行词向量嵌入,得到所述第一词向量; 以及,对所述句子片段执行词向量嵌入,得到所述第二词向量;以及,对所述 词位置信息执行词位置向量嵌入,得到所述词位置向量;将所述第一词向量、 所述第二词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述 事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度 神经网络进行训练,得到事件类型预测模型;这种处理方式,使得结合待检测 词所在文章的信息和周边文本的信息,构建事件类型预测模型;因此,可以有 效提升事件类型预测模型的预测准确度。同时,这种处理方式还使得文章级事 件特征与样本一同训练,从而可以得到更多与事件提取任务有针对性的反馈; 因此,可以进一步有效提升事件类型预测模型的预测准确度。附图说明
[0192] 图1是本申请提供的一种事件确认方法的实施例的流程图
[0193] 图2a是本申请提供的一种事件确认方法的实施例的词向量嵌入的示意图;
[0194] 图2b是本申请提供的一种事件确认方法的实施例的词位置向量嵌入的示意 图;
[0195] 图3是本申请提供的一种事件确认方法的实施例的上下文级事件特征抽取 子网络的示意图;
[0196] 图4是本申请提供的一种事件确认方法的实施例的文章级事件特征抽取子 网络的示意图;
[0197] 图5是本申请提供的一种事件确认方法的实施例的事件类型预测子网络的 示意图;
[0198] 图6是本申请提供的一种事件确认方法的实施例的具体流程图;
[0199] 图7是本申请提供的一种事件确认方法的实施例的事件类型向量嵌入的示 意图;
[0200] 图8是本申请提供的一种事件确认方法的实施例的事件类型预测子网络的 又一示意图;
[0201] 图9是本申请提供的一种事件确认方法的实施例的又一具体流程图;
[0202] 图10是本申请提供的一种事件确认装置的实施例的示意图;
[0203] 图11是本申请提供的一种事件确认装置的实施例的具体示意图;
[0204] 图12是本申请提供的一种事件确认装置的实施例的具体示意图;
[0205] 图13是本申请提供的电子设备的实施例的示意图;
[0206] 图14是本申请提供的一种事件确认方法的实施例的流程图;
[0207] 图15是本申请提供的一种事件确认方法的实施例的事件类型预测子网络的 示意图;
[0208] 图16是本申请提供的一种事件确认装置的实施例的示意图;
[0209] 图17是本申请提供的电子设备的实施例的示意图;
[0210] 图18是本申请提供的一种事件确认方法的实施例的流程图;
[0211] 图19是本申请提供的一种事件确认方法的实施例的事件类型预测子网络的 示意图;
[0212] 图20是本申请提供的一种事件确认装置的实施例的示意图;
[0213] 图21是本申请提供的电子设备的实施例的示意图;
[0214] 图22是本申请提供的一种事件确认方法的实施例的流程图;
[0215] 图23是本申请提供的一种事件确认方法的实施例的事件类型预测子网络的 示意图;
[0216] 图24是本申请提供的一种事件确认装置的实施例的示意图;
[0217] 图25是本申请提供的电子设备的实施例的示意图;
[0218] 图26是本申请提供的一种事件类型预测模型构建方法的实施例的流程图;
[0219] 图27是本申请提供的一种事件类型预测模型构建方法的实施例的具体流程 图;
[0220] 图28是本申请提供的一种事件类型预测模型构建装置的实施例的示意图;
[0221] 图29是本申请提供的一种事件类型预测模型构建装置的实施例的具体示意 图;
[0222] 图30是本申请提供的电子设备的实施例的示意图;
[0223] 图31是本申请提供的一种事件类型预测模型构建方法的实施例的流程图;
[0224] 图32是本申请提供的一种事件类型预测模型构建装置的实施例的示意图;
[0225] 图33是本申请提供的电子设备的实施例的示意图;
[0226] 图34是本申请提供的一种事件类型预测模型构建方法的实施例的流程图;
[0227] 图35是本申请提供的一种事件类型预测模型构建装置的实施例的示意图;
[0228] 图36是本申请提供的电子设备的实施例的示意图;
[0229] 图37是本申请提供的一种事件类型预测模型构建方法的实施例的流程图;
[0230] 图38是本申请提供的一种事件类型预测模型构建装置的实施例的示意图;
[0231] 图39是本申请提供的电子设备的实施例的示意图。

具体实施方式

[0232] 在下面的描述中阐述了很多具体细节以便于充分理解本申请。但是本申请 能够以很多不同于在此描述的其它方式来实施,本领域技术人员可以在不违背 本申请内涵的情况下做类似推广,因此本申请不受下面公开的具体实施的限制。
[0233] 在本申请中,提供了事件确认方法和装置,事件类型预测模型构建方法和 装置,以及电子设备。在下面的实施例中逐一对各种方案进行详细说明。
[0234] 第一实施例
[0235] 请参考图1,其为本申请提供的一种事件确认方法实施例的流程图,该方法 的执行主体包括事件确认装置。本申请提供的一种事件确认方法包括:
[0236] 步骤S101:获取文章中的待检测词;以及,获取与所述待检测词对应的句 子片段。
[0237] 所述文章,包括非结构化的信息,例如,一则新闻或公告等等。通过本申 请实施例提供的方法,可从包括非结构化信息的文章中抽取出用户感兴趣的事 件,并以结构化呈现给用户。
[0238] 所述待检测词,包括所述文章中出现的词。所述文章,可以是各种语言的 文章,如中文或英文等等。当所述文章为中文文章时,所述待检测词包括对中 文文章进行分词得到的词,例如,文本为“刚刚宣誓就任的行政院长某某也应 邀参加成立典礼并且致词”,分词结果包括如下词:刚刚,宣誓,就任,行政, 院长,应邀,参加,成立,典礼,致词等等。当所述文章为英文文章时,所述 待检测词包括文章中出现的英文单词。
[0239] 所述与待检测词对应的句子片段,包括以待检测词为中心,向左右两边扩 展成一个具有预设词数量的文本串。通过所述待检测词对应的句子片段,可体 现所述待检测词的上下文信息。所述句子片段,有可能是一个真正完整的句子 (自然句),也可能不是一个真正完整的句子。从词数量度而言,所述句子片 段可以是词数量定长的文本串。
[0240] 例如,文章包括句子“刚刚宣誓就任的行政院长某某也应邀参加成立典礼 并且致词”,所述预设词数量为11,如果待检测词为“刚刚”,所述句子片段是 以待检测词为中心,并向左右两边各扩展5个词,形成一个由11个词拼接而成 的文本串,则所述句子片段可以是由下述词顺序拼接成的一个文本串:“空词”, “空词”,“空词”,“空词”,“空词”,“刚刚”,“宣誓”,“就任”,“的”,“行 政”,“院长”。其中,由于待检测词“刚刚”为文章的起始词,无法得到向左扩 展的5个词,因此用5个“空词”表示以待检测词“刚刚”为中心,并向左扩 展得到的词。
[0241] 需要说明的是,在以待检测词为中心,并向左右两边扩展,以形成一个具 有预设词数量的文本串(即句子片段)时,可以向左右两边分别扩展相同数量 的词,如向左右两边各扩展5个词;也可以是向左右两边分别扩展不同数量的 词,如向左边扩展3个词,向右边扩展3个词。
[0242] 为了便于描述,本申请实施例将所述句子片段表达为:S= {...wt-1,wt,wt+1...},其中,wt为待检测词,wt-1为待检测词左侧相邻的第1个词, wt+1为待检测词右侧相邻的第1个词。
[0243] 步骤S102:对所述文章执行词向量嵌入,得到所述文章相关的词向量,作 为第一词向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相 关的词向量,作为第二词向量;以及,对所述句子片段中的词对应的词位置信 息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量。
[0244] 通过步骤S101获得文章中的待检测词、及与所述待检测词对应的句子片段 后,就可以进入本步骤,分别对所述文章中的词、所述句子片段中的词和所述 句子片段中的词的位置信息执行向量嵌入(embbeding)处理,以得到各种信息 的向量表达形式。
[0245] 步骤S102包括3个子步骤:1)对所述文章执行词向量嵌入,得到所述文 章相关的词向量,作为第一词向量;2)对所述句子片段执行词向量嵌入,得到 所述句子片段相关的词向量,作为第二词向量;3)对所述句子片段中的词对应 的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向 量。本申请实施例提供的方法,并不限制上述3个子步骤的执行顺序。下面逐 个对上述3个子步骤进行说明。
[0246] 1)对所述文章执行词向量嵌入,得到所述文章相关的词向量,作为第一词 向量。
[0247] 本申请实施例提供的方法,通过词嵌入的方式,将所述文章按照词向量来 组织,获取能够表达所述文章语义的词向量,以便于根据词向量挖掘所述文章 级事件特征。
[0248] 在一个示例中,子步骤1)可包括如下子步骤:1.1)通过分词算法,获取 所述文章包括的词,作为第一词;1.2)对所述第一词执行词嵌入,得到所述第 一词的词向量。
[0249] 1.1)通过分词算法,获取所述文章包括的词,作为第一词。
[0250] 具体实施时,可采用现有的分词算法对所述文章进行分词处理。现有的分 词算法,可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和 基于统计的分词方法。按照是否与词性标注过程相结合,又可以分为单纯分词 方法和分词与标注相结合的一体化方法。分词算法属于较为成熟的现有技术, 此处不再赘述,可根据实际需求选取任意一种现有分词算法。
[0251] 1.2)对所述第一词执行词嵌入,得到所述第一词的词向量。
[0252] 在一个示例中,本申请实施例提供的方法,还包括如下步骤:构建词典, 其中,词典可包括文章中出现的所有词。具体实施时,可通过扫描全部训练文 章,构建词典。
[0253] 在构建词典后,还可对词典中的词进行索引编号,使得每个词对应唯一的一 个数字标识符。此外,在构建词典后,还可对词典中的词进行训练词向量的处理, 以确定词典中的词对应的词向量。具体实施时,也可以直接使用已经训练好的 词向量。
[0254] 如图2a所示,可根据各个词的唯一标识符,通过查询词向量矩阵(word embeddings matrix),获取各个词对应的词向量(word embeddings)。以词典包 括10000个词为例,词向量矩阵为一个10000*词向量维度(自定义)的矩阵。 矩阵的每一行即对应一个词向量。这个矩阵可以是随机初始化的矩阵,可通过 训练词向量更新矩阵。
[0255] 至此对上述第1个子步骤进行了说明。
[0256] 2)对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量,作 为第二词向量。
[0257] 第2个子步骤与上述第1个子步骤的处理方式基本相同,不同之处包括处 理的词不同,第2个子步骤处理的词包括所述句子片段中出现的词。由于第2 个子步骤与上述第1个子步骤的处理方式基本相同,因此此处不再赘述。
[0258] 3)对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所 述句子片段中的词对应的词位置向量。
[0259] 所述句子片段中的词,包括所述待检测词和向左/向右扩展得到的词。其中, 每个词都对应一个词位置,所述词位置信息包括所述句子片段中的词在所述句 子片段中的位置信息。
[0260] 为了便于描述,本申请实施例将所述句子片段对应的词位置信息表达为:P ={...pt-1,pt,pt+1...},其中,pt为待检测词wt在句子片段S中的词位置,pt-1为 待检测词左侧相邻的第1个词wt-1在句子片段S中的词位置,pt+1为待检测词右 侧相邻的第1个词wt+1在句子片段S中的词位置。
[0261] 所述词位置信息,可以根据所述句子片段中的词相对所述待检测词的位置 确定,例如,句子片段S的词长度固定为11,则P={-5,-4,…0…,4,5};也 可以直接根据各个词在所述句子片段中的位置确定,如用p={0,…10}表示。
[0262] 如图2b所示,可根据各个词的词位置编号,通过查询位置向量矩阵 (position embeddings matrix),获取各个词对应的词位置向量(position embeddings)。以句子片段的词数量为11为例,则位置向量矩阵为一个11*词位 置向量维度(自定义)的矩阵。矩阵的每一行即对应一个词位置。这个矩阵可 以是随机初始化的矩阵,可通过训练词位置向量更新矩阵。
[0263] 例如,句子片段S={“空词”,“空词”,“空词”,“空词”,“空词”,“刚刚”, “宣誓”,“就任”,“的”,“行政”,“院长”},P={-5,-4,…0…,4,5},则通过 第3子步骤处理后,可得到如下词与词位置向量之间的对应关系:第1个“空 词”对应位置编号-5对应的词位置向量,第2个“空词”对应位置编号-4对应 的词位置向量,第3个“空词”对应位置编号-3对应的词位置向量,第4个“空 词”对应位置编号-2对应的词位置向量,第5个“空词”对应位置编号-1对应 的词位置向量,“刚刚”对应位置编号0对应的词位置向量,“宣誓”对应位置 编号1对应的词位置向量,“就任”对应位置编号2对应的词位置向量,“的” 对应位置编号3对应的词位置向量,“行政”对应位置编号4对应的词位置向量, “院长”对应位置编号5对应的词位置向量。
[0264] 至此对上述第3个子步骤进行了说明。
[0265] 在得到所述文章相关的第一词向量、所述句子片段相关的第二词向量及所 述句子片段中的词对应的词位置向量之后,就可以进入下一步骤S103。
[0266] 步骤S103:将所述第一词向量、所述第二词向量和所述词位置向量作为事 件类型预测模型的输入数据。
[0267] 所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特 征抽取子网络和事件类型预测子网络。
[0268] 步骤S104:通过所述文章级事件特征抽取子网络,根据所述第一词向量抽 取文章级事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二 词向量和所述词位置向量抽取上下文级事件特征。
[0269] 所述上下文级事件特征,包括从待检测词周边有限的文本范围内提取的对 待检测词的事件类型产生影响的特征。
[0270] 所述上下文级事件特征抽取子网络的输入层数据为连接起来的所述第二词 向量和所述词位置向量(concatenated embbodings),由此使得该子网络获知 所述句子片段中哪个词是待检测的词,其它词和待检测词的相对位置关系。所 述上下文级事件特征抽取子网络的输出层数据为上下文级事件特征。通过该子 网络,可根据所述第二词向量和所述词位置向量抽取上下文级事件特征。
[0271] 所述上下文级事件特征抽取子网络,可采用多种深度神经网络结构,包括 但不限于:卷积神经网络(Convolutional Neural Network,CNN),循环神经网 络(recurrent neural network,RNN)等等。
[0272] 如图3所示的上下文级事件特征抽取子网络,该网络的输入层数据为 concatenated embbodings,该网络包括卷积层和池化层,输入层数据经过卷积 层和池化层的处理后,形成输出层的数据,即所述上下文级事件特征(CNN vector)。
[0273] 所述文章级事件特征,包括从待检测词所在整篇文章中提取的对待检测词 的事件类型产生影响的特征。
[0274] 所述文章级事件特征抽取子网络的输入数据为所述第一词向量,该子网络 的输出数据为文章级事件特征。通过该子网络,可根据所述第一词向量抽取文 章级事件特征。
[0275] 所述文章级事件特征抽取子网络,可采用分级注意网络(Hierarchical Attention Network),也可以采用其它网络结构,如不包括注意力层的分级网 络,或者只包括1级网络等等。
[0276] 如图4所示,在一个示例中,所述文章级事件特征抽取子网络的输入层数据 为所述第一词向量,该网络包括3级子网络,分别为:句子级事件特征确定子 网络、段落级事件类型特征确定子网络及文章级事件特征确定子网络,输入层 数据经过3级子网络的处理后,形成输出层的数据,即所述文章级事件特征 (document vector)。其中,通过所述句子级事件特征确定子网络,根据所述 第一词向量(w0,w1…,wn),获取所述文章包括的句子对应的句子级事件特征 (sentence vector);通过所述段落级事件类型特征确定子网络,根据所述文 章包括的句子对应的句子级事件特征(s0,s1…,sn),获取所述文章包括的段落对 应的段落级事件类型特征(paragraph vector);通过所述文章级事件特征确定 子网络,根据所述段落级事件类型特征(p0,p1…,pn),获取所述文章级事件特征 (document vector)。
[0277] 需要说明的是,所述句子级事件特征确定子网络中所述的句子与所述句子 片段不同,该句子通常为文章中出现的自然句,即根据标点符号进行断句后的 句子。
[0278] 在图4中,句子级事件特征确定子网络、段落级事件类型特征确定子网络 和文章级事件特征确定子网络均采用双向长短期记忆网络结构Bi-LSTM。由于这 三个子网络的网络结构基本相同,处理方式基本相同,不同之处仅在于输入数 据和输出数据不同,因此,下面仅对句子级事件特征确定子网络的工作方式进 行详细说明,段落级事件类型特征确定子网络和文章级事件特征确定子网络的 工作方式参考该说明即可。
[0279] 由图4可见,所述通过所述句子级事件特征确定子网络,根据所述第一词 向量,获取所述文章包括的句子对应的句子级事件特征,可包括如下子步骤:1) 将所述句子相关的第一词向量的正向序列作为第一LSTM的输入数据,通过所述 第一LSTM获取所述句子的正向句子级事件特征;以及,将所述句子相关的第一 词向量的反向序列作为第二LSTM的输入数据,通过所述第二LSTM获取所述句 子的反向句子级事件特征;2)根据所述正向句子级事件特征和所述反向句子级 事件特征,获取所述文章包括的句子对应的句子级事件特征。
[0280] 所述第一词向量的正向序列,是指句子中的词的从左到右的顺序排列的词 序列。所述第一词向量的反向序列,是指句子中的词的从右到左的顺序排列的 词序列。
[0281] 本申请实施例提供的方法,通过采用基于Bi-LSTM的所述句子级事件特征 确定子网络,使得可以建模词与词之间远距离的依赖关系,且可以从两个方向 来建模,由于词之间的远距离依赖关系可以决定句子级事件特征;因此,可以 有效提升句子级事件特征的准确度。
[0282] 由图4可见,所述句子级事件特征确定子网络的网络结构还可包括注意力 层或池化层(max pooling)等等;当所述句子级事件特征确定子网络的网络结 构可包括注意力层时,所述根据所述正向句子级事件特征和所述反向句子级事 件特征,获取所述文章包括的句子对应的句子级事件特征,可采用如下方式实 现:通过所述注意力层,根据所述正向句子级事件特征和所述反向句子级事件 特征,获取所述文章包括的句子对应的句子级事件特征。
[0283] 需要说明的是,所述文章级事件特征抽取子网络也可以只有一层,直接根 据第一词向量,确定所述文章级事件特征;也可以只包括两层,在确定每一个 句子级事件特征后,直接根据句子级事件特征,确定文章级事件特征,或者, 直接根据第一词向量确定段落级事件类型后,根据段落级事件类型,确定文章 级事件特征。
[0284] 在抽取出所述文章级事件特征和所述上下文级事件特征之后,就可以进入 下一步骤,通过所述事件类型预测子网络,根据所述文章级事件特征和所述上 下文级事件特征对待检测词的事件类型进行预测。
[0285] 步骤S105:通过所述事件类型预测子网络,至少根据所述文章级事件特征 和所述上下文级事件特征,获取与所述待检测词对应的事件类型的预测值,作 为所述文章包括的事件类型。
[0286] 如图5所示,所述事件类型预测子网络,包括用于连接所述文章级事件特 征和所述上下文级事件特征的全连接层和所述事件类型预测模型的输出层,通 过全连接层综合所述待检测词的各种特征(文章级事件特征和上下文级事件特 征)计算每一个事件类型的概率,然后选出概率最大的事件类型,作为预测的 事件类型。
[0287] 所述事件类型,可以是某个时间,某个地域,一个或者多个角色,一个或 者多个动作组成的一件事情,例如,事件类型为“开始职务”等等。
[0288] 本发明的发明人发现文章整体讨论的内容对于判断其中某个词是否表示了 某个事件的发生,会起到辅助作用,因此,本申请实施例提供的方法将所述文 章级事件特征与上下文级事件特征结合,其中,所述文章级事件特征包括文章 的信息,所述上下文级事件特征包括待检测词所在句子片段的信息;这种处理 方式,使得扩充事件类型预测的信息量,根据文章的信息辅助判断待检测词为 哪种事件类型;因此,可以有效地利用全文信息辅助预测事件类型。
[0289] 请参考图6,其为本申请提供的一种事件确认方法实施例的具体流程图。在 一个示例中,所述方法还包括如下步骤:
[0290] 步骤S601:获取在所述待检测词之前或之后出现的至少一个词分别对应的 事件类型,作为相邻词的事件类型。
[0291] 所述相邻词,可以是在所述待检测词之前或之后出现的词。如果根据待检 测词之前的相邻词进行预测,可称为顺序预测;如果根据待检测词之后的相邻 词进行预测,可称为逆序预测。
[0292] 所述相邻词,可以是紧邻所述待检测词的词,也可以是与所述待检测词之 间隔有其它词的词。例如,待检测词“就任”对应的句子片段为“刚刚宣誓就 任的行政院长某某也应邀参加成立典礼并且致词”,则该待检测词的相邻词可以 是刚刚,宣誓,行政,院长,应邀,参加,成立,典礼,致词等等。
[0293] 本申请实施例提供的方法,在预测待检测词的事件类型时,考虑被检测词 周围的至少一个相邻词的事件类型,从而为判断待检测词的事件类型,提供了 信息,帮助判断待检测词的事件类型。因此,要预先预测所述相邻词的事件类 型。
[0294] 需要说明的是,使用多个相邻词并不一定优于单个相邻词,其原因在于: 在预测的时候,之前的相邻词或者之后的相邻词的事件类型也是模型预测出来 的,有可能存在错误,如果之前n个预测的词的事件类型都正确,则会对当前 待检测词的事件类型预测结果会有更多帮助,如果n个中存在错误的预测,那 也可能影响预测当前待检测词,甚至得到错误的预测结果。具体实施时,可以 根据具体情况调整所述相邻词的值。
[0295] 步骤S602:对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类 型向量。
[0296] 如图7所示,可根据各个事件类型的编号,通过查询事件类型向量矩阵 (event type embeddings matrix),获取各个事件类型对应的事件类型向量  (event type embeddings)。以共有30种事件类型为例,则事件类型向量矩阵 为一个30*事件类型向量维度(自定义)的矩阵。矩阵的每一行即对应一个事件 类型。这个矩阵可以是随机初始化的矩阵,可通过训练事件类型向量更新矩阵。
[0297] 请参考图8,其为本申请提供的一种事件确认方法实施例的又一事件类型预 测子网络的具体示意图。在图8所示的情况下,所述通过所述事件类型预测子 网络,并至少根据所述文章级事件特征和所述上下文级事件特征,并获取与所 述待检测词对应的事件类型的预测值,可采用如下方式实现:通过所述事件类 型预测子网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述 事件类型向量,获取所述预测值。
[0298] 本申请实施例提供的方法,通过获取在所述待检测词之前或之后出现的至 少一个词分别对应的事件类型,作为相邻词的事件类型;对所述相邻词的事件 类型执行事件类型向量嵌入,得到事件类型向量;通过所述事件类型预测子网 络,根据所述文章级事件特征、所述上下文级事件特征和所述事件类型向量, 获取所述预测值;这种处理方式,使得在根据文章级事件特征和上下文级事件 特征对待检测词的事件类型进行预测的基础上,还引入待检测词的相邻词的事 件类型信息,根据相邻词的事件特征对待检测词的事件类型进行辅助判断;因 此,可以有效提升事件类型预测的准确度。
[0299] 需要说明的是,要实施本申请实施例提供的方法,首先要构建事件类型预 测模型,所述事件类型预测模型可从训练数据中学习获得。
[0300] 请参考图9,其为本申请提供的一种事件确认方法实施例的又一具体流程 图。在本实施例中,所述方法还包括如下步骤:
[0301] 步骤S901:从训练样本集中学习得到所述事件类型预测模型。
[0302] 所述训练样本集,包括多个训练样本。所述训练样本包括与训练用待检测 词对应的文章、句子片段、所述句子片段中的词对应的词位置信息与事件类型 之间的对应关系。
[0303] 在获取到训练样本集后,就可以通过深度学习算法,从所述训练样本集中 学习得到所述事件类型预测模型。由于深度学习算法属于较为成熟的现有技术, 因此此处不再赘述。
[0304] 在一个示例中,要构建事件类型预测模型,还包括如下步骤:获取在所述 训练用待检测词之前或之后出现的至少一个词分别对应的事件类型,作为训练 用相邻词的事件类型;相应的,步骤S901可采用如下方式:根据所述训练样本 集和所述训练用待检测词对应的所述训练用相邻词的事件类型,学习得到所述 事件类型预测模型。
[0305] 在训练所述事件类型预测模型时,所述事件类型预测子网络的损失函数可 采用二值交叉熵函数,也可以采用普通的交叉熵函数。
[0306] 从上述实施例可见,本申请实施例提供的事件确认方法,通过获取文章中 的待检测词;以及,获取与所述待检测词对应的句子片段;对所述文章执行词 向量嵌入,得到所述文章相关的词向量,作为第一词向量;以及,对所述句子 片段执行词向量嵌入,得到所述句子片段相关的词向量,作为第二词向量;以 及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述 句子片段中的词对应的词位置向量;将所述第一词向量、所述第二词向量和所 述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括 文章级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子 网络,通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取文章级 事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词向量和 所述词位置向量抽取上下文级事件特征;通过所述事件类型预测子网络,根据 所述文章级事件特征和所述上下文级事件特征,获取与所述待检测词对应的事 件类型的预测值,作为文章包括的事件类型;这种处理方式,使得结合待检测 词所在文章的信息和周边文本的信息进行事件识别;因此,可以有效提升事件 识别的准确度。
[0307] 在上述的实施例中,提供了一种事件确认方法,与之相对应的,本申请还 提供一种事件确认装置。该装置是与上述方法的实施例相对应。
[0308] 第二实施例
[0309] 请参看图10,其为本申请的事件确认装置的实施例的示意图。由于装置实 施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例 的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0310] 本申请另外提供一种事件确认装置,包括:
[0311] 待检测词获取单元1001,用于获取文章中的待检测词;
[0312] 句子片段获取单元1002,用于获取与所述待检测词对应的句子片段;
[0313] 第一词嵌入单元1003,用于对所述文章执行词向量嵌入,得到所述文章相 关的词向量,作为第一词向量;
[0314] 第二词嵌入单元1004,用于对所述句子片段执行词向量嵌入,得到所述句 子片段相关的词向量,作为第二词向量;
[0315] 词位置向量嵌入单元1005,用于对所述句子片段中的词对应的词位置信息 执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0316] 模型输入单元1006,用于将所述第一词向量、所述第二词向量和所述词位 置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级 事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;
[0317] 第一特征抽取单元1007,用于通过所述文章级事件特征抽取子网络,根据 所述第一词向量抽取文章级事件特征;
[0318] 第二特征抽取单元1008,用于通过所述上下文级事件特征抽取子网络,根 据所述第二词向量和所述词位置向量抽取上下文级事件特征;
[0319] 事件类型预测单元1009,用于通过所述事件类型预测子网络,至少根据所 述文章级事件特征和所述上下文级事件特征,获取与所述待检测词对应的事件 类型的预测值,作为所述文章包括的事件类型。
[0320] 请参看图11,其为本申请的事件确认装置的实施例的具体示意图。可选的, 还包括:
[0321] 事件类型获取单元1101,用于获取在所述待检测词之前或之后出现的至少 一个词分别对应的事件类型,作为相邻词的事件类型;
[0322] 事件类型向量嵌入单元1102,用于对所述相邻词的事件类型执行事件类型 向量嵌入,得到事件类型向量;
[0323] 所述事件类型预测单元1009,具体用于通过所述事件类型预测子网络,根 据所述文章级事件特征、所述上下文级事件特征和所述事件类型向量,获取所 述预测值。
[0324] 可选的,
[0325] 所述文章级事件特征抽取子网络包括:句子级事件特征确定子网络,段落 级事件类型特征确定子网络,文章级事件特征确定子网络;
[0326] 所述第一特征抽取单元1007包括:
[0327] 句子级事件特征确定子单元,用于通过所述句子级事件特征确定子网络, 根据所述第一词向量,获取所述文章包括的句子对应的句子级事件特征;
[0328] 段落级事件特征确定子单元,用于通过所述段落级事件类型特征确定子网 络,根据所述文章包括的句子对应的句子级事件特征,获取所述文章包括的段 落对应的段落级事件类型特征;
[0329] 文章级事件特征确定子单元,用于通过所述文章级事件特征确定子网络, 根据所述段落级事件类型特征,获取所述文章级事件特征。
[0330] 可选的,所述句子级事件特征确定子网络的网络结构包括双向长短期记忆 网络结构Bi-LSTM;
[0331] 所述句子级事件特征确定子单元,具体用于将所述句子相关的第一词向量 的正向序列作为第一LSTM的输入数据,通过所述第一LSTM获取所述句子的正 向句子级事件特征;以及,将所述句子相关的第一词向量的反向序列作为第二 LSTM的输入数据,通过所述第二LSTM获取所述句子的反向句子级事件特征;根 据所述正向句子级事件特征和所述反向句子级事件特征,获取所述文章包括的 句子对应的句子级事件特征。
[0332] 可选的,所述句子级事件特征确定子网络的网络结构还包括注意力层;
[0333] 所述根据所述正向句子级事件特征和所述反向句子级事件特征,获取所述 文章包括的句子对应的句子级事件特征,包括:
[0334] 通过所述注意力层,根据所述正向句子级事件特征和所述反向句子级事件 特征,获取所述文章包括的句子对应的句子级事件特征。
[0335] 可选的,所述上下文级事件特征抽取子网络基于卷积神经网络结构。
[0336] 请参看图12,其为本申请的事件确认装置的实施例的具体示意图。可选的, 还包括:
[0337] 模型构建单元1201,用于从训练样本集中学习得到所述事件类型预测模型;
[0338] 其中,所述训练样本包括训练用待检测词对应的文章、句子片段、所述句 子片段中的词对应的词位置信息与事件类型之间的对应关系。
[0339] 可选的,还包括:
[0340] 训练用相邻词的事件类型获取单元,用于获取在所述训练用待检测词之前 或之后出现的至少一个词分别对应的事件类型,作为训练用相邻词的事件类型;
[0341] 所述模型构建单元1201,具体用于根据所述训练样本集和所述训练用待检 测词对应的所述训练用相邻词的事件类型,学习得到所述事件类型预测模型。
[0342] 第三实施例
[0343] 请参考图13,其为本申请的电子设备实施例的示意图。由于设备实施例基 本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分 说明即可。下述描述的设备实施例仅仅是示意性的。
[0344] 本实施例的一种电子设备,该电子设备包括:处理器1301和存储器1302; 所述存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理 器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以 及,获取与所述待检测词对应的句子片段;对所述文章执行词向量嵌入,得到 所述文章相关的词向量,作为第一词向量;以及,对所述句子片段执行词向量 嵌入,得到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子 片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词 对应的词位置向量;将所述第一词向量、所述第二词向量和所述词位置向量作 为事件类型预测模型的输入数据,所述事件类型预测模型包括文章级事件特征 抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络;通过所述 文章级事件特征抽取子网络,根据所述第一词向量抽取文章级事件特征,并通 过所述上下文级事件特征抽取子网络,根据所述第二词向量和所述词位置向量 抽取上下文级事件特征;通过所述事件类型预测子网络,至少根据所述文章级 事件特征和所述上下文级事件特征,获取与所述待检测词对应的事件类型的预 测值,作为所述文章包括的事件类型。
[0345] 在上述的实施例一中,提供了一种事件确认方法,与之相对应的,本申请 还提供另一种事件确认方法。
[0346] 第四实施例
[0347] 请参考图14,其为本申请提供的一种事件确认方法实施例的流程图,该方 法的执行主体包括事件确认装置。由于该方法实施例与实施例一的方法实施例 相对应,所以描述得比较简单,相关之处参见实施例一的部分说明即可。下述 描述的方法实施例仅仅是示意性的。
[0348] 本申请提供的一种事件确认方法包括:
[0349] 步骤S1401:获取文章中的待检测词;以及,获取在所述待检测词之前出现 的至少一个词分别对应的事件类型,作为第一相邻词的事件类型;以及,获取 在所述待检测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词 的事件类型;以及,获取与所述待检测词对应的句子片段。
[0350] 步骤S1402:对所述文章执行词向量嵌入,得到所述文章相关的词向量,作 为第一词向量;以及,对所述第一相邻词的事件类型执行事件类型向量嵌入, 得到第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向 量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得 到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子片段中的 词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词 位置向量。
[0351] 步骤S1403:将所述第一词向量、所述第一事件类型向量、所述第二事件类 型向量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据, 所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽 取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类 型预测子网络。
[0352] 步骤S1404:通过所述文章级事件特征抽取子网络,根据所述第一词向量抽 取文章级事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二 词向量和所述词位置向量抽取上下文级事件特征。
[0353] 步骤S1405:通过所述第一事件类型预测子网络,至少根据所述文章级事件 特征、所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对 应的各种事件类型的第一概率;以及,通过所述第二事件类型预测子网络,至 少根据所述文章级事件特征、所述上下文级事件特征和所述第二事件类型向量, 获取所述待检测词对应的各种事件类型的第二概率。
[0354] 如图15所示,所述第一事件类型预测子网络,包括用于连接所述文章级事 件特征、所述上下文级事件特征和所述第一事件类型向量的全连接层,通过全 连接层综合所述待检测词的各种特征(文章级事件特征、上下文级事件特征和 第一事件类型向量)计算每一个事件类型的概率,作为第一概率。所述第二事 件类型预测子网络,包括用于连接所述文章级事件特征、所述上下文级事件特 征和所述第二事件类型向量的全连接层,通过全连接层综合所述待检测词的各 种特征(文章级事件特征、上下文级事件特征和第二事件类型向量)计算每一 个事件类型的概率,作为第二概率。
[0355] 步骤S1406:通过所述第三事件类型预测子网络,至少根据所述第一概率和 所述第二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章 包括的事件类型。
[0356] 所述第三事件类型预测子网络,综合考虑第一概率和第二概率,确定所述 待检测词的事件类型的预测值。例如,可以平均各个事件类型对应的第一概率 和第二概率,然后选出概率最大的事件类型,作为预测的事件类型。
[0357] 从上述实施例可见,本申请实施例提供的事件确认方法,通过获取文章中 的待检测词;以及,获取在所述待检测词之前出现的至少一个词分别对应的事 件类型,作为第一相邻词的事件类型;以及,获取在所述待检测词之后出现的 至少一个词分别对应的事件类型,作为第二相邻词的事件类型;以及,获取所 述待检测词对应的句子片段;对所述文章执行词向量嵌入,得到所述文章相关 的词向量,作为第一词向量;以及,对所述第一相邻词的事件类型执行事件类 型向量嵌入,得到第一事件类型向量;以及,对所述第二相邻词的事件类型执 行事件类型向量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词 向量嵌入,得到所述句子片段相关的词向量,作为第二词向量;以及,对所述 句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中 的词对应的词位置向量;将所述第一词向量、所述第一事件类型向量、所述第 二事件类型向量、所述第二词向量和所述词位置向量作为事件类型预测模型的 输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下文级 事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和 第三事件类型预测子网络,通过所述文章级事件特征抽取子网络,根据所述第 一词向量抽取文章级事件特征,并通过所述上下文级事件特征抽取子网络,根 据所述第二词向量和所述词位置向量抽取上下文级事件特征;通过所述第一事 件类型预测子网络,根据所述文章级事件特征、所述上下文级事件特征和所述 第一事件类型向量,获取所述待检测词对应的各种事件类型的第一概率;以及, 通过所述第二事件类型预测子网络,根据所述文章级事件特征、所述上下文级 事件特征和所述第二事件类型向量,获取所述待检测词对应的各种事件类型的 第二概率;通过所述第三事件类型预测子网络,根据所述第一概率和所述第二 概率,确定所述待检测词的事件类型的预测值;这种处理方式,使得结合待检 测词所在文章的信息和周边文本的信息,以及待检测词前后的相邻词的事件类 型信息进行事件识别;因此,可以有效提升事件识别的准确度。
[0358] 在上述的实施例中,提供了一种事件确认方法,与之相对应的,本申请还 提供一种事件确认装置。该装置是与上述方法的实施例相对应。
[0359] 第五实施例
[0360] 请参看图16,其为本申请的事件确认装置的实施例的示意图。由于装置实 施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例 的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0361] 本申请另外提供一种事件确认装置,包括:
[0362] 待检测词获取单元1601,用于获取文章中的待检测词;
[0363] 句子片段获取单元1602,用于获取与所述待检测词对应的句子片段;
[0364] 第一事件类型获取单元1603,用于获取在所述待检测词之前出现的至少一 个词分别对应的事件类型,作为第一相邻词的事件类型;
[0365] 第二事件类型获取单元1604,用于获取在所述待检测词之后出现的至少一 个词分别对应的事件类型,作为第二相邻词的事件类型;
[0366] 第一词嵌入单元1605,用于对所述文章执行词向量嵌入,得到所述文章相 关的词向量,作为第一词向量;
[0367] 第二词嵌入单元1606,用于对所述句子片段执行词向量嵌入,得到所述句 子片段相关的词向量,作为第二词向量;
[0368] 词位置向量嵌入单元1607,用于对所述句子片段中的词对应的词位置信息 执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0369] 第一事件类型向量嵌入单元1608,用于对所述第一相邻词的事件类型执行 事件类型向量嵌入,得到第一事件类型向量;
[0370] 第二事件类型向量嵌入单元1609,用于对所述第二相邻词的事件类型执行 事件类型向量嵌入,得到第二事件类型向量;
[0371] 模型输入单元1610,用于将所述第一词向量、所述第一事件类型向量、所 述第二事件类型向量、所述第二词向量和所述词位置向量作为事件类型预测模 型的输入数据,所述事件类型预测模型包括文章级事件特征抽取子网络、上下 文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网 络和第三事件类型预测子网络;
[0372] 第一特征抽取单元1611,用于通过所述文章级事件特征抽取子网络,根据 所述第一词向量抽取文章级事件特征;
[0373] 第二特征抽取单元1612,用于通过所述上下文级事件特征抽取子网络,根 据所述第二词向量和所述词位置向量抽取上下文级事件特征;
[0374] 第一事件类型预测单元1613,用于通过所述第一事件类型预测子网络,至 少根据所述文章级事件特征、所述上下文级事件特征和所述第一事件类型向量, 获取所述待检测词对应的各种事件类型的第一概率;
[0375] 第二事件类型预测单元1614,用于通过所述第二事件类型预测子网络,至 少根据所述文章级事件特征、所述上下文级事件特征和所述第二事件类型向量, 获取所述待检测词对应的各种事件类型的第二概率;
[0376] 事件类型确定单元1615,用于通过所述第三事件类型预测子网络,至少根 据所述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测 值,作为所述文章包括的事件类型。
[0377] 第六实施例
[0378] 请参考图17,其为本申请的电子设备实施例的示意图。由于设备实施例基 本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分 说明即可。下述描述的设备实施例仅仅是示意性的。
[0379] 本实施例的一种电子设备,该电子设备包括:处理器1701和存储器1702; 所述存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理 器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以 及,获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第 一相邻词的事件类型;以及,获取在所述待检测词之后出现的至少一个词分别 对应的事件类型,作为第二相邻词的事件类型;以及,获取与所述待检测词对 应的句子片段;对所述文章执行词向量嵌入,得到所述文章相关的词向量,作 为第一词向量;以及,对所述第一相邻词的事件类型执行事件类型向量嵌入, 得到第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向 量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得 到所述句子片段相关的词向量,作为第二词向量;以及,对所述句子片段中的 词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词 位置向量;将所述第一词向量、所述第一事件类型向量、所述第二事件类型向 量、所述第二词向量和所述词位置向量作为事件类型预测模型的输入数据,所 述事件类型预测模型包括文章级事件特征抽取子网络、上下文级事件特征抽取 子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型 预测子网络;通过所述文章级事件特征抽取子网络,根据所述第一词向量抽取 文章级事件特征,并通过所述上下文级事件特征抽取子网络,根据所述第二词 向量和所述词位置向量抽取上下文级事件特征;通过所述第一事件类型预测子 网络,至少根据所述文章级事件特征、所述上下文级事件特征和所述第一事件 类型向量,获取所述待检测词对应的各种事件类型的第一概率;以及,通过所 述第二事件类型预测子网络,至少根据所述文章级事件特征、所述上下文级事 件特征和所述第二事件类型向量,获取所述待检测词对应的各种事件类型的第 二概率;通过所述第三事件类型预测子网络,至少根据所述第一概率和所述第 二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章包括的 事件类型。
[0380] 在上述的实施例一中,提供了一种事件确认方法,与之相对应的,本申请 还提供又一种事件确认方法。
[0381] 第七实施例
[0382] 请参考图18,其为本申请提供的一种事件确认方法实施例的流程图,该方 法的执行主体包括事件确认装置。由于该方法实施例与实施例一的方法实施例 相对应,所以描述得比较简单,相关之处参见实施例一的部分说明即可。下述 描述的方法实施例仅仅是示意性的。
[0383] 本申请提供的一种事件确认方法包括:
[0384] 步骤S1801:获取文章中的待检测词;以及,获取在所述待检测词之前出现 的至少一个词分别对应的事件类型,作为第一相邻词的事件类型;以及,获取 在所述待检测词之后出现的至少一个词分别对应的事件类型,作为第二相邻词 的事件类型;以及,获取与所述待检测词对应的句子片段。
[0385] 步骤S1802:对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第 一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入, 得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句 子片段相关的词向量;以及,对所述句子片段中的词对应的词位置信息执行词 位置向量嵌入,得到所述句子片段中的词对应的词位置向量。
[0386] 步骤S1803:将所述第一事件类型向量、所述第二事件类型向量、所述词向 量和所述词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模 型包括上下文级事件特征抽取子网络、第一事件类型预测子网络、第二事件类 型预测子网络和第三事件类型预测子网络。
[0387] 步骤S1804:通过所述上下文级事件特征抽取子网络,根据所述句子片段中 的词对应的所述词向量和所述词位置向量抽取上下文级事件特征。
[0388] 步骤S1805:通过所述第一事件类型预测子网络,至少根据所述上下文级事 件特征和所述第一事件类型向量,获取所述待检测词对应各种事件类型的第一 概率;以及,通过所述第二事件类型预测子网络,至少根据所述上下文级事件 特征和所述第二事件类型向量,获取所述待检测词对应各种事件类型的第二概 率。
[0389] 如图19所示,所述第一事件类型预测子网络,包括用于连接所述上下文级 事件特征和所述第一事件类型向量的全连接层,通过全连接层综合所述待检测 词的各种特征(上下文级事件特征和第一事件类型向量)计算每一个事件类型 的概率,作为第一概率。所述第二事件类型预测子网络,包括用于连接所述上 下文级事件特征和所述第二事件类型向量的全连接层,通过全连接层综合所述 待检测词的各种特征(上下文级事件特征和第二事件类型向量)计算每一个事 件类型的概率,作为第二概率。
[0390] 步骤S1806:通过所述第三事件类型预测子网络,至少根据所述第一概率和 所述第二概率,确定与所述待检测词对应的事件类型的预测值,作为所述文章 包括的事件类型。
[0391] 所述第三事件类型预测子网络,综合考虑第一概率和第二概率,确定所述 待检测词的事件类型的预测值。例如,可以平均各个事件类型对应的第一概率 和第二概率,然后选出概率最大的事件类型,作为预测的事件类型。
[0392] 从上述实施例可见,本申请实施例提供的事件确认方法,通过获取文章中 的待检测词;以及,获取在所述待检测词之前出现的至少一个词分别对应的事 件类型,作为第一相邻词的事件类型;以及,获取在所述待检测词之后出现的 至少一个词分别对应的事件类型,作为第二相邻词的事件类型;以及,获取所 述待检测词对应的句子片段;对所述第一相邻词的事件类型执行事件类型向量 嵌入,得到第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件 类型向量嵌入,得到第二事件类型向量;以及,对所述句子片段执行词向量嵌 入,得到所述句子片段相关的词向量;以及,对所述句子片段中的词对应的词 位置信息执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量; 将所述第一事件类型向量、所述第二事件类型向量、所述词向量和所述词位置 向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级 事件特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和 第三事件类型预测子网络,通过所述上下文级事件特征抽取子网络,根据所述 句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特征; 通过所述第一事件类型预测子网络,根据所述上下文级事件特征和所述第一事 件类型向量,获取所述待检测词对应各种事件类型的第一概率;以及,通过所 述第二事件类型预测子网络,根据所述上下文级事件特征和所述第二事件类型 向量,获取所述待检测词对应各种事件类型的第二概率;通过所述第三事件类 型预测子网络,根据所述第一概率和所述第二概率,确定所述待检测词的事件 类型的预测值;这种处理方式,使得结合待检测词周边文本的信息,以及待检 测词之前和之后的相邻词的事件类型信息进行事件识别;因此,可以有效提升 事件识别的准确度。
[0393] 在上述的实施例中,提供了一种事件确认方法,与之相对应的,本申请还 提供一种事件确认装置。该装置是与上述方法的实施例相对应。
[0394] 第八实施例
[0395] 请参看图20,其为本申请的事件确认装置的实施例的示意图。由于装置实 施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例 的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0396] 本申请另外提供一种事件确认装置,包括:
[0397] 待检测词获取单元2001,用于获取文章中的待检测词;
[0398] 句子片段获取单元2002,用于获取与所述待检测词对应的句子片段;
[0399] 第一事件类型获取单元2003,用于获取在所述待检测词之前出现的至少一 个词分别对应的事件类型,作为第一相邻词的事件类型;
[0400] 第二事件类型获取单元2004,用于获取在所述待检测词之后出现的至少一 个词分别对应的事件类型,作为第二相邻词的事件类型;
[0401] 第一事件类型向量嵌入单元2005,用于对所述第一相邻词的事件类型执行 事件类型向量嵌入,得到第一事件类型向量;
[0402] 第二事件类型向量嵌入单元2006,用于对所述第二相邻词的事件类型执行 事件类型向量嵌入,得到第二事件类型向量;
[0403] 词嵌入单元2007,用于对所述句子片段执行词向量嵌入,得到所述句子片 段相关的词向量;
[0404] 词位置向量嵌入单元2008,用于对所述句子片段中的词对应的词位置信息 执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0405] 模型输入单元2009,用于将所述第一事件类型向量、所述第二事件类型向 量、所述词向量和所述词位置向量作为事件类型预测模型的输入数据,所述事 件类型预测模型包括上下文级事件特征抽取子网络、第一事件类型预测子网络、 第二事件类型预测子网络和第三事件类型预测子网络;
[0406] 特征抽取单元2010,用于通过所述上下文级事件特征抽取子网络,根据所 述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特 征;
[0407] 第一事件类型预测单元2011,用于通过所述第一事件类型预测子网络,至 少根据所述上下文级事件特征和所述第一事件类型向量,获取所述待检测词对 应各种事件类型的第一概率;
[0408] 第二事件类型预测单元2012,用于通过所述第二事件类型预测子网络,至 少根据所述上下文级事件特征和所述第二事件类型向量,获取所述待检测词对 应各种事件类型的第二概率;
[0409] 事件类型确定单元2013,用于通过所述第三事件类型预测子网络,至少根 据所述第一概率和所述第二概率,确定与所述待检测词对应的事件类型的预测 值,作为所述文章包括的事件类型。
[0410] 第九实施例
[0411] 请参考图21,其为本申请的电子设备实施例的示意图。由于设备实施例基 本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分 说明即可。下述描述的设备实施例仅仅是示意性的。
[0412] 本实施例的一种电子设备,该电子设备包括:处理器2101和存储器2102; 所述存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理 器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以 及,获取在所述待检测词之前出现的至少一个词分别对应的事件类型,作为第 一相邻词的事件类型;以及,获取在所述待检测词之后出现的至少一个词分别 对应的事件类型,作为第二相邻词的事件类型;以及,获取与所述待检测词对 应的句子片段;对所述第一相邻词的事件类型执行事件类型向量嵌入,得到第 一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入, 得到第二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述句 子片段相关的词向量;以及,对所述句子片段中的词对应的词位置信息执行词 位置向量嵌入,得到所述句子片段中的词对应的词位置向量;将所述第一事件 类型向量、所述第二事件类型向量、所述词向量和所述词位置向量作为事件类 型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取子 网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件类型预 测子网络;通过所述上下文级事件特征抽取子网络,根据所述句子片段中的词 对应的所述词向量和所述词位置向量抽取上下文级事件特征;通过所述第一事 件类型预测子网络,至少根据所述上下文级事件特征和所述第一事件类型向量, 获取所述待检测词对应各种事件类型的第一概率;以及,通过所述第二事件类 型预测子网络,至少根据所述上下文级事件特征和所述第二事件类型向量,获 取所述待检测词对应各种事件类型的第二概率;通过所述第三事件类型预测子 网络,至少根据所述第一概率和所述第二概率,确定与所述待检测词对应的事 件类型的预测值,作为所述文章包括的事件类型。
[0413] 在上述的实施例一中,提供了一种事件确认方法,与之相对应的,本申请 还提供又一种事件确认方法。
[0414] 第十实施例
[0415] 请参考图22,其为本申请提供的一种事件确认方法实施例的流程图,该方 法的执行主体包括事件确认装置。由于该方法实施例与实施例一的方法实施例 相对应,所以描述得比较简单,相关之处参见实施例一的部分说明即可。下述 描述的方法实施例仅仅是示意性的。
[0416] 本申请提供的一种事件确认方法包括:
[0417] 步骤S2201:获取文章中的待检测词;以及,获取在所述待检测词之前或之 后出现的至少一个词分别对应的事件类型,作为相邻词的事件类型;以及,获 取与所述待检测词对应的句子片段。
[0418] 步骤S2202:对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类 型向量;以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词 向量;以及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入, 得到所述句子片段中的词对应的词位置向量。
[0419] 步骤S2203:将所述事件类型向量、所述词向量和所述词位置向量作为事件 类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特征抽取 子网络和事件类型预测子网络。
[0420] 步骤S2204:通过所述上下文级事件特征抽取子网络,根据所述句子片段中 的词对应的所述词向量和所述词位置向量抽取上下文级事件特征。
[0421] 步骤S2205:通过所述事件类型预测子网络,至少根据所述上下文级事件特 征和所述事件类型向量,获取与所述待检测词的事件类型的预测值,作为所述 文章包括的事件类型。
[0422] 如图23所示,所述事件类型预测子网络,包括用于连接所述上下文级事件 特征和所述事件类型向量的全连接层,通过全连接层综合所述待检测词的各种 特征(上下文级事件特征和事件类型向量)计算每一个事件类型的概率,然后 选出概率最大的事件类型,作为预测的事件类型。
[0423] 从上述实施例可见,本申请实施例提供的事件确认方法,通过获取文章中 的待检测词;以及,获取在所述待检测词之前或之后出现的至少一个词分别对 应的事件类型,作为相邻词的事件类型;以及,获取所述待检测词对应的句子 片段;对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量; 以及,对所述句子片段执行词向量嵌入,得到所述句子片段相关的词向量;以 及,对所述句子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述 句子片段中的词对应的词位置向量;将所述事件类型向量、所述词向量和所述 词位置向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上 下文级事件特征抽取子网络和事件类型预测子网络,通过所述上下文级事件特 征抽取子网络,根据所述句子片段中的词对应的所述词向量和所述词位置向量 抽取上下文级事件特征;通过所述事件类型预测子网络,根据所述上下文级事 件特征和所述事件类型向量,获取所述待检测词的事件类型的预测值;这种处 理方式,使得结合待检测词周边文本的信息,以及待检测词之前或之后的相邻 词的事件类型信息进行事件识别;因此,可以有效提升事件识别的准确度。
[0424] 在上述的实施例中,提供了一种事件确认方法,与之相对应的,本申请还 提供一种事件确认装置。该装置是与上述方法的实施例相对应。
[0425] 第十一实施例
[0426] 请参看图24,其为本申请的事件确认装置的实施例的示意图。由于装置实 施例基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例 的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0427] 本申请另外提供一种事件确认装置,包括:
[0428] 待检测词获取单元2401,用于获取文章中的待检测词;
[0429] 句子片段获取单元2402,用于获取与所述待检测词对应的句子片段;
[0430] 事件类型获取单元2403,用于获取在所述待检测词之前或之后出现的至少 一个词分别对应的事件类型,作为相邻词的事件类型;
[0431] 事件类型向量嵌入单元2404,用于对所述相邻词的事件类型执行事件类型 向量嵌入,得到事件类型向量;
[0432] 词嵌入单元2405,用于对所述句子片段执行词向量嵌入,得到所述句子片 段相关的词向量;
[0433] 词位置向量嵌入单元2406,用于对所述句子片段中的词对应的词位置信息 执行词位置向量嵌入,得到所述句子片段中的词对应的词位置向量;
[0434] 模型输入单元2407,用于将所述事件类型向量、所述词向量和所述词位置 向量作为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级 事件特征抽取子网络和事件类型预测子网络;
[0435] 特征抽取单元2408,用于通过所述上下文级事件特征抽取子网络,根据所 述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事件特 征;
[0436] 事件类型预测单元2409,用于通过所述事件类型预测子网络,至少根据所 述上下文级事件特征和所述事件类型向量,获取与所述待检测词对应的事件类 型的预测值,作为所述文章包括的事件类型。
[0437] 第十二实施例
[0438] 请参考图25,其为本申请的电子设备实施例的示意图。由于设备实施例基 本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分 说明即可。下述描述的设备实施例仅仅是示意性的。
[0439] 本实施例的一种电子设备,该电子设备包括:处理器2501和存储器2502; 所述存储器,用于存储实现事件确认方法的程序,该设备通电并通过所述处理 器运行该事件确认方法的程序后,执行下述步骤:获取文章中的待检测词;以 及,获取在所述待检测词之前或之后出现的至少一个词分别对应的事件类型, 作为相邻词的事件类型;以及,获取与所述待检测词对应的句子片段;对所述 相邻词的事件类型执行事件类型向量嵌入,得到事件类型向量;以及,对所述 句子片段执行词向量嵌入,得到所述句子片段相关的词向量;以及,对所述句 子片段中的词对应的词位置信息执行词位置向量嵌入,得到所述句子片段中的 词对应的词位置向量;将所述事件类型向量、所述词向量和所述词位置向量作 为事件类型预测模型的输入数据,所述事件类型预测模型包括上下文级事件特 征抽取子网络和事件类型预测子网络;通过所述上下文级事件特征抽取子网络, 根据所述句子片段中的词对应的所述词向量和所述词位置向量抽取上下文级事 件特征;通过所述事件类型预测子网络,至少根据所述上下文级事件特征和所 述事件类型向量,获取与所述待检测词对应的事件类型的预测值,作为所述文 章包括的事件类型。
[0440] 在上述的实施例一中,提供了一种事件确认方法,与之相对应的,本申请 还提供一种事件类型预测模型构建方法。该方法是与上述方法的实施例相对应。
[0441] 第十三实施例
[0442] 请参考图26,其为本申请提供的一种事件类型预测模型构建方法实施例的 流程图,该方法的执行主体包括事件类型预测模型构建装置。由于该方法实施 例是实施例一的方法实施例的一部分,所以描述得比较简单,相关之处参见方 法实施例的部分说明即可。下述描述的方法实施例仅仅是示意性的。
[0443] 本申请提供的一种事件类型预测模型构建方法包括:
[0444] 步骤S2601:获取训练样本集。
[0445] 所述训练样本包括与训练用待检测词对应的文章、句子片段、所述句子片 段中的词的词位置信息与事件类型之间的对应关系。
[0446] 步骤S2602:根据多个待预测事件类型,构建深度神经网络。
[0447] 所述待预测事件类型,是指通过事件类型预测模型可预测的事件类型。
[0448] 所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征抽 取子网络和事件类型预测子网络。其中,所述文章级事件特征抽取子网络,用 于根据所述文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特 征抽取子网络,用于根据句子片段相关的第二词向量和所述词位置信息对应的 词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述 文章级事件特征和所述上下文级事件特征,获取所述待检测词的事件类型的预 测值。
[0449] 步骤S2603:对所述文章执行词向量嵌入,得到所述第一词向量;以及,对 所述句子片段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信 息执行词位置向量嵌入,得到所述词位置向量。
[0450] 步骤S2604:将所述第一词向量、所述第二词向量和所述词位置向量作为所 述深度神经网络的输入数据,将所述事件类型作为所述深度神经网络的输出数 据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模 型。
[0451] 所述事件类型预测子网络的损失函数包括但不限于二值交叉熵函数。
[0452] 请参考图27,其为本申请提供的一种事件类型预测模型构建方法实施例的 具体流程图。在本实施例中,所述方法还包括如下步骤:
[0453] 步骤S2701:获取在所述待检测词之前或之后出现的至少一个词分别对应的 事件类型,作为相邻词的事件类型。
[0454] 步骤S2702:对所述相邻词的事件类型执行事件类型向量嵌入,得到事件类 型向量。
[0455] 在这种情况下,所述事件类型预测子网络,具体用于根据所述文章级事件 特征、所述上下文级事件特征和所述事件类型向量,获取所述预测值。相应的, 所述深度神经网络的输入数据还包括所述事件类型向量。
[0456] 从上述实施例可见,本申请实施例提供的事件类型预测模型构建方法,通 过获取训练样本集;其中,所述训练样本包括训练用待检测词对应的文章、句 子片段、所述句子片段中的词的词位置信息与事件类型之间的对应关系;根据 多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章 级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络; 所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文 章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的 第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述 事件类型预测子网络,用于根据所述文章级事件特征和所述上下文级事件特征, 获取所述待检测词的事件类型的预测值;对所述文章执行词向量嵌入,得到所 述第一词向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向量; 以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;将所述 第一词向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入 数据,将所述事件类型作为所述深度神经网络的输出数据,根据所述训练样本 集对所述深度神经网络进行训练,得到事件类型预测模型;这种处理方式,使 得结合待检测词所在文章的信息和周边文本的信息,构建事件类型预测模型; 因此,可以有效提升事件类型预测模型的预测准确度。同时,这种处理方式还 使得文章级事件特征与样本一同训练,从而可以得到更多与事件提取任务有针 对性的反馈;因此,可以进一步有效提升事件类型预测模型的预测准确度。
[0457] 在上述的实施例中,提供了一种事件类型预测模型构建方法,与之相对应 的,本申请还提供一种事件类型预测模型构建装置。该装置是与上述方法的实 施例相对应。
[0458] 第十四实施例
[0459] 请参看图28,其为本申请的事件类型预测模型构建装置的实施例的示意图。 由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见 方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0460] 本申请另外提供一种事件类型预测模型构建装置,包括:
[0461] 训练样本获取单元2801,用于获取训练样本集;其中,所述训练样本包括 与训练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息 与事件类型之间的对应关系;
[0462] 网络构建单元2802,用于根据多个待预测事件类型,构建深度神经网络; 其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征 抽取子网络和事件类型预测子网络;所述文章级事件特征抽取子网络,用于根 据所述文章相关的第一词向量抽取文章级事件特征;所述上下文级事件特征抽 取子网络,用于根据句子片段相关的第二词向量和所述词位置信息对应的词位 置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所述文章 级事件特征和所述上下文级事件特征,获取所述待检测词的事件类型的预测值;
[0463] 第一词嵌入单元2803,用于对所述文章执行词向量嵌入,得到所述第一词 向量;
[0464] 第二词嵌入单元2804,用于对所述句子片段执行词向量嵌入,得到所述第 二词向量;
[0465] 词位置向量嵌入单元2805,用于对所述词位置信息执行词位置向量嵌入, 得到所述词位置向量;
[0466] 模型训练单元2806,用于将所述第一词向量、所述第二词向量和所述词位 置向量作为所述深度神经网络的输入数据,将所述事件类型作为所述深度神经 网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事 件类型预测模型。
[0467] 请参看图29,其为本申请的事件类型预测模型构建装置的实施例的示意图。 可选的,所述装置还包括:
[0468] 事件类型获取单元2901,用于获取在所述待检测词之前或之后出现的至少 一个词分别对应的事件类型,作为相邻词的事件类型。
[0469] 事件类型向量嵌入单元2902,用于对所述相邻词的事件类型执行事件类型 向量嵌入,得到事件类型向量。
[0470] 在这种情况下,所述事件类型预测子网络,具体用于根据所述文章级事件 特征、所述上下文级事件特征和所述事件类型向量,获取所述预测值。相应的, 所述深度神经网络的输入数据还包括所述事件类型向量。
[0471] 第十五实施例
[0472] 请参考图30,其为本申请的电子设备实施例的示意图。由于设备实施例基 本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分 说明即可。下述描述的设备实施例仅仅是示意性的。
[0473] 本实施例的一种电子设备,该电子设备包括:处理器3001和存储器3002; 所述存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并 通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤: 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句 子片段、所述句子片段中的词的词位置信息与事件类型之间的对应关系;根据 多个待预测事件类型,构建深度神经网络;其中,所述深度神经网络包括文章 级事件特征抽取子网络、上下文级事件特征抽取子网络和事件类型预测子网络; 所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽取文 章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相关的 第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述 事件类型预测子网络,用于根据所述文章级事件特征和所述上下文级事件特征, 获取所述待检测词的事件类型的预测值;对所述文章执行词向量嵌入,得到所 述第一词向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向量; 以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量;将所述 第一词向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入 数据,将所述事件类型作为所述深度神经网络的输出数据,根据所述训练样本 集对所述深度神经网络进行训练,得到事件类型预测模型。
[0474] 在上述的实施例四中,提供了一种事件确认方法,与之相对应的,本申请 还提供一种事件类型预测模型构建方法。该方法是与上述方法的实施例相对应。
[0475] 第十六实施例
[0476] 请参考图31,其为本申请提供的一种事件类型预测模型构建方法实施例的 流程图,该方法的执行主体包括事件类型预测模型构建装置。由于该方法实施 例是实施例四的方法实施例的一部分,所以描述得比较简单,相关之处参见方 法实施例的部分说明即可。下述描述的方法实施例仅仅是示意性的。
[0477] 本申请提供的一种事件类型预测模型构建方法包括:
[0478] 步骤S3101:获取训练样本集。
[0479] 其中,所述训练样本包括训练用待检测词对应的文章、句子片段、所述句 子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事件类型 与所述待检测词的事件类型之间的对应关系。
[0480] 所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述第二相 邻词包括在所述待检测词之后出现的至少一个词。
[0481] 步骤S3102:根据多个待预测事件类型,构建深度神经网络。
[0482] 其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件 特征抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三 事件类型预测子网络。
[0483] 所述文章级事件特征抽取子网络,用于根据所述文章相关的第一词向量抽 取文章级事件特征;所述上下文级事件特征抽取子网络,用于根据句子片段相 关的第二词向量和所述词位置信息对应的词位置向量抽取上下文级事件特征; 所述第一事件类型预测子网络,用于根据所述文章级事件特征、所述上下文级 事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取所述待 检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络,用于 根据所述文章级事件特征、所述上下文级事件特征和所述第二相邻词的事件类 型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概 率;所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率, 确定所述待检测词的事件类型的预测值。
[0484] 步骤S3103:对所述文章执行词向量嵌入,得到所述第一词向量;以及,对 所述第一相邻词的事件类型执行事件类型向量嵌入,得到所述第一事件类型向 量;以及,对所述第二相邻词的事件类型执行事件类型向量嵌入,得到所述第 二事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述第二词向 量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向量。
[0485] 步骤S3104:将所述第一词向量、所述第一事件类型向量、所述第二事件类 型向量、所述第二词向量和所述词位置向量作为所述深度神经网络的输入数据, 将所述待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练 样本集对所述深度神经网络进行训练,得到事件类型预测模型。
[0486] 从上述实施例可见,本申请实施例提供的事件类型预测模型构建方法,通 过获取训练样本集;其中,所述训练样本包括训练用待检测词对应的文章、句 子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相 邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词 包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检 测词之后出现的至少一个词;根据多个待预测事件类型,构建深度神经网络; 其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征 抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件 类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的 第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根 据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文 级事件特征;所述第一事件类型预测子网络,用于根据所述文章级事件特征、 所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向 量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预 测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第二 相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事 件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和 所述第二概率,确定所述待检测词的事件类型的预测值;对所述文章执行词向 量嵌入,得到所述第一词向量;以及,对所述第一相邻词的事件类型执行事件 类型向量嵌入,得到所述第一事件类型向量;以及,对所述第二相邻词的事件 类型执行事件类型向量嵌入,得到所述第二事件类型向量;以及,对所述句子 片段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信息执行词 位置向量嵌入,得到所述词位置向量;将所述第一词向量、所述第一事件类型 向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为所述深 度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的 输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型 预测模型;这种处理方式,使得结合待检测词所在文章的信息、周边文本的信 息、及待检测词前后的相邻词的事件类型信息,构建事件类型预测模型;因此, 可以有效提升事件类型预测模型的预测准确度。同时,这种处理方式还使得文 章级事件特征与样本一同训练,从而可以得到更多与事件提取任务有针对性的 反馈;因此,可以进一步有效提升事件类型预测模型的预测准确度。
[0487] 在上述的实施例中,提供了一种事件类型预测模型构建方法,与之相对应 的,本申请还提供一种事件类型预测模型构建装置。该装置是与上述方法的实 施例相对应。
[0488] 第十七实施例
[0489] 请参看图32,其为本申请的事件类型预测模型构建装置的实施例的示意图。 由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见 方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0490] 本申请另外提供一种事件类型预测模型构建装置,包括:
[0491] 训练样本获取单元3201,用于获取训练样本集;其中,所述训练样本包括 与训练用待检测词对应的文章、句子片段、所述句子片段中的词的词位置信息、 第一相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之 间的对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词, 所述第二相邻词包括在所述待检测词之后出现的至少一个词;
[0492] 网络构建单元3202,用于根据多个待预测事件类型,构建深度神经网络; 其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征 抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件 类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的 第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根 据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文 级事件特征;所述第一事件类型预测子网络,用于根据所述文章级事件特征、 所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向 量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预 测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第二 相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事 件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和 所述第二概率,确定所述待检测词的事件类型的预测值;
[0493] 第一词嵌入单元3203,用于对所述文章执行词向量嵌入,得到所述第一词 向量;
[0494] 第一事件类型向量嵌入单元3204,用于对所述第一相邻词的事件类型执行 事件类型向量嵌入,得到所述第一事件类型向量;
[0495] 第二事件类型向量嵌入单元3205,用于对所述第二相邻词的事件类型执行 事件类型向量嵌入,得到所述第二事件类型向量;
[0496] 第二词嵌入单元3206,用于对所述句子片段执行词向量嵌入,得到所述第 二词向量;
[0497] 词位置向量嵌入单元3207,用于对所述词位置信息执行词位置向量嵌入, 得到所述词位置向量;
[0498] 模型训练单元3208,用于将所述第一词向量、所述第一事件类型向量、所 述第二事件类型向量、所述第二词向量和所述词位置向量作为所述深度神经网 络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据, 根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
[0499] 第十八实施例
[0500] 请参考图33,其为本申请的电子设备实施例的示意图。由于设备实施例基 本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分 说明即可。下述描述的设备实施例仅仅是示意性的。
[0501] 本实施例的一种电子设备,该电子设备包括:处理器3301和存储器3302; 所述存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并 通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤: 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的文章、句 子片段、所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相 邻词的事件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词 包括在所述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检 测词之后出现的至少一个词;根据多个待预测事件类型,构建深度神经网络; 其中,所述深度神经网络包括文章级事件特征抽取子网络、上下文级事件特征 抽取子网络、第一事件类型预测子网络、第二事件类型预测子网络和第三事件 类型预测子网络;所述文章级事件特征抽取子网络,用于根据所述文章相关的 第一词向量抽取文章级事件特征;所述上下文级事件特征抽取子网络,用于根 据句子片段相关的第二词向量和所述词位置信息对应的词位置向量抽取上下文 级事件特征;所述第一事件类型预测子网络,用于根据所述文章级事件特征、 所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向 量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预 测子网络,用于根据所述文章级事件特征、所述上下文级事件特征和所述第二 相邻词的事件类型对应的第二事件类型向量,获取所述待检测词对应的各种事 件类型的第二概率;所述第三事件类型预测子网络,用于根据所述第一概率和 所述第二概率,确定所述待检测词的事件类型的预测值;对所述文章执行词向 量嵌入,得到所述第一词向量;以及,对所述第一相邻词的事件类型执行事件 类型向量嵌入,得到所述第一事件类型向量;以及,对所述第二相邻词的事件 类型执行事件类型向量嵌入,得到所述第二事件类型向量;
以及,对所述句子 片段执行词向量嵌入,得到所述第二词向量;以及,对所述词位置信息执行词 位置向量嵌入,得到所述词位置向量;将所述第一词向量、所述第一事件类型 向量、所述第二事件类型向量、所述第二词向量和所述词位置向量作为所述深 度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的 输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类型 预测模型。
[0502] 在上述的实施例七中,提供了一种事件确认方法,与之相对应的,本申请 还提供一种事件类型预测模型构建方法。该方法是与上述方法的实施例相对应。
[0503] 第十九实施例
[0504] 请参考图34,其为本申请提供的一种事件类型预测模型构建方法实施例的 流程图,该方法的执行主体包括事件类型预测模型构建装置。由于该方法实施 例是实施例七的方法实施例的一部分,所以描述得比较简单,相关之处参见方 法实施例的部分说明即可。下述描述的方法实施例仅仅是示意性的。
[0505] 本申请提供的一种事件类型预测模型构建方法包括:
[0506] 步骤S3401:获取训练样本集。
[0507] 其中,所述训练样本包括训练用待检测词对应的句子片段、所述句子片段 中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事件类型与所述 待检测词的事件类型之间的对应关系;所述第一相邻词包括在所述待检测词之 前出现的至少一个词,所述第二相邻词包括在所述待检测词之后出现的至少一 个词。
[0508] 步骤S3402:根据多个待预测事件类型,构建深度神经网络。
[0509] 其中,所述深度神经网络包括上下文级事件特征抽取子网络、第一事件类 型预测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述上 下文级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信 息对应的词位置向量抽取上下文级事件特征;所述第一事件类型预测子网络, 用于根据所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件 类型向量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件 类型预测子网络,用于根据所述上下文级事件特征和所述第二相邻词的事件类 型对应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概 率;所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率, 确定所述待检测词的事件类型的预测值。
[0510] 步骤S3403:对所述第一相邻词的事件类型执行事件类型向量嵌入,得到所 述第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类型向量 嵌入,得到所述第二事件类型向量;以及,对所述句子片段执行词向量嵌入, 得到所述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词 位置向量。
[0511] 步骤S3404:将所述第一事件类型向量、所述第二事件类型向量、所述词向 量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的事 件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度神 经网络进行训练,得到事件类型预测模型。
[0512] 从上述实施例可见,本申请实施例提供的事件类型预测模型构建方法,通 过获取训练样本集;其中,所述训练样本包括训练用待检测词对应的句子片段、 所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事 件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所 述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后 出现的至少一个词;根据多个待预测事件类型,构建深度神经网络;其中,所 述深度神经网络包括上下文级事件特征抽取子网络、第一事件类型预测子网络、 第二事件类型预测子网络和第三事件类型预测子网络;所述上下文级事件特征 抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置 向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述上 下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取 所述待检测词对应的各种事件类型的第一概率;所述第二事件类型预测子网络, 用于根据所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件 类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第三事件 类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词 的事件类型的预测值;对所述第一相邻词的事件类型执行事件类型向量嵌入, 得到所述第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类 型向量嵌入,得到所述第二事件类型向量;以及,对所述句子片段执行词向量 嵌入,得到所述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到 所述词位置向量;将所述第一事件类型向量、所述第二事件类型向量、所述词 向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的 事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度 神经网络进行训练,得到事件类型预测模型;这种处理方式,使得结合待检测 词周边文本的信息、及待检测词之前和之后的相邻词的事件类型信息,构建事 件类型预测模型;因此,可以有效提升事件识别的准确度。
[0513] 在上述的实施例中,提供了一种事件类型预测模型构建方法,与之相对应 的,本申请还提供一种事件类型预测模型构建装置。该装置是与上述方法的实 施例相对应。
[0514] 第二十实施例
[0515] 请参看图35,其为本申请的事件类型预测模型构建装置的实施例的示意图。 由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见 方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0516] 本申请另外提供一种事件类型预测模型构建装置,包括:
[0517] 训练样本获取单元3501,用于获取训练样本集;其中,所述训练样本包括 与训练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、第一 相邻词的事件类型、第二相邻词的事件类型与所述待检测词的事件类型之间的 对应关系;所述第一相邻词包括在所述待检测词之前出现的至少一个词,所述 第二相邻词包括在所述待检测词之后出现的至少一个词;
[0518] 网络构建单元3502,用于根据多个待预测事件类型,构建深度神经网络; 其中,所述深度神经网络包括上下文级事件特征抽取子网络、第一事件类型预 测子网络、第二事件类型预测子网络和第三事件类型预测子网络;所述上下文 级事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对 应的词位置向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于 根据所述上下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型 向量,获取所述待检测词对应的各种事件类型的第一概率;所述第二事件类型 预测子网络,用于根据所述上下文级事件特征和所述第二相邻词的事件类型对 应的第二事件类型向量,获取所述待检测词对应的各种事件类型的第二概率; 所述第三事件类型预测子网络,用于根据所述第一概率和所述第二概率,确定 所述待检测词的事件类型的预测值;
[0519] 第一事件类型向量嵌入单元3503,用于对所述第一相邻词的事件类型执行 事件类型向量嵌入,得到所述第一事件类型向量;
[0520] 第二事件类型向量嵌入单元3504,用于对所述第二相邻词的事件类型执行 事件类型向量嵌入,得到所述第二事件类型向量;
[0521] 词嵌入单元3505,用于对所述句子片段执行词向量嵌入,得到所述词向量;
[0522] 词位置向量嵌入单元3506,用于对所述词位置信息执行词位置向量嵌入, 得到所述词位置向量;
[0523] 模型训练单元3507,用于将所述第一事件类型向量、所述第二事件类型向 量、所述词向量和所述词位置向量作为所述深度神经网络的输入数据,将所述 待检测词的事件类型作为所述深度神经网络的输出数据,根据所述训练样本集 对所述深度神经网络进行训练,得到事件类型预测模型。
[0524] 第二十一实施例
[0525] 请参考图36,其为本申请的电子设备实施例的示意图。由于设备实施例基 本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分 说明即可。下述描述的设备实施例仅仅是示意性的。
[0526] 本实施例的一种电子设备,该电子设备包括:处理器3601和存储器3602; 所述存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并 通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤: 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、 所述句子片段中的词的词位置信息、第一相邻词的事件类型、第二相邻词的事 件类型与所述待检测词的事件类型之间的对应关系;所述第一相邻词包括在所 述待检测词之前出现的至少一个词,所述第二相邻词包括在所述待检测词之后 出现的至少一个词;根据多个待预测事件类型,构建深度神经网络;其中,所 述深度神经网络包括上下文级事件特征抽取子网络、第一事件类型预测子网络、 第二事件类型预测子网络和第三事件类型预测子网络;所述上下文级事件特征 抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应的词位置 向量抽取上下文级事件特征;所述第一事件类型预测子网络,用于根据所述上 下文级事件特征和所述第一相邻词的事件类型对应的第一事件类型向量,获取 所述待检测词对应的各种事件类型的第一概率;
所述第二事件类型预测子网络, 用于根据所述上下文级事件特征和所述第二相邻词的事件类型对应的第二事件 类型向量,获取所述待检测词对应的各种事件类型的第二概率;所述第三事件 类型预测子网络,用于根据所述第一概率和所述第二概率,确定所述待检测词 的事件类型的预测值;对所述第一相邻词的事件类型执行事件类型向量嵌入, 得到所述第一事件类型向量;以及,对所述第二相邻词的事件类型执行事件类 型向量嵌入,得到所述第二事件类型向量;以及,对所述句子片段执行词向量 嵌入,得到所述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到 所述词位置向量;将所述第一事件类型向量、所述第二事件类型向量、所述词 向量和所述词位置向量作为所述深度神经网络的输入数据,将所述待检测词的 事件类型作为所述深度神经网络的输出数据,根据所述训练样本集对所述深度 神经网络进行训练,得到事件类型预测模型。
[0527] 在上述的实施例十中,提供了一种事件确认方法,与之相对应的,本申请 还提供一种事件类型预测模型构建方法。该方法是与上述方法的实施例相对应。
[0528] 第二十二实施例
[0529] 请参考图37,其为本申请提供的一种事件类型预测模型构建方法实施例的 流程图,该方法的执行主体包括事件类型预测模型构建装置。由于该方法实施 例是实施例十的方法实施例的一部分,所以描述得比较简单,相关之处参见方 法实施例的部分说明即可。下述描述的方法实施例仅仅是示意性的。
[0530] 本申请提供的一种事件类型预测模型构建方法包括:
[0531] 步骤S3701:获取训练样本集。
[0532] 其中,所述训练样本包括训练用待检测词对应的句子片段、所述句子片段 中的词的词位置信息、相邻词的事件类型与所述待检测词的事件类型之间的对 应关系;所述相邻词包括在所述待检测词之前或之后出现的至少一个词。
[0533] 步骤S3702:根据多个待预测事件类型,构建深度神经网络。
[0534] 其中,所述深度神经网络包括上下文级事件特征抽取子网络和事件类型预 测子网络;所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向 量和所述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型 预测子网络,用于根据所述上下文级事件特征和所述相邻词的事件类型对应的 事件类型向量,获取所述待检测词的事件类型的预测值。
[0535] 步骤S3703:对所述相邻词的事件类型执行事件类型向量嵌入,得到所述事 件类型向量;以及,对所述句子片段执行词向量嵌入,得到所述词向量;以及, 对所述词位置信息执行词位置向量嵌入,得到所述词位置向量。
[0536] 步骤S3704:将所述事件类型向量、所述词向量和所述词位置向量作为所述 深度神经网络的输入数据,将所述待检测词的事件类型作为所述深度神经网络 的输出数据,根据所述训练样本集对所述深度神经网络进行训练,得到事件类 型预测模型。
[0537] 从上述实施例可见,本申请实施例提供的事件类型预测模型构建方法,通 过获取训练样本集;其中,所述训练样本包括训练用待检测词对应的句子片段、 所述句子片段中的词的词位置信息、相邻词的事件类型与所述待检测词的事件 类型之间的对应关系;所述相邻词包括在所述待检测词之前或之后出现的至少 一个词;根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经 网络包括上下文级事件特征抽取子网络和事件类型预测子网络;所述上下文级 事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应 的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所 述上下文级事件特征和所述相邻词的事件类型对应的事件类型向量,获取所述 待检测词的事件类型的预测值;对所述相邻词的事件类型执行事件类型向量嵌 入,得到所述事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所 述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向 量;将所述事件类型向量、所述词向量和所述词位置向量作为所述深度神经网 络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据, 根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型; 这种处理方式,使得结合待检测词周边文本的信息、及待检测词之前或之后的 相邻词的事件类型信息,构建事件类型预测模型;因此,可以有效提升事件识 别的准确度。
[0538] 在上述的实施例中,提供了一种事件类型预测模型构建方法,与之相对应 的,本申请还提供一种事件类型预测模型构建装置。该装置是与上述方法的实 施例相对应。
[0539] 第二十三实施例
[0540] 请参看图38,其为本申请的事件类型预测模型构建装置的实施例的示意图。 由于装置实施例基本相似于方法实施例,所以描述得比较简单,相关之处参见 方法实施例的部分说明即可。下述描述的装置实施例仅仅是示意性的。
[0541] 本申请另外提供一种事件类型预测模型构建装置,包括:
[0542] 训练样本获取单元3801,用于获取训练样本集;其中,所述训练样本包括 与训练用待检测词对应的句子片段、所述句子片段中的词的词位置信息、相邻 词的事件类型与所述待检测词的事件类型之间的对应关系;所述相邻词包括在 所述待检测词之前或之后出现的至少一个词;
[0543] 网络构建单元3802,用于根据多个待预测事件类型,构建深度神经网络; 其中,所述深度神经网络包括上下文级事件特征抽取子网络和事件类型预测子 网络;所述上下文级事件特征抽取子网络,用于根据句子片段相关的词向量和 所述词位置信息对应的词位置向量抽取上下文级事件特征;所述事件类型预测 子网络,用于根据所述上下文级事件特征和所述相邻词的事件类型对应的事件 类型向量,获取所述待检测词的事件类型的预测值;
[0544] 事件类型向量嵌入单元3803,用于对所述相邻词的事件类型执行事件类型 向量嵌入,得到所述事件类型向量;
[0545] 词嵌入单元3804,用于对所述句子片段执行词向量嵌入,得到所述词向量;
[0546] 词位置向量嵌入单元3805,用于对所述词位置信息执行词位置向量嵌入, 得到所述词位置向量;
[0547] 模型训练单元3806,用于将所述事件类型向量、所述词向量和所述词位置 向量作为所述深度神经网络的输入数据,将所述待检测词的事件类型作为所述 深度神经网络的输出数据,根据所述训练样本集对所述深度神经网络进行训练, 得到事件类型预测模型。
[0548] 第二十四实施例
[0549] 请参考图39,其为本申请的电子设备实施例的示意图。由于设备实施例基 本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分 说明即可。下述描述的设备实施例仅仅是示意性的。
[0550] 本实施例的一种电子设备,该电子设备包括:处理器3901和存储器3902; 所述存储器,用于存储实现事件类型预测模型构建方法的程序,该设备通电并 通过所述处理器运行该事件类型预测模型构建方法的程序后,执行下述步骤: 获取训练样本集;其中,所述训练样本包括与训练用待检测词对应的句子片段、 所述句子片段中的词的词位置信息、相邻词的事件类型与所述待检测词的事件 类型之间的对应关系;所述相邻词包括在所述待检测词之前或之后出现的至少 一个词;根据多个待预测事件类型,构建深度神经网络;其中,所述深度神经 网络包括上下文级事件特征抽取子网络和事件类型预测子网络;所述上下文级 事件特征抽取子网络,用于根据句子片段相关的词向量和所述词位置信息对应 的词位置向量抽取上下文级事件特征;所述事件类型预测子网络,用于根据所 述上下文级事件特征和所述相邻词的事件类型对应的事件类型向量,获取所述 待检测词的事件类型的预测值;对所述相邻词的事件类型执行事件类型向量嵌 入,得到所述事件类型向量;以及,对所述句子片段执行词向量嵌入,得到所 述词向量;以及,对所述词位置信息执行词位置向量嵌入,得到所述词位置向 量;将所述事件类型向量、所述词向量和所述词位置向量作为所述深度神经网 络的输入数据,将所述待检测词的事件类型作为所述深度神经网络的输出数据, 根据所述训练样本集对所述深度神经网络进行训练,得到事件类型预测模型。
[0551] 本申请虽然以较佳实施例公开如上,但其并不是用来限定本申请,任何本 领域技术人员在不脱离本申请的精神和范围内,都可以做出可能的变动和修改, 因此本申请的保护范围应当以本申请权利要求所界定的范围为准。
[0552] 在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输 出接口、网络接口和内存。
[0553] 内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM) 和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是 计算机可读介质的示例。
[0554] 1、计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由 任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程 序的模或其他数据。计算机的存储介质的例子包括,但不限于相变内存  (PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类 型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器 (EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字 多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性 存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按 照本文中的界定,计算机可读介质不包括非暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0555] 2、本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机 程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件 和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计 算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、 光学存储器等)上实施的计算机程序产品的形式。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈