首页 / 专利库 / 人工智能 / 人工智能 / 自然语言处理 / 共指消解 / 一种英语作文语篇连贯质量的分析方法

一种英语作文语篇连贯质量的分析方法

阅读:127发布:2020-05-16

专利汇可以提供一种英语作文语篇连贯质量的分析方法专利检索,专利查询,专利分析的服务。并且本 发明 提供一种英语作文语篇连贯 质量 的分析方法,该方法是一个由顺序连接的英语作文预处理模 块 、英语作文语法 角 色标注模块、英语作文特征提取模块、英语作文 共指消解 模块、英语作文实体链网格构建模块和英语作文语篇连贯分析模块组成的分析模型。一篇英语作文通过该分析模型处理后,最后能够得到这篇英语作文的语篇连贯质量分析结果。本发明的方法解决了英语作文中指代关系、语言用词的连贯性分析问题,其分析结果比传统的英语作文语篇连贯质量分析方法的分析结果更好。,下面是一种英语作文语篇连贯质量的分析方法专利的具体信息内容。

1.一种英语作文语篇连贯质量的分析方法,其特征是:包括一个由顺序连的英语作文预处理模、英语作文语法色标注模块、英语作文特征提取模块、英语作文共指消解模块、英语作文实体链网格构建模块和英语作文语篇连贯分析模块组成的分析模型,其分析方法包括如下步骤:
(1)英语作文预处理模块读入一篇英语作文,对该篇英语作文进行分段、分词、分句、词性标注和依存句法分析,输出该英语作文的预处理结果;
(2)英语作文语法角色标注模块读入该英语作文的预处理结果,在预处理结果中找出每个实体词的依存关系,并根据依存关系标注这些实体词在其句子中的语法角色,输出这些实体词在其句子中的语法角色;
(3)英语作文特征提取模块读入该英语作文的预处理结果,对预处理结果中实体词进行语义等级定义,同时提取这些实体词的共指消解特征,输出这些实体词共指消解特征;
(4)英语作文特征提取模块读入英语作文特征提取模块输出的实体词共指消解特征,通过共指消解模型和实体词共指消解特征,对实体词的共指关系进行分析,输出这些实体词构成的共指链表;
(5)英语作文实体链网格构建模块读入英语作文共指消解模块输出的实体词共指链表,利用实体词共指链表构建该英语作文实体链网格,并用优先级高语法角色替换实体链网格中优先级低语法角色,输出该英语作文的实体链网格;
(6)英语作文语篇连贯分析模块读入英语作文实体链网格构建模块输出的英语作文实体链网格,通过这个实体链网格分析英语作文的句子连贯度,并计算英语作文的语篇连贯质量,输出该英语作文的语篇连贯质量分析结果。
2.根据权利要求1所述的分析方法,其特征是:所述的英语作文预处理模块处理步骤如下:
P201开始;
P202读入英语作文;
P203对英语作文进行分段;
P204对英语作文进行分句;
P205对英语作文进行分词;
P206根据单词词性标注集对英语作文进行词性标注;
P207根据英语作文的词性标注结果,生成英语作文的单词有向图,在该有向图中,一个节点为单词及其词性标注,每个节点之间通过一条有向边连接起来;
P208根据有向边依存关系权值结合,赋予有向图中有向边的依存关系对应的权值;
P209通过贪心搜索生成英语作文的句子依存关系库,并输出英语作文的依存句法分析结果;
P210结束。
3.根据权利要求1所述的分析方法,其特征是:所述的英语作文语法角色标注模块处理步骤如下:
P301开始;
P302读取英语作文的依存句法分析结果;
P303遍历英语作文的句子依存关系中依存树的叶子节点
P304如果当前节点所在的单词是实体词,则转P305操作,否则转P303操作;
P305寻找当前节点的兄弟节点;
P306在单词词性标注集中查询当前节点与其兄弟节点所构成的组成成分;
P307如果在单词词性标注集中查询到结果,则转P308操作,否则转P315操作;
P308根据短语句法标注集对当前短语进行短语标注;
P309如果当前短语是介词短语,则转P310操作,否则转P311操作;
P310对介词短语进行处理,转P315操作;
P311如果当前短语是名词短语,则转P312操作,否则转P313操作;
P312对名词短语进行处理,转P315操作;
P313如果当前短语是“Most of”短语,则转P314操作,否则转P315操作;
P314对“Most of”短语进行处理,转P315操作;
P315从英语作文的句子依存关系库中,获取与当前实体词有关的所有依存关系;
P316如果存在名词性主语关系或从句成分主语关系,则转P317操作,否则转P318操作;
P317将当前实体词的语法角色标记为主语,转P321操作;
P318如果存在直接宾语关系或间接宾语关系,则转P319操作,否则转P320操作;
P319将当前实体词标注为宾语,转P321操作;
P320将当前实体词的语法角色标注为“存在”;
P321将英语作文的语法角色标注结果存到语法角色标注链表;
P322如果依存句法树遍历结束,则转P323操作,否则转P303操作;
P323输出英语作文的语法角色标注结果;
P324结束。
4.根据权利要求1所述的分析方法,其特征是:所述的英语作文特征提取模块处理步骤如下:
P401开始;
P402读取英语作文的依存句法分析结果;
P403遍历依存句法树的叶子节点;
P404根据依存句法分析结果,进行实体词检测;
P405如果当前单词被检测为实体词,则转P406操作,否则转P403操作;
P406依据共指消解特征集,创建一个用于存储特征信息的“表述”对象;
P407通过实体词的位置信息,在依存句法树中找到代表当前实体词的叶子节点;
P408从当前叶子节点开始,向上寻找当前节点的父节点
P409如果父节点是名词短语节点,则转P410操作,否则转P408操作;
P410将名词短语节点下的所有叶子节点整合为一个短语,并存到当前“表述”对象中;
P411根据共指消解特征集提取实体词的普通特征,存到当前“表述”对象中;
P412分别查询男性人名词汇表和女性人名词汇表;
P413如果查询到当前实体词的性别,则转P414操作,否则转P415操作;
P414将性别特征存到当前“表述”对象中,转P416操作;
P415将性别特征设为未知,并存到当前“表述”对象中;
P416查询常见表示人物的词汇表;
P417如果在常见表示人物的词汇表中查询到当前实体词,则转P418操作,否则转P419操作;
P418将对应的语义等级类型作为当前实体词的语义等级,转P426操作;
P419对实体词进行命名实体识别;
P420如果命名实体识别结果为命名实体,则转P421操作,否则转P422操作;
P421将命名实体识别结果转化为对应的语义等级,转P426操作;
P422对实体词进行日期检测;
P423如果实体词表示日期,则转P424操作,否则转P425操作;
P424将实体词的语义等级设为日期,转P426操作;
P425将实体词的语义等级结果标注为“对象”;
P426查询包含有生命特征词汇的有生词汇表;
P427如果在有生词汇表中查询到当前实体词,则转P428操作,否则转P429操作;
P428将实体词的有生特征标注为真,转P430操作;
P429将实体词的有生特征标注为假;
P430查询别名表;
P431如果在别名表中查询到当前实体词,则转P433操作,否则转P432操作;
P432将别名特征设置为空,转P434操作;
P433将查询到的别名信息存到当前实体词的别名特征中;
P434在英语实体词常识库中查询当前实体的事实信息,并将结果存到共指消解特征集中;
P435如果依存句法树遍历结束,则转P436操作,否则转P403操作;
P436输出英语作文特征提取结果;
P437结束。
5.根据权利要求1所述的分析方法,其特征是:所述的英语作文共指消解模块的计算公式定义如下:
(1)词汇语义相似度的计算公式
在公式(1)中,路径1是指在语义分类树中,从两个单词词义的最小公共父节点到根节点的路径;路径2是指在语义分类树中,从第一个单词的词义到两个单词词义的最小公共父节点的路径;路径3是指在语义分类树中,第二个单词的词义到两个单词词义的最小公共父节点的路径,其中,最小公共父节点是指从两个单词的词义所在的节点开始向上进行搜索,搜索到的当前两个单词词义节点的首个共同父节点;
(2)实体词集合信息熵的计算公式
在公式(2)中,决策类别属性i是决策类别中第i个属性;i是当前属性的序号,i=1,
2,…,m;m是决策类别中属性的总个数;决策类别所有属性总数是决策类别中属性的总个数;
(3)共指消解特征期望信息的计算公式
在公式(3)中,特征A是当前待计算的特征;j是当前属性的序号,j=1,2,…,v;v是实体词集合中特征A的属性类别个数;属性j是特征A中第j个属性;实体词集合信息熵是由上述公式(2)计算得到;
(4)共指消解特征信息增益的计算公式
共指消解特征信息增益=实体词集合信息熵-共指消解特征期望信息   (4)在公式(4)中,实体词集合信息熵是通过上述公式(2)计算得到;共指消解特征期望信息是通过上述公式(3)计算得到;
(5)共指消解特征分裂信息的计算公式
在公式(5)中,特征A是当前待计算的特征;j是当前属性的序号,j=1,2,…,v;v是实体词集合中特征A的属性类别个数;属性j是特征A中第j个属性;
(6)共指消解特征信息增益率的计算公式
在公式(6)中,信息增益是通过上述公式(4)计算得到;分裂信息是通过上述公式(5)计算得到。
6.根据权利要求5所述的分析方法,其特征是:所述的英语作文共指消解模块处理步骤如下:
P501开始;
P502读取英语作文的特征提取结果;
P503对英语作文的特征提取结果进行遍历;
P504检测单词“it”是否处于没有指代任何前指词的句型或语义中;
P505如果单词“it”具有非指代性,则转P519操作,否则转P506操作;
P506如果当前实体词存在同位语,则转P507操作,否则转P508操作;
P507将当前实体词加入到其同位语所在的共指链中,转P521操作;
P508如果当前实体词处于以“As”开头的从句中,则转P509操作,否则转P511操作;
P509如果“As”从句中的主语存在主语关系,则转P510操作,否则转P511操作;
P510将当前实体词加入到“As”从句主语的实体词所在的实体链中,转P521操作;
P511构建候选前指词列表;
P512在英语词汇网络词典中查询这些实体词的词义;
P513通过语义分类树、实体词的词义和公式(1),计算当前“表述”与所有候选前指词的词汇语义相似度,并加入到英语作文的共指消解特征集中;
P514将当前实体词与所有候选前指词的特征信息转化为共指消解算法所需要的格式;
P515加载在共指消解训练英语作文集中训练好的共指消解模型;
P516根据公式(2)、公式(3)、公式(4)、公式(5)、公式(6)计算各个共指消解特征的信息增益率,并采用共指消解算法进行共指消解处理;
P517如果实体词是共指的,则转P518操作,否则转P519操作;
P518将回指词加入到前指词所在的共指链中,转P521操作;
P519为回指词创建一个新的共指链;
P520将新创建的共指链存到共指链表中;
P521如果共指特征结果遍历结束,则转P522操作,否则转P503操作;
P522输出英语作文的共指链表;
P523结束。
7.根据权利要求1所述的分析方法,其特征是:所述的英语作文实体链网格构建模块处理步骤如下:
P601开始;
P602创建用于储存共指链语法角色信息的二维矩阵,并初始化该矩阵;
P603读取英语作文的共指链表;
P604遍历下一条共指链;
P605遍历当前共指链的下一个“表述”;
P606获取当前“表述”的新语法角色信息;
P607通过当前“表述”的位置信息,从二维矩阵中获取该“表述”的旧语法角色;
P608如果新语法角色的优先级高于旧语法角色的优先级,则转P609操作,否则转P610操作;
P609根据当前“表述”的位置信息,在二维矩阵中用新的语法角色替换旧的语法角色;
P610如果当前共指链中还有未处理的“表述”,则转P605操作,否则转P611操作;
P611如果还有未处理的共指链,则转P604操作,否则转P612操作;
P612生成英语作文的实体链网格;
P613结束。
8.根据权利要求1所述的分析方法,其特征是:所述的英语作文实体链网格构建模块的计算公式定义如下:
(1)实体链序列出现概率的计算公式
在公式(7)中,i是当前语法角色在语法角色序列中的序号,i=1,2,…,v;v是当前实体链的语法角色总数;语法角色i是当前计算的语法角色;语法角色i+1是当前计算的语法角色;共现次数是指两个语法角色在语篇连贯训练英语作文集中共同出现的总次数;
(2)英语作文语篇连贯得分的计算公式
在公式(8)中,i是当前句子的序号,i=1,2,…,n;j是当前实体链的序号,j=1,2,…,m;n是句子总数;m是实体链总数;实体链的权值是指同一个实体链中不同实体词的个数;实体链序列出现概率通过上述公式(7)计算得到;
(3)句子语义连贯度的计算公式
在公式(9)中,实体链i是当前被计算的实体链;i是当前实体链的序号,i=1,2,…,n;n是句子1和句子2中不同实体链的总数;句子1是当前待计算的句子;句子2是当前待计算的句子;
(4)浅层语义连贯度的计算公式
在公式(10)中,i是当前待被计算句子的序号,i=1,2,…,n;n是英语作文的句子总数;
句子语义连贯度是通过上述公式(9)计算得到。
9.根据权利要求8所述的分析方法,其特征是:所述的英语作文语篇连贯分析模块处理步骤如下:
P701开始;
P702初始化语法角色转移频数矩阵;
P703读入英语作文的实体链网格;
P704遍历该实体链网格;
P705如果当前实体词是实体链的第一个元素,则转P706操作,否则转P707操作;
P706缓存当前语法角色,转P704操作;
P707将当前语法角色与缓存的语法角色一起形成长度为2的转移序列;
P708在语法角色转移频数矩阵中,将当前转移序列的频数加1;
P709将缓存的语法角色替换为当前的语法角色;
P710如果实体链网格遍历结束,则转P711操作,否则转P704操作;
P711加载在语篇连贯训练英语作文集训练好的实体链网格模型
P712根据公式(7)计算实体链序列出现概率;
P713根据公式(8)计算英语作文的语篇连贯得分;
P714根据共指链中不同实体词的个数,对分数进行加权;
P715根据公式(9)计算英语作文的句子语义相似度,并根据公式(10)计算英语作文的浅层语义连贯度;
P716根据英语作文语篇连贯得分和浅层语义连贯度,生成英语作文的语篇连贯分析结果;
P717结束。

说明书全文

一种英语作文语篇连贯质量的分析方法

技术领域

[0001] 本发明涉及自然语言处理技术、机器学习算法、英语作文内容分析技术,具体是一种英语作文语篇连贯质量的分析方法。

背景技术

[0002] 传统的英语文本语篇连贯质量分析方法主要有潜在语义分析方法和实体网格分析方法。潜在语义分析方法是一种通过构建词-文档矩阵,利用奇异值分解对词-文档矩阵进行降维,分析词汇之间内在语义联系的方法。然而,因为奇异值分解是一种数学变换,新生成的矩阵解释性比较差,而且潜在语义分析方法还存在无法处理一词多义现象,忽略词出现的先后顺序的缺点。近年来实体网格分析方法逐步在代替潜在语义分析方法,成为一种更为广泛使用的英语文本语篇连贯质量分析方法。而且,传统的英语文本语篇连贯质量分析方法普遍都是解决新闻报道内英语文本中出现的语篇连贯性问题,由于这类英语文本的篇章结构、指代关系、语言用词都比较固定,传统的英语文本语篇连贯质量分析方法能够取得较好的分析结果;然而,由于英语作文的篇章结构、指代关系、语言用词都不固定,所以传统的英语文本语篇连贯质量分析方法在分析英语作文的语篇连贯质量方面取得的分析结果不太理想。因此针对上述问题,本发明专利提供了一种英语作文语篇连贯质量的分析方法。

发明内容

[0003] 1.一种英语作文语篇连贯质量的分析方法,其特征是:包括一个由顺序连的英语作文预处理模、英语作文语法色标注模块、英语作文特征提取模块、英语作文共指消解模块、英语作文实体链网格构建模块和英语作文语篇连贯分析模块组成的分析模型,该分析模型总体处理步骤如图1所示。
[0004] 在分析模型中,第一步英语作文预处理模块读入一篇英语作文,对该篇英语作文进行分段、分词、分句、词性标注和依存句法分析,输出该英语作文的预处理结果;第二步英语作文语法角色标注模块读入该英语作文的预处理结果,在预处理结果中找出每个实体词的依存关系,并根据依存关系标注这些实体词在其句子中的语法角色,输出这些实体词在其句子中的语法角色;第三步英语作文特征提取模块读入该英语作文的预处理结果,对预处理结果中实体词进行语义等级定义,同时提取这些实体词的共指消解特征,输出这些实体词共指消解特征;第四步英语作文特征提取模块读入英语作文特征提取模块输出的实体词共指消解特征,通过共指消解模型和实体词共指消解特征,对实体词的共指关系进行分析,输出这些实体词构成的共指链表;第五步英语作文实体链网格构建模块读入英语作文共指消解模块输出的实体词共指链表,利用实体词共指链表构建该英语作文实体链网格,并用优先级高语法角色替换实体链网格中优先级低语法角色,输出该英语作文的实体链网格;第六步英语作文语篇连贯分析模块读入英语作文实体链网格构建模块输出的英语作文实体链网格,通过这个实体链网格分析英语作文的句子连贯度,并计算英语作文的语篇连贯质量,输出该英语作文的语篇连贯质量分析结果;下面是该分析模型中每个模块的处理步骤:
[0005] (1)所述的英语作文预处理模块处理步骤如下,如图2所示:
[0006] P201开始;
[0007] P202读入英语作文;
[0008] P203对英语作文进行分段;
[0009] P204对英语作文进行分句;
[0010] P205对英语作文进行分词;
[0011] P206根据单词词性标注集对英语作文进行词性标注;
[0012] P207根据英语作文的词性标注结果,生成英语作文的单词有向图。在该有向图中,一个节点为单词及其词性标注,每个节点之间通过一条有向边连接起来;
[0013] P208根据有向边依存关系权值结合,赋予有向图中有向边的依存关系对应的权值;
[0014] P209通过贪心搜索生成英语作文的句子依存关系库,并输出英语作文的依存句法分析结果;
[0015] P210结束;
[0016] (2)所述的英语作文语法角色标注模块处理步骤如下,如图3所示:
[0017] P301开始;
[0018] P302读取英语作文的依存句法分析结果;
[0019] P303遍历英语作文的句子依存关系中依存树的叶子节点
[0020] P304如果当前节点所在的单词是实体词,则转P305操作,否则转P303操作;
[0021] P305寻找当前节点的兄弟节点;
[0022] P306在单词词性标注集中查询当前节点与其兄弟节点所构成的组成成分;
[0023] P307如果在单词词性标注集中查询到结果,则转P308操作,否则转P315操作;
[0024] P308根据短语句法标注集对当前短语进行短语标注;
[0025] P309如果当前短语是介词短语,则转P310操作,否则转P311操作;
[0026] P310对介词短语进行处理,转P315操作;
[0027] P311如果当前短语是名词短语,则转P312操作,否则转P313操作;
[0028] P312对名词短语进行处理,转P315操作;
[0029] P313如果当前短语是“Most of”短语,则转P314操作,否则转P315操作;
[0030] P314对“Most of”短语进行处理,转P315操作;
[0031] P315从英语作文的句子依存关系库中,获取与当前实体词有关的所有依存关系;
[0032] P316如果存在名词性主语关系或从句成分主语关系,则转P317操作,否则转P318操作;
[0033] P317将当前实体词的语法角色标记为主语,转P321操作;
[0034] P318如果存在直接宾语关系或间接宾语关系,则转P319操作,否则转P320操作;
[0035] P319将当前实体词标注为宾语,转P321操作;
[0036] P320将当前实体词的语法角色标注为“存在”;
[0037] P321将英语作文的语法角色标注结果存到语法角色标注链表;
[0038] P322如果依存句法树遍历结束,则转P323操作,否则转P303操作;
[0039] P323输出英语作文的语法角色标注结果;
[0040] P324结束;
[0041] (3)所述的英语作文特征提取模块处理步骤如下,如图4所示:
[0042] P401开始;
[0043] P402读取英语作文的依存句法分析结果;
[0044] P403遍历依存句法树的叶子节点;
[0045] P404根据依存句法分析结果,进行实体词检测;
[0046] P405如果当前单词被检测为实体词,则转P406操作,否则转P403操作;
[0047] P406依据共指消解特征集,创建一个用于存储特征信息的“表述”对象;
[0048] P407通过实体词的位置信息,在依存句法树中找到代表当前实体词的叶子节点;
[0049] P408从当前叶子节点开始,向上寻找当前节点的父节点
[0050] P409如果父节点是名词短语节点,则转P410操作,否则转P408操作;
[0051] P410将名词短语节点下的所有叶子节点整合为一个短语,并存到当前“表述”对象中;
[0052] P411根据共指消解特征集提取实体词的普通特征,存到当前“表述”对象中;
[0053] P412分别查询男性人名词汇表和女性人名词汇表;
[0054] P413如果查询到当前实体词的性别,则转P414操作,否则转P415操作;
[0055] P414将性别特征存到当前“表述”对象中,转P416操作;
[0056] P415将性别特征设为未知,并存到当前“表述”对象中;
[0057] P416查询常见表示人物的词汇表;
[0058] P417如果在常见表示人物的词汇表中查询到当前实体词,则转P418操作,否则转P419操作;
[0059] P418将对应的语义等级类型作为当前实体词的语义等级,转P426操作;
[0060] P419对实体词进行命名实体识别;
[0061] P420如果命名实体识别结果为命名实体,则转P421操作,否则转P422操作;
[0062] P421将命名实体识别结果转化为对应的语义等级,转P426操作;
[0063] P422对实体词进行日期检测;
[0064] P423如果实体词表示日期,则转P424操作,否则转P425操作;
[0065] P424将实体词的语义等级设为日期,转P426操作;
[0066] P425将实体词的语义等级结果标注为“对象”;
[0067] P426查询包含有生命特征词汇的有生词汇表;
[0068] P427如果在有生词汇表中查询到当前实体词,则转P428操作,否则转P429操作;
[0069] P428将实体词的有生特征标注为真,转P430操作;
[0070] P429将实体词的有生特征标注为假;
[0071] P430查询别名表;
[0072] P431如果在别名表中查询到当前实体词,则转P433操作,否则转P432操作;
[0073] P432将别名特征设置为空,转P434操作;
[0074] P433将查询到的别名信息存到当前实体词的别名特征中;
[0075] P434在英语实体词常识库中查询当前实体的事实信息,并将结果存到共指消解特征集中;
[0076] P435如果依存句法树遍历结束,则转P436操作,否则转P403操作;
[0077] P436输出英语作文特征提取结果;
[0078] P437结束;
[0079] (4)所述的英语作文共指消解模块处理步骤如下,如图5所示:
[0080] P501开始;
[0081] P502读取英语作文的特征提取结果;
[0082] P503对英语作文的特征提取结果进行遍历;
[0083] P504检测单词“it”是否处于没有指代任何前指词的句型或语义中;
[0084] P505如果单词“it”具有非指代性,则转P519操作,否则转P506操作;
[0085] P506如果当前实体词存在同位语,则转P507操作,否则转P508操作;
[0086] P507将当前实体词加入到其同位语所在的共指链中,转P521操作;
[0087] P508如果当前实体词处于以“As”开头的从句中,则转P509操作,否则转P511操作;
[0088] P509如果“As”从句中的主语存在主语关系,则转P510操作,否则转P511操作;
[0089] P510将当前实体词加入到“As”从句主语的实体词所在的实体链中,转P521操作;
[0090] P511构建候选前指词列表;
[0091] P512在英语词汇网络词典中查询这些实体词的词义;
[0092] P513通过语义分类树、实体词的词义和下述公式(1),计算当前“表述”与所有候选前指词的词汇语义相似度,并加入到英语作文的共指消解特征集中;
[0093] P514将当前实体词与所有候选前指词的特征信息转化为共指消解算法所需要的格式;
[0094] P515加载在共指消解训练英语作文集中训练好的共指消解模型;
[0095] P516根据下述公式(2)、公式(3)、公式(4)、公式(5)、公式(6)计算各个共指消解特征的信息增益率,并采用共指消解算法进行共指消解处理;
[0096] P517如果实体词是共指的,则转P518操作,否则转P519操作;
[0097] P518将回指词加入到前指词所在的共指链中,转P521操作;
[0098] P519为回指词创建一个新的共指链;
[0099] P520将新创建的共指链存到共指链表中;
[0100] P521如果共指特征结果遍历结束,则转P522操作,否则转P503操作;
[0101] P522输出英语作文的共指链表;
[0102] P523结束;
[0103] (5)所述的英语作文实体链网格构建模块处理步骤如下,如图6所示:
[0104] P601开始;
[0105] P602创建用于储存共指链语法角色信息的二维矩阵,并初始化该矩阵;
[0106] P603读取英语作文的共指链表;
[0107] P604遍历下一条共指链;
[0108] P605遍历当前共指链的下一个“表述”;
[0109] P606获取当前“表述”的新语法角色信息;
[0110] P607通过当前“表述”的位置信息,从二维矩阵中获取该“表述”的旧语法角色;
[0111] P608如果新语法角色的优先级高于旧语法角色的优先级,则转P609操作,否则转P610操作;
[0112] P609根据当前“表述”的位置信息,在二维矩阵中用新的语法角色替换旧的语法角色;
[0113] P610如果当前共指链中还有未处理的“表述”,则转P605操作,否则转P611操作;
[0114] P611如果还有未处理的共指链,则转P604操作,否则转P612操作;
[0115] P612生成英语作文的实体链网格;
[0116] P613结束;
[0117] (6)所述的英语作文语篇连贯分析模块处理步骤如下,如图7所示:
[0118] P701开始;
[0119] P702初始化语法角色转移频数矩阵;
[0120] P703读入英语作文的实体链网格;
[0121] P704遍历该实体链网格;
[0122] P705如果当前实体词是实体链的第一个元素,则转P706操作,否则转P707操作;
[0123] P706缓存当前语法角色,转P704操作;
[0124] P707将当前语法角色与缓存的语法角色一起形成长度为2的转移序列;
[0125] P708在语法角色转移频数矩阵中,将当前转移序列的频数加1;
[0126] P709将缓存的语法角色替换为当前的语法角色;
[0127] P710如果实体链网格遍历结束,则转P711操作,否则转P704操作;
[0128] P711加载在语篇连贯训练英语作文集训练好的实体链网格模型
[0129] P712根据下述公式(7)计算实体链网格中语法角色序列的转移概率;
[0130] P713根据下述公式(8)计算英语作文的语篇连贯得分;
[0131] P714根据共指链中不同实体词的个数,对分数进行加权;
[0132] P715根据下述公式(9)计算相邻句子间的语义相似度,并根据下述公式(10)计算英语作文的浅层语义连贯度;
[0133] P716根据英语作文语篇连贯得分和浅层语义连贯度,生成英语作文的语篇连贯分析结果;
[0134] P717结束。
[0135] 2.本发明方法的基本概念定义如下:
[0136] (1)共指消解训练英语作文集与语篇连贯训练英语作文集
[0137] 本发明的共指消解训练英语作文集取材于不含单词错误、语法错误、表达错误、不含普遍共指现象的英语范文,本发明的语篇连贯训练英语作文集取材于不含单词错误、语法错误、表达错误、语篇连贯好的英语范文。
[0138] (2)单词词性标注集与短语句法标注集
[0139] 本发明的单词词性标注集与短语句法标注集都采用宾州树库词性标注集。
[0140] (3)句子依存关系库
[0141] 句子依存关系库是指包含英语作文所有依存关系的集合。在句子依存关系库中,每一行表示一个依存关系记录,每个依存关系的存储结构如下:
[0142] 依存关系(单词1-单词1的位置序号,单词2-单词2的位置序号)
[0143] (4)共指消解特征集
[0144] 共指消解特征集是指包含回指词和前指词所有特征信息的特征集合,共指消解特征集如下表1所示:
[0145] 表1:共指消解特征集
[0146]
[0147] (5)英语词汇网络词典
[0148] 英语词汇网络词典是指包含常见英语单词词义信息的英语词典,英语词汇网络词典的存储结构如下:
[0149] 词性(词频){偏移量}<所属词典文件名>[词典文件序号](单词#词义序号)(词义释义)“例句”
[0150] (6)语义分类树
[0151] 语义分类树是包含英语单词、同义关系、反义关系、整体部分关系、属性关系、修饰关系、 上义关系、下义关关系的英语单词关系集合,语义分类树的存储结构如下:
[0152]
[0153] (7)英语实体词常识知识库
[0154] 英语实体词常识知识库是指包含关于日常实体相关信息的事实集合库。在英语实体词常识知识库中,每一行表示一个事实,每一个事实由序号和一个三元组<实体1,关系,实体2>组成,序号是这个事实在知识库中的编号,实体1是主语,关系是谓语,实体2是宾语,每个事实的存储结构如下:
[0155] <序号><实体1><关系><实体2>
[0156] 3.本发明方法的计算公式定义如下:
[0157] (1)词汇语义相似度的计算公式
[0158]
[0159] 在公式(1)中,路径1是指在语义分类树中,从两个单词词义的最小公共父节点到根节点的路径;路径2是指在语义分类树中,从第一个单词的词义到两个单词词义的最小公共父节点的路径;路径3是指在语义分类树中,第二个单词的词义到两个单词词义的最小公共父节点的路径。其中,最小公共父节点是指从两个单词的词义所在的节点开始向上进行搜索,搜索到的当前两个单词词义节点的首个共同父节点;
[0160] (2)实体词集合信息熵的计算公式
[0161]
[0162] 在公式(2)中,决策类别属性i是决策类别中第i个属性;i是当前属性的序号,i=1,2,…,m;m是决策类别中属性的总个数;决策类别所有属性总数是决策类别中属性的总个数。
[0163] (3)共指消解特征信息增益的计算公式
[0164] 共指消解特征信息增益=实体词集合信息熵-共指消解特征期望信息(4)[0165] 在公式(4)中,实体词集合信息熵是通过上述公式(2)计算得到;共指消解特征期望信息是通过上述公式(3)计算得到;
[0166] (4)共指消解特征期望信息的计算公式
[0167]
[0168] 在公式(3)中,特征A是当前待计算的特征;j是当前属性的序号,j=1,2,…,v;v是实体词集合中特征A的属性类别个数;属性j是特征A中第j个属性;实体词集合信息熵是由上述公式(2)计算得到;
[0169] (5)共指消解特征分裂信息的计算公式
[0170]
[0171] 在公式(5)中,特征A是当前待计算的特征;j是当前属性的序号,j=1,2,…,v;v是实体词集合中特征A的属性类别个数;属性j是特征A中第j个属性;
[0172] (6)共指消解特征信息增益率的计算公式
[0173]
[0174] 在公式(6)中,信息增益是通过下述公式(4)计算得到;分裂信息是通过下述公式(5)计算得到。
[0175] (7)实体链序列出现概率的计算公式
[0176]
[0177] 在公式(7)中,i是当前语法角色在语法角色序列中的序号,i=1,2,…,v;v是当前实体链的语法角色总数;语法角色i是当前计算的语法角色;语法角色i+1是当前计算的语法角色;共现次数是指两个语法角色在语篇连贯训练英语作文集中共同出现的总次数;
[0178] (8)英语作文语篇连贯得分的计算公式
[0179]
[0180] 在公式(8)中,i是当前句子的序号,i=1,2,…,n;j是当前实体链的序号,j=1,2,…,m;n是句子总数;m是实体链总数;实体链的权值是指同一个实体链中不同实体词的个数;实体链序列出现概率通过上述公式(7)计算得到;
[0181] (9)句子语义连贯度的计算公式
[0182]
[0183] 在公式(9)中,实体链i是当前被计算的实体链;i是当前实体链的序号,i=1,2,…,n;n是句子1和句子2中不同实体链的总数;句子1是当前待计算的句子;句子2是当前待计算的句子;
[0184] (10)浅层语义连贯度的计算公式
[0185]
[0186] 在公式(10)中,i是当前待被计算句子的序号,i=1,2,…,n;n是英语作文的句子总数;句子语义连贯度是通过上述公式(9)计算得到。(五)附图说明
[0187] 图1是本发明方法的英语作文总体处理步骤图;
[0188] 图2是本发明方法的英语作文预处理模块处理步骤图;
[0189] 图3是本发明方法的英语作文语法角色标注模块处理步骤图;
[0190] 图4是本发明方法的英语作文特征提取模块处理步骤图;
[0191] 图5是本发明方法的英语作文共指消解模块处理步骤图;
[0192] 图6是本发明方法的英语作文实体链网格构建模块处理步骤图;
[0193] 图7是本发明方法的英语作文语篇连贯分析模块处理步骤图;(六)具体实施方式
[0194] 本发明的一种英语作文语篇连贯质量的分析方法的具体实施方式分为如下六个步骤。
[0195] 第一步骤:执行“英语作文预处理模块”
[0196] 输入的英语作文取材于中国学习者英语语料库中的英语作文。本发明实施方式中英语作文的题目为“Is it necessary for college students to know about the society?”,其实施结果如下所述:
[0197] (1)输入英语作文的内容如下所示:
[0198] Is it necessary for college students to know about the society?[0199] It is necessary for college students to know about the society.After graduatingfrom campus,they will enter the society,which is quite different from university.
[0200] In order to adapt to the complicated society in the future,they should do somethingnow.There are many ways to know the world outside the campus.For example,studentscan know about it through mass medium,such as TV,newspapers and etc.In addition,they should take part in various activities of society.
[0201] As far as I am concerned,I'm eager to know the society.I'm a student of JournalismDepartment,so I can know many people.I mean to make friends with them after each interview.I will keep in touch with them and communicate with each other.From them,I may learn about part of the world.I will do so from now on.
[0202] (2)对英语作文进行词性标注后,生成的词性标注结果如下所示:
[0203] It/PRP is/VBZ necessary/JJ for/IN college/NN students/NNS to/TO know/VB about/INthe/DT society/NN./.After/IN graduating/VBG from/IN campus/NN,/,they/PRP will/MDenter/VB the/DT society/NN,/,which/WDT is/VBZ quite/RB different/JJ from/INuniversity/NN./.In/IN order/NN to/TO adapt/VB to/TO the/DT complicated/JJsociety/NN in/IN the/DT future/NN,/,they/PRP should/MD do/VB something/NN now/RB./.
[0204] There/EX are/VBP many/JJ ways/NNS to/TO know/VB the/DT world/NN outside/IN the/DTcampus/NN./.For/IN example/NN,/,students/NNS can/MD know/VB about/IN the/DTworld/NN through/IN mass/NN medium/NN,/,such/JJ as/IN TV/NN,/,newspapers/NNSand/CC etc./FW./.In/IN addition/NN,/,they/PRP should/MD take/VB part/NN in/INvarious/JJ activities/NNS of/IN society/NN./.
[0205] As/RB far/RB as/IN I/PRP am/VBP concerned/VBN,/,I/PRP'm/VBP eager/JJ to/TOknow/VB  the/DT society/NN./.I/PRP'm/VBP a/DT student/NN of/IN Journalism/NNPSDepartment/NNP,/,so/IN I/PRP can/MD know/VB many/JJ people/NNS./.I/PRP mean/VBPto/TO make/VB friends/NN with/IN them/PRP after/IN each/DT interview/NN./.I/PRPwill/MD keep/VB in/RB touch/NN with/IN them/PRP and/CC communicate/VB with/IN each/DTother/JJ./.From/IN them/PRP,/,I/PRP may/MD learn/VB about/IN part/NN of/IN the/DTworld/NN./.I/PRP will/MD do/VB so/RB from/IN now/RB on/IN./.
[0206] (3)对英语作文进行依存句法分析处理后,生成的句子依存关系库如下所示:
[0207] nsubj(necessary-3,It-1)cop(necessary-3,is-2)root(ROOT-0,necessary-3)mark(know-8,for-4)compound(students-6,college-5)nsubj(know-8,students-6)mark(know-8,to-7)advcl(necessary-3,know-8)case(society-11,about-9)det(society-11,the-10)nmod:about(know-8,society-11)
[0208] mark(graduating-2,After-1)advcl(enter-8,graduating-2)case(campus-4,from-3)nmod:from(graduating-2,campus-4)nsubj(enter-8,they-6)aux(enter-8,will-7)root(ROOT-0,enter-8)det(society-10,the-9)dobj(enter-8,society-10)nsubj(different-15,society-10)ref(society-10,which-12)cop(different-15,is-13)advmod(different-15,quite-14)acl:relcl(society-10,different-15)case(university-17,from-16)nmod:from(different-15,university-17)
[0209] mark(adapt-4,In-1)mwe(In-1,order-2)mark(adapt-4,to-3)advcl(do-15,adapt-4)case(society-8,to-5)det(society-8,the-6)amod(society-8,complicated-7)nmod:to(adapt-4,soci ety-8)case(future-11,in-9)det(future-11,the-10)nmod:in(adapt-4,future-11)nsubj(do-15,they-13)aux(do-15,should-14)root(ROOT-0,do-15)dobj(do-15,something-16)advmod(do-15,now-17)
[0210] expl(are-2,There-1)root(ROOT-0,are-2)amod(ways-4,many-3)nsubj(are-2,ways-4)mark(know-6,to-5)acl(ways-4,know-6)det(world-8,the-7)dobj(know-6,world-8)case(campus-11,outside-9)det(campus-11,the-10)nmod:outside(know-6,campus-11)
[0211] case(example-2,For-1)nmod:for(know-6,example-2)nsubj(know-6,students-4)aux(know-6,can-5)root(ROOT-0,know-6)case(world-9,about-7)det(world-9,the-8)nmod:about(know-6,world-9)case(medium-12,through-10)compound(medium-12,mass-
11)nmod:through(world-9,medium-12)case(TV-16,such-14)mwe(such-14,as-15)nmod:
such_as(medium-12,TV-16)nmod:such_as(medium-12,newspapers-18)conj:and(TV-16,newspapers-18)cc(TV-16,and-19)nmod:such_as(medium-12,etc.-20)conj:and(TV-16,etc.-20)
[0212] case(addition-2,In-1)nmod:in(take-6,addition-2)nsubj(take-6,they-4)aux(take-6,should-5)root(ROOT-0,take-6)dobj(take-6,part-7)case(activities-10,in-8)amod(activities-10,various-9)nmod:in(take-6,activities-10)case(society-12,of-11)nmod:of(activities-10,society-12)
[0213] advmod(far-2,As-1)advmod(concerned-6,far-2)mark(concerned-6,as-3)nsubjpass(concerned-6,I-4)auxpass(concerned-6,am-5)advcl(eager-10,concerned-6)nsubj(eager-10,I-8)nsubj(know-12,I-8)cop(eager-10,'m-9)root(ROOT-0,eager-
10)mark(know-12,to-11)xcomp(eager-10,know-12)det(society-14,the-13)dobj(know-
12,society-14)
[0214] nsubj(student-4,I-1)cop(student-4,'m-2)det(student-4,a-3)root(ROOT-0,student-4)case(Department-7,of-5)compound(Department-7,Journalism-6)nmod:of(student-4,Department-7)dep(student-4,so-9)nsubj(know-12,I-10)aux(know-12,can-11)parataxis(student-4,know-12)amod(people-14,many-13)dobj(know-12,people-14)
[0215] nsubj(mean-2,I-1)nsubj(make-4,I-1)root(ROOT-0,mean-2)mark(make-4,to-3)xcomp(mean-2,make-4)dobj(make-4,friends-5)case(them-7,with-6)nmod:with(make-4,them-7)case(interview-10,after-8)det(interview-10,each-9)nmod:after(make-4,interview-10)
[0216] nsubj(keep-3,I-1)nsubj(communicate-9,I-1)aux(keep-3,will-2)root(ROOT-0,keep-3)advmod(keep-3,in-4)dobj(keep-3,touch-5)case(them-7,with-6)nmod:with(keep-3,them-7)cc(keep-3,and-8)conj:and(keep-3,communicate-9)case(other-12,with-10)det(other-12,each-11)nmod:with(communicate-9,other-12)
[0217] case(them-2,From-1)nmod:from(learn-6,them-2)nsubj(learn-6,I-4)aux(learn-6,may-5)root(ROOT-0,learn-6)case(part-8,about-7)nmod:about(learn-6,part-8)case(world-11,of-9)det(world-11,the-10)nmod:of(part-8,world-11)[0218] nsubj(do-3,I-1)aux(do-3,will-2)root(ROOT-0,do-3)advmod(do-3,so-4) case(now-6,from-5)advcl:on(do-3,now-6)case(now-6,on-7)
[0219] 第二步骤:执行“英语作文语法角色标注模块”
[0220] 英语作文语法角色标注模块是通过第一步骤执行英语作文预处理模块输出的词性标注结果和句子依存关系库进行实体词检测,并对实体词进行语法角色标注,最后生成英语作文的语法角色标注结果。由于语法角色为“未出现”的实体词较多,因此下面只列举了语法角色不为“未出现”的实体词的标注结果。
[0221] It(1)/S society(3)/X society(6)/O society(8)/X students(2)/S they(5)/S they(10)/Scampus(4)/X university(7)/X future(9)/X something(11)/O ways(1)/S world(2)/Oworld(5)/X campus(3)/X students(4)/S they(10)/S medium(6)/X TV(7)/X newspapers(8)/Xaddition(9)/X part(11)/O activities(12)/X I(1)/O I(2)/S I(4)/S I(6)/S I(8)/S I(12)/SI(16)/S I(18)/S society(3)/O student(5)/X people(7)/O friends(9)/O them(10)/Xthem(14)/X them(15)/X interview(11)/X touch(13)/O part(17)/X
[0222] 第三步骤:执行“英语作文特征提取模块”
[0223] 英语作文特征提取模块是第一步骤和第二步骤执行后输出的词性标注结果、句子依存关系库和语法角色标注结果,对英语作文实体词集合的共指消解特征进行提取,最后输出英语作文实体词集合的共指消解特征集。由于英语作文的共指消解特征集较为庞大,无法一一列举,下面只列举了英语作文的第一段的共指消解特征集,后面的数据用省略符号代替。
[0224] [college students,It]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.084746,28.559322,FALSE,TRUE,FALSE,FALSE
[0225] [the society,college students]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.084746,0,FALSE,TRUE,TRUE,FALSE
[0226] [the society,It]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,TRUE,FALSE,FALSE,FALSE,1,0.444444,0.847458,0,FALSE,TRUE,FALSE,FALSE
[0227] [campus,the society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.235294,0.677966,0.084746,FALSE,FALSE,FALSE,FALSE
[0228] [campus,college students]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0,0.084746,FALSE,TRUE,FALSE,FALSE
[0229] [campus,It]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.235294,0.677966,0.084746,FALSE,FALSE,FALSE,FALSE
[0230] [they,campus]:FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.762712,0.423729,FALSE,FALSE,FALSE,FALSE
[0231] [they,the society]:FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,2,0,18.389831,28.559322,FALSE,FALSE,TRUE,FALSE
[0232] [they,college students]:FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,0,0,0.084746,28.559322,FALSE,TRUE,TRUE,FALSE
[0233] [the society,they]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE, 2,0,0.847458,6.101695,FALSE,TRUE,TRUE,FALSE
[0234] [the society,campus]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,1,0.235294,0.762712,0.169492,FALSE,FALSE,FALSE,FALSE
[0235] [the society,the society]:TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,1,2.79661,6.101695,FALSE,FALSE,TRUE,TRUE
[0236] [university,the society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.75,0.677966,0.254237,FALSE,FALSE,FALSE,FALSE[0237] [university,they]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.508475,0.084746,FALSE,TRUE,FALSE,FALSE
[0238] [university,campus]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,1,0.421053,3.220339,0,FALSE,FALSE,FALSE,TRUE
[0239] [the complicated society,university]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,1,0.75,0.847458,0.254237,FALSE,FALSE,FALSE,FALSE[0240] [the complicated society,the society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,1,0.59322,0.847458,FALSE,FALSE,TRUE,TRUE[0241] [the future,the complicated society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.625,2.79661,0.677966,FALSE,FALSE,FALSE,FALSE[0242] [the future,university]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,1,0.705882,0.762712,0,FALSE,FALSE,FALSE,FALSE
[0243] [the future,the society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.625,2.79661,0.677966,FALSE,FALSE,FALSE,FALSE[0244] [the future,they]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.847458,0.677966,FALSE,TRUE,FALSE,FALSE
[0245] [the future,campus]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,1,0.705882,0.762712,0,FALSE,FALSE,FALSE,FALSE
[0246] [the future,the society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.625,2.79661,0.677966,FALSE,FALSE,FALSE,FALSE[0247] [the future,college students]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.847458,0.677966,FALSE,TRUE,FALSE,FALSE[0248] [the future,It]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.625,2.79661,0.677966,FALSE,FALSE,FALSE,FALSE
[0249] [they,the future]:FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,2,0,0.847458,0.677966,FALSE,FALSE,FALSE,FALSE
[0250] [they,the complicated society]:FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,2,0,18.389831,28.559322,FALSE,FALSE,TRUE,FALSE[0251] [they,university]:FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0, 0.762712,0.423729,FALSE,FALSE,FALSE,FALSE
[0252] [they,the society]:FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,2,0,18.389831,28.559322,FALSE,FALSE,TRUE,FALSE
[0253] [they,they]:TRUE,FALSE,FALSE,TRUE,TRUE,FALSE,TRUE,FALSE,FALSE,FALSE,0,0,18.389831,28.559322,FALSE,TRUE,TRUE,TRUE
[0254] [something,they]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.508475,6.101695,FALSE,TRUE,FALSE,FALSE
[0255] [something,the future]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.461538,0.677966,0.677966,FALSE,FALSE,FALSE,FALSE
[0256] [something,the complicated society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.333333,0.677966,6.101695,FALSE,FALSE,FALSE,FALSE
[0257] [something,university]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,1,0.428571,3.220339,0.169492,FALSE,FALSE,FALSE,FALSE[0258] [something,the society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.333333,0.677966,6.101695,FALSE,FALSE,FALSE,FALSE[0259] [something,they]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.508475,6.101695,FALSE,TRUE,FALSE,FALSE
[0260] [something,campus]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,1,0.428571,3.220339,0.169492,FALSE,FALSE,FALSE,FALSE
[0261] [something,the society]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.333333,0.677966,6.101695,FALSE,FALSE,FALSE,FALSE[0262] [something,college students]:FALSE,FALSE,FALSE,FALSE,TRUE,FALSE,FALSE,FALSE,FALSE,FALSE,2,0,0.508475,6.101695,FALSE,TRUE,FALSE,FALSE[0263] [something,It]:FALSE,FALSE,FALSE,FALSE,FALSE,FALSE,TRUE,TRUE,FALSE,FALSE,1,0.333333,0.677966,6.101695,FALSE,FALSE,FALSE,FALSE
[0264] ……
[0265] 第四步骤:执行“英语作文共指消解模块”
[0266] 英语作文共指消解模块是通过第三步骤执行英语作文特征提取模块输出的共指消解特征集,对英语作文中的实体词进行共指消解,最后生成该篇英语作文的共指链表,如下表2所示:
[0267] 表2:英语作文的共指链表
[0268]
[0269]
[0270] 第五步骤:执行“英语作文实体链网格构建模块”
[0271] 英语作文实体链网格构建模块是通过第四步骤执行英语作文共指消解模块输出的共指链表,以及第二步骤执行英语作文语法角色标注模块输出的语法角色标注结果,构建英语作文的实体链网格,所构造的实体链网格如下所示:
[0272]
[0273] 第六步骤:执行“英语作文语篇连贯分析模块”
[0274] 英语作文语篇连贯分析模块是通过第五步骤执行英语作文实体链网格构建模块输出的实 体链网格,并根据上述公式(7)、公式(8)、公式(9)、公式(10),对英语作文的语篇连贯性进行分析,其分析结果如下所示:
[0275] 连贯性分值:0.3267(文字连贯较)
[0276] 第1段连贯性分值:0.3733(文字连贯较好)
[0277] 第1句与第2句过渡得分:6(过渡非常好)
[0278] 第2句与第3句过渡得分:5(过渡非常好)
[0279] 第2段连贯性分值:0.2119(文字勉强连贯)
[0280] 第1句与第2句过渡得分:2(过渡一般)
[0281] 第2句与第3句过渡得分:3(过渡良好)
[0282] 第3段连贯性分值:0.3949(文字连贯较好)
[0283] 第1句与第2句过渡得分:3(过渡良好)
[0284] 第2句与第3句过渡得分:3(过渡良好)
[0285] 第3句与第4句过渡得分:4(过渡良好)
[0286] 第4句与第5句过渡得分:4(过渡良好)
[0287] 第5句与第6句过渡得分:3(过渡良好)。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈