首页 / 专利库 / 人工智能 / 社交媒体挖掘 / 一种面向法律领域的动态法律事件图谱构建方法

一种面向法律领域的动态法律事件图谱构建方法

阅读:305发布:2020-05-17

专利汇可以提供一种面向法律领域的动态法律事件图谱构建方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种面向法律领域的动态法律事件图谱构建方法,本发明利用 自然语言处理 技术构建了面向法律领域的动态法律事件图谱,本发明在法律领域尚未出现动态法律事件图谱构建方法;与 现有技术 相比,本发明中的动态法律事件图谱的最小单元是法律事件而不是实体,所构建的图谱是由法律事件和法律事件间关系组成;与传统的事件 抽取 相比,本发明所构建的动态法律事件图谱中知识是动态化、可计算化、可推理,而不是简单的抽取事件。本发明构建了面向法律领域的动态法律事件图谱,结合了传统知识图谱知识抽取的技术和事件挖掘技术构建了图谱,然后通过对法律事件图谱中的法律事件要素以及法律事件间的关系分别建模进行法律事件图谱计量。,下面是一种面向法律领域的动态法律事件图谱构建方法专利的具体信息内容。

1.一种面向法律领域的动态法律事件图谱构建方法,其包括以下步骤:
(1)定义动态法律事件图谱;
(2)法律语料收集与整理
(3)动态法律事件图谱中事件抽取模型;
(4)动态法律事件图谱中事件关系抽取模型;
(5)动态法律事件图谱中概率图事件模型;
(6)动态法律事件图谱知识更新;
其中,步骤(3)中,动态法律事件图谱中事件抽取模型包括两个子步骤:(i)法律事件的识别与抽取;(ii)法律事件参数的抽取;
在所述步骤(5)中,其包括两个子步骤:(a)法律事件间的概率量度;(b)法律事件内要素概率量度。
2.根据权利要求1所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(1)中,动态法律事件图谱是以法律事件为基础,通过一定方式灵活地表示事件以及事件链的关系,用以做法律行为的预测、推演、计算和表示;其中,一个完整的法律事件可以表示为:事件名、法律场景、法律意图、法律构成要件、锚词、类别和法律依据。
3.根据权利要求2所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(2)中,在对法律语料收集与整理时,法律领域的语料按照来源区分有:法律法规、裁判文书、问答语料和法律资讯;构建动态法律事件图谱要综合大规模的语料去挖掘法律事件及事件间关联;多源法律语料的处理要严格遵从法律的严谨性、全面性和准确性;
从数据质量度来看,法律法规和裁判文书的质量要相对高于其他语料,在融合多源数据时需要以具有法律效的法律法规和裁判文书为基准。
4.根据权利要求3所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(3)中,为准确地识别事件和参数,需要捕获上下文特征,上下文特征至少包括语法特征和句法特征,采用结合法律专家事件规则模板和动态神经网络模型进行事件的抽取和参数的抽取。
5.根据权利要求4所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(4)中,动态法律事件图谱中的事件关系有:因果关系、时序关系、反转关系、条件关系和上下级事件关系;正确定义法律事件之间的关系是动态法律事件图谱事件关系抽取的前提,用事件关系将法律事件形成结构化的信息存储起来;将事件关系抽取看作是分类任务,在法律专家标注一定规模语料后结合专家规则和分类学习算法来做法律事件之间的关系识别。
6.根据权利要求5所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(5)中,采用动态法律事件概率图模型,在事件挖掘的基础上融合法律专家规则和法律知识图谱,借鉴点互信息的算法,建立事件之间的关联关系的有向无环图,通过对概率转移矩阵的计算实现事件间的概率度量,通过改变事件要素编码方式进行法律要素的编码,最终所构建的动态法律事件图谱不仅可检测和跟踪法律事件的发展规律,也对建立突发事件监测与预警机制。
7.根据权利要求6所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(5)中,在法律事件间的概率量度步骤中,采用以下方法:
在具体某种法律范式的指标下,法律事件X在时间t所处的状态记为Ei,假设法律事件有n种状态,那么n中状态构成的完备空间记为E, ,事件Xt在时间t状态的概率记
为 ,用 ,其中k=1,2,...;时间t=m的状态为Ei,时间t=m+
1的状态为Ej的概率记pij,则有一次转移概率 ,
显然可得在k次转移之后得到 ,
一次转移的概率矩阵记为 ,显然可得到经过k次转移概率的
概率矩阵为 ,经过k次转移矩阵等于一次转移的k
次方,记为 ,可以通过就事件间的概率转移矩阵得
到事件转移的概率。
8.根据权利要求7所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(5)中的法律事件内要素概率量度中,采用以下方法:
给定法律事件X、目标要素xi以及候选要素集合 ,则有

指定的X集合中的要素进行排序,得到 ,排名越靠前则候选要
素与目标要素的关联越大;
整个算法分为几个过程:首先,对于给定的目标要素以及候选要素集合中的每个要素进行特征抽取以及上下文信息的抽取,其次,使用自编码器对上述抽取到的特征进行特征化表示学习,然后通过多通道编码器进行编码;最后,计算目标要素和候选要素集合进行相似计算机并排序;在抽取上下文信息的过程中,将要素当做由若干个词语有序的集合,结合特征工程的思想抽取要素的特征。
9.根据权利要求8所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(5)中,在多通道编码模型中,将要素排序的过程转化成分类问题,要素对(x,y)作为模型的输入,在嵌入层编码时,借鉴PMI思想,考虑模型输入要素的相关性;点互信息的计算公式为:
,其中x1和x2分别代表两个要
素,p(x1)和p(x2)分别代表语料中x1和x2出现的概率,p(x1,x2)两者共现的概率;
对于每对要素对,期望得到 ,其中x1和x2分别代表两个要素,vx1、
vx2分别是x1和x2对应的向量;
考虑实际语料的情况,如使用 、拉普拉斯平滑做处理;将
嵌入层的优化目标变成:
,其中 的词向量;
在进行多通道编码时,选用可替换的卷积神经网络模型进行多通道编码,最后将模型训练得到的副产物向量用作法律要素的编码器,法律要素经由编码可以编码成向量,使用相似度计算模型来做给定目标要素和候选要素之间的排序。
10.根据权利要求1所述的一种面向法律领域的动态法律事件图谱构建方法,其特征在于,在所述步骤(6)中,采用网络爬虫或者直接下载的方式定期同步法律网站上的数据以及以社交媒体网站上的与法律相关的热事件以及各大搜索引擎的热门词为候选法律事件。

说明书全文

一种面向法律领域的动态法律事件图谱构建方法

技术领域

[0001] 本发明主要涉及自然语言处理领域,特别是涉及一种面向法律领域的动态法律事件图谱构建方法。

背景技术

[0002] 随着我国法制建设逐步完备,行政法规日趋完善,公民法律意识不断增强。越来越多法律文本、裁判文书的公开化、数字化、信息化,积累了大量法律领域的文本信息。通过构建司法领域的法律文本语料库,并使用自然语言处理技术进行挖掘出用户关心的在特定场景、特定情节、特定时间范围和特定区域内发生的,有至少一个色且发生的动作不少于一个的事情,称之为事件。与通用事件不同的是,法律事件强调的是不依权利主体的主观意志为转移的法律事实和客观现象,构建的基础是法律事件。
[0003] 目前,对于法律知识图谱的构建方法有很多,但在法律事件图谱构建方面并没有相似的专利。在中国专利CN107122444A通过对审判文书自动构建法律知识图谱,最终形成主题词-主题关系-主题词,主题词-相近关系-相近词三元组结构。在中国专利CN108073673A构建的是以实体为基础的知识图谱。在事件图谱构建技术中,目前的主流方法是利用事件抽取技术从语料充抽取与事件相关的信息,最终得到一个庞大的事件库,如面向长文本的主题事件抽取,面向短文本的元事件抽取。事件抽取的数据源较为单一,停留在浅层语义,为考虑高层次和更复杂语义层的关联和交互,尤其是在法律领域,更加无法满足法律事件的“要素—证据”关联、犯罪构成查询、类案研判参考和案件偏离推理等实际需求。运用人工智能和大数据处理技术构建的动态法律事件图谱可以实现:(1) 整合分散的数据库、基础信息,打通法律数据壁垒。(2)强化原有事件推理、归纳、比较、区别等能,增强事件动态化能力,改善信息的浏览、检索效率 (3)创立新型“法律智库”为法律科学决策提供支持。
[0004] 但是,以下方法具有以下三个方面的缺点,一是,通常面向法律的法律知识图谱中的描述和刻画的知识是相对静态的知识,缺乏对事物动态特征的描述,这显然不符合事实。法律数据的增加与更新表明知识图谱本来就是动态。动态知识图汇聚海量信息,快速构建弹性可扩展知识,可实时敏捷、灵活、智能自适应的构建知识图谱;二是,现有事件抽取的技术关注的是事件本身的抽取,如元事件和主题事件抽取。缺乏对事件间的关联挖掘分析。利用多源数据来挖掘事件和事件件的演化的分析研究不够深入,概率事件模型在法律领域的检测和追踪的应用不够完善;三是,法律知识图谱和事件抽取并不能够完整地描述法律事件以及法律事件之间的关联,需要重新定义法律事件,结合动态知识图谱和事件抽取技术,重新构建动态法律事件图谱。
[0005] 基于以上三个方面的缺点,这三个方面的缺点主要有三个方面的原因,一是数据原因,大数据时代,法律数据呈现出数量大、速率快、多样化、不稳定等特点,大数据正在挑战传统法学研究方式,正在向法学领域渗透。法律大数据及其应用的迅速发展,已经引起了法律界的关注,法律人已经开始从不同的视角对这场大变革进行思考和议论。法律大数据的研究与应用将成为法学研究的一个新领域,加上法律领域缺乏大规模高质量的标注数据,人工标注数据耗时费力,成本高昂,所以法律领域的标注数据亟待解决;二是技术原因,在通用知识图谱的构建方面,已有相对成熟的技术和知识图谱产品。而在垂直知识图谱的构建方面,现有垂直知识图谱常采用手工构建方式,缺乏一套统一的垂直知识图谱构建方法。在事件抽取方面,从篇章级别的文本中去抽取一个结构化的事件,通常由多个句子描述一个事件,一个事件的多个元素分布在不同的句子中,不确定性加大,难度加大;三是,法律认知体系,法律认知体系是建立在法律专家知识和生活常识的基础上,将法律当做一种“看得见”并“用着顺手”的工具,并将其转化为计算机可以理解的知识。生活常识往往是零散的、不成体系的,法律常识的固化需要借助于法律知识体系的构建。法律知识的庞杂性和专业性用来对生活中的法律事件进行解释、推理。
[0006] 上述现有技术上述现有的技术在知识图谱构建上仅仅是构建法律领域的相对静态的知识,并不完全符合实际的需求,多数法律需求存储的是组成事件的概念及其之间的关系、事件及其之间的关系。所以,在事件的角度能更好的描述法律市场的需求。事件的颗粒度要大于知识图谱中实体的颗粒度,知识图谱中实体的所反映的概念难以描绘出事件的动态变化。从知识描述从层面上看,传统知识图谱所描述的世界是不具备动态属性,描述的是一种非黑即白的事实性、客观性事实。而法律领域面临的是一种随着外部知识变化而动态调整的问题。传统知识图谱善于回答是什么的事实性定义问题,能够在已知知识基础上推理和校验新知识。这些从根本上仍然属于“静态”的知识,无法回答“为什么”、“怎么办”、”怎么处理”等“动态”问题。传统知识图谱可以看做是一个庞大的、相对静态的知识库,让计算机学会运用知识,学会思考知识,学会理解知识就需要构建动态法律事件图谱,实现真正的机器智能化,在解决法律领域相关问题时具有重要意义。
[0007] 因此,本发明提供了一种面向法律领域的动态法律事件图谱构建方法,以解决上述背景技术中提出的问题。

发明内容

[0008] 本发明的目的在于提供一种面向法律领域的动态法律事件图谱构建方法,以解决上述背景技术中提出的问题。
[0009] 为实现上述目的,本发明提供如下技术方案:一种面向法律领域的动态法律事件图谱构建方法,其包括以下步骤:
(1)定义动态法律事件图谱;
(2)法律语料收集与整理
(3)动态法律事件图谱中事件抽取模型;
(4)动态法律事件图谱中事件关系抽取模型;
(5)动态法律事件图谱中概率图事件模型;
(6)动态法律事件图谱知识更新;
其中,步骤(3)中,动态法律事件图谱中事件抽取模型包括两个子步骤:(i)法律事件的识别与抽取;(ii)法律事件参数的抽取;
在所述步骤(5)中,其包括两个子步骤:(a)法律事件间的概率量度;(b)法律事件内要素概率量度。
[0010] 进一步,作为优选,在所述步骤(1)中,动态法律事件图谱是以法律事件为基础,通过一定方式灵活地表示事件以及事件链的关系,用以做法律行为的预测、推演、计算和表示;其中,一个完整的法律事件可以表示为:事件名、法律场景、法律意图、法律构成要件、锚词、类别和法律依据。
[0011] 进一步,作为优选,在所述步骤(2)中,在对法律语料收集与整理时,法律领域的语料按照来源区分有:法律法规、裁判文书、问答语料和法律资讯;构建动态法律事件图谱要综合大规模的语料去挖掘法律事件及事件间关联;多源法律语料的处理要严格遵从法律的严谨性、全面性和准确性;从数据质量的角度来看,法律法规和裁判文书的质量要相对高于其他语料,在融合多源数据时需要以法律法规和裁判文书为基准。
[0012] 进一步,作为优选,在所述步骤(3)中,为准确地识别事件和参数,需要捕获上下文特征,上下文特征至少包括语法特征和句法特征,采用结合法律专家事件规则模板和动态神经网络模型进行事件的抽取和参数的抽取。
[0013] 进一步,作为优选,在所述步骤(4)中,动态法律事件图谱中的事件关系有:因果关系、时序关系、反转关系、条件关系和上下级事件关系;正确定义法律事件之间的关系是动态法律事件图谱事件关系抽取的前提,用事件关系将法律事件形成结构化的信息存储起来;将事件关系抽取看作是分类任务,在法律专家标注一定规模语料后结合专家规则和分类学习算法来做法律事件之间的关系识别。
[0014] 进一步,作为优选,在所述步骤(5)中,采用动态法律事件概率图模型,在事件挖掘的基础上融合法律专家规则和法律知识图谱,借鉴点互信息的算法,建立事件之间的关联关系的有向无环图,通过对概率转移矩阵的计算实现事件间的概率度量,通过改变事件要素编码方式进行法律要素的编码,最终所构建的动态法律事件图谱不仅可检测和跟踪法律事件的发展规律,也对建立突发事件监测与预警机制。
[0015] 进一步,作为优选,在所述步骤(5)中,在法律事件间的概率量度步骤中,采用以下方法:在具体某种法律范式的指标下,法律事件X在时间t所处的状态记为Ei,假设法律事件有n种状态,那么n中状态构成的完备空间记为E, ,事件Xt在时间t状态的概率
记为 ,用 ,其中k=1,2,...;时间t=m的状态为Ei,时间t=m
+1的状态为Ej的概率记pij,则有一次转移概率 ,
显然可得在k次转移之后得到 ,
一次转移的概率矩阵记为 ,显然可得到经过k次转移概率的
概率矩阵为 ,经过k次转移矩阵等于一次转移的k
次方,记为 ,可以通过就事件间的概率转移矩阵得
到事件转移的概率。
[0016] 进一步,作为优选,在所述步骤(5)中的法律事件内要素概率量度中,采用以下方法:给定法律事件X、目标要素xi以及候选要素集合 ,则有

指定的X集合中的要素进行排序,得到 ,排名越靠前则候选要
素与目标要素的关联越大;
整个算法分为几个过程:首先,对于给定的目标要素以及候选要素集合中的每个要素进行特征抽取以及上下文信息的抽取,其次,使用自编码器对上述抽取到的特征进行特征化表示学习,然后通过多通道编码器进行编码;最后,计算目标要素和候选要素集合进行相似计算机并排序;在抽取上下文信息的过程中,将要素当做由若干个词语有序的集合,结合特征工程的思想抽取要素的特征。
[0017] 进一步,作为优选,在所述步骤(5)中,在多通道编码模型中,将要素排序的过程转化成分类问题,要素对(x,y)作为模型的输入,在嵌入层编码时,借鉴PMI思想,考虑模型输入要素的相关性;点互信息的计算公式为:,其中x1和x2分别代表两个要
素,p(x1)和p(x2)分别代表语料中x1和x2出现的概率,p(x1,x2)两者共现的概率;
对于每对要素对,期望得到 ,其中x1和x2分别代表两个要素,vx1、
vx2分别是x1和x2对应的向量;
考虑实际语料的情况,如使用 、拉普拉斯平滑做处理;将
嵌入层的优化目标变成:
,其中 的词向量;
在进行多通道编码时,选用可替换的卷积神经网络模型进行多通道编码,最后将模型训练得到的副产物向量当做法律要素的编码器,法律要素经由编码可以编码成向量,使用相似度计算模型来做给定目标要素和候选要素之间的排序。
[0018] 进一步,作为优选,在所述步骤(6)中,采用网络爬虫或者直接下载的方式定期同步法律网站上的数据以及以社交媒体网站上的与法律相关的热事件以及各大搜索引擎的热门词为候选法律事件。
[0019] 与现有技术相比,本发明的有益效果是:本发明的利用自然语言处理技术构建了面向法律领域的动态法律事件图谱,本发明与现有技术相比,具有以下优点:
目前,在法律领域尚未出现动态法律事件图谱构建方法;与法律领域的法律知识图谱相比,本发明中的动态法律事件图谱的最小单元是法律事件而不是实体,所构建的图谱是由法律事件和法律事件间关系组成;与传统的事件抽取相比,本发明所构建的动态法律事件图谱中知识是动态化、可计算化、可推理,而不是简单的抽取事件库;本发明构建了面向法律领域的动态法律事件图谱,结合了传统知识图谱知识抽取的技术和事件挖掘技术构建了图谱,然后通过对法律事件图谱中的法律事件要素以及法律事件间的关系分别建模进行法律事件图谱计量。
附图说明
[0020] 图1为一种面向法律领域的动态法律事件图谱构建方法的流程结构示意图。

具体实施方式

[0021] 请参阅图1,本发明实施例中,一种面向法律领域的动态法律事件图谱构建方法,该方法用于构建面向法律领域的动态法律事件图谱,本发明需要法律专家知识对法律事件做严格定义,然后利用知识图谱技术和事件抽取技术,结合概率图模型从多法律数据源的角度构建事件图谱。
[0022] 本发明的一种面向法律领域的动态法律事件图谱构建方法,包括以下步骤:(1)动态法律事件图谱定义:
法律事件,狭义上是指是法律领域的一种法律事实,不依权利主体的主观意志为转移的法律事实和客观现象;广义上的法律事件,是指正在或者已经发生在特定场景、特定情节、特定时间范围和特定区域内发生的,有至少一个角色且发生的动作不少于一个的法律事实。本发明的动态法律事件图谱是以法律事件为基础,通过一定方式灵活地表示事件以及事件链的关系,用以做法律行为的预测、推演、计算、表示等。一个完整的法律事件可以表示为<事件名,法律场景,法律意图,法律构成要件,锚词,类别,法律依据>。以疲劳驾驶法律事件为例,完整的法律事件可表示为:(<事件名:疲劳驾驶>、<法律场景:道路交通>、<法律意图:违章>、<法律构成要件:[<主体:驾驶人>、<客体:道路交通安全>、<主观方面:过失>、<客观方面:疲劳驾驶>] >、<锚词:[连续开车、未停车休息] >、<类别:行政执法>、<法律依据:[《中华人民共和国道路交通安全法》第二十二条、《中华人民共和国道路交通安全法实施条例》第六十二条第七款]>)。
[0023] (2)法律语料收集与整理:法律领域的语料按照来源区分有:法律法规、裁判文书、问答语料、法律资讯等,构建动态法律事件图谱需要综合大规模的语料去挖掘法律事件及事件间关联,多源法律语料的处理要严格遵从法律的严谨性、全面性和准确性,从数据质量的角度来看,法律法规和裁判文书的质量要相对高于其他语料,所以在融合多源数据的时候需要以法律法规和裁判文书为基准。
[0024] (3)动态法律事件图谱中事件抽取模型:法律事件的抽取模型可以划分为两个步骤:(1)法律事件的识别与抽取 ;(2)法律事件参数的抽取。
[0025] 为了更准确地识别事件和参数,通常捕获上下文特征,例如语法特征,句法特征等,目的是理解事实是如何联系在一起的。但是这种方法在句子级别的事件抽取比较有效,在处理跨句子的时候就很难找到直接的依赖路径。采用结合法律专家事件规则模板(如:正则匹配规则)和动态神经网络模型(如:CRF+LSTM事件抽取模型,其中CRF为条件随机场(Conditional Random Field,CRF);LSTM为长短时记忆网络(Long Short Term Memory Network, LSTM))进行事件的抽取和参数的抽取。
[0026] (4) 动态法律事件图谱中事件关系抽取模型:动态法律事件图谱中的事件关系有:因果关系、时序关系、反转关系、条件关系和上下级事件关系;正确定义法律事件之间的关系是动态法律事件图谱事件关系抽取的前提,用事件关系将法律事件形成结构化的信息存储起来;将事件关系抽取看作是分类任务,在法律专家标注一定规模语料后结合专家规则和分类学习算法来做法律事件之间的关系识别、(5)动态法律事件图谱中概率图事件模型:
本发明采用动态法律事件概率图模型(Dynamic Probability Maps Model of Legal Events,DP2MLE),在事件挖掘的基础上融合了法律专家规则和法律知识图谱,借鉴PageRank、PMI等算法的思想,建立事件之间的关联关系的有向无环图,通过对概率转移矩阵的计算实现事件间的概率度量,通过改变事件要素编码方式进行法律要素的编码。最终所构建的动态法律事件图谱不仅可以检测和跟踪法律事件的发展规律,也对建立突发事件监测与预警机制。
[0027] (5.1)法律事件间的概率量度:在具体某种法律范式的指标下(如:案由、专题等)下,法律事件X在时间t所处的状态记为Ei,假设法律事件有n种状态,那么n中状态构成的完备空间记为E, ,
事件Xt在时间t状态的概率记为 ,用 ,其中k=1,
2,...。时间t=m的状态为Ei,时间t=m+1的状态为Ej的概率记pij,则有一次转移概率,显然可得在k次转移之后得到
,一次转移的概率矩阵记为
,显然可得到经 过k 次转移概率的概率矩阵 为
,经过k次转移矩阵等于一次转移的k次方,记为
,可以通过就事件间的概率转移矩阵得到事件转
移的概率。
[0028] (5.2)法律事件内要素概率量度给定法律事件X、目标要素xi以及候选要素集合 ,则有
;对指定的X集合中的要素进行排序,得到
,排名越靠前则候选要素与目标要素的关联越大;如果所示整个算
法大概分为几个过程:首先,对于给定的目标要素以及候选要素集合中的每个要素进行特征抽取以及上下文信息的抽取,其次,使用自编码器对上述抽取到的特征进行特征化表示学习,然后通过多通道编码器进行编码;最后,计算目标要素和候选要素集合进行相似计算机并排序。
[0029] 在抽取上下文信息的过程中,可将要素当做由若干个词语有序的集合,结合特征工程的思想抽取要素的特征。
[0030] 在多通道编码模型中,将要素排序的过程转化成分类问题,那么要素对(x,y)作为模型的输入,在embedding layer(嵌入层)编码时,借鉴PMI思想,考虑模型输入要素的相关性。点互信息的计算公式为:,其中x1和x2分别代表两个要
素,p(x1)和p(x2)分别代表语料中x1和x2出现的概率,p(x1,x2)两者共现的概率。对于每对要素对,期望得到 ,其中x1和x2分别代表两个要素,vx1、vx2分别是x1和x2
对应的向量。考虑实际语料的情况,如使用 、拉普拉斯平滑
等做处理。将embedding layer的优化目标变成:
,其中 的词向量;
可选用可替换的神经网络模型(如:卷积神经网络)进行多通道编码。最后将模型训练得到的副产物向量用作法律要素的编码器,法律要素经由编码可以编码成向量,因此可以使用相似度计算模型来做给定目标要素和候选要素之间的排序。
[0031] (6) 动态法律事件图谱知识更新:动态法律事件图谱的动态更新是保证事件图谱中的知识尽可能的更新。数据源的更新是知识更新的基础,一方面采用网络爬虫或者直接下载的方式定期同步法律网站上的数据。另一方面以社交媒体网站上的与法律相关的热门事件以及各大搜索引擎的热门词为候选法律事件。
[0032] 本发明的关键点是利用自然语言处理技术构建了面向法律领域的动态法律事件图谱。本发明在法律领域尚未出现动态法律事件图谱构建方法;与法律领域的法律知识图谱相比,本发明中的动态法律事件图谱的最小单元是法律事件而不是实体,所构建的图谱是由法律事件和法律事件间关系组成;与传统的事件抽取相比,本发明所构建的动态法律事件图谱中知识是动态化、可计算化、可推理,而不是简单的抽取事件库。本发明的优点是构建了面向法律领域的动态法律事件图谱,结合了传统知识图谱知识抽取的技术和事件挖掘技术构建了图谱,然后通过对法律事件图谱中的法律事件要素以及法律事件间的关系分别建模进行法律事件图谱计量。
[0033] 以上所述的,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈