专利汇可以提供一种基于信息抽取的网络安全法案件智能研判方法专利检索,专利查询,专利分析的服务。并且一种基于信息 抽取 的网络安全法案件智能研判方法,包括如下步骤:(1)知识图谱构建:从事件概念、事件实体、法律条文三个方面构建网络安全法知识图谱;(2)案件信息抽取:从网络安全法案件文本中抽取违法事件、违法主体、违法客体等事件实体,并在网络安全法知识图谱中进行事件概念链接;(3)法律条文检索:综合基于知识图谱的结构化检索和基于语义匹配的非结构化检索,得到可用于对网络安全法案件进行研判的法律条文。本 发明 基于信息抽取对网络安全法案件进行理解,使得方法可更精确的获得案件的结构化信息,采用知识图谱对网络安全法的相关知识进行表示,使得方法可更准确的对案件做出研判。,下面是一种基于信息抽取的网络安全法案件智能研判方法专利的具体信息内容。
1.一种基于信息抽取的网络安全法案件智能研判方法,其特征在于,所述方法包括如下步骤:
(1)知识图谱构建:从事件概念、事件实体、法律条文三个方面构建网络安全法知识图谱;
(2)案件信息抽取:从网络安全法案件文本中抽取违法事件、违法主体、违法客体等事件实体,并在网络安全法知识图谱中进行事件概念链接;
(3)法律条文检索:综合基于知识图谱的结构化检索和基于语义匹配的非结构化检索,得到可用于对网络安全法案件进行研判的法律条文。
2.如权利要求1所述的一种基于信息抽取的网络安全法案件智能研判方法,其特征在于,所述步骤(1)中,网络安全法知识图谱依赖专家知识人工构建,步骤如下:
(1-1)节点构建:从事件概念、事件实体、法律条文三个方面构建节点,其中,事件概念节点包括违法事件类型、违法主体类型、违法客体类型三类,事件实体节点包括违法事件实体、违法主体实体、违法客体实体三类,法律条文节点包括事件条文、责任条文两类;
(1-2)关系构建:为违法事件类型和其对应的违法事件实体、违法主体类型和其对应的违法主体实体、违法客体类型和其对应的违法客体实体建立“属于”关系,为事件条文和其对应的违法事件类型、违法主体类型、违法客体类型建立“涉及”关系,为事件条文和其对应的责任条文建立“后果”关系。
3.如权利要求1或2所述的一种基于信息抽取的网络安全法案件智能研判方法,其特征在于,所述步骤(2)中,网络安全法案件信息抽取基于深度学习技术实现,步骤如下:
(2-1)训练样本标注:对网络安全法历史案件文本集合中的每一个句子,对其中所有的字进行序列标注,包括违法事件实体首字B-EVE、违法事件实体非首字I-EVE、违法主体实体首字B-SUB、违法主体实体非首字I-SUB、违法客体实体首字B-OBJ、违法客体实体非首字I-OBJ、非事件实体部分O,标注好的句子即为一个训练样本;
(2-2)事件实体识别:事件实体识别指从一个句子中识别出违法事件实体、违法主体实体和违法客体实体;
(2-3)事件概念链接:事件概念链接指识别出事件实体对应的事件概念,给定事件实体三元组E=(Ee,Es,Eo)。
4.如权利要求3所述的一种基于信息抽取的网络安全法案件智能研判方法,其特征在于,所述步骤(2.2)包括线下训练和线上识别两部分,步骤如下:
(2-2-1)线下训练:基于双向LSTM+CRF训练事件实体识别模型,模型结构解释如下:
输入层:模型的输入为一个句子,采用预训练的字嵌入矩阵将句子中的每个字映射为一个k维向量,得到一个字向量序列
双向LSTM层:首先,将字向量序列,其中,hi=[fhi;bhi]为一个m维向量;最后,采用一个全连接层将每个m维的隐状态向量hi映射为一个7维的特征向量pi,得到一个特征向量序列
CRF层:将特征向量序列
(2-2-2)线上识别:给定一个网络安全法案件文本D,首先将D按句子进行划分,得到一个句子集合SS;然后,将SS中每个句子Si输入训练好的事件实体识别模型,得到Si的标注序列,并对连续的B-EVE和I-EVE字进行合并得到违法事件实体Ee,对连续的B-SUB和I-SUB字进行合并得到违法主体实体Es,对连续的B-OBJ和I-OBJ字进行合并得到违法客体实体Eo,若Ee和Es均不为空,则构成事件实体三元组E=(Ee,Es,Eo);最后,合并SS中多个句子检测出的事件实体三元组,则得到事件实体三元组集合ES。
5.如权利要求3所述的一种基于信息抽取的网络安全法案件智能研判方法,其特征在于,所述步骤(2.3)的步骤如下:
(2-3-1)违法主体概念链接:直接在网络安全法知识图谱中检索名称或别名为Es的违法主体实体节点,然后返回与该节点存在“属于”关系的违法主体类型节点对应的违法主体类型Cs;
(2-3-2)违法客体概念链接:若Eo为空,则返回空;若Eo不为空,则直接在网络安全法知识图谱中检索名称或别名为Eo的违法客体实体节点,然后返回与该节点存在“属于”关系的违法客体类型节点对应的违法客体类型Co;
(2-3-3)违法事件概念链接:首先,基于FastText算法线下训练一个违法事件分类模型,用于将违法事件实体文本分类到违法事件类型,然后,应用该分类模型获得Ee对应的违法事件类型Ce;
(2-3-4)事件概念三元组构建:基于步骤(2-3-1)、(2-3-2)和(2-3-3)得到ES中每个事件实体三元组E=(Ee,Es,Eo)对应的事件概念三元组C=(Ce,Cs,Co),最终得到事件概念三元组集合CS。
6.如权利要求1或2所述的一种基于信息抽取的网络安全法案件智能研判方法,其特征在于,所述步骤(3)中,给定网络安全法案件文本D和其对应的事件概念三元组集合CS,法律条文检索步骤如下:
(3-1)结构化检索:对CS中每个事件概念三元组C=(Ce,Cs,Co),若Co为空,则在网络安全法知识图谱中检索与Ce和Cs均存在“涉及”关系的事件条文节点和与该节点存在“后果”关系的责任条文节点,得到检索结果二元组Q=(Le,Lr),其中Le为网络安全法中的事件条文,Lr为网络安全法中的责任条文;若Co不为空,则在网络安全法知识图谱中检索与Ce、Cs和Co均存在“涉及”关系的事件条文节点和与该节点存在“后果”关系的责任条文节点,得到检索结果二元组Q=(Le,Lr);最终,得到检索结果二元组集合QS;
(3-2)非结构化检索:若QS为空,则进行非结构化检索;
(3-3)结果返回:返回QS作为最终研判结果。
7.如权利要求6所述的一种基于信息抽取的网络安全法案件智能研判方法,其特征在于,所述步骤(3-2)的步骤如下:
(3-2-1)关键词抽取:基于TF-IDF算法对D进行关键词抽取,保留分数最高的k个关键词,形成关键词集合KW(D);
(3-2-2)全文检索:基于Lucene全文检索引擎从网络安全法事件条文数据库中检索至少包含KW(D)中一个关键词的所有事件条文,形成候选事件条文集合LE(D);
(3-2-3)匹配度计算:对LE(D)中每个候选事件条文Le,计算其包含KW(D)中关键词的数量n(Le),则匹配度score(D,Le)=n(Le)/k;最终,选取匹配度最高的候选事件条文Le,并在网络安全法知识图谱中检索Le对应的事件条文节点和与该节点存在“后果”关系的责任条文节点对应的责任条文Lr,得到检索结果二元组Q=(Le,Lr),将Q加入检索结果二元组集合QS。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
具有多设备消息传输的总线通信 | 2020-05-08 | 845 |
一种发票匹配方法及系统 | 2020-05-08 | 475 |
一种基于知识图谱的智能问答方法及装置 | 2020-05-12 | 417 |
一种热点节目负载均衡的方法和装置 | 2020-05-13 | 265 |
一种基于配置的对象属性元数据抽取系统 | 2020-05-12 | 1080 |
一种人工智能代接来电的系统 | 2020-05-12 | 704 |
内容分发网络服务提供方法及处理系统 | 2020-05-13 | 254 |
一种主网OCS系统责任区维护校验方法 | 2020-05-13 | 145 |
一种构建DNS应答报文的方法及装置 | 2020-05-08 | 338 |
基于语义识别的别名挖掘方法、装置、介质及电子设备 | 2020-05-14 | 743 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。