专利汇可以提供一种用于公共安全领域大数据知识图谱的自动化构建方法专利检索,专利查询,专利分析的服务。并且本 发明 公开一种用于公共安全领域 大数据 知识图谱的自动化构建方法,涉及 数据挖掘 、 人工智能 技术领域,包括该构建方法首先需要针对公共安全所涉及领域建立标准体系,随后建立公共安全领域实体映射库Entity-Mapping,将实体的主要属性存储到文件存储 数据库 ,将数据推送至内存存储数据库,进行碎片实体自动化 串联 ,前期准备工作完成后,将数据抽象成实体、关系、事件三大类,依托 机器学习 和 深度学习 服务,通过知识建模、知识 抽取 、实体融合依次完成公共安全领域知识图谱的自动化构建;另外,在实现自动化构建能 力 之外,还进行知识图谱的 质量 管控和优化,还构建公共安全领域搜索意图解析器,促进用户搜索智能化推荐,提高用户搜索获取有效信息的效率。,下面是一种用于公共安全领域大数据知识图谱的自动化构建方法专利的具体信息内容。
1.一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,其实现过程包括:
步骤一,根据公共安全所涉及领域建立标准体系,确保多源异构数据的融汇贯通和深度智能挖掘有章可循;
步骤二,建立公共安全领域实体映射库Entity-Mapping,将实体的主要属性存储到文件存储数据库,将数据推送至内存存储数据库,进行碎片实体自动化串联;
步骤三,将数据抽象成实体、关系、事件三大类,构建公共安全领域知识图谱:
1)通过知识建模工具对公共安全领域所有数据资源进行数据地图分类展示,通过人机协同模式进行语料标注不同数据资源对应数据的实体类型,根据数据元标准自动化标准不同实体的关联规则和标签规则,通过数据地图自动显示不同实体之间的关联关系;
2)依托机器学习和深度学习服务进行文本深度挖掘,提取出结构化的实体、属性以及实体间的关系、事件,并在此基础上形成本体化的知识表达;
3)对多源知识进行实体融合,消除矛盾和歧义,解决同名实体产生歧义的问题,完成公共安全领域知识图谱的构建。
2.根据权利要求1所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,其实现过程还包括:
通过权威度、冗余度、多样性、一致性进行知识验证,判断新知识是否正确;
多次验证,通过对图谱密度、中心性特征、孤立节点和比例、属性填充率完成知识图谱的质量管控。
3.根据权利要求2所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,通过自生长优化、应用反馈优化、业务分析人员反馈优化三种数据优化方式对构建的公共安全领域知识图谱进行优化,提升构建公共安全领域知识图谱的完整性;其中,自生长优化主要采用数据挖掘分类算法对实体进行分析,对实体的属性、关联、标签进行自动关联。
4.根据权利要求1或2或3所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,其实现过程还包括:
通过公共安全领域知识图谱的建模数据、公共安全领域实体映射库的数据、用户搜索行为数据,通过变长命令序列检测模型分析用户搜索意图,根据用户搜索行为数据建立序列,定义一个集合C={l(1)
构建公共安全领域知识图谱的可视化展现页面,可以进行实体、事件、关键词的检索,同时支持对图谱进行智能挖掘分析,分析实体关联关系和路径之间的连接度。
6.根据权利要求1所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,在步骤一中,所述公共安全涉及元数据规范、数据元标准、本体模型、数据分级分类规范、标签分类体系、知识存储、图谱交换与共享规范七部分,对每部分分别建立标准体系。
7.根据权利要求1所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,在步骤二中,通过MongoDB、Redis建立公共安全领域实体映射库Entity-Mapping,将实体的主要属性通过Entity-Mapping引擎存储到MongoDB数据库中,同时为了提升分析效率,将数据推送Redis中缓存,实现碎片实体自动化串联。
8.根据权利要求1所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,在步骤三中,基于实体-链接二维理论,将现实中的人、案、物抽象为实体表示为图标,实体之间的关系抽象为链接表示为连线,基于机器学习和实体识别技术,从公共安全领域的基础数据库和专题数据库中提取各类实体,基于图数据库技术将实体之间的关联关系以知识图谱的形式进行保存。
9.根据权利要求8所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,知识图谱存储采用图数据库titan作为存储介质,将实体定义为图的节点Vertex,节点一方面存储实体基本关键信息,同时将不同实体的标签信息与实体通过实体Entity-Mapping映射自动串联存储;同时,实体之间的关系信息、事件信息也进行定义标注,并以边Edge的形式进行自动存储。
10.根据权利要求1所述的一种用于公共安全领域大数据知识图谱的自动化构建方法,其特征在于,在步骤三中,对多源知识进行实体融合具体包括实体消歧和共指消解;实体消歧从存储在图数据库中数据中提取实体特征、实体关联数据建立相似度矩阵,利用不同的聚类算法得到不同的划分,采用基于均方误差邻接矩阵聚类算法对划分进行共指消解或集成,实现实体消歧解决同名实体产生歧义的问题,
Similar(di,dj)是实体di与实体dj的特征相似度或者数据关联相似度,uik是实体di中第k个特征相似度或者数据关联相似度。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种聚碳酸酯组合物及其制备方法 | 2020-05-11 | 1024 |
用于自然语言精准检索的结构化查询语句生成系统及方法 | 2020-05-16 | 672 |
一种文本解析方法及装置 | 2020-05-18 | 1010 |
沼液理化指标近红外光谱同步快速检测方法 | 2020-05-25 | 818 |
沼液理化指标近红外光谱同步快速检测方法 | 2020-05-15 | 37 |
一种用于公共安全领域大数据知识图谱的自动化构建方法 | 2020-05-23 | 651 |
基于动态图谱链接分析的领域搜索排序方法 | 2020-05-08 | 972 |
基于电网调度知识图谱的语音合成方法、系统及电子设备 | 2020-05-20 | 858 |
一种基于环保目标约束的电能替代策略实施的运行方法 | 2020-05-12 | 710 |
基于天地一体化信息的PM2.5浓度监测方法 | 2020-05-13 | 902 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。