专利汇可以提供基于bert算法模型的知识图谱构建系统专利检索,专利查询,专利分析的服务。并且本 发明 属于知识图谱技术领域,具体涉及一种基于bert 算法 模型的知识图谱构建系统。与 现有技术 相比较,本发明通过使用bert-bilstm-crf中文命名识别 深度学习 算法对归零文档段落中的数据进行实体提取;利用句法依存关系对关系提取,并通过领域图谱的上下位关系、同意关系、反义关系、关联关系实现多个文档的横向和纵向关联,形成归零文档的知识体系和知识图谱。与现有技术相比,本发明提出的技术方案,实现了军工集团归零文档知识的体系化、结构化和知识化等,同时,基于bert-bilstm-crf中文命名识别算法模型,也保证了段落实体提取的快速性和精准性。,下面是基于bert算法模型的知识图谱构建系统专利的具体信息内容。
1.一种基于bert算法模型的知识图谱构建系统,其特征在于,所述系统包括:
领域数据预处理模块,其用于对归零文档领域的数据做预处理得到实体识别模型需要的标注数据集;
实体识别模型生成模块,其用于利用标注数据集训练bert-bilstm-crf中文命名识别算法模型,得到归零文档实体识别模型;
文档预处理模块,其用于读入归零文档,对归零文档做预处理,降低异常值和冗余数据的干扰,得到低噪声的文本数据;
文本切分模块,其用于将低噪声的文本数据按照章节目录结构进行切分,切成与章节目录对应的段落,使每个章节目录与段落一一映射,形成若干个有章节目录的段落;
实体提取模块,其用于利用归零文档实体识别模型对有章节目录的段落数据进行实体提取;
实体关系提取模块,其用于利用句法依存关系算法提取实体与实体之间的关系,将提取的关系与提取到的实体一一连接,形成知识图谱的三元组;
整合模块,其用于利用上下位关系、同意关系、反义关系、关联关系将多个归零文档实体的横向和纵向关联打通,形成整体归零文档知识图谱三元组;
知识图谱生成模块,其用于将最终生成的整体归零文档知识图谱三元组存储在图数据库中,形成知识图谱,为后续的相关应用提供基础的数据支撑。
2.如权利要求1所述的基于bert算法模型的知识图谱构建系统,其特征在于,在整合模块进行整合之前,由于归零文档本身知识体系的不完善性,还可以结合归零文档和公开的领域词典对提取的实体和关系进行融合和完善,使实体和关系更加完善充实,最终形成单文档的知识图谱三元组。
3.如权利要求2所述的基于bert算法模型的知识图谱构建系统,其特征在于,所述公开的领域词典包括来自清华的领域词典。
4.如权利要求2所述的基于bert算法模型的知识图谱构建系统,其特征在于,所述公开的领域词典包括来自百度的领域词典。
5.如权利要求1所述的基于bert算法模型的知识图谱构建系统,其特征在于,所述步骤
5中,所述图数据库为neo4j图数据库。
6.如权利要求1所述的基于bert算法模型的知识图谱构建系统,其特征在于,所述步骤
5中,所述图数据库为JanusGraph图数据库。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
用于对运动信息进行编码和解码的方法以及用于对运动信息进行编码和解码的设备 | 2020-05-08 | 867 |
用于车辆对基础设施通信的命名数据网络 | 2020-05-08 | 26 |
无定子电压电流传感器的DFIG-DC系统定子功率及频率控制方法 | 2020-05-08 | 674 |
一种锌镍蓄电池 | 2020-05-11 | 985 |
一种具有纳米二氧化钛/聚氨酯保护层的钙钛矿太阳能电池 | 2020-05-11 | 949 |
用于热交换板的金属制基础板材 | 2020-05-08 | 997 |
一种层状-尖晶石相复合正极材料及其制备方法 | 2020-05-11 | 775 |
一种构建信息通信智能调度指挥沙盘的方法 | 2020-05-08 | 774 |
一种通信系统时钟分配管理电路 | 2020-05-08 | 855 |
一种逆变器主动放电方法和装置 | 2020-05-11 | 371 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。