专利汇可以提供一种基于用户日志动态更新知识图谱的方法专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于用户日志动态更新知识图谱的方法,包括:从智能电视语义日志中获取本次更新周期内用户的 请求 日志数据;遍历用户的请求日志,基于 命名实体 识别模型从用户的请求语句中提取出实体名和实体类型;并按照请求类别和实体类别分别统计 访问 量;根据实体访问量和现有的影视知识图谱,得到热 门 实体、冷门实体和缺失实体;从预设垂直 网站 爬取所述热门实体和缺失实体的信息并进行数据预处理;将得到的热门实体与现有影视知识图谱中实体作实体匹配,并对匹配实体进行更新;将得到的缺失实体新增至知识图谱,以及清理冷门实体。本发明基于用户日志中确定需要更新的实体并进行更新,能有效减少处理的数据量。,下面是一种基于用户日志动态更新知识图谱的方法专利的具体信息内容。
1.一种基于用户日志动态更新知识图谱的方法,其特征在于,包括:
步骤A:从智能电视语义日志中获取本次更新周期内用户的请求日志数据;
步骤B:遍历用户的请求日志,基于命名实体识别模型从用户的请求语句中提取出实体名和实体类型;并按照请求类别和实体类别分别统计访问量,并记作实体集E1,则E1={(e1,t1,n11),(e1,t2,n12),(e2,t3,n23),…,(ei,tj,nij),…(en,tm,nnm)},其中三元组(ei,tj,nij)表示实体名为ei且实体类别为tj的实体的用户访问量nij;
步骤C:根据实体访问量和现有的影视知识图谱,得到热门实体、冷门实体和缺失实体;
步骤D:从预设垂直网站爬取所述热门实体和缺失实体的信息并进行数据预处理;
步骤E:将得到的热门实体与现有影视知识图谱中实体作实体匹配,并对匹配实体进行更新;
步骤F:将得到的缺失实体新增至知识图谱,以及清理冷门实体。
2.根据权利要求1所述的一种基于用户日志动态更新知识图谱的方法,其特征在于,所述步骤C具体为:
设定热门阈值THRsp和冷门阈值THRunsp,令现有知识图谱中的实体集:
E2={(e1,t1),(e1,t2),(e2,t3),…,(ei,tj),…,(eh,tk)},其中二元组(ei,tj)表示实体名为ei且实体类别为tj的实体;
遍历所得到的实体集E1中的三元组(en,tm,nnm),判断:
若nij≥THRsp且(ei,tj)∈E2,则记该实体为热门实体;
若nij≤THRunsp且(ei,tj)∈E2,则记该实体为冷门实体;
若nij>THRunsp且 则记该实体为缺失实体。
3.根据权利要求2所述的一种基于用户日志动态更新知识图谱的方法,其特征在于,所述步骤D具体为:
步骤D1:将缺失实体标记为待爬取,判断热门实体的实体类型,并根据预设规则将其标记为待爬取或者不爬取;
步骤D2:对标记为带爬取的实体,从垂直网站爬取实体信息;
步骤D3:将爬取的数据格式化,用于与知识图谱中已有数据匹配。
4.根据权利要求3所述的一种基于用户日志动态更新知识图谱的方法,其特征在于,所述步骤E具体为:
设定实体相似度阈值THRstm;
计算实体属性值相似度的加权平均值作为实体的相似度,所述属性值包括用于区分不同实体的一个或者多个属性;
遍历获取的热门实体,计算其与现有知识图谱中实体的相似度;
选择相似度≥THRstm且相似度最大的实体作为该热门实体的匹配实体,并对匹配实体的属性值进行更新。
5.根据权利要求4所述的一种基于用户日志动态更新知识图谱的方法,其特征在于,所述步骤F中将缺失实体新增至知识图谱的步骤为:
将缺失实体与现有知识图谱中的实体进行匹配,如不存在匹配实体,曾将缺失实体新增至知识图谱,若已存在匹配实体,且实体的访问量≥THRsp,则对已有实体进行更新。
6.根据权利要求4所述的一种基于用户日志动态更新知识图谱的方法,其特征在于,所述步骤F中清理冷门实体的步骤为:对冷门实体增加标志其冷门的标记字段,若连续多次更新知识图谱时该实体均为冷门实体,则将该冷门实体从影视知识图谱中删除。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种室外中继器的密封壳体及室外中继器 | 2020-05-08 | 519 |
一种智能路由方法 | 2020-05-08 | 932 |
特别是用于计轴器的应变测量设备 | 2020-05-08 | 632 |
固态电解质电池和用于制造固态电解质电池的方法 | 2020-05-08 | 159 |
分析板的置放用支架和分析套件 | 2020-05-08 | 400 |
一种受前面帧目标信息约束的相关滤波目标跟踪算法 | 2020-05-08 | 339 |
存储地形特征估计程序的介质、地形特征估计方法及装置 | 2020-05-08 | 734 |
基于阻抗实部为零材料的长时间存储电磁波的方法 | 2020-05-08 | 165 |
用于确定电线位置的方法和设备以及存储介质 | 2020-05-11 | 817 |
通用动量方法、基于通用动量方法的目标检测与识别方法 | 2020-05-11 | 265 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。