专利汇可以提供一种回答自然语言问题的方法与装置专利检索,专利查询,专利分析的服务。并且公开了一种满足结构化信息源对检索精确性的要求、满足广大普通互联网用户日益增长的信息获取方面的需求的回答自然语言问题的方法,包括以下步骤:(1)生成实体-属性模型,进行实体-属性对集合的收集及特征提取;(2)执行用户查询分析,当用户输入查询内容时,将该查询内容映射到它对应的用户需求的实体-属性对,其中查询内容即自然语言问题。还提供了一种回答自然语言问题的装置。,下面是一种回答自然语言问题的方法与装置专利的具体信息内容。
1.一种回答自然语言问题的方法,其特征在于:包括以下步骤:
(1)生成实体-属性模型,进行实体-属性对集合的收集及特征提取;
(2)执行用户查询分析,当用户输入查询内容时,将该查询内容映射到它对应的用户需求的实体-属性对,其中查询内容即自然语言问题。
2.根据权利要求1所述的回答自然语言问题的方法,其特征在于:步骤(1)包括以下分步骤:
(1.1)实体抽取:从在线的开放百科档案中获取实体名;
(1.2)属性抽取:从用户的查询内容中抽取出每一类实体的属性名;
(1.3)属性特征生成:从用户的查询内容中抽取每一属性相关的问题的最佳答案文本作为该属性的特征;
(1.4)实体-属性对模型生成:将每一个实体名和该实体所具有的属性名组成实体-属性对,并结合该实体-属性对的属性特征生成实体-属性模型。
3.根据权利要求2所述的回答自然语言问题的方法,其特征在于:步骤(1.3)包括以下分步骤:
(1.3.1)检索出问题文本中包含该属性名的所有问答数据;
(1.3.2)过滤掉问题文本中不包含与用户关注的实体名同类的实体名的问答数据;
(1.3.3)以BM25算法对检索出的问题依据它与属性名的相似程度排序;
(1.3.4)将排序结果中的前k个问题的最佳答案的文本集合作为该属性的特征,k为正整数。
4.根据权利要求1所述的回答自然语言问题的方法,其特征在于:步骤(2)包括以下分步骤:
(2.1)查询预处理:检测并回退无法从结构化或半结构化信息源中检索出答案的用户的查询;
(2.2)用户查询分析:将用户的查询内容分拆为实体相关和属性相关两部分内容;
(2.3)用户查询所关注的实体的提取:使用关键词匹配技术从实体相关的查询内容中提取出用户关注的实体名;
(2.4)用户查询所关注的属性的提取:使用基于语言模型和作者-话题模型的混合模型根据属性相关的查询内容预测用户关注的属性名;
(2.5)分析结果后处理:将所提取的用户关注的实体名和属性名组合成实体-属性对,输出该实体-属性对。
5.根据权利要求4所述的回答自然语言问题的方法,其特征在于:步骤(2.4)包括以下分步骤:
(2.4.1)生成候选属性名列表:根据已经提取出的实体名,得到它所具有的全部属性作为候选属性;
(2.4.2)属性相关的查询内容的特征生成:从问答数据中抽取该内容文本相关的问题的最佳答案文本作为该查询内容的特征;
(2.4.3)计算属性相关的查询内容的特征与各候选属性特征的语义关联:使用如下公式计算该语义关联的数值:
rel(phr,att)=μ·relsim(phr,att)+(1-μ)·relint(phr,att)
其中,phr表示查询内容,att表示候选属性,且有,
relint(phr,att)=p(a=att|Fphr)
其中,F*表示提取出的特征,p(a=·|·)表示作者-话题模型中的作者对给定文本的后验概率;
(2.4.4)结果输出:选择与查询的语义关联数值最大的一个或多个属性名,输出该一个或多个属性名。
6.根据权利要求5所述的回答自然语言问题的方法,其特征在于:步骤(2.4.2)包括以下分步骤:
(2.4.2.1)检索出问题文本中匹配该内容文本的所有问答数据;
(2.4.2.2)过滤掉问题文本中不包含与用户关注的实体名同类的实体名的问答数据;
(2.4.2.3)以BM25算法对检索出的问题依据它与属性名的相似程度排序;
(2.4.2.4)将排序结果中的前k个问题的最佳答案的文本集合作为该属性的特征,k为正整数。
7.一种回答自然语言问题的装置,其特征在于:包括:
(1)实体-属性模型,其进行实体-属性对集合的收集及特征提取;
(2)用户查询分析模型,当用户输入查询内容时,利用用户查询分析模型将该查询内容映射到它对应的用户需求的实体-属性对,其中查询内容即自然语言问题。
标题 | 发布/更新时间 | 阅读量 |
---|---|---|
一种用于子话题划分的诱导划分方法 | 2021-03-09 | 1 |
一种出行提醒的方法及穿戴设备 | 2021-08-28 | 0 |
用于计算国家特定费用的计算机系统 | 2021-07-01 | 0 |
一种基于网购评价的细粒度情感分析方法 | 2020-06-22 | 2 |
一种基于建构的概念词义发展脉络的提取方法 | 2020-06-21 | 0 |
基于命名实体识别的模板生成、搜索及文本生成设备与方法 | 2020-08-19 | 0 |
基于双层语义分析的全文检索系统 | 2023-04-22 | 1 |
装置间的应用状态和活动传送 | 2023-06-26 | 1 |
이동통신단말장치에서 사용되는 애플리케이션의 데이터를 관리하는 시스템 및 그 방법 | 2023-10-10 | 1 |
LEARNING LANGUAGE MODELS FROM SCRATCH BASED ON CROWD-SOURCED USER TEXT INPUT | 2022-03-09 | 0 |
高效检索全球专利专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。
我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。
专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。