首页 / 专利库 / 专利权 / 专利合作条约 / 第I章 / 国际申请 / 请求书 / 保护类型 / 专利 / 基于语义的交互系统及交互方法

基于语义的交互系统及交互方法

阅读:106发布:2020-10-11

专利汇可以提供基于语义的交互系统及交互方法专利检索,专利查询,专利分析的服务。并且本 专利 申请 公开了一种基于语义的交互系统及交互方法,通过定义规则化的语义参数模型,以实现让机器最大限度地读懂人类的语言表达,运用 规则引擎 、索引定义和模糊关联操作,降低数据维度提高机器处理效率,让计算机积极响应用户的同时理解用户语言,达到“真实的人类” 水 平,实现与计算机世界的沟通就像人类在现实生活中沟通一样。,下面是基于语义的交互系统及交互方法专利的具体信息内容。

1.基于语义的交互系统,其特征在于,包括:
规则引擎,用于将自然语言的语义规则定义为计算机可识别的规则对象,并将所述规则对象存储在规则映射库中;
智能分析模块,用于深层次的语言理解与推理,基于大数据分析和处理用户语言习惯及其关联关系,分析后与规则对象进行匹配,并实现自我修复与自我更新过程;
智能芯片化模块,用于消息组包、编码、解码、分发、接收、线性预测处理过程,实现语音压缩解压处理,并向用户提供个性化接口调用;
规则映射库,用于存储计算机可识别的规则对象。
2.根据权利要求1所述的基于语义的交互系统,其特征在于:还包括数据模型定义模块,所述数据模型定义模块定义N种不同的格式,用于将输入的自然语言数据转换成系统可认知的格式。
3.根据权利要求1所述的基于语义的交互系统,其特征在于:所述规则引擎模块包括分词模块、去冗模块、定标模块、定类模块和定参模块。
4.根据权利要求1所述的基于语义的交互系统,其特征在于:所述的智能分析模块包括回收模块、唯一匹配模块和优先匹配模块。
5.基于语义的交互方法,其特征在于:包括以下步骤:
1)将自然语言的语义规则定义为计算机可识别的规则对象,并将所述规则对象存储在规则映射库中;
2)对深层次的语言理解与推理,基于大数据分析和处理用户语言习惯及其关联关系,分析后与规则对象进行匹配,并同时进行情感识别
3)用于消息组包、编码、解码、分发、接收、线性预测处理过程,实现语音压缩解压处理,并向用户提供个性化接口调用。
6.根据权利要求5所述的基于语义的交互方法,其特征在于:在步骤1)之前,还包括定义N种不同的格式,将输入的自然语言数据转换成系统可认知的格式。
7.根据权利要求5所述的基于语义的交互方法,其特征在于:步骤1)中,将自然语言的语义规则定义为计算机可识别的规则对象的方式是:分别对自然语言进行分词处理、去冗处理、定标处理、定类处理和定参处理。
8.根据权利要求5所述的基于语义的交互方法,其特征在于:所述的匹配包括:若识别出用户说的自然语言是无意义的,则对该自然语言数据进行回收,若识别出用户说的自然语言是有唯一匹配信息的,则给出该唯一匹配信息;若识别出用户说的自然语言是有相似匹配信息的,则优先给出该相似匹配信息。
9.根据权利要求5所述的基于语义的交互方法,其特征在于:在步骤2)中,还包括通过自主学习提取规则库中新增的规则对象,以完善词库的步骤。
10.根据权利要求1或5所述的基于语义的交互系统,其特征在于:所述的规则对象采用结构化参数模型,所述的结构化参数模型包括意图、区域、信息点、类别和规划方式,参数可任意组合。

说明书全文

基于语义的交互系统及交互方法

技术领域

[0001] 本发明涉及人机交互技术领域,尤其涉及一种基于语义的交互系统及交互方法。

背景技术

[0002] 人机交互技术(Human-Computer Interaction Techniques)是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。它包括机器通过输出或显示设备给人提供大量有关信息及提示请示等,人通过输入设备给机器输入有关信息及提示请示,回答问题等。语音识别技术是人机交互中的一种。现有的语音识别技术,往往存在以下问题:1.由于未采用结构化的规则对象,因此语音识别精度低,可靠性差;2.自然语言未经降维处理,在空间向量模型中,一个词就是一个维度,文本分类、聚类的挖掘计算中,高维度向量间相似度计算会消耗大量计算机资源造成维度灾难;3.无法实现对用户的自然语言进行地域化、方言及说话习惯的匹配分析;4.在使用过程中,无法通过自主学习来丰富和完善词库。

发明内容

[0003] 本发明的目的之一是提供一种基于语义的交互系统,以提高系统语音识别精度和可靠性,同时实现系统词库的修复与更新功能。
[0004] 本方案中的基于语义的交互系统,包括规则引擎,用于将自然语言的语义规则定义为计算机可识别的规则对象,并将所述规则对象存储在规则映射库中。
[0005] 智能分析模块,用于深层次的语言理解与推理,基于大数据分析和处理用户语言习惯及其关联关系,分析后与规则对象进行匹配,并实现自我修复与自我更新过程。
[0006] 智能芯片化模块,用于消息组包、编码、解码、分发、接收、线性预测处理过程,实现语音压缩解压处理,并向用户提供个性化接口调用;规则映射库,用于存储计算机可识别的规则对象。
[0007] 本发明的有益效果如下:1.设置了规则引擎模块,通过规则引擎模块将自然语言的语义规则定义为计算机可识别的规则对象,由于采用了计算机可识别的结构化的规则对象,因此可提高语音识别的精度和可靠性。
[0008] 2. 将所述规则对象存储在规则映射库中,可在用户使用过程中提取有效信息并加入词库,进而为系统通过自主学习丰富和完善词库提供可能。
[0009] 3.本发明所述的深层次的语言理解与推理,是指声音情绪识别,例如,同样一句话,不用的语气,可能匹配的结果会有差别;声音特征识别,例如声音比较尖,那么系统可推断该用户可能是女性。
[0010] 本发明所述的用户语言习惯及其关联关系,即分析地域化、方言及用户的说话习惯。不同的区域有不同的方言习惯,不同的车主也有不同的说话习惯,例如,A用户说出“我饿了”,可能系统第一次交互的时候并不能识别,系统询问A用户说的是不是“美食”之类的,此时A用户改说“美食”,系统识别出,下一次A用户表示“饿了”的时候就可直接说“美食”,那么系统就可以知道A用户表达的是“饿了”。
[0011] 通过智能分析模块,可分析地域化、方言、用户习惯,实现规则对象与系统大数据(包括地域化的、方言以及用户习惯用语)的匹配,扩大了自然语言的分析范围,适用性更广,并可同时实现系统词库的修复和更新。
[0012] 本发明所说的系统词库的修复和更新,是指通过用户的不断输入来判断词汇的准确和有效性。例如,用户第一次使用关键字A没有找到相关的内容,那么系统会自动将该关键字A添加至词库中;如果用户换了关键字B去搜索,那么可以判定该关键字A与关键字B可能存在关联关系,于是可以把这种关系暂时更新至词库中,待以后还有同样的用户说出此关键字时,可确定该关键字是有效的。
[0013] 4.通过智能芯片化模块,用于消息组包、编码、解码、分发、接收、线性预测处理过程,实现语音压缩解压功能,其在保证通信安全的同时,缩短人机交互的响应速度,并向用户提供个性化接口调用实现用户对所需要的信息的调用功能。
[0014] 本发明所说的线性预测处理过程为现有技术,预测是根据离散信号之间存在的一定关联性的特点,利用前面一个或多个信号预测下一个信号,然后对实际值和预测值得差(预测误差)进行编码。如果预测较准确,则误差很小。在同等精度要求的条件下,就可用较少的比特进行编码,达到压缩数据的目的。
[0015] 进一步,还包括数据模型定义模块,所述数据模型定义模块定义N种不同的格式,用于将输入的自然语言数据转换成系统可认知的格式。定义N种不同的格式的意义在于基本满足所有的数据交换。
[0016] 进一步,所述规则引擎模块包括分词模块、去冗模块、定标模块、定类模块和定参模块。 通过上述模块,可分别对自然语言进行分词处理、去冗处理、定标处理、定类处理和定参处理,这样经过分词和去冗后,高维表示投影在低维的潜在语义空间中,缩小了问题的规模,在降低特征空间维度的同时,能够挖掘词语间的语义信息,提高降维后特征集合的质量,提升文本表示质量。
[0017] 进一步,所述的智能分析模块包括回收模块、唯一匹配模块和优先匹配模块。所述的回收模块用于回收无意义的语音,所述的唯一匹配模块用于与规则对象进行唯一的匹配;所述的优先匹配模块用于将系统中与规则对象相似的信息优先与规则对象进行匹配。
[0018] 本发明的另一目的是提供一种基于语义的交互方法,包括以下步骤:1)将自然语言的语义规则定义为计算机可识别的规则对象,并将所述规则对象存储在规则映射库中;
2)对深层次的语言理解与推理,基于大数据分析和处理用户语言习惯及其关联关系,分析后与规则对象进行匹配,并同时进行情感识别
3)用于消息组包、编码、解码、分发、接收、线性预测处理过程,并实现语音压缩解压功能,其在保证通信安全的同时,缩短人机交互的响应速度,并向用户提供个性化接口调用。
[0019] 通过上述交互方法,由于将自然语言的语义规则定义为计算机可识别的规则对象,因此可提高语音识别的精度和可靠性。
[0020] 将所述规则对象存储在规则映射库中,可在用户使用过程中提取有效信息并加入词库,进而为系统通过自主学习丰富和完善词库提供可能。
[0021] 通过步骤2),可实现系统信息数据与规则对象的精准匹配,并可同时实现对用于语音的情感识别,如识别是陈述、反问、疑问、与事实相反还是肯定语气,从而实现在不同的场合与语境下输出不同的信息数据。
[0022] 进一步,在步骤1)之前,还包括定义N种不同的格式,将输入的自然语言数据转换成系统可认知的格式,以基本满足所有的数据交换。
[0023] 进一步,步骤1)中,将自然语言的语义规则定义为计算机可识别的规则对象的方式是:分别对自然语言进行分词处理、去冗处理、定标处理、定类处理和定参处理。经过分词和去冗后,高维表示投影在低维的潜在语义空间中,缩小了问题的规模,在降低特征空间维度的同时,能够挖掘词语间的语义信息,提高降维后特征集合的质量,提升文本表示质量。
[0024] 进一步,所述的匹配包括:若识别出用户说的自然语言是无意义的,则对该自然语言数据进行回收,若识别出用户说的自然语言是有唯一匹配信息的,则给出该唯一匹配信息;若识别出用户说的自然语言是有相似匹配信息的,则优先给出该相似匹配信息。上述匹配过程,若识别出用户说的自然语言是有相似匹配信息的,则优先给出该相似匹配信息,这种模糊匹配的方式,有助于提高语音识别的匹配效率。
[0025] 进一步,在步骤2)中,还包括通过自主学习提取规则库中新增的规则对象,以完善词库的步骤。可实现系统词库的自主更新。
[0026] 进一步,所述的规则对象采用结构化参数模型,所述的结构化参数模型包括意图、区域、信息点、类别和规划方式,参数可任意组合。采用结构化参数模型,参数可任意组合,即可以任意颠倒说话次序、加长、缩短参数结构,可以避免大量空聚类和增加稳定性,即使用户颠倒说话,系统仍然可以读懂,所以不会返回很多空聚类,不会让用户觉得系统不好用,说什么都识别不了。附图说明
[0027]图1为本发明实施例基于语义的交互系统的基础模块框图
[0028] 图2为本发明实施例基于语义的交互系统的规则引擎模块及智能分析模块中的匹配示意图。
[0029] 图3为本发明实施例基于语义的交互系统中规则引擎模块分词示意图。图中的竖线表述对各个词汇进行分割。
[0030] 图4为本发明实施例基于语义的交互系统中规则引擎模块去冗流程图
[0031] 图5为本发明实施例基于语义的交互系统中规则引擎模块去冗示意图。图中方框表述去冗后保留的词汇。
[0032] 图6为本发明实施例基于语义的交互系统中规则引擎模块定标示意图。
[0033] 图7为本发明实施例基于语义的交互系统中规则引擎模块定类示意图。
[0034] 图8为本发明实施例基于语义的交互系统中规则引擎模块定参示意图。
[0035] 图9为本发明实施例基于语义的交互系统中规则引擎模块类别别名映射示意图。

具体实施方式

[0036] 下面通过具体实施方式对本发明作进一步详细的说明:一、基础模块,如图1所示。
[0037] 用户所说的自然语言经由输入设备输入,通过规则引擎模块,将自然语言的语义规则定义为计算机可识别的规则对象,并将所述规则对象存储在规则映射库中。然后再通过智能分析模块进行匹配,本实施例的智能分析模块包括方言库、特征库、结构化参数库,匹配的结果有三种:若识别出用户说的自然语言是无意义的,则对该自然语言数据进行回收,若识别出用户说的自然语言是有唯一匹配信息的,则给出该唯一匹配信息;若识别出用户说的自然语言是有相似匹配信息的,则优先给出该相似匹配信息。通过智能芯片化模块,本实施例的智能芯片化模块可以是DSP,给出唯一匹配信息或相似匹配信息后,传送控制指令,系统向用户推送相关信息数据。若当智能分析模块未分析出具体含义时,也可询问用户。
[0038] 二、规则引擎模块及智能分析模块中的匹配如图2所示。
[0039] 本实施例的规则引擎模块包括对自然语言进行的分词处理、去冗处理、定标处理、定类处理和定参处理。
[0040] 三、规则引擎模块中的分词如图3所示。本实施例所谓的分词是指将用户输入的语句的词汇进行分块分割。
[0041] 四、规则引擎模块中的去冗流程如图4所示。本实施例所说的去冗是指去掉用户输入的语句中非关键性的词汇。
[0042] 五、规则引擎模块中的去冗举例如图5所示。
[0043] 六、规则引擎模块中的定标如图6所示。本实施例所说的定标是指确定用户所说的对象。
[0044] 六、规则引擎模块中的定类如图7所示。本实施例所说的定类是指确定用户所说的对象的类别。
[0045] 七、规则引擎模块中的定参如图8所示。本实施例所述的定参是指确定是用户所说的对象的哪个参数。
[0046] 在本发明的一些实施例中,所述规则对象采用结构化参数模型。下面进行进一步详细的说明:结构化参数模型定义
用户语音输入的结构化参数:
<意图> + <区域> + <信息点> + <类别> + <规划方式>
输入参数可以任意组合。
[0047] 交互处理:主动信息源、交互处理过程、分享交互接口。
[0048] <意图>我要去(默认)+查找/设置导航目的地
以查找或设置导航目的地为例,针对用户输入的语音信息分析并结构化数据响应用户请求,包含但不仅限于以下内容:
道路定位——主辅、高低
规划方式——近、快、高速、收费
顺路——查找/设置导航中途点
路线管理——路线查看、模拟、删除
分享与车队——建队、加入、退出、撤队、踢人、头车、跟车、目的地设置/取得、好友、分享
通信处理——电话、短信、微信
历史行程——历史轨迹
车况与传感——卫星定位与OBD
信息查询——天气、路况
设置与管理——参数与用户数据
<区域>
省 —— 行政区划名称
市 —— 行政区划名称、电话区号编码
区 —— 行政区划名称、区域邮政编码
街道 —— 行政区划名称、区域邮政编码
支持别名
如:内蒙古->内蒙、天河区->天河
语言习惯的称谓,如:原来的市变成区的,原来的区变成市的
支持组合,如:潮汕地区
列表导入
<信息点>

明确的道路门牌编号
模糊的门牌定位算法:门牌奇偶序列、前后接近、算法定位
名称
信息点名称关键字、道路名称关键字、别名关键字
电话
固定电话号码、特殊服务号码(如:距离最近的120/110/119)
路口
两条道路名称关键字
道路 + 方向
具体的道路名称 + 方向信息(如:三环外)
交通站点
具体的公共交通站点名称(例如:公主坟地、地铁石牌桥)
交通站点 + 标识
具体的公共交通站点名称 + 站点属性标识 (例如:公主坟站C出口)
信息点+方向
主要支持模糊类的定位,具体的信息点名称 + 方向信息 (如:天河城北、天河城北门)自定义
取得用户已经定义保存的地点(如:家、公司、理发、朋友的名字)
<类别>
采用大类和小类两级分类结构
大类,灵活。
[0049] 大类种类可以根据引擎未识别的用户语句数据进行挖掘分析,从中抽析出新的类别名称,智能的将原来无法解析的语句进行归属分类。
[0050] 引擎可以根据用户使用的小类的热度、频度进行分析挖掘,将小类从新划分为大类,并同时抽析出更具备用户使用习惯的小类。
[0051] 小类,可扩展。
[0052] 引擎可以对用户对大类直接进行检索的语句数据进行分析挖掘,抽析出新的小类类别,减少用户交互次数,提高地图引擎对信息检索的准确度。
[0053] 类别名称的定义符合用户在车上的语言习惯。
[0054] 类别名称可以与地图/导航引擎现有分类进行映射。
[0055] 类别名称支持组合与交叉组合。
[0056] 类别名称支持别名。
[0057] 类别名称支持导入。
[0058] 类别的别名定义用户语音输入是口语化的,我们需要将口语化的词汇映射到具体一级类目或二级类目中。如图9所示。例如:
例一:语音输入“到太古汇吃饭”,关键词“吃饭”映射到餐饮,引擎应能罗列太古汇附件的餐饮店面列表。
[0059] 例二:语音输入“到天河区K歌”,关键词“K歌”映射到KTV,引擎应能罗列出天河区的KTV。
[0060] 例三:语音输入“住酒店”,因为没有区域信息,则罗列出附近的酒店住宿列表。
[0061] 本实施例的基于语义的交互方法,包括如下步骤:定义N种不同的格式,将输入的自然语言数据转换成系统可认知的格式。
[0062] 分别对自然语言进行分词处理、去冗处理、定标处理、定类处理和定参处理,将自然语言的语义规则定义为计算机可识别的规则对象,并将所述规则对象存储在规则映射库中;对深层次的语言理解与推理,基于大数据分析和处理用户语言习惯及其关联关系,分析后与规则对象进行匹配,并同时进行情感识别,通过自主学习提取规则库中新增的规则对象,以完善词库的步骤;
用于消息组包、编码、解码、分发、接收、线性预测处理过程,并实现语音压缩解压功能,其在保证通信安全的同时,缩短人机交互的响应速度,并向用户提供个性化接口调用。
[0063] 以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述,所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识,能够获知该领域中所有的现有技术,并且具有应用该日期之前常规实验手段的能,所属领域普通技术人员可以在本申请给出的启示下,结合自身能力完善并实施本方案,一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。
相关专利内容
标题 发布/更新时间 阅读量
一种专利评估系统 2020-05-12 668
一种专利检索时智能推荐专利的方法 2020-05-11 441
专利检索系统 2020-05-11 62
专利检索方法 2020-05-11 288
专利申请平台 2020-05-11 233
专利数据分析系统 2020-05-12 751
一种专利分类方法 2020-05-12 292
专利技术分布分析方法 2020-05-13 183
一种专利费用管理系统 2020-05-13 362
一种专利文献下载系统 2020-05-13 299
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈