首页 / 专利库 / 资料储存系统 / 信息时代 / 一种基于语音交互的老年人个人信息助理系统

一种基于语音交互的老年人个人信息助理系统

阅读:371发布:2020-05-13

专利汇可以提供一种基于语音交互的老年人个人信息助理系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种基于语音交互的老年人个人信息助理系统,针对老年人抱怨 电子 产品和网络服务“太远、太冷”的抱怨,聚焦看病和出行两个具体问题,系统通过智能音箱与老人进行自然交互,通过调用网络上的 语音识别 接口 ,把输入的语音转成文本;然后再通过调用第三方的 自然语言处理 接口,分析输入文本,理解老人的意图;通过查找我们预先设置好的看病和出行等意图和动作 知识库 ,找到对应老人意图的动作,并执行相关的第三方服务;若库中没有预设的动作,系统支持动作组装,通过拼合试图最大限度的为老人提供解决方案。本发明能够帮助老年人适应信息化时代,方便、简单的使用电子产品和网络服务,方便生活,提高 生活 质量 ,解决自己的个性化需求。,下面是一种基于语音交互的老年人个人信息助理系统专利的具体信息内容。

1.一种基于语音交互的老年人个人信息助理系统,其特征在于,包括输入输出模、智能问答模块以及服务组合拼装模块;其中:
所述输入输出模块集成了语音识别和语音合成功能;
所述智能问答模块包括意图库、自然语言理解、对话状态跟踪、对话策略以及对话响应五部分功能;
所述服务组合拼装模块负责服务执行、服务依赖关系生成和服务动态拼装;
服务依赖关系生成即根据服务的输入、输出参数生成服务依赖关系图;
服务动态拼装即当已知特定输入而求特定输出时,通过遍历服务依赖关系图以实现服务的拼装。
2.根据权利要求1所述的老年人个人信息助理系统,其特征在于:所述老年人个人信息助理系统依赖于硬件——智能音箱,该音箱实现语音的输入和输出。
3.根据权利要求1所述的老年人个人信息助理系统,其特征在于:所述语音识别、语音合成以及自然语言理解功能依赖第三方开放服务。
4.根据权利要求1所述的老年人个人信息助理系统,其特征在于:所述服务依赖关系图中的服务依赖关系包括前序关系、后序关系、相伴关系、接口输入关系。
5.根据权利要求4所述的老年人个人信息助理系统,其特征在于:所述前序关系指一个服务的执行是另外一个服务执行的先决条件,所述后续关系指一个服务的执行是另外一个服务执行后的必然执行,所述相伴关系指一个服务的执行和另外一个服务的执行同时发生,所述接口输入关系指一个服务的输入需要另外一个服务的输出。
6.根据权利要求1所述的老年人个人信息助理系统,其特征在于:所述服务组合拼装模块在实现服务动态拼装过程中,通过图遍历,然后判断输入和输出条件的满足,以快速确定组合的服务集合。
7.根据权利要求1所述的老年人个人信息助理系统,其特征在于:所述服务组合拼装模块所涉及到的如看病、出行等服务,需要第三方机构支持并提供开放服务接口。
8.根据权利要求1所述的老年人个人信息助理系统,其特征在于:所述老年人个人信息助理系统实现了面向老年人基于语音的自然交互以及服务的执行,不仅可以查询服务库中的单个服务而且可以实现服务的拼装,最大限度的满足用户需求,提高用户体验。

说明书全文

一种基于语音交互的老年人个人信息助理系统

技术领域

[0001] 本发明属于软件工程技术领域,具体涉及一种基于语音交互的老年人个人信息助理系统。

背景技术

[0002] 老龄化是中国面对的巨大挑战,2017年,全国人口中60周岁及以上人口24090万人,占总人口的17.3%,其中65周岁及以上人口15831万人,占总人口的11.4%。预计到2025年,六十岁以上人口将达到3亿,成为超老年型国家;到2040我国人口老龄化进程达到顶峰。对大多数老年人来讲,由于人机交互方式的不便,如何使用电子产品满足自己的需求还存在很大困难,如很多老年人不会用手机挂号、打车、购物、聊天等网络服务。语音是一种自然的交互方式,近年来语音识别准确率大幅提升,使得这一技术在多个领域得到应用。
[0003] 现代社会信息化程度的普及,越来越多的信息化科技为老年人的生活带来了很大的困惑,如自动取款机、智能电视、互联网、手机支付等。
[0004] 中国互联网协会发布的第33期报告中我们可以看到,截至2013年12月,我国高龄网民由2012年的1.8%略微提升至1.9%,但老年群体在整个网民中所占份额仍然最少,老年人群体与现代社会信息生活距离很远。
[0005] 在现有有关老年人的产品中有关老年人的身体健康方面的居多,但是有关老年人精神、心理健康方面的技术及产品则很少,即使有也做得相当简单,大部分的老年人网站内容都倾向于简单重复,比如百度搜索的专老年人搜索,虽然整个页面的字体放大,导航也有一定的针对性,但搜索结果仍然只是网址链接,对大部分老年人来说,这种举措并不能带来太大的改变。鉴于信息化科技已经是生活不可分割的一部分,而老年人在使用相应设备进入互联网生活时会遇到很多障碍,虽然老年人可以向子女求助,但子女也不可能随时有空而且也不可能解决所有问题;所以,开发一款专门针对老年人在这方面需求的智能服务系统是很有必要的。
[0006] 随着互联网技术和现代移动通信技术发展进步,越来越多的互联网和移动应用都会运用到计算技术,云计算通过整合互联网资源使用户能通过相对简单的设备利用海量的互联网资源并提高设备计算。目前由于3G和4G技术以及WiFi网络的普及,移动网络的传输率也有所增加,可以通过移动云服务和移动Web服务之间的融合促进创造更多复杂和丰富的应用程序。
[0007] 老龄化是我国乃至世界各国面临的重大社会问题,信息化和网络化为老年人提高生活质量提供了一个良好契机。因此,面向老人就医和出行两个场景,通过语音这一自然交互方式,建立人机交互的界面,为老年人提供进入网络和信息世界的便捷入口,帮助老年人适应信息化时代,方便、简单的使用电子产品和网络服务,方便生活,提高生活质量,解决自己的个性化需求。

发明内容

[0008] 针对老年人使用手机等电子产品不方便的问题,聚焦看病和出行两个具体问题,本发明提供了一种基于语音交互的老年人个人信息助理系统,该系统通过智能音箱与老人进行自然交互,通过调用网络上的语音识别接口把输入的语音转成文本,然后再通过第三方的自然语言处理接口分析文本,理解老人的意图,通过查找预先设置好的意图和动作知识库,找到对应老人意图的动作并执行相关的第三方服务,从而为老年人提供一种方便、简单的使用电子产品和网络服务的手段。
[0009] 一种基于语音交互的老年人个人信息助理系统,包括输入输出模、智能问答模块以及服务组合拼装模块;其中:
[0010] 所述输入输出模块集成了语音识别和语音合成功能;
[0011] 所述智能问答模块包括意图库、自然语言理解、对话状态跟踪、对话策略以及对话响应五部分功能;
[0012] 所述服务组合拼装模块负责服务执行、服务依赖关系生成和服务动态拼装;
[0013] 服务依赖关系生成即根据服务的输入、输出参数生成服务依赖关系图;
[0014] 服务动态拼装即当已知特定输入而求特定输出时,通过遍历服务依赖关系图以实现服务的拼装。
[0015] 进一步地,所述老年人个人信息助理系统依赖于硬件——智能音箱,该音箱实现语音的输入和输出。
[0016] 进一步地,所述语音识别、语音合成以及自然语言理解功能依赖第三方开放服务。
[0017] 进一步地,所述服务依赖关系图中的服务依赖关系包括前序关系、后序关系、相伴关系、接口输入关系。
[0018] 所述前序关系指一个服务的执行是另外一个服务执行的先决条件。
[0019] 所述后续关系指一个服务的执行是另外一个服务执行后的必然执行。
[0020] 所述相伴关系指一个服务的执行和另外一个服务的执行同时发生。
[0021] 所述接口输入关系指一个服务的输入需要另外一个服务的输出。
[0022] 进一步地,所述服务组合拼装模块在实现服务动态拼装过程中,通过图遍历,然后判断输入和输出条件的满足,以快速确定组合的服务集合。
[0023] 进一步地,所述服务组合拼装模块所涉及到的如看病、出行等服务,需要第三方机构支持并提供开放服务接口。
[0024] 进一步地,所述老年人个人信息助理系统实现了面向老年人基于语音的自然交互以及服务的执行,不仅可以查询服务库中的单个服务而且可以实现服务的拼装,最大限度的满足用户需求,提高用户体验。
[0025] 与现有技术相比,本发明系统具有以下有益技术效果:
[0026] 1.本发明基于语音交互的老年人信息助理系统,该系统通过智能音箱与老人进行自然交互,通过调用网络上的语音识别接口,把输入的语音转成文本;然后再通过调用第三方的自然语言处理接口,通过建立语料库,分析输入文本,理解老人的意图,为我国老人提供进入网络和信息世界的便捷入口,从而帮助老年人适应信息化时代,方便、简单的使用电子产品和网络服务,提高生活质量,解决自己的个性化需求,为解决老人认为电子产品和网络产品“很远、很冷”提供解决方案。
[0027] 2.本发明基于依赖关系和动作拼装的老年人复杂服务需求自动生成技术,不仅可以像现有技术,直接查找预先设置好的看病和出行等意图和服务知识库,找到对应老人意图的动作,并执行相关的第三方服务;同时若库中没有预设的服务或动作,系统支持基于库中的服务和动作,基于相关的前序、后序、相伴、接口等依赖关系,采用动作快速组装算法,通过拼合试图最大限度的为老人提供解决方案。
[0028] 3.本发明面向老人出行和看病这一特定领域应用的智慧信息助理,相对国内外现有的通用智能音箱、个人信息助理系统,创新在于本发明聚焦看病和出行两个具体问题,这使得我们对于看病和出行两个特定问题的答案更加精准;相比苹果Siri、天猫精灵、百度小度、小米小爱,这些产品均不能给出相应的用户满意答案,本发明系统则可以。附图说明
[0029] 图1为本发明老年人个人信息助理系统的总体架构示意图。
[0030] 图2为本发明智能对话模块的实现框架示意图。
[0031] 图3为本发明服务拼装模块的实现框架示意图。
[0032] 图4为本发明服务依赖生成算法示意图。
[0033] 图5为本发明服务动态拼装算法示意图。

具体实施方式

[0034] 为了更为具体地描述本发明,下面结合附图及具体实施方式对本发明的技术方案进行详细说明。
[0035] 如图1所示,本发明基于语音交互的老年人个人信息助理系统,包括三个模块:
[0036] 语音识别和语音合成组成的输入输出模块,主要完成对用户的语音输入转文字输入给智能问答模块,以及将系统处理后的机器人反馈由文字转为语音,这一部分利用智能音箱硬件的能力实现。
[0037] 智能问答模块,对用户的文本输入进行语义理解,首先根据意图库进行领域分类,在对应的领域中进行自然语言理解,识别意图并填充对应的词槽,根据对话策略和对话状态选择对话动作,并调用服务组合模块,生成对话响应;意图库定义了系统的能力和理解力,需要用语料库来训练,也可以用户来设计定义。
[0038] 问题求解和服务拼装模块,这是系统的后台能力库,首先依赖生成引擎可以通过服务的接口表和效果表获取服务间的执行依赖关系表;在老人调用服务时,服务组合引擎可以通过从对话模块获取的输入、期望输出、期望效果动态地组合服务库中的服务,完成服务流程后调用相应服务,并根据结果进行反馈。
[0039] 智能问答模块的实现框架如图2所示,具体如下:
[0040] (1)意图库。
[0041] 意图库是预先根据我们系统的应用场景设计好的,按照不同的应用领域进行划分,例如老人看病领域,其中包含的意图有预约挂号、查询科室信息、查询医生排班信息等,出行规划领域,其中包含的意图有预约打车、规划路线等。在将用户的语音输入转为文本后,我们首先需要明确用户输入的文本所属的领域,然后再根据领域类别,确定更细粒度的意图。
[0042] (2)自然语言理解。
[0043] 在自然语言理解时,需要对输入进行两种类型的表示:一种是句子级别的意图分类,第二种是词级别的信息抽取,例如命名实体识别和表示用户语义的关键词(语义槽)的填充。给定一句文本输入“帮我预约同仁医院的眼科”,自然语言理解确定该输入的意图为“预约挂号”,并将其映射到语义槽中,其中“同仁医院”是<医院>语义槽的槽值,“眼科”是<科室>语义槽的槽值,这些槽也是根据意图库中不同领域场景预设而成的。
[0044] 意图一般以“动词+名词”命名,如查询天气、预约挂号等,意图识别用来检测用户意图,又称意图分类,即根据用户话语所涉及到的领域和意图将其分类到先前定义好的意图类别中。上述过程比较复杂,好在有现成的网络服务可以利用,我们也利用现有网络服务解决这一问题。
[0045] (3)对话状态追踪。
[0046] 跟踪对话状态是确保对话系统健壮性的核心组成部分,它负责维护和更新对话状态;对话状态是一种机器能够处理的数据数据表征,包含所有可能会影响到接下来的决策的信息,如NLU模块的输出、用户的特征等。具体地,对话状态St是一种将到t时刻为止的对话历史简化为可供系统选择下一时刻动作信息的数据结构,对话状态追踪的主流方法包括人工规则、生成式模型、判别式模型,我们实现采用最简单的人工规则方式。
[0047] (4)对话策略。
[0048] 该模块的主要功能是根据前面的对话状态决策采取的最优动作(如:提供结果,询问特定限制条件,澄清或确认需求等),从而最有效的辅助用户完成信息或服务获取的任务,该模块基于用户输入的语义表达和当前对话状态输出下一步的行为。例如,用户输入“帮我叫一辆车去同仁医院”,此时对话状态包括NLU模块的输出、用户的位置、历史行为等特征,在这个状态下,系统接下来的动作可能有几种:1.向用户询问起点,如“请问从哪里出发”;2.向用户确认起点,如“请问从家出发吗”;3.直接为用户叫车,“上为你叫车从家去同仁医院”。
[0049] (5)对话响应。
[0050] 该模块负责两方面一是将对话策略中选择出来的动作生成自然语言并反馈给下一模块(语音合成或服务组合模块),二是更新会话状态。当所选的动作不需要再进行问题求解,例如上述例子中的1向用户询问起点,如“请问从哪里出发”;2向用户确认起点,如“请问从家出发吗”,直接生成自然语言并由语音合成模块生成语音反馈给用户;如果所选的动作需要进行服务调用,如“马上为你叫车从家去同仁医院”,此时需要进入服务模块,选择对应的服务,为用户生成解决方案。
[0051] 服务执行与拼装部分是问题求解中的任务执行部分,它根据用户意图对系统服务库中的服务进行挑选和组合,实现框架如图3所示,具体步骤如下。
[0052] (1)意图理解;对于意图,我们会建立相关对应的动作(Action)或服务,这些服务可以是单独的服务如天气查询、是否有号源等简单服务,也可以是预设的经过组合或者拼装的服务,如挂号,包括号源查询、输入信息、挂号、反馈结果等一系列服务。
[0053] (2)当简单服务和拼装好的服务都无法满足用户需求,系统需要从服务库中动态寻求拼装服务,以满足用户意图需求。我们提出一种基于执行依赖关系的服务组合方法,该方法使用关系型数据库来储存存储服务的信息,并以此生成服务执行依赖关系,可以根据用户的请求快速灵活地确定服务组合路径。
[0054] (3)执行依赖关系考虑的是服务接口(输入和输出)和能力(前提条件和效果);在该方法中,首先将根据服务的接口和能力生成服务的依赖关系,填入WSRelation表中,然后再根据用户的需求(包括输入、输出和功能需求),从WSRelation表中获取动态组合服务的方式,设计的数据库为表结构为:Service(WSname,Input,Output,Precondition,Effect),Input(i_id,pid,ws_id),Output(o.id,pid,ws_id),Precondition(pr_id,pid,tid,ws_id),Effect(e_id,pid,tid_s,tid_e,ws_id),Para(pid,pname,cid),Class(cid,cname),Relation(rid,rname),Axiom(aid,cid_1,cid_2,rid),State(tid,tname),ClassState(cs_id,cid,sid),StateTrans(sp_id,tid_1,tid_2),WSRelation(as_s,as_e)。
[0055] (4)生成依赖关系方法,目标是根据服务的输入、输出参数,生成服务依赖关系图,如图4所示,实现步骤如下:
[0056] ①通过服务接口获取服务执行依赖关系,将Output和Input两个表连接起来获取新的临时表IO,然后判断IO中的数据以获取匹配的服务对,插入WSRelation中;
[0057] ②通过服务的前提条件和结果来获取依赖关系,连接Effect和Precondition两个表获取临时表;
[0058] ③遍历表中的数据获取匹配的服务对,插入WSRelation中;
[0059] ④依赖关系按照类型可以分为前序关系、后序关系、相伴关系、接口输入等,这些关系可以自动获取,也可以手工指定。前序关系指一个服务的执行是另外一个服务执行的先决条件;后续关系指一个服务的执行是另外一个服务执行后的必然执行;相伴关系,指一个服务的执行和另外一个服务的执行同时发生;接口输入关系,指一个服务的输入需要另外一个服务的输出。
[0060] (5)服务动态拼装的算法;生成依赖关系方法可以把关联的服务连成一个服务网络图,当已知特定输入,而求特定输出时,可以通过遍历这张图来实现服务的拼装,如图5所示,实现步骤如下:
[0061] ①用用户的输入和输入查询,查询WSRelation表格,得到一条路径,若没有路径,程序终止;
[0062] ②扫描路径的输入参数;
[0063] ③扫描路径的输出参数;
[0064] ④判断用户的输出参数是否全部包含于该路径的输出参数内;
[0065] ⑤若不在其中,返回①;
[0066] ⑥检查输入参数是否可以可以完全触发该路径上的所有服务;
[0067] ⑦若可以触发所有服务,则该路径是可选服务拼装;若不可以,则返回①。
[0068] 上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改,并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此,本发明不限于上述实施例,本领域技术人员根据本发明的揭示,对于本发明做出的改进和修改都应该在本发明的保护范围之内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈