首页 / 专利库 / 视听技术与设备 / / 一种基于人工智能的综合客服系统

一种基于人工智能的综合客服系统

阅读:1097发布:2020-05-20

专利汇可以提供一种基于人工智能的综合客服系统专利检索,专利查询,专利分析的服务。并且本 发明 提供一种基于 人工智能 的综合客服系统,包括鉴权模 块 ,用于判断用户是否在预设名单内及用户等级;预处理模块,用于对语音 信号 进行噪声过滤、语音增强;特征提取模块,用于提取 特征向量 ;说话人识别模块,用于将用户声纹和库中登记的该号码对应的声纹进行比对,排除仿冒者; 语音识别 模块,用于将 语音信号 转换为文本;语义理解模块,用于对文本进行分析,理解用户需求。语音合成模块,用于将文本转换为语音。本发明可承担号码查询、电话接转、业务咨询、投诉建议、故障申告等作业,过滤无效来电,在无人值守情况下接听来电,减少来电排队等待,提升服务体验,节省人 力 成本,使得面对突发情况话务高峰时保证服务效率不打折扣。,下面是一种基于人工智能的综合客服系统专利的具体信息内容。

1.一种基于人工智能的综合客服系统,其特征在于,包括:
预处理模,用于对来电用户的语音信号进行噪声过滤及语音增强;
特征提取模块,用于从经过语音增强的语音信号中提取特征向量
语音识别模块,用于利用语音识别技术,基于提取的特征向量,将来电用户的语音信号转换为相应的文本;
语义理解模块,用于基于语义理解技术,对语音信号转换成的文本进行分析,理解来电用户的需求。
语音合成模块,用于将根据用户意图生成的答复文本转换为语音。
2.如权利要求1所述的基于人工智能的综合客服系统,其特征在于,所述系统还包括鉴权模块;
所述鉴权模块用于判断来电用户是否在预设名单内,并对来电用户的用户等级进行判断,根据来电用户的等级为其提供相应的服务。
3.如权利要求2所述的基于人工智能的综合客服系统,其特征在于,在所述系统中,下级用户可查询上一级用户的办公电话,不能越级查询,同级之间可查询所有电话,不在预设名单内和预设等级以上的来电直接转接人工台。
4.如权利要求1所述的基于人工智能的综合客服系统,其特征在于,所述系统还包括说话人识别模块;
所述说话人识别模块用于基于声纹识别技术,将来电用户的声纹和预设声纹库中登记的来电号码对应的声纹进行比对,确认来电用户的声纹和所述预设声纹库中来电号码对应的声纹是否一致,排除仿冒者。
5.如权利要求1所述的基于人工智能的综合客服系统,其特征在于,所述语义理解模块还用于同义词模糊匹配;
当来电用户查询区域性电话号码时,根据来电号码所属片区表自动识别来电号码所属片区,然后查询来电号码所属片区的服务类电话;
当用户查询的人在号码库中的姓名唯一时,直接报号码,当用户查询的人在号码库中的姓名不唯一时,系统继续进入问询单位环节;
当用户查询保障范围以外的用户或单位电话时,进行智能识别,不转人工台而是进入外单位总机电话表进行查询。
6.如权利要求1所述的基于人工智能的综合客服系统,其特征在于,所述系统还包括转人工模块;
所述转人工模块用于在无法识别用户语音、无用户语音或根据用户意图无法查询到结果时,自动将来电转接至人工台。
7.如权利要求1所述的基于人工智能的综合客服系统,其特征在于,所述语音识别模块中的声学模型采用深层神经网络算法进行训练。
8.如权利要求7所述的基于人工智能的综合客服系统,其特征在于,所述语音识别模块中的语言模型采用N-gram语言模型。
9.如权利要求1所述的基于人工智能的综合客服系统,其特征在于,所述语义理解模块采用分词及语义分析、槽文法来实现理解用户意图的目的;
实现过程包括:将语音识别得到的句子按自然语言习惯分解成一个个词语或词组;将分好的词按预设规则放入各个语义槽位中,从而实现用户意图理解。
10.如权利要求1所述的基于人工智能的综合客服系统,其特征在于,所述预处理模块包括前端处理单元和后端处理单元;
所述前端处理单元利用麦克阵列计算说话人的度和距离,实现对说话人声音的定向获取,从而将环境背景声音过滤;
所述后端处理单元通过训练含有噪声数据的过滤模型,滤除语音信号中的噪声,去除信道失真,提高系统的能

说明书全文

一种基于人工智能的综合客服系统

技术领域

[0001] 本发明涉及客服系统技术领域,特指一种基于人工智能的综合客服系统。

背景技术

[0002] 综合客服系统一般用于提供号码查询、电话接转、故障申告、业务咨询、投诉建议等服务,现有的综合客服系统一般采用的都是人工应答的方式;这种方式存在以下缺点:
[0003] 人工成本高,每一工位都需要一位专业的话务人员守护,以便及时响应呼叫者的呼叫,解答呼叫者的疑问,为呼叫者提供相应的服务;
[0004] 话务人员训练周期长,由于呼叫者来源复杂,反应的问题多种多样,为了满足不同呼叫者的不同需求,需要对话务人员进行大量的专业化业务培训才能上岗;
[0005] 反应时间长,人工应答需要一定的反应时间,而一旦遇到呼叫高峰期或话务人员不在岗的情况,更是会延长应答时间;
[0006] 可能存在报号错误的情况,在话务员疲劳状态下可能出现报号错误问题。

发明内容

[0007] 本发明要解决的技术问题是提供一种基于人工智能的综合客服系统,以解决现有的综合客服系统所存在的人工成本高、话务人员训练周期长、反应时间长,以及可能存在报号错误的情况的问题。
[0008] 为解决上述技术问题,本发明提供如下技术方案:
[0009] 一种基于人工智能的综合客服系统,所述系统包括:
[0010] 预处理模,用于对来电用户的语音信号进行噪声过滤及语音增强;
[0011] 特征提取模块,用于从经过语音增强的语音信号中提取特征向量
[0012] 语音识别模块,用于利用语音识别技术,基于提取的特征向量,将来电用户的语音信号转换为相应的文本;
[0013] 语义理解模块,用于基于语义理解技术,对语音信号转换成的文本进行分析,理解来电用户的需求。
[0014] 语音合成模块,用于将根据用户意图生成的答复文本转换为语音。
[0015] 进一步地,所述系统还包括鉴权模块;
[0016] 所述鉴权模块用于判断来电用户是否在预设名单内,并对来电用户的用户等级进行判断,根据来电用户的等级为其提供相应的服务。
[0017] 进一步地,在所述系统中,下级用户可查询上一级用户的办公电话,不能越级查询,同级之间可查询所有电话,不在预设名单内和预设等级以上的来电直接转接人工台。
[0018] 进一步地,所述系统还包括说话人识别模块;
[0019] 所述说话人识别模块用于基于声纹识别技术,将来电用户的声纹和预设声纹库中登记的来电号码对应的声纹进行比对,确认来电用户的声纹和所述预设声纹库中来电号码对应的声纹是否一致,排除仿冒者。
[0020] 进一步地,所述语义理解模块还用于同义词模糊匹配;
[0021] 当来电用户查询区域性电话号码时,根据来电号码所属片区表自动识别来电号码所属片区,然后查询来电号码所属片区的服务类电话;
[0022] 当用户查询的人在号码库中的姓名唯一时,直接报号码,当用户查询的人在号码库中的姓名不唯一时,系统继续进入问询单位环节;
[0023] 当用户查询保障范围以外的用户或单位电话时,进行智能识别,不转人工台而是进入外单位总机电话表进行查询。
[0024] 进一步地,所述系统还包括转人工模块;
[0025] 所述转人工模块用于在无法识别用户语音、无用户语音或根据用户意图无法查询到结果时,自动将来电转接至人工台。
[0026] 可选地,语音识别模块中的声学模型采用深层神经网络算法进行训练。
[0027] 可选地,所述语音识别模块中的语言模型采用N-gram语言模型。
[0028] 进一步地,所述语义理解模块采用分词及语义分析、槽文法来实现理解用户意图的目的;
[0029] 实现过程包括:将语音识别得到的句子按自然语言习惯分解成一个个词语或词组;将分好的词按预设规则放入各个语义槽位中,从而实现用户意图理解。
[0030] 进一步地,所述预处理模块包括前端处理单元和后端处理单元;
[0031] 所述前端处理单元利用麦克阵列计算说话人的度和距离,实现对说话人声音的定向获取,从而将环境背景声音过滤;
[0032] 所述后端处理单元通过训练含有噪声数据的过滤模型,滤除语音信号中的噪声,去除信道失真,提高系统的能
[0033] 本发明的上述技术方案的有益效果如下:
[0034] 1、价格低廉:据统计,智能机器人客服可以解决85%的常见客服问题,而本发明一个机器人坐席的花费只相当于一个人工坐席花费的1%;
[0035] 2、移植快:本发明可用电话线或2M线快速连接设备,设备可迅速接入电话网,训练的声学模型和语言模型可快速复制至新设备,无需重新训练;
[0036] 3、训练快:由于内容复杂,话务人员训练周期长,大约需6个月的训练周期,而本发明训练一套声学模型仅需2个星期,且能复制到多台机器上使用;
[0037] 4、反应快:本发明应答迅速,可有效提高应答率,保证时刻在线;
[0038] 5、识别准:本发明识别性能稳定,有效减少因话务员疲惫产生的错误;
[0039] 6、抗毁抗瘫:本发明训练的声学模型和语言模型可快速复制至新设备,可组成多套设备的多路由备用系统,抗毁抗瘫性强;
[0040] 7、保密性:本发明的系统和外界只有电话线连接,无网络连接,不易被病毒攻击;号码表属于绝密资料,通过机要途径发放。
附图说明
[0041] 图1为本发明的基于人工智能的综合客服系统的执行流程图

具体实施方式

[0042] 为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
[0043] 请参阅图1,本实施例提供一种基于人工智能的综合客服系统,其包括:
[0044] 鉴权模块,用于根据用户来电,首先判断来电用户是否在预设名单内,其次判断来电用户的等级,根据来电用户的等级为其提供相应的服务;其中,本实施例将用户的等级分为6级:陌生号码为0级,生活、家属、服务电话为1级,各值班室、科以下(含科级)、机房、要素为2级,处级领导为3级、局级领导为4级,局以上为5级;下级用户可查询上一级用户的办公电话,不能越级查询,同级之间可查询所有电话,0级和4级以上直接转接人工台。
[0045] 预处理模块,用于对来电用户的语音信号进行噪声过滤及语音增强;以解决环境噪声、回声、其他人声音干扰的影响;解决思路主要分前端和后端,前端处理单元可以利用麦克风阵列计算说话人的角度和距离,实现对说话人声音的定向获取,从而实现将环境背景声音过滤。后端处理单元可以通过训练含有噪声数据的过滤模型滤除语音信号中的噪声,去除信道失真,提高系统的能力。
[0046] 特征提取模块,用于经过噪声消除、去除信道失真等对语音信号进行增强,从语音信号中提取特征向量;
[0047] 说话人识别模块,用于基于声纹识别技术,将来电用户的声纹和预设声纹库中登记的来电号码对应的声纹进行比对,确认来电用户的声纹和所述预设声纹库中来电号码对应的声纹是否一致,排除仿冒者;
[0048] 语音识别模块,用于在来电用户的声纹和所述预设声纹库中来电号码对应的声纹一致时,利用语音识别技术,基于提取的特征向量,将来电用户的语音信号转换为相应的文本;其中,语音识别(Automatic Speech Recognition,ASR),就是让机器通过分析和理解过程把语音信号转变为相应的文本或命令的技术。一般包括训练声学模型、训练语言模型和解码三个步骤。
[0049] (1)声学模型把声学特征对应到音素,生成整个序列的声学模型打分。本系统采用最新的DNN(深层神经网络)算法训练声学模型,大大提高了识别准确率和抗噪性能。(2)语言模型计算一句话对应的词序列的可能性。本系统用的是N-gram语言模型,在上下文中,假设当前词的概率只与之前N-1个词有关,利用条件概率的连乘,得到整句的概率。(3)解码器模块根据声学模型、语言模型的信息,采用Viterbi动态规划找到对输入特征向量最可能的词序列。本系统中的语音识别模块在安静情况下准确率已经到97%以上。
[0050] 语义理解模块,用于基于语义理解技术,对语音信号转换成的文本进行分析,理解来电用户的需求。其中,语义理解又称自然语言理解,从输入的文字中分析出关键信息,即通过语法、语义、语用的分析,获取自然语言的语义表示。具体地,本实施例采用分词及语义分析、槽文法(从复杂文字中提取关键信息)来实现理解用户意图的目的。主要分为两步:(1)分词:将语音识别得到的句子按自然语言习惯分解成一个个词语或词组(2)获取提槽:
将分好的词按预先制定的规则放入各个语义槽位中,从而实现用户意图理解。
[0051] 进一步地,在本实施例中,语义理解模块对领域节点的语义理解结果为号码查询、电话接转、故障申告、业务咨询、投诉建议5个语义;意图节点有确认节点、重听节点,重听节点的语义理解分为“肯定”“否定”两个语义,确认节点的语义理解分为“肯定”“否定”两个语义;号码查询节点语义理解的结果分别为姓名、职务、一级单位、二级单位、三级单位、四级单位、电话类型7个槽位;电话接转节点语义理解的结果分别为姓名、职务、一级单位、二级单位、三级单位、四级单位、电话类型7个槽位。
[0052] 此外,为进一步完善本系统的功能,本实施例中的语义理解模块还包括如下特殊功能:
[0053] 同义词模糊匹配:由于一个单位在日常口语中有很多叫法,比如“信息产业部”常被人叫做“信息化部”或者“信产部”。因此为防止出现用户查询时说单位名称的缩略语,无法准确识别的问题,提供同义词模糊匹配功能;
[0054] 智能地址匹配:当来电用户查询服务电话、生活设施等区域性强的电话号码时,根据来电号码所属片区表自动识别出来电号码所属片区,然后查询来电号码所属片区的服务类电话。
[0055] 用户去重:当用户查询的人在号码库中的姓名唯一时,直接报号码,当用户查询的人在号码库中的姓名不唯一时,系统继续进入问询单位环节。
[0056] 智能总机查询:当用户查询保障范围以外的用户或单位电话时,进行智能识别,不转人工台而是进入外单位总机电话表进行查询。
[0057] 语音合成模块,用于将根据用户意图生成的答复文本转换为语音;转换过程为先将文字序列转换成音韵序列,再由系统根据音韵序列生成语音波形。本实施例中的语音合成模块对标准中文语音和英文语音的合成自然度≥4.3分。
[0058] 语音合成分为三步:(1)语言处理:模拟人对自然语言的理解过程--文本规整、词的切分、语法分析和语义分析,使计算机对输入的文本能完全理解,并给出后两部分所需要的各种发音提示。(2)韵律处理:为合成语音规划出音段特征,如音高、音长和音强等,使合成语音能正确表达语意,听起来更加自然。(3)声学处理:根据前两部分处理结果的要求输出语音,即合成语音。
[0059] 进一步地,本系统还包括转人工模块,用于在无法识别用户语音、无用户语音或根据用户意图无法查询到结果时,自动将来电转接至人工台。
[0060] 此外,需要说明的是,本实施例中的系统所使用的各种查询表如下:
[0061] 1、号码表:包含姓名、区域号,用户等级、级别、职务、一级单位名称、二级单位名称、三级单位名称、四级单位名称、办公号码、家里号码、手机、备注;
[0062] 2、别名表:包含所有有别名的单位名称及对应的别名;
[0063] 3、号码所属片区表;
[0064] 4、查无此人时转的电话表;
[0065] 5、查外单位时总机电话表。
[0066] 综上,本实施例的基于人工智能的综合客服系统将AI语音技术应用在综合客服的服务场景,通过先进的声纹识别、呼叫中心、语音识别、语音合成及自然语言理解等技术实现自助服务,分流人工压力,为综合客服自动化工作降本增效。作为自然语音交互辅助,不受时间、空间限制,通过自然语言文字,进行业务查询、号码查询、故障报修、技术咨询等自助服务,可通过内网查询,同时针对智能知识库未解决问题可平滑转接至人工进行解答或办理。从而提供了智能化语音交互自助查号系统、智能语音信息发布系统、智能知识库系统、智能语音输入系统等服务,解决了人工压力,提升了系统自主化、智能化平。
[0067] 此外,需要说明的是,本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
[0068] 本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0069] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0070] 还需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
[0071] 最后需说明的是,以上仅是本发明优选实施方式,应当指出,尽管已描述了本发明的优选实施例,对于本技术领域的普通技术人员来说,一旦得知了本发明的基本创造性概念,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明实施例范围的所有变更和修改
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈