首页 / 专利库 / 人工智能 / 对话分析 / 一种智能对话系统

一种智能对话系统

阅读:63发布:2020-05-14

专利汇可以提供一种智能对话系统专利检索,专利查询,专利分析的服务。并且本 发明 公开了一种智能 对话系统 ,实现智能化、规范化、安全高效的拖欠款催收管理,形成物流行业催收服务标准,解决物流行业现状中人工催收效率低下、人 力 耗费大、催收过程不透明等问题。其技术方案为:系统包括:信息录入模 块 用于录入用户信息;外呼模块用于基于录入的用户信息自动外呼电话给用户,呼出电话接通后由 聊天 机器人 与外呼用户进行语音对话;语音文本转换模块用于将外呼用户的语音 信号 转换成文本信息;智能处理模块基于文本相似度模型、文本 情感分析 模型和 聊天机器人 对获取到的外呼用户的文本信息进行处理,获取与外呼用户的语音信息相应的回复话术;文本语音转换模块用于将回复话术的文本信息转换成 语音信号 后回复给外呼用户。,下面是一种智能对话系统专利的具体信息内容。

1.一种智能对话系统,其特征在于,包括:信息录入模、外呼模块、语音文本转换模块、智能处理模块、文本语音转换模块,其中:
信息录入模块,用于录入用户信息;
外呼模块,用于基于录入的用户信息自动外呼电话给用户,呼出电话接通后由聊天机器人与外呼用户进行语音对话;
语音文本转换模块,用于将外呼用户的语音信号转换成文本信息;
智能处理模块,基于文本相似度模型、文本情感分析模型和聊天机器人对获取到的外呼用户的文本信息进行处理,获取与外呼用户的语音信息相应的回复话术;
文本语音转换模块,用于将回复话术的文本信息转换成语音信号后回复给外呼用户。
2.根据权利要求1所述的智能对话系统,其特征在于,智能处理模块包括文本相似度模型处理单元、文本情感分析模型处理单元、聊天机器人处理单元,其中文本相似度模型处理单元用于基于jaccard的文本相似度模型,以实现对开放性问题的分类;文本情感分析模型处理单元用于基于LSTM的文本情感分析模型,实现对于半开放问题的情感积极和消极的判断;聊天机器人处理单元用于对开放性问题中其他类别的语义识别。
3.根据权利要求2所述的智能对话系统,其特征在于,文本相似度模型处理单元配置为将两个句子作为输入,使用结巴分词工具进行分词并将分词结果存入集合中,再利用Jaccard算法计算两个句子的相似度。
4.根据权利要求2所述的智能对话系统,其特征在于,文本情感分析模型处理单元配置为基于LSTM的文本情感分析模型对输入的句子进行以下处理:
输入已标注情感积极或消极的情感标签的不同领域情感文本文档的集合;
对文档进行包括去停用词、分词以及使用Word2Vec对其进行向量化在内的预处理,形成文本向量矩阵;
将文本向量矩阵按照一定比例划分为训练信和测试集;
在训练集上使用深度学习神经网络模型进行学习;
使用文本情感分析模型在训练集上训练获得最终的LSTM模型。
5.根据权利要求2所述的智能对话系统,其特征在于,聊天机器人处理单元配置为用图灵机器人API实现。
6.根据权利要求1所述的智能对话系统,其特征在于,系统还包括:
存储模块,用于在结束通话后存储对话结果,更新对话后的结果。
7.根据权利要求1至6中任一项所述的智能对话系统,其特征在于,智能对话系统是面向快递物流行业催收的系统;外呼用户是欠款对象;信息录入模块录入的用户信息是欠款信息,包括但不限于欠款对象姓名、联系电话、欠款金额、预计还款时间、催收时间;外呼模块是根据欠款对象的欠款信息自动生成还款策略;存储模块更新的是催收结果。

说明书全文

一种智能对话系统

技术领域

[0001] 本发明涉及一种智能客服技术,具体涉及面向快递物流行业催收场景的智能对话系统。

背景技术

[0002] 在物流行业,企业客户与物流公司之间的发件运费都是月结收费模式,延迟结算的客户比比皆是,碍于要跟客户保持友好合作关系,对客户欠款不还,还款滞后等行为物流企业总是深感无
[0003] 物流企业加盟制模式下,加盟商的网络运输费虽是以预付款充值形式进行结算,但加盟公司往来账余额不足产生欠款的现象还是频频发生,总部对欠款加盟网点暂未形成强而有力的欠款催收体系与催收规范。
[0004] 总部、加盟商每个月都有相当部分欠款需要收回,且金额不小。物流行业对应收款的收回都是通过自己物流公司员工来进行人工跟踪处理,且行业内暂末发现外包催收的先例。传统人工催收面临效率低下、人力耗费大、催收过程不透明等问题。
[0005] 以上就是目前物流行业普遍存在的欠款催收难题,目前亟待一种新的技术来解决这一难题。

发明内容

[0006] 以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览,并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之序。
[0007] 本发明的目的在于解决上述问题,提供了一种智能对话系统,实现智能化、规范化、安全高效的拖欠款催收管理,形成物流行业催收服务标准,解决了物流行业现状中人工催收效率低下、人力耗费大、催收过程不透明等问题。
[0008] 本发明的技术方案为:本发明揭示了一种智能对话系统,包括:信息录入模、外呼模块、语音文本转换模块、智能处理模块、文本语音转换模块,其中:
[0009] 信息录入模块,用于录入用户信息;
[0010] 外呼模块,用于基于录入的用户信息自动外呼电话给用户,呼出电话接通后由聊天机器人与外呼用户进行语音对话;
[0011] 语音文本转换模块,用于将外呼用户的语音信号转换成文本信息;
[0012] 智能处理模块,基于文本相似度模型、文本情感分析模型和聊天机器人对获取到的外呼用户的文本信息进行处理,获取与外呼用户的语音信息相应的回复话术;
[0013] 文本语音转换模块,用于将回复话术的文本信息转换成语音信号后回复给外呼用户。
[0014] 根据本发明的智能对话系统的一实施例,智能处理模块包括文本相似度模型处理单元、文本情感分析模型处理单元、聊天机器人处理单元,其中文本相似度模型处理单元用于基于jaccard的文本相似度模型,以实现对开放性问题的分类;文本情感分析模型处理单元用于基于LSTM的文本情感分析模型,实现对于半开放问题的情感积极和消极的判断;聊天机器人处理单元用于对开放性问题中其他类别的语义识别。
[0015] 根据本发明的智能对话系统的一实施例,文本相似度模型处理单元配置为将两个句子作为输入,使用结巴分词工具进行分词并将分词结果存入集合中,再利用Jaccard算法计算两个句子的相似度。
[0016] 根据本发明的智能对话系统的一实施例,文本情感分析模型处理单元配置为基于LSTM的文本情感分析模型对输入的句子进行以下处理:
[0017] 输入已标注情感积极或消极的情感标签的不同领域情感文本文档的集合;
[0018] 对文档进行包括去停用词、分词以及使用Word2Vec对其进行向量化在内的预处理,形成文本向量矩阵;
[0019] 将文本向量矩阵按照一定比例划分为训练信和测试集;
[0020] 在训练集上使用深度学习神经网络模型进行学习;
[0021] 使用文本情感分析模型在训练集上训练获得最终的LSTM模型。
[0022] 根据本发明的智能对话系统的一实施例,聊天机器人处理单元配置为用图灵机器人API实现。
[0023] 根据本发明的智能对话系统的一实施例,系统还包括:
[0024] 存储模块,用于在结束通话后存储对话结果,更新对话后的结果。
[0025] 根据本发明的智能对话系统的一实施例,智能对话系统是面向快递物流行业催收的系统;外呼用户是欠款对象;信息录入模块录入的用户信息是欠款信息,包括但不限于欠款对象姓名、联系电话、欠款金额、预计还款时间、催收时间;外呼模块是根据欠款对象的欠款信息自动生成还款策略;存储模块更新的是催收结果。
[0026] 本发明对比现有技术有如下的有益效果:本发明运用基于jaccard的文本相似度模型,实现对开放性问题的分类,结合利用基于LSTM(长短期记忆人工神经网络,Long-Short Term Memory)的文本情感分析模型,实现对于半开放问题的情感积极和消极的判断,利用图灵聊天机器人进行对开放性问题中其他类别的语义识别。相较于现有的技术,本发明针对物流行业欠款催收难问题,可解决传统人工催收面临效率低下、人力耗费大、催收过程不透明等问题,从而实现智能化、规范化、高效的催收管理,形成物流行业催收服务标准。附图说明
[0027] 在结合以下附图阅读本公开的实施例的详细描述之后,能够更好地理解本发明的上述特征和优点。在附图中,各组件不一定是按比例绘制,并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
[0028] 图1为本发明的一种智能对话系统的一实施例中的LSTM模型序列图。
[0029] 图2为本发明的一种智能对话系统的一实施例中的LSTM模型流程图
[0030] 图3为本发明的一种语音对话系统的一实施例的原理图。

具体实施方式

[0031] 以下结合附图和具体实施例对本发明作详细描述。注意,以下结合附图和具体实施例描述的诸方面仅是示例性的,而不应被理解为对本发明的保护范围进行任何限制。
[0032] 图3示出了本发明的智能对话系统的一实施例的原理,请参见图3所示,本实施例的系统包括:信息录入模块、外呼模块、语音文本转换模块、智能处理模块、文本语音转换模块、存储模块。以下具体描述以面向快递物流行业的催收场景为例进行说明,但本发明也可以扩展至其他的应用场景。
[0033] 信息录入模块用于录入用户信息,例如对应物流行业催收场景的欠款信息,即导入或录入用户欠款信息,包括但不限于欠款对象姓名、联系电话、欠款金额、预计还款时间、催收时间。
[0034] 外呼模块用于基于录入的用户信息外呼电话,例如催收电话,即,系统根据欠款对象的欠款信息,自动生成还款策略,并自动拔打外呼电话给欠款对象,呼出电话接通后由聊天机器人与欠款对象进行语音对话。
[0035] 语音文本转换模块用于将外呼用户(欠款对象)的语音信号转换成文本信息,即,呼出电话被欠款对象接通,将对话过程中欠款对象语音信息转换成文本信息;若电话未被接通,则通话结束。
[0036] 智能处理模块包括文本相似度模型处理单元、文本情感分析模型处理单元、聊天机器人处理单元。智能处理模块基于文本相似度模型、文本情感分析模型和聊天机器人对获取到的文本信息进行处理,获取与外呼用户(欠款对象)的语音信息相应的回复话术。
[0037] 文本语音转换模块用于将文本回复话术的文本信息转换成语音信号后回复给外呼用户(欠款对象)。
[0038] 存储模块用于在结束通话后存储对话结果,更新催收结果。
[0039] 智能处理模块中的文本相似度模型处理单元用于基于jaccard的文本相似度模型,以实现对开放性问题的分类。
[0040] 智能处理模块中的文本情感分析模型处理单元用于基于LSTM的文本情感分析模型,实现对于半开放问题的情感积极和消极的判断,分析欠款对象的还款意愿,例如情感为正的代表愿意还款,情感为负代表不愿意还款。
[0041] 智能处理模块中的聊天机器人处理单元用于对开放性问题中其他类别的语义识别。
[0042] 其中,开放性是针对领域知识讲的。例如,对于物流领域的问答数据,用户突然问了一个衣帽类的问题(例如“我的衣服好看吗?”),这个问题就被判定为开放性的,而其中的其他类别比如本例中的衣帽类。
[0043] 文本相似度模型处理单元中的基于Jaccard(杰卡德)的文本相似度模型的处理过程如下:
[0044] Jaccard(杰卡德)相似性系数主要用于计算符号度量或布尔值度量的样本间的相似度。若样本间的特征属性由符号和布尔值标识,无法衡量差异具体值的大小,只能获得“是否相同”这样一种结果,而Jaccard系数关心的是样本间共同具有的特征。
[0045] Jaccard系数等于样本集交集个数和样本集并集个数的比值,用J(A,B)表示[0046]
[0047] 与Jaccard系数相反的概念是Jaccard距离,用两个集合中不同元素所占元素的比例来衡量两个集合(样本)的区分度,可用如下公式表示:
[0048]
[0049] Jaccard距离用于计算符号度量或者布尔值度量的两个个体之间的相似度,由于个体的特征属性是用符号或者布尔值度量的,所以只能统计包含的共同特征个数。由于只需做集合操作,所以效率较高。
[0050] 本实施例中,将两个句子作为输入,使用结巴分词工具进行分词并将结果存入集合中,之后利用Jaccard算法计算两个句子的相似度,由于本实施例是将其与五个类别进行比较,输出大相似度的类别,并且经过实验,认为当相似度都小于0.1时,则为其他分类。
[0051] 文本情感分析模型处理单元中的基于LSTM的文本情感分析模型对输入的句子进行处理的过程如下,请参见图1所示。
[0052] 步骤a:输入已标注情感积极或消极的情感标签的不同领域情感文本文档的集合。
[0053] 步骤b:对文档进行去停用词、分词以及使用Word2Vec对其进行向量化等预处理。
[0054] 步骤c:将文本向量矩阵按照8:2的比例划分为训练信和测试集。
[0055] 步骤d:在训练集上使用深度学习神经网络模型进行学习。
[0056] 步骤e:使用文本情感分析模型在训练集上训练获得最终的LSTM模型。
[0057] 模型的训练流程如图2所示,该模型包含3层,第一层是输入层、第二层是LSTM层,第三层是输出层,选用sigmoid(机器学习中的公知函数)作为激活函数,使用categorical_crossentropy作为loss函数。使用此模型在训练集上训练获得最终的LSTM模型,用此LSTM模型在测试集上进行计算得到一个概率矩阵,概率矩阵的行代表此样例属于预先设定的各个类别的概率,取出概率最大的作为此样例的标注结果。根据概率矩阵会得到每个样例的标注结果,将它和标准答案进行比较得到识别的准确率、召回率和F测度。
[0058] 聊天机器人处理单元是一种实现方式是现有的图灵机器人API,是在人工智能的核心能力(包括语义理解、智能问答、场景交互、知识管理等)的基础上提供的基于计算和大数据平台的在线服务和开发接口
[0059] 图灵机器人API允许的请求方式为HTTP POST,请求格式为json。本实施例使用了requests包的POST方法,给图灵接口地址发送json数据,并且接收来自API的返回数据,根据返回数据的code判断返回的状态是否成功,当出现调用次数超过限制的情况,则移除列表中第一个元素,让其使用列表中其余的未超限的APIkey,当全部都超限,将停用图灵API,只使用固定的话术来进行交互。
[0060] 尽管为使解释简单化将上述方法图示并描述为一系列动作,但是应理解并领会,这些方法不受动作的次序所限,因为根据一个或多个实施例,一些动作可按不同次序发生和/或与来自本文中图示和描述或本文中未图示和描述但本领域技术人员可以理解的其他动作并发地发生。
[0061] 本领域技术人员将进一步领会,结合本文中所公开的实施例来描述的各种解说性逻辑板块、模块、电路、和算法步骤可实现为电子硬件、计算机软件、或这两者的组合。为清楚地解说硬件与软件的这一可互换性,各种解说性组件、框、模块、电路、和步骤在上面是以其功能性的形式作一般化描述的。此类功能性是被实现为硬件还是软件取决于具体应用和施加于整体系统的设计约束。技术人员对于每种特定应用可用不同的方式来实现所描述的功能性,但这样的实现决策不应被解读成导致脱离了本发明的范围。
[0062] 结合本文所公开的实施例描述的各种解说性逻辑板块、模块、和电路可用通用处理器、数字信号处理器(DSP)、专用集成电路(ASIC)、现场可编程阵列(FPGA)或其它可编程逻辑器件、分立的门或晶体管逻辑、分立的硬件组件、或其设计成执行本文所描述功能的任何组合来实现或执行。通用处理器可以是微处理器,但在替换方案中,该处理器可以是任何常规的处理器、控制器微控制器、或状态机。处理器还可以被实现为计算设备的组合,例如DSP与微处理器的组合、多个微处理器、与DSP核心协作的一个或多个微处理器、或任何其他此类配置。
[0063] 结合本文中公开的实施例描述的方法或算法的步骤可直接在硬件中、在由处理器执行的软件模块中、或在这两者的组合中体现。软件模块可驻留在RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、可移动盘、CD-ROM、或本领域中所知的任何其他形式的存储介质中。示例性存储介质耦合到处理器以使得该处理器能从/向该存储介质读取和写入信息。在替换方案中,存储介质可以被整合到处理器。处理器和存储介质可驻留在ASIC中。ASIC可驻留在用户终端中。在替换方案中,处理器和存储介质可作为分立组件驻留在用户终端中。
[0064] 在一个或多个示例性实施例中,所描述的功能可在硬件、软件、固件或其任何组合中实现。如果在软件中实现为计算机程序产品,则各功能可以作为一条或更多条指令或代码存储在计算机可读介质上或藉其进行传送。计算机可读介质包括计算机存储介质和通信介质两者,其包括促成计算机程序从一地向另一地转移的任何介质。存储介质可以是能被计算机访问的任何可用介质。作为示例而非限定,这样的计算机可读介质可包括RAM、ROM、EEPROM、CD-ROM或其它光盘存储、磁盘存储或其它磁存储设备、或能被用来携带或存储指令或数据结构形式的合意程序代码且能被计算机访问的任何其它介质。任何连接也被正当地称为计算机可读介质。例如,如果软件是使用同轴电缆、光纤电缆、双绞线、数字订户线(DSL)、或诸如红外、无线电、以及微波之类的无线技术从web网站服务器、或其它远程源传送而来,则该同轴电缆、光纤电缆、双绞线、DSL、或诸如红外、无线电、以及微波之类的无线技术就被包括在介质的定义之中。如本文中所使用的盘(disk)和碟(disc)包括压缩碟(CD)、激光碟、光碟、数字多用碟(DVD)、软盘和蓝光碟,其中盘(disk)往往以磁的方式再现数据,而碟(disc)用激光以光学方式再现数据。上述的组合也应被包括在计算机可读介质的范围内。
[0065] 提供对本公开的先前描述是为使得本领域任何技术人员皆能够制作或使用本公开。对本公开的各种修改对本领域技术人员来说都将是显而易见的,且本文中所定义的普适原理可被应用到其他变体而不会脱离本公开的精神或范围。由此,本公开并非旨在被限定于本文中所描述的示例和设计,而是应被授予与本文中所公开的原理和新颖性特征相一致的最广范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈