基于人工智能处理信贷数据的方法、装置及存储介质专利检索-语音信号音频信号广播专利检索查询-专利查询网

基于人工智能处理信贷数据的方法、装置及存储介质

阅读：1024发布：2020-05-23

专利汇可以提供基于人工智能处理信贷数据的方法、装置及存储介质专利检索，专利查询，专利分析的服务。并且本申请涉及人工智能领域，提供基于人工智能处理信贷数据的方法、装置及存储介质，方法包括：按照贷款催收清单中各目标用户对应的逾期类型分别确定与逾期类型匹配的问题类型，按照问题类型从题库中选择与问题类型匹配的目标问题，按照逾期类型确定各目标用户的催收渠道，通过催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，向目标用户的终端发送第一媒体流以与终端会话。根据语音识别技术对目标用户的第二媒体流进行语义分析，从第二媒体流中提取与逾期还款相关的音频数据，将与逾期还款相关的音频数据转换为文字信息，将文字信息和催收标签录入催收平台。本方案能够提高催收工作效率。，下面是基于人工智能处理信贷数据的方法、装置及存储介质专利的具体信息内容。

权利要求

1.一种基于人工智能处理信贷数据的方法，其特征在于，所述方法包括：
获取和遍历多个用户贷款信息；
按照预设筛选条件从所述用户贷款信息筛选出多项逾期贷款数据，按照逾期类型对各逾期贷款数据分类，并统计各逾期贷款数据对应的目标用户，生成包括多个目标用户的贷款催收清单；
按照所述贷款催收清单中各目标用户对应的逾期类型分别确定与各目标用户的逾期类型匹配的问题类型，根据各目标用户对应的问题类型从题库中选择与问题类型匹配的目标问题，以及按照逾期类型分别确定所述贷款催收清单中各目标用户的催收渠道；
通过所述催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，向目标用户的终端发送与目标问题对应的第一媒体流，以与目标用户的终端进行会话；其中，应答逻辑是指催收平台按照预设的应答模式向目标用户的终端发送目标问题的媒体流，以与终端会话的应答规则；
接收目标用户的终端发送的第二媒体流，根据语音识别技术对所述第二媒体流进行语义分析，从所述第二媒体流中提取与逾期还款相关的音频数据；
将与逾期还款相关的音频数据转换为文字信息，并将文字信息和与文字信息匹配的催收标签录入所述催收平台；
根据所述文字信息和所述催收标签生成贷款催收记录并保存。
2.根据权利要求1所述的方法，其特征在于，所述根据语音识别技术对所述第二媒体流进行语义分析，从所述第二媒体流中提取与逾期还款相关的数据，包括：
采用移动窗函数对第二媒体流进行声音分帧，得到多段音频数据，每一段音频数据为一帧；
将每段音频数据分别进行波形变换，得到每段音频数据对应的一个多维向量，所述多维向量为声学特征；
采用声学模型识别出与各多维向量匹配概率最大的发音序列；
采用语言模型查找出与所述发音序列匹配概率最大的字符串序列；
对所述字符串序列进行语义理解(例如上下文理解)，以识别所述第二媒体流中的核心词语；
将预设关键词与所述第二媒体流中的核心词语进行匹配，得到所述与逾期还款相关的音频数据；其中，所述预设关键词是指同意还款或者具备还款倾向的关键词。
3.根据权利要求1所述的方法，其特征在于，所述在接收目标用户的终端发送的第二媒体流之后，所述根据语音识别技术对第二媒体流进行语义分析之前，所述方法还包括：
测量所述第二媒体流的播放分贝；
若所述第二媒体流的播放分贝低于预设分贝，则增加所述第二媒体流的播放分贝，以使述第二媒体流的播放分贝不小于所述预设分贝，其中，预设分贝是指满足机器对所述第二媒体流进行语义识别的最低分贝值。
4.根据权利要求1-3中任一项所述的方法，其特征在于，所述在接收目标用户的终端发送的第二媒体流之后，所述根据语音识别技术对第二媒体流进行语义分析之前，所述方法还包括：
分析所述第二媒体流中的数据；
若通过分析确定所述第二媒体流中包含噪声数据，则采用以下公式对所述第二媒体流的语音信号进行语音增强处理，得到最优语音信号：
minimize WT(k)R-1W(k)+(X(k)-X^(k|k-1))TΘ-1(X(k)-X^(k|k-1))+λ||v(k)||1subjiect to Y(k)＝CX(k)+n(k)+v(k)
其中，X(k)和n(k)为变量，X(k)为卡尔曼滤波算法中对状态值的最优估计，n(k)是对高斯噪声的估计，Θ是高斯噪声的协方差矩阵，v(k)为稀疏噪声；
采用卡尔曼滤波算法将所述噪声数据从所述第二媒体流中过滤。
5.根据权利要求1-3中任一项所述的方法，其特征在于，所述在接收目标用户的终端发送的第二媒体流之后，所述根据语音识别技术对第二媒体流进行语义分析之前，所述方法还包括：
测量所述第二媒体流的播放速度；
若所述第二媒体流的播放速度高于预设播放速度，则降低所述第二媒体流的播放速度，以使所述第二媒体流的播放速度不高于预设播放速度。
6.根据权利要求5所述的方法，其特征在于，所述降低所述第二媒体流的播放速度，包括：
采用分帧或加窗的方式降低所述第二媒体流的播放速度
采用交叠分段方式将所述第二媒体流的语音信号分为多个短段，其中，所述第二媒体流的语音信号包括多个视频帧，前一帧和后一帧的交叠部分为帧移；
采用可移动的有限长度的窗口对所述多个短段进行加权处理，以降低所述第二媒体流的播放速度。
7.根据权利要求1-3中任一项所述的方法，其特征在于，所述从所述第二媒体流中提取与逾期还款相关的音频数据之后，所述将与逾期还款相关的音频数据转换为文字信息之前，所述方法还包括：
对所述第二媒体流进行测谎分析；
若确定所述目标用户存在虚假回答，则根据虚假回答对应的问题选择补强问题，所述补强问题用于引导目标用户回答多个维度的问题；
按照问题引导模式向所述目标用户发送所述补强问题；
接收目标用户针对所述补强问题的回答；
对目标用户针对所述补强问题的回答进行语义分析，将所述与逾期还款相关的数据中的虚假回答替换为本次语义分析的结果。
8.一种基于人工智能处理信贷数据的装置，其特征在于，所述装置包括：
收发模块，用于获取多个用户贷款信息；
处理模块，用于遍历所述收发模块获取到的所述多个用户贷款信息；按照预设筛选条件从所述用户贷款信息筛选出多项逾期贷款数据，按照逾期类型对各逾期贷款数据分类，并统计各逾期贷款数据对应的目标用户，生成包括多个目标用户的贷款催收清单；按照所述贷款催收清单中各目标用户对应的逾期类型分别确定与各目标用户的逾期类型匹配的问题类型，根据各目标用户对应的问题类型从题库中选择与问题类型匹配的目标问题，以及按照逾期类型分别确定所述贷款催收清单中各目标用户的催收渠道；通过所述催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，通过所述收发模块向目标用户的终端发送与目标问题对应的第一媒体流，以与目标用户的终端进行会话；其中，应答逻辑是指催收平台按照预设的应答模式向目标用户的终端发送目标问题的媒体流，以与终端会话的应答规则；
所述处理模块还用于通过所述收发模块接收目标用户的终端发送的第二媒体流，根据语音识别技术对所述第二媒体流进行语义分析，从所述第二媒体流中提取与逾期还款相关的音频数据；将与逾期还款相关的音频数据转换为文字信息，并将文字信息和与文字信息匹配的催收标签录入所述催收平台；根据所述文字信息和所述催收标签生成贷款催收记录并保存。
9.一种计算机设备，其特征在于，所述设备包括：
至少一个处理器、存储器和收发器；
其中，所述存储器用于存储程序代码，所述处理器用于调用所述存储器中存储的程序代码来执行如权利要求1-7中任一项所述的方法。
10.一种计算机存储介质，其特征在于，其包括指令，当其在计算机上运行时，使得计算机执行如权利要求1-7中任一项所述的方法。

说明书全文

基于人工智能处理信贷数据的方法、装置及存储介质

技术领域

[0001] 本申请涉及人工智能技术领域，尤其涉及一种基于人工智能处理信贷数据的方法、装置及存储介质。

背景技术

[0002] 目前，国内消费金融正在蓬勃发展，与此同时，逾期贷款的案件数量也在不断增加。针对逾期贷款的用户，现行的催收方式主要由客服人员通过电话、短信、邮件或信函等方式进行催收。具体来说，催收过程如下：使用催收平台打电话时，需要催收员与债务人沟通以确认各种信息，并在催收平台的操作界面填写确认后的信息。需要投入很多催收员人力。

[0003] 但是，催收员与债务人沟通过程中，若催收员对电话沟通中的语音识别不准确，则催收员有可能理解错债务人的意图，或者因频繁进行重复性的记录而降低注意力等因素，导致录入错误的动作代码，最终录入错误的债务人意图。由于催收员在催收平台的操作界面填写确认后的信息时需要填写很多信息，比如动作代码，催收备注等，即便催收员理解正确的语音意图，也容易录入错误的信息，且操作耗时和费力。发明内容

[0004] 本申请提供了一种基于人工智能处理信贷数据的方法、装置及存储介质，能够解决现有技术中人工催收效率低下且易出错的问题。

[0005] 第一方面，本申请提供一种基于人工智能处理信贷数据的方法，所述方法包括：

[0006] 获取和遍历多个用户贷款信息；

[0007] 按照预设筛选条件从所述用户贷款信息筛选出多项逾期贷款数据，按照逾期类型对各逾期贷款数据分类，并统计各逾期贷款数据对应的目标用户，生成包括多个目标用户的贷款催收清单；

[0008] 按照所述贷款催收清单中各目标用户对应的逾期类型分别确定与各目标用户的逾期类型匹配的问题类型，根据各目标用户对应的问题类型从题库中选择与问题类型匹配的目标问题，以及按照逾期类型分别确定所述贷款催收清单中各目标用户的催收渠道；

[0009] 通过所述催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，向目标用户的终端发送与目标问题对应的第一媒体流，以与目标用户的终端进行会话；其中，应答逻辑是指催收平台按照预设的应答模式向目标用户的终端发送目标问题的媒体流，以与终端会话的应答规则；

[0010] 接收目标用户的终端发送的第二媒体流，根据语音识别技术对所述第二媒体流进行语义分析，从所述第二媒体流中提取与逾期还款相关的音频数据；

[0011] 将与逾期还款相关的音频数据转换为文字信息，并将文字信息和与文字信息匹配的催收标签录入所述催收平台；

[0012] 根据所述文字信息和所述催收标签生成贷款催收记录并保存。

[0013] 在一些可能的设计中，所述根据语音识别技术对所述第二媒体流进行语义分析，从所述第二媒体流中提取与逾期还款相关的数据，包括：

[0014] 采用移动窗函数对第二媒体流进行声音分帧，得到多段音频数据，每一段音频数据为一帧；

[0015] 将每段音频数据分别进行波形变换，得到每段音频数据对应的一个多维向量，所述多维向量为声学特征；

[0016] 采用声学模型识别出与各多维向量匹配概率最大的发音序列；

[0017] 采用语言模型查找出与所述发音序列匹配概率最大的字符串序列；

[0018] 对所述字符串序列进行语义理解(例如上下文理解)，以识别所述第二媒体流中的核心词语；

[0019] 将预设关键词与所述第二媒体流中的核心词语进行匹配，得到所述与逾期还款相关的音频数据；其中，所述预设关键词是指同意还款或者具备还款倾向的关键词。

[0020] 在一些可能的设计中，所述在接收目标用户的终端发送的第二媒体流之后，所述根据语音识别技术对第二媒体流进行语义分析之前，所述方法还包括：

[0021] 测量所述第二媒体流的播放分贝；

[0022] 若所述第二媒体流的播放分贝低于预设分贝，则增加所述第二媒体流的播放分贝，以使述第二媒体流的播放分贝不小于所述预设分贝，其中，预设分贝是指满足机器对所述第二媒体流进行语义识别的最低分贝值。

[0023] 在一些可能的设计中，所述在接收目标用户的终端发送的第二媒体流之后，所述根据语音识别技术对第二媒体流进行语义分析之前，所述方法还包括：

[0024] 分析所述第二媒体流中的数据；

[0025] 若通过分析确定所述第二媒体流中包含噪声数据，则采用以下公式对所述第二媒体流的语音信号进行语音增强处理，得到最优语音信号：

[0026] min i m i z e W T(k)R-1W(k)+(X(k)-X^(k|k-1))TΘ-1(X(k)-X^(k|k-1))+λ||v(k)||1

[0027] subjiect to Y(k)＝CX(k)+n(k)+v(k)

[0028] 其中，X(k)和n(k)为变量，X(k)为卡尔曼滤波算法中对状态值的最优估计，n(k)是对高斯噪声的估计，Θ是高斯噪声的协方差矩阵，v(k)为稀疏噪声；

[0029] 采用卡尔曼滤波算法将所述噪声数据从所述第二媒体流中过滤。

[0030] 在一些可能的设计中，所述在接收目标用户的终端发送的第二媒体流之后，所述根据语音识别技术对第二媒体流进行语义分析之前，所述方法还包括：

[0031] 测量所述第二媒体流的播放速度；

[0032] 若所述第二媒体流的播放速度高于预设播放速度，则降低所述第二媒体流的播放速度，以使所述第二媒体流的播放速度不高于预设播放速度。

[0033] 在一些可能的设计中，所述降低所述第二媒体流的播放速度，包括：

[0034] 采用分帧或加窗的方式降低所述第二媒体流的播放速度

[0035] 采用交叠分段方式将所述第二媒体流的语音信号分为多个短段，其中，所述第二媒体流的语音信号包括多个视频帧，前一帧和后一帧的交叠部分为帧移；

[0036] 采用可移动的有限长度的窗口对所述多个短段进行加权处理，以降低所述第二媒体流的播放速度。

[0037] 在一些可能的设计中，所述从所述第二媒体流中提取与逾期还款相关的音频数据之后，所述将与逾期还款相关的音频数据转换为文字信息之前，所述方法还包括：

[0038] 对所述第二媒体流进行测谎分析；

[0039] 若确定所述目标用户存在虚假回答，则根据虚假回答对应的问题选择补强问题，所述补强问题用于引导目标用户回答多个维度的问题；

[0040] 按照问题引导模式向所述目标用户发送所述补强问题；

[0041] 接收目标用户针对所述补强问题的回答；

[0042] 对目标用户针对所述补强问题的回答进行语义分析，将所述与逾期还款相关的数据中的虚假回答替换为本次语义分析的结果。

[0043] 第二方面，本申请提供一种基于人工智能处理信贷数据的装置，具有实现对应于上述第一方面提供的基于人工智能处理信贷数据的方法的功能。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块，所述模块可以是软件和/或硬件。

[0044] 一种可能的设计中，所述装置包括：

[0045] 收发模块，用于获取多个用户贷款信息；

[0046] 处理模块，用于遍历所述收发模块获取到的所述多个用户贷款信息；按照预设筛选条件从所述用户贷款信息筛选出多项逾期贷款数据，按照逾期类型对各逾期贷款数据分类，并统计各逾期贷款数据对应的目标用户，生成包括多个目标用户的贷款催收清单；按照所述贷款催收清单中各目标用户对应的逾期类型分别确定与各目标用户的逾期类型匹配的问题类型，根据各目标用户对应的问题类型从题库中选择与问题类型匹配的目标问题，以及按照逾期类型分别确定所述贷款催收清单中各目标用户的催收渠道；通过所述催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，通过所述收发模块向目标用户的终端发送与目标问题对应的第一媒体流，以与目标用户的终端进行会话；其中，应答逻辑是指催收平台按照预设的应答模式向目标用户的终端发送目标问题的媒体流，以与终端会话的应答规则；

[0047] 所述处理模块还用于通过所述收发模块接收目标用户的终端发送的第二媒体流，根据语音识别技术对所述第二媒体流进行语义分析，从所述第二媒体流中提取与逾期还款相关的音频数据；将与逾期还款相关的音频数据转换为文字信息，并将文字信息和与文字信息匹配的催收标签录入所述催收平台；根据所述文字信息和所述催收标签生成贷款催收记录并保存。

[0048] 在一些可能的设计中，所述处理模块具体用于：

[0049] 采用移动窗函数对第二媒体流进行声音分帧，得到多段音频数据，每一段音频数据为一帧；

[0050] 将每段音频数据分别进行波形变换，得到每段音频数据对应的一个多维向量，所述多维向量为声学特征；

[0051] 采用声学模型识别出与各多维向量匹配概率最大的发音序列；

[0052] 采用语言模型查找出与所述发音序列匹配概率最大的字符串序列；

[0053] 对所述字符串序列进行语义理解(例如上下文理解)，以识别所述第二媒体流中的核心词语；

[0054] 将预设关键词与所述第二媒体流中的核心词语进行匹配，得到所述与逾期还款相关的音频数据；其中，所述预设关键词是指同意还款或者具备还款倾向的关键词。

[0055] 在一些可能的设计中，所述处理模块在所述收发模块接收目标用户的终端发送的第二媒体流之后，在根据语音识别技术对第二媒体流进行语义分析之前，还用于：

[0056] 测量所述第二媒体流的播放分贝；

[0057] 若所述第二媒体流的播放分贝低于预设分贝，则增加所述第二媒体流的播放分贝，以使述第二媒体流的播放分贝不小于所述预设分贝，其中，预设分贝是指满足机器对所述第二媒体流进行语义识别的最低分贝值。

[0058] 在一些可能的设计中，所述处理模块在所述收发模块在接收目标用户的终端发送的第二媒体流之后，在根据语音识别技术对第二媒体流进行语义分析之前，还用于：

[0059] 分析所述第二媒体流中的数据；

[0060] 若通过分析确定所述第二媒体流中包含噪声数据，则采用以下公式对所述第二媒体流的语音信号进行语音增强处理，得到最优语音信号：

[0061] min i m i z e W T(k)R-1W(k)+(X(k)-X^(k|k-1))TΘ-1(X(k)-X^(k|k-1))+λ||v(k)||1

[0062] subjiect to Y(k)＝CX(k)+n(k)+v(k)

[0063] 其中，X(k)和n(k)为变量，X(k)为卡尔曼滤波算法中对状态值的最优估计，n(k)是对高斯噪声的估计，Θ是高斯噪声的协方差矩阵，v(k)为稀疏噪声；

[0064] 采用卡尔曼滤波算法将所述噪声数据从所述第二媒体流中过滤。

[0065] 在一些可能的设计中，所述处理模块在所述收发模块接收目标用户的终端发送的第二媒体流之后，在根据语音识别技术对第二媒体流进行语义分析之前，还用于：

[0066] 测量所述第二媒体流的播放速度；

[0067] 若所述第二媒体流的播放速度高于预设播放速度，则降低所述第二媒体流的播放速度，以使所述第二媒体流的播放速度不高于预设播放速度。

[0068] 在一些可能的设计中，所述处理模块具体用于：

[0069] 采用分帧或加窗的方式降低所述第二媒体流的播放速度

[0070] 采用交叠分段方式将所述第二媒体流的语音信号分为多个短段，其中，所述第二媒体流的语音信号包括多个视频帧，前一帧和后一帧的交叠部分为帧移；

[0071] 采用可移动的有限长度的窗口对所述多个短段进行加权处理，以降低所述第二媒体流的播放速度。

[0072] 在一些可能的设计中，所述处理模块从所述第二媒体流中提取与逾期还款相关的音频数据之后，所述处理模块将与逾期还款相关的音频数据转换为文字信息之前，还用于：

[0073] 对所述第二媒体流进行测谎分析；

[0074] 若确定所述目标用户存在虚假回答，则根据虚假回答对应的问题选择补强问题，所述补强问题用于引导目标用户回答多个维度的问题；

[0075] 按照问题引导模式向所述目标用户发送所述补强问题；

[0076] 通过所述收发模块接收目标用户针对所述补强问题的回答；

[0077] 对目标用户针对所述补强问题的回答进行语义分析，将所述与逾期还款相关的数据中的虚假回答替换为本次语义分析的结果。

[0078] 本申请又一方面提供了一种计算机设备，其包括至少一个连接的处理器、存储器和收发器，其中，所述存储器用于存储程序代码，所述处理器用于调用所述存储器中的程序代码来执行上述第一方面所述的方法。

[0079] 本申请又一方面提供了一种计算机存储介质，其包括指令，当其在计算机上运行时，使得计算机执行上述第一方面所述的方法。

[0080] 与现有机制相比，本申请实施例中，按照所述贷款催收清单中各目标用户对应的逾期类型分别确定与各目标用户的逾期类型匹配的问题类型，根据各目标用户对应的问题类型从题库中选择与问题类型匹配的目标问题，以及按照逾期类型分别确定所述贷款催收清单中各目标用户的催收渠道，通过所述催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，向目标用户的终端发送与目标问题对应的第一媒体流以与目标用户的终端进行会话。根据语音识别技术对目标用户的第二媒体流进行语义分析，从第二媒体流中提取与逾期还款相关的音频数据，将与逾期还款相关的音频数据转换为文字信息，并将文字信息和与文字信息匹配的催收标签录入所述催收平台。可见，采用本方案后，由机器与目标用户沟通并确认各种基本信息，提高催收工作效率，降低催收成本，无需考虑机器是否疲倦，并且能够提高识别目标用户的真实语音意图的准确率，以及自动生成贷款催收记录，无需催收员填写很多信息，使催收变得智能化，解放生产力以及提高用户体验。附图说明

[0081] 图1为本申请实施例中基于人工智能处理信贷数据的方法的一种流程示意图；

[0082] 图2为本申请实施例中基于人工智能处理信贷数据的装置的结构示意图；

[0083] 图3为本申请实施例中计算机设备的一种结构示意图。

[0084] 本申请目的的实现、功能特点及优点将结合实施例，参照附图做进一步说明。

具体实施方式

[0085] 应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的实施例能够以除了在这里图示或描述的内容以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或模块的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或模块，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块，本申请中所出现的模块的划分，仅仅是一种逻辑上的划分，实际应用中实现时可以有另外的划分方式，例如多个模块可以结合成或集成在另一个系统中，或一些特征可以忽略，或不执行。

[0086] 本申请提供一种基于人工智能处理信贷数据的方法、装置及存储介质。本方案由催收平台执行，催收平台中部署人工智能(artificial intelligence，AI)。

[0087] 参照图1，以下介绍本申请实施例中的一种基于人工智能处理信贷数据的方法，所述方法包括：

[0088] 101、获取和遍历多个用户贷款信息。

[0089] 其中，所述用户贷款信息包括贷款人姓名、身份证号、人脸图像、邮箱、手机号码、贷款产品、借款日期、借款金额和还款期限。

[0090] 102、按照预设筛选条件从所述用户贷款信息筛选出多项逾期贷款数据，按照逾期类型对各逾期贷款数据分类，并统计各逾期贷款数据对应的目标用户，生成包括多个目标用户的贷款催收清单。

[0091] 其中，所述预设筛选条件可包括逾期未还款金额、逾期天数高于预设期限、临近还款日未还款金额、以及剩余还款日。

[0092] 所述逾期类型包括风险用户、潜在风险用户、老赖用户、失联用户和老赖用户。其中，风险用户指逾期还款天数超过90天的用户。潜在风险用户指逾期还款天数不超过60天的用户。老赖用户指6个月内的历史逾期还款次数累计达到4次的用户。失联用户指根据入催案件中的联系电话无法联系到的用户。老赖用户指到了指定还款时间一直不还钱的用户。为便于区分逾期用户，分别为每种逾期用户设置一个逾期类型标识。例如：潜在风险用户对应潜在风险类型标识L，风险用户对应逾期类型标识H，老赖用户对应逾期类型标识F，失联用户对应逾期类型标识M，老赖用户对应逾期类型标识L。

[0093] 本申请仅以已逾期的目标用户为例，针对即将逾期的目标用户的催收处理方案可参考本申请对已逾期的目标用户的处理方式，不做赘述。

[0094] 103、按照所述贷款催收清单中各目标用户对应的逾期类型分别确定与各目标用户的逾期类型匹配的问题类型，根据各目标用户对应的问题类型从题库中选择与问题类型匹配的目标问题，以及按照逾期类型分别确定所述贷款催收清单中各目标用户的催收渠道。

[0095] 其中，所述催收渠道包括电话、网络通讯账号、邮箱、家庭住址、工作地址和法院。

[0096] 例如，对于潜在风险用户，目标问题可以为“李先生，您好，您深圳南山银行尾号为6222342100009094的信用卡逾期22090.23元，请尽快在2019-5-20日之前还款，如果没有异议并同意还款请确认”。

[0097] 对于老赖用户，目标问题可以为“您好，您到底什么时候能还款，不还款则向征信中心申报您的逾期信息，并在全国公示或者向您递交法院传票”。

[0098] 对于失联用户，目标问题可以为“您好，请您在2019-8-20日之前务必还款，若未还款，则向法院申请冻结个人不动产和名下所有金融账户内的资金”。

[0099] 104、通过所述催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，向目标用户的终端发送与目标问题对应的第一媒体流，以与目标用户的终端进行会话。

[0100] 其中，应答逻辑是指催收平台按照预设的应答模式向目标用户的终端发送目标问题的媒体流，以与终端会话的应答规则。

[0101] 所述第一媒体流可为语音数据或视频数据，语音数据或视频数据均为AI模拟人声，本申请不对第一媒体流的格式作限定。

[0102] 一些实施方式中，所述按照目标问题的应答逻辑将目标问题转换为第一媒体流，包括：

[0103] 按照所述目标问题的应答逻辑将所述目标问题编码，得到第一媒体流。

[0104] 105、接收目标用户的终端发送的第二媒体流，根据语音识别技术对第二媒体流进行语义分析，从第二媒体流中提取与逾期还款相关的音频数据。

[0105] 一些实施方式中，所述根据语音识别技术对第二媒体流进行语义分析，从第二媒体流中提取与逾期还款相关的数据，包括：

[0106] 采用移动窗函数对第二媒体流进行声音分帧，得到多段音频数据，每一段音频数据为一帧；

[0107] 将每段音频数据分别进行波形变换，得到每段音频数据对应的一个多维向量，所述多维向量为声学特征；

[0108] 采用声学模型识别出与各多维向量匹配概率最大的发音序列；

[0109] 采用语言模型查找出与所述发音序列匹配概率最大的字符串序列；

[0110] 对所述字符串序列进行语义理解(例如上下文理解)，以识别所述第二媒体流中的核心词语；

[0111] 将预设关键词与所述第二媒体流中的核心词语进行匹配，得到所述与逾期还款相关的音频数据。

[0112] 其中，所述预设关键词是指同意还款或者具备还款倾向的关键词。例如，所述预设关键词包括“好的”、“OK”、“可以”和“等会就还”等携带同意还款的关键词。若音频数据中含有“好的”、“OK”、“可以”和“等会就还”等携带同意还款单向的关键词，则表示逾期用户同意还款，逾期催收结果为愿意还款。若语音数据中不含有“好的”、“OK”、“可以”和“等会就还”等携带同意还款的关键词，则表示逾期用户不同意还款，逾期催收结果为不愿意还款。

[0113] 一些实施方式中，预设关键词可采用预先训练好的隐式马尔科夫(Hidden Markov Model，HMM)模型实现，采用HMM模型即可对音频数据进行关键词识别。其中，HMM模型是预先训练好的存储在催收平台中，用于识别通话语音中是否存在“好的”、“OK”、“可以”和“等会就还”等预设关键词的模型。本实施例中，采用预先训练好的HMM模型识别音频数据中是否存在预设关键词，可以提高识别准确率。

[0114] 一些实施方式中，为进一步保证语义分析的准确性，在接收目标用户的终端发送的第二媒体流之后，根据语音识别技术对第二媒体流进行语义分析之前，还可以提高第二媒体流的播放分贝、降低第二媒体流的播放速度、以及去除第二媒体流中的噪声。以下分别介绍：

[0115] (1)提高第二媒体流的播放分贝

[0116] 测量所述第二媒体流的播放分贝；

[0117] 若所述第二媒体流的播放分贝低于预设分贝，则增加所述第二媒体流的播放分贝，以使述第二媒体流的播放分贝不小于所述预设分贝。

[0118] 其中，预设分贝是指满足机器对所述第二媒体流进行语义识别的最低分贝值。

[0119] 即使目标用户说话的音量低，或者离麦克风较远，也不会因为录制的用户说话(即转换为第二媒体流发给催收平台)的音量低而导致无法清晰和准确的分析接收到的第二媒体流。可见，提高第二媒体流的播放分贝后，能够增强语义识别的准确性和清晰度。

[0120] (2)降低所述第二媒体流的播放速度

[0121] 测量所述第二媒体流的播放速度；

[0122] 若所述第二媒体流的播放速度高于预设播放速度，则降低所述第二媒体流的播放速度，以使所述第二媒体流的播放速度不高于预设播放速度。

[0123] 即使目标用户说话的语速快，也不会因为录制的用户说话(即转换为第二媒体流发给催收平台)的语速快而导致无法清晰和准确的分析接收到的第二媒体流。可见，降低所述第二媒体流的播放速度后，能够增强语义识别的准确性和清晰度。

[0124] 一些实施方式中，可采用分帧或加窗的方式降低第二媒体流的播放速度。以第二媒体流为语音信号为例，语音信号具有短时平稳性(10～30ms内可以认为语音信号近似不变)，那么，对语音信号进行分帧则是指将语音信号分为一些短段进行处理，例如交叠分段的方法，前一帧和后一帧的交叠部分称为帧移，帧移与帧长的比值一般为0～0.5。例如，每秒的帧数约为33～100帧，帧长为25ms，帧移为10ms。分帧可采用可移动的有限长度的窗口进行加权的方法实现。

[0125] (3)去除所述第二媒体流中的噪声

[0126] 分析所述第二媒体流中的数据；

[0127] 若通过分析确定所述第二媒体流中包含噪声数据，则将所述噪声数据从所述第二媒体流中过滤。

[0128] 即使目标用户说话时周围存在噪声，也不会因为录制的用户说话(即转换为第二媒体流发给催收平台)中包括噪声数据而导致无法清晰和准确的分析接收到的第二媒体流。可见，去除所述第二媒体流中的噪声数据后，能够实现语义增强，即增强语义识别的准确性和清晰度。

[0129] 可采用卡尔曼(Kronecker)滤波算法过滤噪声。本申请不对分析噪声数据的方式、以及过滤噪声数据的方式作限定。

[0130] 例如，语音信号、噪声数据p(k)&噪声数据n(k)的统计特性分别为：

[0131] E(p(k))＝q,E(n(k))＝r

[0132] E(p(k)p(j)T)＝Qδkj,E(n(k)n(j)T)＝Rδkj

[0133] 其中，q和r分别为噪声p(k)和n(k)的均值；Q和R分别为噪声数据p(k)&噪声数据n(k)的协方差，δkj为Kronecker函数。本申请中，语音增强是指在已知语音信号Y(k)的前提下去估计最优语音信号X(k)，最优语音信号X(k)也可称为最优估计。一种语音信号的优化公式如下：

[0134] min i m i z e W T(k)R-1W(k)+(X(k)-X^(k|k-1))TΘ-1(X(k)-X^(k|k-1))+λ||v(k)||1

[0135] subjiect to Y(k)＝CX(k)+n(k)+v(k)

[0136] 其中，X(k)和n(k)为变量，X(k)即为Kronecker滤波算法中对状态值的最优估计，即n(k)是对高斯噪声的估计，Θ是高斯噪声的协方差矩阵，v(k)即为稀疏噪声，通过对上述优化公式求解，得到对语音信号的最优估计X(k)。

[0137] 106、将与逾期还款相关的音频数据转换为文字信息，并将文字信息和与文字信息匹配的催收标签录入所述催收平台。

[0138] 其中，所述催收标签可包括承诺按期还款(例如接通-是本人-承诺还款)、申请推迟还款(例如接通-是本人-承诺推迟还款)、无力还款(例如接通-用户家属-无力还款)等。

[0139] 一些实施方式中，所述从第二媒体流中提取与逾期还款相关的音频数据之后，所述将与逾期还款相关的音频数据转换为文字信息之前，所述方法还包括：

[0140] 对所述第二媒体流进行测谎分析；

[0141] 若确定所述目标用户存在虚假回答，则根据虚假回答对应的问题选择补强问题，所述补强问题用于引导目标用户回答多个维度的问题；

[0142] 按照问题引导模式向所述目标用户发送所述补强问题；

[0143] 接收目标用户针对所述补强问题的回答；

[0144] 对目标用户针对所述补强问题的回答进行语义分析，将所述与逾期还款相关的数据中的虚假回答替换为本次语义分析的结果。

[0145] 可见，通过对目标用户的第二媒体流进行测谎分析，能够更深的挖掘目标用户是否在隐瞒真实还款能力和还款意愿，能够提高对目标用户的真实还款能力核还款意愿的掌握程度，从而降低逾期还款的概率和应对潜在赖账的风险。

[0146] 107、根据所述文字信息和所述催收标签生成贷款催收记录并保存。

[0147] 其中，所述贷款催收记录是指对每次催收还款的全程记录，用于催收人员分析、更新和管理，例如便于按条件检索催收记录，或者为目标用户分配催收等级。所述催收等级根据超出还款日期的时间或逾期贷款金额确定，超期时间越长，逾期贷款数据催收等级越高，贷款金额越大，逾期贷款数据催收等级越高。

[0148] 一些实施方式中，在生成贷款催收记录后，还可以根据催收记录对各目标用户绘制用户画像(例如知识图谱形式)，便于催收人员更直观的分析目标用户的还款能力和还款信用等特性。

[0149] 与现有机制相比，本申请实施例中，按照所述贷款催收清单中各目标用户对应的逾期类型分别确定与各目标用户的逾期类型匹配的问题类型，根据各目标用户对应的问题类型从题库中选择与问题类型匹配的目标问题，以及按照逾期类型分别确定所述贷款催收清单中各目标用户的催收渠道，通过所述催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，向目标用户的终端发送与目标问题对应的第一媒体流以与目标用户的终端进行会话。根据语音识别技术对目标用户的第二媒体流进行语义分析，从第二媒体流中提取与逾期还款相关的音频数据，将与逾期还款相关的音频数据转换为文字信息，并将文字信息和与文字信息匹配的催收标签录入所述催收平台。可见，采用本方案后，由机器与目标用户沟通并确认各种基本信息，提高催收工作效率，降低催收成本，无需考虑机器是否疲倦，并且能够提高识别目标用户的真实语音意图的准确率，以及自动生成贷款催收记录，无需催收员填写很多信息，使催收变得智能化，解放生产力以及提高用户体验。

[0150] 上述图1所对应的实施例或实施方式中所提及的技术特征也同样适用于本申请中的图2和图3所对应的实施例，后续类似之处不再赘述。

[0151] 以上对本申请中一种基于人工智能处理信贷数据的方法进行说明，以下对执行上述基于人工智能处理信贷数据的方法的装置进行描述。

[0152] 如图2所示的一种基于人工智能处理信贷数据的装置20的结构示意图，其可应用于语音意图识别，例如机器与人语音或视频通话。本申请实施例中的装置20能够实现对应于上述图1所对应的实施例中所执行的基于人工智能处理信贷数据的方法的步骤。装置20实现的功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块，所述模块可以是软件和/或硬件。所述装置20可包括收发模块201和处理模块202，所述处理模块202和获取模块201的功能实现可参考图1所对应的实施例中所执行的操作，此处不作赘述。所述处理模块202可用于控制所述收发模块201的收发、获取等操作。

[0153] 一些实施方式中，所述收发模块201可用于获取多个用户贷款信息；

[0154] 所述处理模块202可用于遍历所述收发模块201获取到的所述多个用户贷款信息；按照预设筛选条件从所述用户贷款信息筛选出多项逾期贷款数据，按照逾期类型对各逾期贷款数据分类，并统计各逾期贷款数据对应的目标用户，生成包括多个目标用户的贷款催收清单；按照所述贷款催收清单中各目标用户对应的逾期类型分别确定与各目标用户的逾期类型匹配的问题类型，根据各目标用户对应的问题类型从题库中选择与问题类型匹配的目标问题，以及按照逾期类型分别确定所述贷款催收清单中各目标用户的催收渠道；通过所述催收渠道与各目标用户绑定的终端建立会话连接，按照目标问题的应答逻辑将目标问题转换为第一媒体流，通过所述收发模块201向目标用户的终端发送与目标问题对应的第一媒体流，以与目标用户的终端进行会话；其中，应答逻辑是指催收平台按照预设的应答模式向目标用户的终端发送目标问题的媒体流，以与终端会话的应答规则；

[0155] 所述处理模块202还用于通过所述收发模块接收目标用户的终端发送的第二媒体流，根据语音识别技术对所述第二媒体流进行语义分析，从所述第二媒体流中提取与逾期还款相关的音频数据；将与逾期还款相关的音频数据转换为文字信息，并将文字信息和与文字信息匹配的催收标签录入所述催收平台；根据所述文字信息和所述催收标签生成贷款催收记录并保存。

[0156] 在一些实施方式中，所述处理模块202具体用于：

[0157] 采用移动窗函数对第二媒体流进行声音分帧，得到多段音频数据，每一段音频数据为一帧；

[0158] 将每段音频数据分别进行波形变换，得到每段音频数据对应的一个多维向量，所述多维向量为声学特征；

[0159] 采用声学模型识别出与各多维向量匹配概率最大的发音序列；

[0160] 采用语言模型查找出与所述发音序列匹配概率最大的字符串序列；

[0161] 对所述字符串序列进行语义理解(例如上下文理解)，以识别所述第二媒体流中的核心词语；

[0162] 将预设关键词与所述第二媒体流中的核心词语进行匹配，得到所述与逾期还款相关的音频数据；其中，所述预设关键词是指同意还款或者具备还款倾向的关键词。

[0163] 在一些实施方式中，所述处理模块202在所述收发模块201接收目标用户的终端发送的第二媒体流之后，在根据语音识别技术对第二媒体流进行语义分析之前，还用于：

[0164] 测量所述第二媒体流的播放分贝；

[0165] 若所述第二媒体流的播放分贝低于预设分贝，则增加所述第二媒体流的播放分贝，以使述第二媒体流的播放分贝不小于所述预设分贝，其中，预设分贝是指满足机器对所述第二媒体流进行语义识别的最低分贝值。

[0166] 在一些实施方式中，所述处理模块202在所述收发模块201在接收目标用户的终端发送的第二媒体流之后，在根据语音识别技术对第二媒体流进行语义分析之前，还用于：

[0167] 分析所述第二媒体流中的数据；

[0168] 若通过分析确定所述第二媒体流中包含噪声数据，则采用以下公式对所述第二媒体流的语音信号进行语音增强处理，得到最优语音信号：

[0169] min i m i z e W T(k)R-1W(k)+(X(k)-X^(k|k-1))TΘ-1(X(k)-X^(k|k-1))+λ||v(k)||1

[0170] subjiect to Y(k)＝CX(k)+n(k)+v(k)

[0171] 其中，X(k)和n(k)为变量，X(k)为卡尔曼滤波算法中对状态值的最优估计，n(k)是对高斯噪声的估计，Θ是高斯噪声的协方差矩阵，v(k)为稀疏噪声；

[0172] 采用卡尔曼滤波算法将所述噪声数据从所述第二媒体流中过滤。

[0173] 在一些实施方式中，所述处理模块202在所述收发模块接收目标用户的终端发送的第二媒体流之后，在根据语音识别技术对第二媒体流进行语义分析之前，还用于：

[0174] 测量所述第二媒体流的播放速度；

[0175] 若所述第二媒体流的播放速度高于预设播放速度，则降低所述第二媒体流的播放速度，以使所述第二媒体流的播放速度不高于预设播放速度。

[0176] 在一些实施方式中，所述处理模块202具体用于：

[0177] 采用分帧或加窗的方式降低所述第二媒体流的播放速度

[0178] 采用交叠分段方式将所述第二媒体流的语音信号分为多个短段，其中，所述第二媒体流的语音信号包括多个视频帧，前一帧和后一帧的交叠部分为帧移；

[0179] 采用可移动的有限长度的窗口对所述多个短段进行加权处理，以降低所述第二媒体流的播放速度。

[0180] 在一些实施方式中，所述处理模块202从所述第二媒体流中提取与逾期还款相关的音频数据之后，所述处理模块将与逾期还款相关的音频数据转换为文字信息之前，还用于：

[0181] 对所述第二媒体流进行测谎分析；

[0182] 若确定所述目标用户存在虚假回答，则根据虚假回答对应的问题选择补强问题，所述补强问题用于引导目标用户回答多个维度的问题；

[0183] 按照问题引导模式向所述目标用户发送所述补强问题；

[0184] 通过所述收发模块接收目标用户针对所述补强问题的回答；

[0185] 对目标用户针对所述补强问题的回答进行语义分析，将所述与逾期还款相关的数据中的虚假回答替换为本次语义分析的结果。

[0186] 需要说明的是，上述图2中所示的收发模块201对应的实体设备为图3所示的收发器，该收发器能够实现收发模块201部分或全部的功能，或者实现与收发模块201相同或相似的功能。

[0187] 图2中所示的处理模块202对应的实体设备为图3所示的处理器，该处理器能够实现处理模块202部分或全部的功能，或者实现与处理模块202相同或相似的功能。

[0188] 上面从模块化功能实体的角度分别介绍了本申请实施例中的装置20，以下从硬件角度介绍一种计算机设备，如图3所示，其包括：处理器、存储器、收发器(也可以是输入输出单元，图3中未标识出)以及存储在所述存储器中并可在所述处理器上运行的计算机程序。例如，该计算机程序可以为图1所对应的实施例中基于人工智能处理信贷数据的方法对应的程序。例如，当计算机设备实现如图2所示的装置20的功能时，所述处理器执行所述计算机程序时实现上述图2所对应的实施例中由装置20执行的基于人工智能处理信贷数据的方法中的各步骤；或者，所述处理器执行所述计算机程序时实现上述图2所对应的实施例的装置20中各模块的功能。又例如，该计算机程序可以为图1所对应的实施例中基于人工智能处理信贷数据的方法对应的程序。

[0189] 所称处理器可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现成可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等，所述处理器是所述计算机设备的控制中心，利用各种接口和线路连接整个计算机设备的各个部分。

[0190] 所述存储器可用于存储所述计算机程序和/或模块，所述处理器通过运行或执行存储在所述存储器内的计算机程序和/或模块，以及调用存储在存储器内的数据，实现所述计算机设备的各种功能。所述存储器可主要包括存储程序区和存储数据区，其中，存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等；存储数据区可存储根据手机的使用所创建的数据(比如音频数据、视频数据等)等。此外，存储器可以包括高速随机存取存储器，还可以包括非易失性存储器，例如硬盘、内存、插接式硬盘，智能存储卡(Smart Media Card,SMC)，安全数字(Secure Digital,SD)卡，闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

[0191] 所述收发器也可以用接收器和发送器代替，可以为相同或者不同的物理实体。为相同的物理实体时，可以统称为收发器。该收发器可以为输入输出单元。

[0192] 所述存储器可以集成在所述处理器中，也可以与所述处理器分开设置。

[0193] 通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM)中，包括若干指令用以使得一台终端(可以是手机，计算机，服务器或者网络设备等)执行本申请各个实施例所述的方法。

[0194] 上面结合附图对本申请的实施例进行了描述，但是本申请并不局限于上述的具体实施方式，上述的具体实施方式仅仅是示意性的，而不是限制性的，本领域的普通技术人员在本申请的启示下，在不脱离本申请宗旨和权利要求所保护的范围情况下，还可做出很多形式，凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换，或直接或间接运用在其他相关的技术领域，这些均属于本申请的保护之内。

标题	发布/更新时间	阅读量
一种训练生成对抗网络、语音增强方法及系统	2020-05-08	199
一种语音信号处理方法、装置、设备及存储介质	2020-05-08	891
一种语音采集识别方法与系统	2020-05-08	792
一种基于定制化模型的轻量级语音识别系统及方法	2020-05-08	916
多音频识别方法、装置、设备及可读存储介质	2020-05-11	563
一种基于语音的动作捕捉数据云分享的控制方法、及其系统	2020-05-08	704
一种订单打印机及打印系统	2020-05-08	943
通过智能手表控制智能家居的系统	2020-05-08	810
一种磁悬浮智能灯	2020-05-08	77
一种参量阵交通声音安全提示系统	2020-05-08	307

基于人工智能处理信贷数据的方法、装置及存储介质

基于人工智能处理信贷数据的方法、装置及存储介质

技术领域

背景技术

具体实施方式

该功能需要专业版企业版VIP权限，您可以：