首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 人工神经网络 / 前馈神经网络 / 多层感知器 / 目标问题的确定方法、装置、服务器和客服机器人

目标问题的确定方法、装置、服务器和客服机器人

阅读:23发布:2020-05-11

专利汇可以提供目标问题的确定方法、装置、服务器和客服机器人专利检索,专利查询,专利分析的服务。并且本 说明书 提供了目标问题的确定方法、装置、 服务器 和客服 机器人 。在一个 实施例 中,目标问题的确定方法在用户提问前,获取目标用户的业务状态数据和历史提问记录;先通过训练好的第一处理模型根据业务状态数据和历史提问记录确定出目标用户的 特征向量 ;再通过比较基于与第一处理模型关联的第二处理模型得到的预设的问题的特征向量,从多个预设问题中确定出特征向量与目标用户的特征向量满足预设的匹配关系的预设问题,作为目标问题。从而能够适用于多种业务场景,在用户提出具体问题之前,高效、准确地预测出用户想要提问的目标问题。,下面是目标问题的确定方法、装置、服务器和客服机器人专利的具体信息内容。

1.一种目标问题的确定方法,包括:
获取目标用户的业务状态数据和历史提问记录;
通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量
根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
2.根据权利要求1所述的方法,在根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题后,所述方法还包括:
检索预设的数据库,获取与所述目标问题对应的答案数据作为目标答案;其中,所述预设的数据库中包括多个预设问题,以及与预设问题对应的答案数据;
向所述目标用户反馈所述目标答案。
3.根据权利要求1所述的方法,通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量,包括:
通过第一处理模型根据所述业务状态数据,确定出目标用户特征;
对所述目标用户特征进行第一类处理,得到第一子向量;对所述历史提问记录进行第二类处理,得到第二子向量;
根据所述第一子向量和所述第二子向量,确定目标用户向量;
利用预设的第一多层感知器对所述目标用户向量进行映射处理,得到所述目标用户的特征向量。
4.根据权利要求1所述的方法,根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题,包括:
计算所述目标用户的特征向量与预设问题的特征向量之间的余弦相似度;
从多个预设问题中筛选出特征向量与所述目标用户的特征向量之间的余弦相似度的绝对值大于等于预设阈值的预设问题作为满足预设的匹配关系的目标问题。
5.根据权利要求1所述的方法,所述预设问题的特征向量保存于KDTree数据结构中。
6.根据权利要求1所述的方法,所述第一处理模型和所述第二处理模型按照以下方式获取:
获取样本用户的样本业务状态数据、样本历史提问记录,以及针对所述样本用户所预测的目标问题;
采集样本用户针对所预测的目标问题的操作数据;
将所述样本用户的样本业务状态数据、样本历史提问记录,以及所预测的目标问题组合,作为样本数据;
根据样本用户针对所预测的目标问题的操作数据,标注所述样本数据,得到标注后的样本数据;
根据所述标注后的样本数据,通过模型训练,得到第一处理模型和第二处理模型。
7.根据权利要求6所述的方法,根据样本用户针对所预测的目标问题的操作数据,标注所述样本数据,包括:
根据样本用户针对所预测的目标问题的操作数据,在确定样本用户选中了所预测的目标问题的情况下,将所述样本数据的标注参数确定为第一数值;
在确定样本用户没有选中所预测的目标问题的情况下,将所述样本数据的标注参数确定为第二数值。
8.根据权利要求7所述的方法,根据所述标注后的样本数据,通过模型训练,得到第一处理模型和第二处理模型,包括:
建立初始的第一处理模型和初始的第二处理模型;
根据所述初始的第一处理模型和初始的第二处理模型,建立关联模型;其中,所述关联模型用于描述所述初始的第一处理模型的模型输出向量与所述初始的第二处理模型的模型输出向量之间的关联度;
将标注后的样本数据中的样本用户的样本业务状态数据、样本历史提问记录作为初始的第一处理模型的模型输入;将标注后的样本数据中的所预测的目标问题作为初始的第二处理模型的模型输入;根据所述标注后的样本数据中的标注参数,训练所述关联模型,得到符合要求的关联模型;
根据所述符合要求的关联模型,确定出所述第一处理模型和所述第二处理模型。
9.根据权利要求1所述的方法,所述业务状态数据包括以下至少之一:业务的开通状态、订单的付款状态、退货状态、物流进度、用户评价。
10.一种目标问题的确定装置,包括:
获取模,用于获取目标用户的业务状态数据和历史提问记录;
第一确定模块,用于通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;
第二确定模块,用于根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
11.根据权利要求10所述的装置,所述装置还包括检索模块和反馈模块,其中,检索模块,用于检索预设的数据库,获取与所述目标问题对应的答案数据作为目标答案;其中,所述预设的数据库中包括多个预设问题,以及与预设问题对应的答案数据;
反馈模块,用于向所述目标用户反馈所述目标答案。
12.根据权利要求10所述的装置,所述第一确定模块包括:
第一确定单元,用于通过第一处理模型根据所述业务状态数据,确定出目标用户特征;
第一处理单元,用于对所述目标用户特征进行第一类处理,得到第一子向量;对所述历史提问记录进行第二类处理,得到第二子向量;
拼接单元,用于根据所述第一子向量和所述第二子向量,确定目标用户向量;
第二处理单元,用于利用预设的第一多层感知器对所述目标用户向量进行映射处理,得到所述目标用户的特征向量。
13.根据权利要求10所述的装置,所述第二确定模块包括:
计算单元,用于计算所述目标用户的特征向量与预设问题的特征向量之间的余弦相似度;
筛选单元,用于从多个预设问题中筛选出特征向量与所述目标用户的特征向量之间的余弦相似度的绝对值大于等于预设阈值的预设问题作为满足预设的匹配关系的目标问题。
14.根据权利要求10所述的装置,所述预设问题的特征向量保存于KDTree数据结构中。
15.根据权利要求10所述的装置,所述装置还包括建模模块,所述建模模块包括:
获取单元,用于获取样本用户的样本业务状态数据、样本历史提问记录,以及针对所述样本用户所预测的目标问题;
采集单元,用于采集样本用户针对所预测的目标问题的操作数据;
组合单元,用于将所述样本用户的样本业务状态数据、样本历史提问记录,以及所预测的目标问题组合,作为样本数据;
标注单元,用于根据样本用户针对所预测的目标问题的操作数据,标注所述样本数据,得到标注后的样本数据;
训练单元,用于根据所述标注后的样本数据,通过模型训练,得到第一处理模型和第二处理模型。
16.根据权利要求15所述的装置,所述标注单元包括:
第一确定子单元,用于根据样本用户针对所预测的目标问题的操作数据,在确定样本用户选中了所预测的目标问题的情况下,将所述样本数据的标注参数确定为第一数值;
第二确定子单元,用于在确定样本用户没有选中所预测的目标问题的情况下,将所述样本数据的标注参数确定为第二数值。
17.根据权利要求16所述的装置,所述训练单元包括:
第一建立子单元,用于建立初始的第一处理模型和初始的第二处理模型;
第二建立子单元,用于根据所述初始的第一处理模型和初始的第二处理模型,建立关联模型;其中,所述关联模型用于描述所述初始的第一处理模型的模型输出向量与所述初始的第二处理模型的模型输出向量之间的关联度;
训练子单元,用于将标注后的样本数据中的样本用户的样本业务状态数据、样本历史提问记录作为初始的第一处理模型的模型输入;将标注后的样本数据中的所预测的目标问题作为初始的第二处理模型的模型输入;根据所述标注后的样本数据中的标注参数,训练所述关联模型,得到符合要求的关联模型;
第三确定子单元,用于根据所述符合要求的关联模型,确定出所述第一处理模型和所述第二处理模型。
18.根据权利要求10所述的装置,所述业务状态数据包括以下至少之一:业务的开通状态、订单的付款状态、退货状态、物流进度、用户评价。
19.一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至9中任一项所述方法的步骤。
20.一种客服机器人,所述客服机器人用于实现权利要求1至9中任一项所述方法的步骤。

说明书全文

目标问题的确定方法、装置、服务器和客服机器人

技术领域

[0001] 本说明书属于互联网技术领域,尤其涉及目标问题的确定方法、装置、服务器和客服机器人。

背景技术

[0002] 在一些具体的应用场景(例如,客服场景等)中,为了提高用户的使用体验,希望能够在用户自己输入想要提问的问题之前,就能自动地预测出用户想要提问的问题,并基于该问题反馈给用户对应的答案。
[0003] 因此,亟需一种能够准确、高效地预测用户想要提问的目标问题的方法。发明内容
[0004] 本说明书提供了一种目标问题的确定方法、装置、服务器和客服机器人,以高效、准确地预测出用户想要提问的目标问题。
[0005] 本说明书提供的一种目标问题的确定方法、装置、服务器和客服机器人是这样实现的:
[0006] 一种目标问题的确定方法,包括:获取目标用户的业务状态数据和历史提问记录;通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量
根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0007] 一种目标问题的确定装置,包括:获取模,用于获取目标用户的业务状态数据和历史提问记录;第一确定模块,用于通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;第二确定模块,用于根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0008] 一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现获取目标用户的业务状态数据和历史提问记录;通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0009] 一种客服机器人,所述客服机器人用于实现获取目标用户的业务状态数据和历史提问记录;通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0010] 本说明书提供的一种目标问题的确定方法、装置、服务器和客服机器人,在用户提问前,获取目标用户的业务状态数据和历史提问记录;先通过训练好的第一处理模型根据业务状态数据和历史提问记录确定出目标用户的特征向量;再通过比较基于与第一处理模型关联的第二处理模型得到的预设的问题的特征向量,从多个预设问题中确定出特征向量与目标用户的特征向量满足预设的匹配关系的预设问题,作为目标问题。从而能够适用于多种业务场景,在用户自己提问之前,高效、准确地预测出用户想要提问的目标问题。附图说明
[0011] 为了更清楚地说明本说明书实施例,下面将对实施例中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0012] 图1是应用本说明书实施例提供的目标问题的确定方法的系统结构组成的一个实施例的示意图;
[0013] 图2是在一个场景示例中,应用本说明书实施例提供的目标问题的确定方法的一种实施例的示意图;
[0014] 图3是在一个场景示例中,应用本说明书实施例提供的目标问题的确定方法的一种实施例的示意图;
[0015] 图4是在一个场景示例中,应用本说明书实施例提供的目标问题的确定方法的一种实施例的示意图;
[0016] 图5是在一个场景示例中,应用本说明书实施例提供的目标问题的确定方法的一种实施例的示意图;
[0017] 图6是在一个场景示例中,应用本说明书实施例提供的目标问题的确定方法的一种实施例的示意图;
[0018] 图7是在一个场景示例中,应用本说明书实施例提供的目标问题的确定方法的一种实施例的示意图;
[0019] 图8是本说明书的一个实施例提供的目标问题的确定方法的流程示意图;
[0020] 图9是本说明书的一个实施例提供的服务器的结构组成示意图;
[0021] 图10是本说明书的一个实施例提供的目标问题的确定装置的结构组成示意图。

具体实施方式

[0022] 为了使本技术领域的人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
[0023] 本说明书实施例提供一种目标问题的确定方法,所述目标问题的确定方法具体可以应用于包含有服务器和客户端设备的系统架构中。具体可以参阅图1所示。上述客户端设备与服务器耦合,相互之间可以进行数据交互。
[0024] 具体的,当目标用户使用客户端设备准备提问时,客户端设备会先获取目标用户的业务状态数据和历史提问记录,并将所获取的目标用户的业务状态数据和历史提问记录发送至服务器。服务器可以通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。从而能够在目标用户提出目标问题之前预测出该目标用户想要提问的目标问题。进一步,服务器还可以通过检索预设的数据库,找到与目标问题对应的答案作为目标答案,并将目标问题和目标答案发送至客户端设备。从而客户端设备可以在目标用户提出目标问题之前就为目标用户展示出目标用户想要提问和了解的目标问题和目标答案。
[0025] 在本实施例中,所述服务器具体可以包括一种应用于业务平台一侧,能够实现数据传输、数据处理等功能的后台负责数据处理的服务器。具体的,所述服务器例如可以为一个具有数据运算、存储功能以及网络交互功能的电子设备。或者,所述服务器也可以为运行于该电子设备中,为数据处理、存储和网络交互提供支持的软件程序。在本实施例中,并不具体限定所述服务器的数量。所述服务器具体可以为一个服务器,也可以为几个服务器,或者,由若干服务器形成的服务器集群。
[0026] 在本实施例中,所述客户端设备具体可以包括一种应用于用户一侧,能够实现数据采集、数据传输等功能的前端设备。具体的,所述客户端设备例如可以为台式电脑、平板电脑笔记本电脑、智能手机、数字助理、智能可穿戴设备、具有网络访问功能的电视机等。或者,所述客户端也可以为能够运行于上述电子设备中的软件应用。例如,可以是在手机上运行的某APP等。
[0027] 在一个场景示例中,参阅图2所示,用户甲使用手机作为客户端设备。手机上安装有XX电商平台的APP。在XX电商平台的APP中进一步还集成、入驻了多个次一级的与网上购物相关联的业务应用程序。例如“快递服务”、“借贷业务”、“好货推荐”、“手机充值”、“火车票”等等。为了方便用户使用,及时地解答用户在使用过程中疑问,除了为XX电商平台设置有客服服务接口外,为上述次一级的业务应用程序,也分别设置了对应的客服服务接口。为了提供用户的使用体验,减少用户提问成本,XX电商平台的服务器还为该平台上的上述次一级的业务应用程序统一提供了训练好的第一处理模型和第二处理模型,以便可以在用户提出疑问之前,自动地预测出用户想要提问的问题,并自动地反馈给用对应的答案。
[0028] 具体的,用户甲之前在XX电商平台上购买了一件商品,目前该商品还没送到。用户想查查该商品相关的快递信息,例如,该商品目前的物流状态、商家所选择快递公司、该商品所对应的快递的运单号等等。但用户自己不知道怎么通过XX电商平台上集成的“快递服务”来查询上述快递信息。
[0029] 这时用户可以参阅图2所示,在XX电商平台的主页面上点击“快递服务”的图标,进入“快递服务”这次一级的业务应用程序的业务页面。在该次一级的“快递服务”的页面中,用户甲可以找到并点击客服图标,进入客服服务界面去了解如何在“快递服务”中查询所关注的快递信息。
[0030] 当用户甲在“快递服务”的业务页面中点击客服图标,以进入“快递服务”的客服务服务界面时,参阅图3所示,手机还会接收并响应用户甲的上述操作,跳转至对应的客服服务界面。同时,手机还会采集用户甲当前在XX电商平台上的业务状态数据,例如,用户甲购买商品的订单、商品订单的付款状态、商品订单所对应的商品的接收状态等等。同时,手机还会搜集用户甲近段时间,例如最近一周,在“快递服务”、XX电商平台,以及其他次一级的应用业务程序的客服服务中提问咨询的问题作为历史提问记录。例如,手机搜集到用户甲在两天前,在XX电商平台的客服服务中提问的问题:“如何在XX电商平台购买商品”,以及用户甲在五天前,在次一级的业务应用程序“优惠商品推荐”的客服服务中提问的问题“如何寻找打折商品”等记录作为上述历史提问记录。当然,需要说明的是上述所列举的业务状态数据和历史提问记录只是一种示意性说明。根据具体情况,上述业务状态数据和历史提问记录还可以包括其他数据。对此,本说明书不作限定。
[0031] 手机在按照上述方式采集到用户甲的上述业务状态数据和历史提问记录后,可以在用户甲具体提问之前,将上述业务状态数据和历史提问记录发送至“快递服务”的客服服务器。
[0032] “快递服务”的客服服务器在接收到上述用户甲的业务状态数据和历史提问记录后,可以先根据上述数据来预测用户甲最有可能提问的目标问题,从而能够在用户甲提问之前找到并通过“快递服务”的客服服务向用户甲反馈目标问题的答案。这样不需要用户甲自己再输入具体的问题进行提问,使得用户的提问更加简便,减少了用户的提问成本。同时,由于是在用户提问之前就猜出了用户想要提问的问题,并反馈给对应的答案,使得用户感情上会觉得很贴心、很人性化,提高了用户的使用体验。
[0033] 在本场景示例中,参阅图4所示,“快递服务”的客服服务器可以利用XX电商平台统一提供的训练好的相互关联的第一处理模型和第二处理模型来预测用户甲想要提问的目标问题。其中,上述第一处理模型(为了方便区分,可以记为Factor2Vec等)具体可以用于根据用户的业务状态数据和用户的历史提问记录,确定出对应的能够反映用户的业务状态数据和用户的历史提问记录所包含的相关信息的特征向量。上述第二处理模型(为了方便区分,可以记为Know2Vec等)具体用于对客服服务器预先准备的多个预设问题(例如标问等)分别进行处理,确定出与各个预设问题对应的特征向量。需要说明的是,上述第一处理模型和第二处理模型并不是针对某一个具体特定的业务场景设计、训练的,因此在XX电商平台,以及入驻该电商平台上的次一级的业务应用程序的客服服务器都可以调用上述第一处理模型和第二处理模型。这样XX电商平台可以不用分别单独为每一个次一级的业务应用程序所对应的具体的业务场景另外再训练建立对应的用于预测用户提问的分类模型。
[0034] 具体实施时,“快递服务”的客服服务器可以预先准备多个用户可能提问的问题作为预设问题,并确定出各个预设问题所对应的答案数据;将相互对应的预设问题和答案数据存储在“快递服务”的预设的数据库中,并建立预设问题和答案数据的对应关系。进一步,客服服务器可以调用第二处理模型,对预设的数据库中的各个预设问题进行处理,得到各个预设问题的特征向量。
[0035] 具体的,“快递服务”的客服服务器可以将多个预设问题作为模型输入,分别依次输入至第二处理模型中,并运行第二处理模型。参阅图5所示,第二处理模型具体运行时,可以先对所输入的预设问题进行编码,并得到对应的表示向量。例如,可以利用第二处理模型将预设问题拆分成多个词,再利用第二处理模型中的已经训练好的词嵌入向量(WordEmbedding)将上述多个词按顺序依次转换成一定长度的词向量,根据上述多个词的词向量组合得到对应预设问题的表示向量。进一步,第二处理模型可以根据上述表示向量,确定出对应的特征向量作为模型输出。例如,第二处理模型,可以先将上述表示向量输入至第二处理模型中的已经训练好的LSTM(Long Short Term Memory,长短期记忆网络)模型进行编码,再将编码后的数据输入至第二处理模型中的已经训练好的第二多层感知器(MultipleLayer Perceptron,MLP)进行处理,得到对应该预设问题的特征向量作为模型输出。从而可以得到多个预设问题中的各个预设问题的特征向量,并保存上述预设问题的特征向量,以备后续查询使用。
[0036] 在本场景实施例中,“快递服务”的客服服务器在接收到手机发送的用户甲的业务状态数据和历史提问记录后,可以调用第一处理模型对上述用户甲的业务状态数据和历史提问记录进行处理,确定出对应的特征向量。具体的,参阅图6所示,客服服务器可以将上述用户甲的业务状态数据和历史提问记录作为第一处理模型的模型输入,输入至第一处理模型中,运行第一处理模型,得到对应的模型输出,作为对应的用户甲的特征向量。
[0037] 第一处理模型具体运行时,可以先从上述业务状态数据中提取用户甲的用户特征(也可以称为因子特征),例如,订单金额“50”元,订单状态为“已支付”等关键参数。进一步,可以对上述用户特征进行第一类处理,得到对应的第一子向量。
[0038] 第一处理模型在对用户甲的用户特征具体进行第一类处理时,可以先确定上述用户特征的类型,并采用与用户类型匹配的处理方式对上述用户特征进行具体处理,得到对应的第一类子向量。
[0039] 具体的,在确定用户特征为连续性特征(例如,金额数据“10至50”或“500至1000”等)时,第一处理模型可以通过特征处理器采用等量分桶处理方案,将金额数据映射到向量的多个维度中的一维。例如,将“10至50”元表示为以下向量形式:[0,1,0,0,0],或将“500至1000”元表示为以下向量形式:[0,0,0,0,1]等。
[0040] 在确定用户特征为离散性特征(例如,状态特征“已支付”或“已完成”等)时,可以通过特征处理器将每一个枚举值映射到向量的多个维度中的一维。例如,可以将“已支付”表示为以下向量形式:[0,1,0,0],或将“已完成”表示为以下向量形式:[0,0,1,0]等。
[0041] 按照上述方式第一处理模型可以根据用户甲的业务状态数据得到对应的第一子向量。对于用户甲的历史提问记录,由于历史提问记录与基于业务状态数据所提取的用户特征不同,往往历史提问记录是一句完整的文本语句,而不是单独的文本词组,要处理的数据特点不同。因此,在处理用户甲的历史提问记录时,可以通过区别于第一类处理的,针对文本语句的第二类处理来对用户甲的历史提问记录进行处理,以得到对应的第二子向量。
[0042] 第一处理模型在具体对用户甲的历史提问记录进行第二类处理时,可以先通过词嵌入向量将上述历史提问记录转化为对应的表示向量。进而可以将上述历史提问记录的表示向量输入至第一处理模型中已经训练好的Contextual LSTM(CLSTM)模型进行编码,得到对应的第二子向量。
[0043] 其中,上述第一子向量和第二子向量维度相同。因此,第一处理模型进一步可以将第一子向量和第二子向量通过加权平均,得到能够综合了第一子向量信息和第二子向量信息的目标用户向量。
[0044] 进一步,第一处理模型可以将上述用户甲的目标用户向量输入至第一处理模型中已经训练好的第一多层感知器(MLP)进行映射处理,得到能够有效地反映用户甲的业务状态数据和历史提问记录中所包含的特征的用户甲的目标用户的特征向量。
[0045] 需要说明的是,由于上述第一处理模型和第二处理模型是相互关联的,两个模型是XX电商平台服务器事先关联在一起训练得到的。因此,当通过上述第一处理模型和第二处理模型分别对相互存在关联的模型输入进行处理,分别输出的对应向量也会满足一定的匹配关系。例如,输出的两个向量近似度会相对较高,表现出较高的关联。
[0046] 因此,在本实施例中,“快递服务”的客服服务器在通过第一处理模型对用户甲的业务状态数据和历史提问记录进行处理,得到对应的用户甲的目标用户的特征向量后,进一步可以以上述目标用户的特征向量作为索引,检索预设的数据库中所存储的预设问题的特征向量,找到与目标用户的特征向量较为接近、关联度较高的特征向量作为满足预设的匹配关系的特征向量,进而可以将上述满足预设的匹配关系的特征向量所对应的问题,确定为与用户甲的业务状态数据和历史提问记录关联度较高的目标问题,即基于用户甲的业务状态和历史提问记录所预测的用户甲最有可能提问的问题。
[0047] 具体的,“快递服务”的客服服务器可以分别计算用户甲的目标用户的特征向量与预设的数据库中存储的各个预设问题的特征向量之间的余弦(cosine)相似度;再从多个预设问题中筛选出特征向量与用户甲的目标用户的特征向量之间的余弦相似度的绝对值大于等于预设阈值的预设问题作为满足预设的匹配关系的目标问题。
[0048] 通常预设问题的特征向量与用户的目标用户的特征向量之间的余弦相似度绝对值越接近于1,则说明上述两个特征向量所分别对应的预设问题和用户的业务状态数据和历史提问记录之间的关联度越高。
[0049] 在本场景示例中,上述预设阈值的具体数值可以设置为0.7。当然,上述所列举的预设阈值只是一种示意性说明。具体实施时,根据具体的应用场景和精度要求,还可以设置其他合适的数值作为上述预设阈值。对此,本说明书不作限定。
[0050] “快递服务”的客服服务器在按照上述方式,可以确定出与用户甲的业务状态数据和历史提问记录满足预设的匹配关系的预设问题为:“如何查询快递信息”,并将该问题确定为用户甲最有可能提问的目标问题。进一步,可以根据该目标问题,检索预设的数据库,找到与该目标问题对应的答案数据作为目标答案,并将该目标答案发送至用户甲的手机。
[0051] 用户甲的手机在接收到上述目标答案后,参阅图7所示,可以在用户刚点击进入的“快递服务”的客服服务界面中,在用户自己输入具体的问题之前,向用户甲展示出上述目标答案。当然,具体实施时,客户端设备还可以同时在“快递服务”的客服服务界面中展示所预测出来的目标问题。
[0052] 这样用户甲不需要在客服服务界面输入自己想要问的问题,就能够看到自己想要提问的问题的答案,有效地降低了用户的提问成本,提高了用户的使用体验。
[0053] 在另一个场景示例中,当上述XX电商平台集成、入驻一个新的业务应用程序,例如A业务应用程序时,XX电商平台可以不需要单独为A业务应用程序专训练适用于该业务应用程序所对应的业务场景的提问模型,而只需要开放A业务应用程序的客服服务器调用第一处理模型和第二处理模型的调用权限。这样A业务应用程序的客服服务器可以先建立对应A业务应用程序的预设的数据库,该预设的数据库中可以存储有预先准备好的多个预设问题,以及与预设问题对应答案数据。进一步,服务器可以再调用第二处理模型对上述多个预设问题分别进行处理,确定出多个预设的问题的特征向量。
[0054] 这样当用户在使用业务应用程序A时有什么疑问,点击进入业务应用程序A客服服务界面后,按照上述方式也会自动触发获取该用户的业务状态数据和历史提问记录,进而业务应用程序A客服服务器可以通过第一处理模型对上述用户的业务状态数据和历史提问记录进行处理,确定出对应该用户的目标用户的特征向量。再基于上述目标用户的特征向量,检索到特征向量与目标用户的特征向量满足预设的匹配关系的目标问题,并将目标问题所对应的目标答案连同上述目标问题在用户提问之前,及时地反馈给用户。从而能够使得XX电商平台快速地适用、对接新接入的业务场景,而不需要另外再针对新接入的业务场景耗费大量的时间、资源来训练对应的提问模型。
[0055] 可见,基于上述目标问题的确定方法,任意一个新接入、入驻XX电商平台的相关的业务应用程序,都能够通过调用预先训练好的、适用范围相对较广的第一处理模型和第二处理模型,进行该业务应用程序所针对的业务场景的客服服务。
[0056] 在本场景示例中,为了提高客服服务器检索满足预设的匹配关系的目标问题的效率,具体实施时,在客服服务器利用第二处理模型确定出各个预设问题的特征向量后,可以将预设问题的特征向量先保存在KDTree(k-dimensional树,一种分割k维数据空间的数据结构)数据结构中。进而在确定出目标用户的特征向量后,可以通过二分查找的方式在上述KDTree中进行搜索、查找,以便快速地确定出满足预设的匹配关系的预设问题的特征向量。通过上述方式可以有效地降低检索时的复杂度,提高检索效率,降低用户的等待时间,进一步提高用户的使用体验。
[0057] 在本场景示例中,业务应用程序A客服服务器针对同一个目标用户的特征向量,可能会检索到多个特征向量满足预设的匹配关系的目标问题。这时,客服服务器可以根据获取上述多个目标问题所对应的多个目标答案,将上述多个目标答案连同多个目标问题一同反馈给用户。也可以采用预设的融合规则,将多个目标答案进行相应合并组合后,将组合后的目标答案反馈给用户。还可以将上述多个目标问题按照预设的排序规则进行排序。例如,按照近期XX电商平台上用户总体的搜索热度进行排序,只将排序最靠前的目标问题的目标答案反馈给用户等等。从而能更加合理、多样化地向用户反馈目标答案,进一步提高了用户的使用体验。
[0058] 参阅图8所示,本说明书实施例提供了一种目标问题的确定方法,其中,该方法具体应用于服务器一侧。具体实施时,该方法可以包括以下内容。
[0059] S801:获取目标用户的业务状态数据和历史提问记录。
[0060] 在一些实施例中,上述目标用户具体可以包括在使用当前的业务应用程序时想要提问的用户。例如,点击进入当前业务应用程序的客服服务界面的用户。需要说明的是,上述目标用户虽然点击进入了对应的客服服务界面但并没有直接输入自己想要提问的问题。上述目标用户还可以包括真实的生活场景中在使用实体产品或者享受具体服务时存在疑问的用户。例如,正在无人超市中购物但不知道怎么结账的用户等。当然,上述所列举的目标用户只是一种示意性说明。具体实施时,根据具体的应用场景,上述目标用户还可以包括其他类型的用户。对此,本说明书不作限定。
[0061] 在一些实施例中,上述目标用户的业务状态数据具体可以在包括:预设时间段内,例如最近一周,或者当前,业务应用程序所记录的对应业务场景下与目标用户相关的业务数据。具体的,上述业务状态数据可以包括:业务的开通状态、订单的付款状态、退货状态、物流进度、用户评价等等。当然,需要说明的是,上述所列举的业务状态数据只是一种示意性说明。具体实施时,根据具体的业务应用程序所针对的业务场景,上述业务状态数据还可以包括其他类型的数据。对此,本说明书不作限定。
[0062] 在一些实施例中,上述历史提问记录具体可以包括:历史上的一段时间内,例如最近3天,目标用户针对当前业务应用程序或者其他相关业务应用程序在对应的客服服务界面中咨询过的问题记录。
[0063] 在一些实施例中,具体实施时,当用户点击客户端设备上的业务应用程序的客服图标时,会触发进入该业务应用程序的客服服务界面。同时,还会触发客户端设备采集获取目标用户的业务状态数据,以及历史提问记录,并将上述目标用户的业务状态数据,以及历史提问记录发送至负责业务应用程序的客服工作的客服服务器。相应的,客服服务器可以通过客户端设备获取得到上述目标用户的业务状态数据和历史提问记录。
[0064] S803:通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量。
[0065] 在一些实施例中,客服服务器在得到上述目标用户的业务状态数据和历史提问记录后,可以调用第一处理模型对上述业务状态数据和历史提问记录确定出对应的目标用户的特征向量。
[0066] 其中,上述第一处理模型具体可以包括一种预先和第二处理模型一同训练得到的,能够按照一定的规则将目标用户的业务状态数据和历史提问记录映射成一种特征向量的,与第二处理模型关联的模型。上述目标用户的特征向量具体可以包括一种能够有效地反映目标用户的业务状态数据和历史提问记录中所包含的相关信息的特征向量数据。
[0067] 在本实施例中,具体实施时,客服服务器可以将所获取的目标用户的业务状态数据和历史提问记录作为模型输入,输入至第一处理模型;并运行第一处理模型,得到对应的模型输出,作为目标用户的特征向量。
[0068] 在一些实施例中,上述第一处理模型具体运行时,由于业务状态数据和历史提问记录两种数据之间存在差异,可以根据两种数据各自的特点进行区分处理。
[0069] 具体的,对于业务状态数据,往往其中的某些参数会包含有较为关注的信息。因此,第一处理模型可以通过从业务状态数据中提取所关注的关键参数,来获取业务状态数据中所包含的目标用户特征。其中,上述关键参数据具体可以包括:业务状态数据中的订单金额、订单日期、订单状态等等。当然,上述所列举的关键参数只是一种示意性说明。具体实施时,根据具体情况,上述关键参数还可以包括其他类型的参数。
[0070] 在提取到上述目标用户特征后,进一步可以对目标用户特征进行第一类处理,得到对应的第一子向量。
[0071] 具体的,第一处理模型可以先确定目标用户特征的类型是离散性特征还是连续性特征,再对不同类型的目标用户特征采用对应的映射处理方式进行向量映射,得到对应的第一子向量。
[0072] 在一些实施例中,具体实施时,上述第一处理模型还可以利用Wide and Deep模型结构中的Wide结构对上述目标用户特征进行归一化和离散化处理,得到对应的多维向量,作为对应的第一子向量。
[0073] 考虑到历史提问记录中的文本数据往往在一个文本语句中会包含有较为关注的信息,因此,不同于对业务状态数据的处理,第一处理模型会对历史提问记录进行第二类处理,以确定出对应的第二子向量。
[0074] 具体的,第一处理模型可以先通过词嵌入向量将上述历史提问记录转化为对应的表示向量。进而可以将上述历史提问记录的表示向量输入至第一处理模型中已经训练好的Contextual LSTM(CLSTM)模型进行编码,得到对应的第二子向量。
[0075] 在一些实施例中,具体实施时,上述第一处理模型还可以利用Wide and Deep模型结构中的Deep结构对上述历史提问记录进行映射和编码处理,得到对应的多维向量,作为对应的第二子向量。
[0076] 其中,上述第一子向量和第二子向量可以是维度相同的向量。这样第一处理模型在得到上述第一子向量和第二子向量后,第一处理模型进一步会将上述第一子向量和第二子向量进行加权平均,得到能够综合第一子向量和第二子向量的信息的目标用户向量。
[0077] 但是目前得到的目标用户向量的方式和规则,并不完全与确定预设问题的特征向量所基于的方式和规则相关联。因此,进一步,第一处理模型还会将上述目标用户向量输入至第一处理模型中已经训练好的第一多层感知器进行映射处理,从而得到能够有效地反映目标用户的业务状态数据和历史提问记录中所包含的相关信息的目标用户的特征向量。并且,按照上述方式所确定的目标用户的特征向量的方式和规则与确定预设问题的特征向量的方式和规则是关联的。这样后续,才可以根据目标用户的特征向量和预设问题的特征向量,找到与目标应用的业务状态数据和历史提问记录关联度较高的预设问题。
[0078] 在一些实施例中,客服服务器具体实施时,可以先通过第一处理模型根据所述业务状态数据,确定出目标用户特征;对所述目标用户特征进行第一类处理,得到第一子向量;对所述历史提问记录进行第二类处理,得到第二子向量,其中,所述第一子向量和所述第二子向量的向量维度相同;再根据所述第一子向量和所述第二子向量,确定目标用户向量;最后利用预设的第一多层感知器对所述目标用户向量进行映射处理,得到所述目标用户的特征向量。
[0079] S805:根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0080] 在一些实施例中,客服服务器可以根据事先根据所针对业务场景设置多个用户可能会提问的问题作为预设问题,并确定出与各个预设问题对应的答案数据。将上述多个预设问题,以及对应的答案数据存在预设的数据库中,并建立预设问题和答案数据的对应关系。这样后续客服服务器可以通过查询预设的数据库找到预设问题所对应的答案数据。
[0081] 在一些实施例中,在具体实施时之前,客服服务器还可以调用第二处理模型对预设的数据库中的多个预设问题分别进行处理,以确定出多个预设问题的特征向量。
[0082] 其中,上述第二处理模型具体可以包括一种预先和第一处理模型一同训练得到的,能够按照一定的规则将预设问题映射成一种特征向量,与第一处理模型关联的模型。上述预设问题的特征向量具体可以包括一种能够有效地反映预设问题所包含的相关信息的特征向量数据。
[0083] 在本实施例中,具体实施时,客服服务器可以将预设问题作为模型输入,输入至上述第二处理模型;并运行上述第二处理模型,得到对应的模型输出,作为上述预设问题的特征向量。
[0084] 在一些实施例中,上述第二处理模型具体运行时,可以利用第二处理模型中已经训练好的词嵌入向量确定出预设问题的表示向量。进一步,第二处理模型可以将上述表示向量输入至第二处理模型中已经训练好的LSTM模型进行编码,再将编码后的数据输入至第二处理模型中已经训练好的第二多层感知器中进行处理,得到对应的输出数据作为预设的问题的特征向量。客服服务器可以保存上述预设问题的特征向量,以便后续使用。
[0085] 在本实施例中,客服服务器可以根据目标用户的特征向量,通过寻找特征向量与目标用户的特征向量关联度较高的预设问题作为上述满足预设的匹配关系的预设问题。
[0086] 考虑到,通常预设问题的特征向量与目标用户的特征向量关联度较高或者数值较为接近,说明预设问题与目标用户的业务状态数据和历史提问记录越相关,相对的,该目标用户基于该用户的当前情况具有较高的概率提问该预设问题。因此,客服服务器可以将上述特征向量满足预设的匹配关系的预设问题确定为目标用户具有较高概率会提问的目标问题。
[0087] 在一些实施例中,客服服务器具体可以通过计算并根据目标用户的特征向量与预设问题的特征向量之间的余弦相似度来判断目标用户的特征向量与预设问题的特征向量之间的关联度。
[0088] 具体的,客服服务器可以先计算所述目标用户的特征向量与多个预设问题中的各个预设问题的特征向量之间的余弦相似度。再根据余弦相似度的数值的绝对值,从多个预设问题的特征向量中筛选出特征向量与所述目标用户的特征向量之间的余弦相似度的绝对值大于等于预设阈值的预设问题的特征向量,作为与目标用户的特征向量较为关联、接近的特征向量,并将该特征向量所对应的预设问题确定为满足预设的匹配关系的目标问题。
[0089] 在一些实施例中,上述预设阈值具体可以根据具体应用场景和精度要求灵活设置。具体的,例如,上述预设阈值可以设置为0.7,也可以设置为其他接近于1的数值。
[0090] 在一些实施例中,具体实施时,客服服务器也可以先计算所述目标用户的特征向量与多个预设问题中的各个预设问题的特征向量之间的余弦相似度。再根据余弦相似度的数值的绝对值,从多个预设问题中筛选出与目标用户的特征向量的余弦相似度的绝对值最大的预设问题,作为上述满足预设的匹配关系的目标问题。
[0091] 在一些实施例中,客服服务器在按照上述方式确定出目标问题后,还可以查询预设的数据库,确定出与目标问题对应的答案数据作为目标答案。进而可以将目标答案反馈给客户端设备。客户端设备在接收到上述目标答案后,可以在用户输入想要提问的问题之前,通过客服服务界面将用户想要提问的目标问题的目标答案展示给用户。避免用户自己输入问题,降低了用户的提问成本。
[0092] 在一些实施例中,客服服务器还可以将目标问题连同对应的目标答案一同反馈给客户端设备。客户端设备可以在用户提问之前,通过客服服务界面向用户同时展示出用户想要提问的目标问题和目标答案。
[0093] 需要说明的是,上述目标问题的确定方法仅以服务器作为执行主体进行说明,上述目标问题的确定方法还可以拓展应用于其他具备数据处理能的客户端设备上。例如,用户使用的智能手机、平板电脑、计算机等等。这样,客户端设备可以不需要依赖客服服务器,直接利用客户端设备的本地资源,就能根据所获取的目标用户的业务状态数据和历史提问记录,确定出目标用户想要提问的目标问题。从而减少了与服务器交互带来的耗时,进一步提高了处理效率。
[0094] 在本实施例中,由于在用户提问前,获取目标用户的业务状态数据和历史提问记录;先通过训练好的第一处理模型根据业务状态数据和历史提问记录确定出目标用户的特征向量;再通过比较基于与第一处理模型关联的第二处理模型得到的预设的问题的特征向量,从多个预设问题中确定出特征向量与目标用户的特征向量满足预设的匹配关系的预设问题,作为目标问题。从而能够适用于多种业务场景,高效、准确地预测出用户想要提问的目标问题。
[0095] 在一些实施例中,在根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题后,所述方法具体实施时,还可以包括以下内容:检索预设的数据库,获取与所述目标问题对应的答案数据作为目标答案;其中,所述预设的数据库中包括多个预设问题,以及与预设问题对应的答案数据;向所述目标用户反馈所述目标答案。
[0096] 在本实施例中,具体实施时,还可以将目标答案连同目标问题一同反馈给目标用户。此外,还可以获取目标用户对所反馈的目标问题和目标答案的评价数据。例如,如果目标用户觉得所反馈的目标问题和目标答案是自己想要提问和了解的数据,则可以回复一个正向的评价信息。如果目标用户觉得所反馈的目标问题和目标答案不是自己想要提问和了解的数据,则可以回复一个负向的评价信息。进而可以根据上述负向的评价信息有针对性地对所使用的第一处理模型和第二处理模型进行调整,以提高确定目标问题的准确度。
[0097] 在一些实施例中,上述通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量,具体实施时,可以包括以下内容:通过第一处理模型根据所述业务状态数据,确定出目标用户特征;对所述目标用户特征进行第一类处理,得到第一子向量;对所述历史提问记录进行第二类处理,得到第二子向量,其中,所述第一子向量和所述第二子向量的向量维度相同;根据所述第一子向量和所述第二子向量,确定目标用户向量;利用预设的第一多层感知器对所述目标用户向量进行映射处理,得到所述目标用户的特征向量。
[0098] 在一些实施例中,所述业务状态数据具体可以包括以下至少之一:业务的开通状态、订单的付款状态、退货状态、物流进度、用户评价等等。当然,需要说明的是,上述所列举的业务状态数据只是一种示意性说明。具体实施时,根据具体的业务场景,还可以包括有其他类型的业务状态数据。对此,本说明书不作限定。
[0099] 在一些实施例中,上述根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题,具体实施时,可以包括以下内容:计算所述目标用户的特征向量与预设问题的特征向量之间的余弦相似度;从多个预设问题中筛选出特征向量与所述目标用户的特征向量之间的余弦相似度的绝对值大于等于预设阈值的预设问题作为满足预设的匹配关系的目标问题。
[0100] 在一些实施例中,具体实施时,在计算所述目标用户的特征向量与预设问题的特征向量之间的余弦相似度后,还可以从多个预设问题中筛选出特征向量与所述目标用户的特征向量之间的余弦相似度的绝对值最大的预设问题作为上述满足预设的匹配关系的目标问题。
[0101] 在一些实施例中,具体实施时,还可以根据余弦相似度,从多个预设问题中筛选出特征向量与所述目标用户的特征向量之间的余弦相似度的绝对值大于等于预设阈值的多个预设问题作为满足预设的匹配关系的多个目标问题。进一步,针对多个目标问题,可以根据近期用户的总体搜索热度,从多个目标问题中筛选出搜索热度最高的目标问题作为最终的目标问题,并只将最终的目标问题的目标答案反馈给目标用户。也可以查询得到多个目标问题对应的多个目标答案,再对多个目标答案进行融合,将融合后的目标答案反馈给目标用户。
[0102] 在一个实施例中,所述预设问题的特征向量具体可以保存于KDTree等数据结构中。
[0103] 在本实施例中,在通过调用第二处理模型确定出预设问题的特征向量后可以将预设问题的特征向量统一保存在KDTree数据结构中。这样在根据目标用户的特征向量,检索预设问题的特征向量时,可以通过对KDTree数据结构中保存的预设问题的特征向量采用二分查找方式进行检索,以找到与目标用户的特征向量之间的余弦相似度的绝对值大于等于预设阈值的预设问题的特征向量,从而能够有效地降低上述处理的复杂度,提高了处理效率。
[0104] 在本实施例中,需要补充的是,上述所列举的KDTree数据结构只是一种示意性说明。具体实施时,根据具体情况,也可以采用其他合适的数据结构来保存预设问题的特征向量。
[0105] 在一些实施例中,为了使得第一处理模型和第二处理模型所得到的模型输出向量符合相同的表征方式和规则,可以将第一处理模型和第二处理模型关联在一起进行模型训练,以得到相互关联的第一处理模型和第二处理模型。
[0106] 在一些实施例中,上述第一处理模型和第二处理模型可以按照以下方式获取:获取样本用户的样本业务状态数据、样本历史提问记录,以及针对所述样本用户所预测的目标问题;采集样本用户针对所预测的目标问题的操作数据;将所述样本用户的样本业务状态数据、样本历史提问记录,以及所预测的目标问题组合,作为样本数据;根据样本用户针对所预测的目标问题的操作数据,标注所述样本数据,得到标注后的样本数据;根据所述标注后的样本数据,通过模型训练,得到第一处理模型和第二处理模型。
[0107] 在本实施例中,具体实施时,也可以根据近期问题的搜索热度,确定出推荐给样本用户的问题作为上述目标问题。
[0108] 在本实施例中,具体实施时,可以向样本用户展示出上述目标问题。样本用户如果认可所预测的目标问题可以通过点击确定图标等操作选中该目标问题,确认所预测的目标问题是准确的。如果不认为所预测的目标问题可以通过点击关闭图标等操作,确认所预测的目标问题不准确。进而可以采集获取上述操作数据。
[0109] 在一些实施例中,上述根据样本用户针对所预测的目标问题的操作数据,标注所述样本数据,具体实施时,可以包括以下内容:根据样本用户针对所预测的目标问题的操作数据,在确定样本用户选中了所预测的目标问题的情况下,将所述样本数据的标注参数确定为第一数值;在确定样本用户没有选中所预测的目标问题的情况下,将所述样本数据的标注参数确定为第二数值。
[0110] 在本实施例中,上述第一数值可以为1,用于标注该组样本数据中所预测的目标问题是与样本用户的样本业务状态数据、样本历史提问记录关联的。上述第二数值可以为0,用于标注该组样本数据中所预测的目标问题是与样本用户的样本业务状态数据、样本历史提问记录不关联的。当然,上述所列举的第一数值和第二数值只是一种示意性说明。具体实施时,根据具体情况,也可以将上述第一数值和第二数值分别设置为其他不同的数值。
[0111] 在一些实施例中,上述根据所述标注后的样本数据,通过模型训练,得到第一处理模型和第二处理模型,具体实施时,可以包括以下内容:建立初始的第一处理模型和初始的第二处理模型;根据所述初始的第一处理模型和初始的第二处理模型,建立关联模型;其中,所述关联模型用于描述所述初始的第一处理模型的模型输出向量与所述初始的第二处理模型的模型输出向量之间的关联度;将标注后的样本数据中的样本用户的样本业务状态数据、样本历史提问记录作为初始的第一处理模型的模型输入;将标注后的样本数据中的所预测的目标问题作为初始的第二处理模型的模型输入;根据所述标注后的样本数据中的标注参数训练所述关联模型,得到符合要求的关联模型;根据所述符合要求的关联模型,确定出所述第一处理模型和所述第二处理模型。
[0112] 在本实施例中,上述符合要求的关联模型具体可以包括一种针对标注后的样本数据,得到的第一处理模型的模型输出向量和基于第二处理模型的模型输出向量之间的关联度结果与标注参数的差异小于误差容忍范围的模型。
[0113] 在本实施例中,在确定出上述符合要求的联合模型后,可以将上述联合模型中的第一处理模型作为目标问题的确定方法中所使用的第一处理模型,将上述联合模型中的第二处理模型作为目标问题的确定方法中所使用的第二处理模型,从而得到较为准确的相互关联的第一处理模型和第二处理模型。
[0114] 由上可见,本说明书实施例提供的目标问题的确定方法,由于在用户提问前,获取目标用户的业务状态数据和历史提问记录;先通过训练好的第一处理模型根据业务状态数据和历史提问记录确定出目标用户的特征向量;再通过比较基于与第一处理模型关联的第二处理模型得到的预设的问题的特征向量,从多个预设问题中确定出特征向量与目标用户的特征向量满足预设的匹配关系的预设问题,作为目标问题。从而能够适用于多种业务场景,高效、准确地预测出用户想要提问的目标问题。还通过根据目标用户的特征向量和预设问题的特征向量来确定与目标用户关联度较高的预设问题作为目标问题,从而不需要再针对具体的业务场景训练对应的分类模型来预测目标用户的目标问题,使得上述目标问题的确定方法具有更广泛的适用性,能够有效地适用于多种不同的业务场景。
[0115] 本说明书实施例还提供一种服务器,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取目标用户的业务状态数据和历史提问记录;通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0116] 为了能够更加准确地完成上述指令,参阅图9所示,本说明书实施例还提供了另一种具体的服务器,其中,所述服务器包括网络通信端口901、处理器902以及存储器903,上述结构通过内部线缆相连,以便各个结构可以进行具体的数据交互。
[0117] 其中,所述网络通信端口901,具体可以用于获取目标用户的业务状态数据和历史提问记录。
[0118] 所述处理器902,具体可以用于通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0119] 所述存储器903,具体可以用于存储相应的指令程序。
[0120] 在本实施例中,所述网络通信端口901可以是与不同的通信协议进行绑定,从而可以发送或接收不同数据的虚拟端口。例如,所述网络通信端口可以是负责进行web数据通信的80号端口,也可以是负责进行FTP数据通信的21号端口,还可以是负责进行邮件数据通信的25号端口。此外,所述网络通信端口还可以是实体的通信接口或者通信芯片。例如,其可以为无线移动网络通信芯片,如GSM、CDMA等;其还可以为Wifi芯片;其还可以为蓝牙芯片。
[0121] 在本实施例中,所述处理器902可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。本说明书并不作限定。
[0122] 在本实施例中,所述存储器903可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
[0123] 本说明书实施例还提供一种客户端设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器具体实施时可以根据指令执行以下步骤:获取目标用户的业务状态数据和历史提问记录;通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0124] 本说明书实施例还提供了一种基于上述目标问题的确定方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现:获取目标用户的业务状态数据和历史提问记录;通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0125] 在本实施例中,上述存储介质包括但不限于随机存取存储器(Random Access Memory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard Disk Drive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
[0126] 在本实施例中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
[0127] 本说明书实施例还提供了一种客服机器人,所述客服机器人具体实施时,可以用于实现:获取目标用户的业务状态数据和历史提问记录;通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0128] 在本实施例中,上述客服机器人具体可以是一种布设于具体场景中的实体机器人设备。例如,可以是布设在列车上负责为乘客咨询答疑的列车客服机器人,也可以是布设在商场负责为消费者答疑提供建议的商场客服机器人等。上述客服机器人可以包括:交互设备、信号收发器、处理等。其中,上述交互设备具体可以包括:摄像头、麦克、收音器等。通过上述交互设备,客服机器人可以及时发现并响应目标用户的提问需求,进而会通过信号收发器通过端服务器搜集该目标用户的业务状态数据和历史提问记录。进一步可以通过处理器调用第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。客服机器人在按照上述方式确定出目标问题后,可以通过检索预设的数据库,找到目标问题对应的目标答案。从而能够在目标用户具体提出目标问题之前,通过交互设备告知目标用户想要提问的目标问题的目标答案。
[0129] 在本实施例中,上述客服机器人具体还可以是一种布设并应用于用户所使用的客户端设备中的虚拟的客服机器人答复程序。通过该客服机器人答复程序可以利用客户端设备获取目标用户的业务状态数据和历史提问记录;通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量;根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。进而根据目标问题,检索预设的数据库确定出对应的目标答案。并通过客户端设备向目标用户及时地展示出上述目标答案。
[0130] 参阅图10所示,在软件层面上,本说明书实施例还提供了一种目标问题的确定装置,该装置具体可以包括以下的结构模块。
[0131] 获取模块1001,具体可以用于获取目标用户的业务状态数据和历史提问记录。
[0132] 第一确定模块1003,具体可以用于通过第一处理模型根据所述业务状态数据和所述历史提问记录确定目标用户的特征向量。
[0133] 第二确定模块1005,具体可以用于根据所述目标用户的特征向量,从多个预设问题中确定出特征向量与所述目标用户的特征向量满足预设的匹配关系的预设问题作为目标问题;其中,所述预设问题的特征向量包括通过第二处理模型对预设问题进行处理得到的向量,所述第一处理模型和所述第二处理模型为关联模型。
[0134] 在一些实施例中,所述装置具体还可以包括检索模块和反馈模块,其中,[0135] 检索模块,具体可以用于检索预设的数据库,获取与所述目标问题对应的答案数据作为目标答案;其中,所述预设的数据库中包括多个预设问题,以及与预设问题对应的答案数据;
[0136] 反馈模块,具体可以用于向所述目标用户反馈所述目标答案。
[0137] 在一些实施例中,所述第一确定模块1003具体可以包括以下结构单元:
[0138] 第一确定单元,具体可以用于通过第一处理模型根据所述业务状态数据,确定出目标用户特征;
[0139] 第一处理单元,具体可以用于对所述目标用户特征进行第一类处理,得到第一子向量;对所述历史提问记录进行第二类处理,得到第二子向量;
[0140] 拼接单元,具体可以用于根据所述第一子向量和所述第二子向量,确定目标用户向量;
[0141] 第二处理单元,具体可以用于利用预设的第一多层感知器对所述目标用户向量进行映射处理,得到所述目标用户的特征向量。
[0142] 在一些实施例中,所述第二确定模块1005具体可以包括以下结构单元:
[0143] 计算单元,具体可以用于计算所述目标用户的特征向量与预设问题的特征向量之间的余弦相似度;
[0144] 筛选单元,具体可以用于从多个预设问题中筛选出特征向量与所述目标用户的特征向量之间的余弦相似度的绝对值大于等于预设阈值的预设问题作为满足预设的匹配关系的目标问题。
[0145] 在一些实施例中,所述预设问题的特征向量具体还可以保存于KDTree等数据结构中。
[0146] 在一些实施例中,所述装置具体还可以包括建模模块,所述建模模块具体用于为训练建立相互关联的第一处理模型和第二处理模型。其中,所述建模模块具体可以包括以下结构单元:
[0147] 获取单元,具体可以用于获取样本用户的样本业务状态数据、样本历史提问记录,以及针对所述样本用户所预测的目标问题;
[0148] 采集单元,用于采集样本用户针对所预测的目标问题的操作数据;
[0149] 组合单元,具体可以用于将所述样本用户的样本业务状态数据、样本历史提问记录,以及所预测的目标问题组合,作为样本数据;
[0150] 标注单元,具体可以用于根据样本用户针对所预测的目标问题的操作数据,标注所述样本数据,得到标注后的样本数据;
[0151] 训练单元,具体可以用于根据所述标注后的样本数据,通过模型训练,得到第一处理模型和第二处理模型。
[0152] 在一些实施例中,所述标注单元具体可以包括以下子单元:
[0153] 第一确定子单元,具体可以用于根据样本用户针对所预测的目标问题的操作数据,在确定样本用户选中了所预测的目标问题的情况下,将所述样本数据的标注参数确定为第一数值;
[0154] 第二确定子单元,具体可以用于在确定样本用户没有选中所预测的目标问题的情况下,将所述样本数据的标注参数确定为第二数值。
[0155] 在一些实施例中,所述训练单元具体可以包括以下结构子单元:
[0156] 第一建立子单元,具体可以用于建立初始的第一处理模型和初始的第二处理模型;
[0157] 第二建立子单元,具体可以用于根据所述初始的第一处理模型和初始的第二处理模型,建立关联模型;其中,所述关联模型用于描述所述初始的第一处理模型的模型输出向量与所述初始的第二处理模型的模型输出向量之间的关联度;
[0158] 训练子单元,具体可以用于将标注后的样本数据中的样本用户的样本业务状态数据、样本历史提问记录作为初始的第一处理模型的模型输入;将标注后的样本数据中的所预测的目标问题作为初始的第二处理模型的模型输入;根据所述标注后的样本数据中的标注参数训练所述关联模型,得到符合要求的关联模型;
[0159] 第三确定子单元,具体可以用于根据所述符合要求的关联模型,确定出所述第一处理模型和所述第二处理模型。
[0160] 在一些实施例中,所述业务状态数据具体可以包括以下至少之一:业务的开通状态、订单的付款状态、退货状态、物流进度、用户评价等等。当然,上述所列举的业务状态数据只是为了更好地说明本说明书实施例。具体实施时,根据具体的应用场景,上述业务状态数据还可以包括其他类型的数据。对此,本说明书不作限定。
[0161] 需要说明的是,上述实施例阐明的单元、装置或模块等,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0162] 由上可见,本说明书实施例提供的目标问题的确定装置,在用户提问前,通过获取模块获取目标用户的业务状态数据和历史提问记录;通过第一确定模块调用训练好的第一处理模型根据业务状态数据和历史提问记录确定出目标用户的特征向量;再通过第二确定模块比较基于与第一处理模型关联的第二处理模型得到的预设的问题的特征向量,从多个预设问题中确定出特征向量与目标用户的特征向量满足预设的匹配关系的预设问题,作为目标问题。从而能够适用于多种业务场景,高效、准确地预测出用户想要提问的目标问题。
[0163] 虽然本说明书提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或客户端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
[0164] 本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内部包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
[0165] 本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构、类等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
[0166] 通过以上的实施例的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,移动终端,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
[0167] 本说明书中的各个实施例采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
[0168] 虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈