一种服务策略制定方法、装置、存储介质及电子设备专利检索-贝叶斯网络人工智能专利检索查询-专利查询网

一种服务策略制定方法、装置、存储介质及 电子设备

阅读：216发布：2020-05-12

专利汇可以提供一种服务策略制定方法、装置、存储介质及电子设备专利检索，专利查询，专利分析的服务。并且本申请涉及人工智能技术领域，提供一种服务策略制定方法、装置、存储介质及电子设备。其中，服务策略制定方法包括：获取从认知服务中拆解得到的决策任务，决策任务包括需要进行决策的多种服务策略；针对每种服务策略，计算采用服务策略后对于用户达成认知服务的服务目标带来的收益和成本，并根据计算结果选择多种服务策略中的最优服务策略；输出用于执行最优服务策略的控制指令。上述方法提供了一种针对认知服务选择最优服务策略的机制，有利于根据实际需求快速确定服务于用户的最优服务策略，更好地为用户提供服务。并且，该方法完全自动化执行，无需人工干预，从而可以应用于大规模认知服务场景。，下面是一种服务策略制定方法、装置、存储介质及电子设备专利的具体信息内容。

权利要求

1.一种服务策略制定方法，其特征在于，包括：
获取从人机协作的认知服务中拆解得到的决策任务，所述决策任务包括需要进行决策的多种服务策略；
针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并根据计算结果选择所述多种服务策略中的最优服务策略；其中，所述用户是指所述认知服务的服务对象；
输出用于执行所述最优服务策略的控制指令。
2.根据权利要求1所述的服务策略制定方法，其特征在于，所述针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并根据计算结果选择所述多种服务策略中的最优服务策略，包括：
针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并将所述多种服务策略中对应的收益与成本之差最大的服务策略确定为所述最优服务策略。
3.根据权利要求1所述的服务策略制定方法，其特征在于，所述决策任务为人机分工任务，所述多种服务策略中包括由人为用户提供服务的策略和由机器为用户提供服务的策略。
4.根据权利要求1所述的服务策略制定方法，其特征在于，计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益，包括：
根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述服务目标带来的收益；
其中，所述因果贝叶斯网络包括节点以及节点之间的因果关系，所述节点中包括对应于用户达成所述服务目标的概率的服务目标节点，以及，对应于影响用户达成所述服务目标的原因的影响因素节点；所述影响因素节点中包括对应于每种服务策略的采用状况的策略节点。
5.根据权利要求4所述的服务策略制定方法，其特征在于，所述影响因素节点中还包括对应于影响用户达成所述服务目标的显式原因的显因节点，以及，对应于影响用户达成所述服务目标的隐性原因的隐因节点，所述策略节点以及所述显因节点分别与所述隐因节点之间存在因果关系，所述隐因节点与所述服务目标节点之间存在因果关系；
所述根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益，包括：
根据知识图谱中记录的用户的近期数据计算所述显因节点的概率；
根据所述策略节点的值以及所述显因节点的概率计算所述隐因节点的概率；
根据所述隐因节点的概率计算所述服务目标节点的概率；
根据所述服务目标节点的概率计算采用所述服务策略对于用户达成所述服务目标带来的收益。
6.根据权利要求4所述的服务策略制定方法，其特征在于，在所述根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益之前，所述方法还包括：
根据业务专家的专家经验确定所述因果贝叶斯网络的初始结构；
利用知识图谱中记录的历史用户的历史数据对所述因果贝叶斯网络中的因果关系进行识别、评估以及反驳，确定所述因果贝叶斯网络的最终结构；
利用所述历史数据和/或所述专家经验确定所述因果贝叶斯网络中的节点的概率分布函数，所述概率分布函数用于计算所述节点的概率。
7.根据权利要求6所述的服务策略制定方法，其特征在于，所述历史数据包括从所述历史用户的结构化数据以及非结构化数据中抽取的特征。
8.根据权利要求1所述的服务策略制定方法，其特征在于，计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的成本，包括：
根据知识图谱中记录的所述服务策略和所需资源的关系，计算采用所述服务策略对于用户达成所述服务目标带来的成本。
9.根据权利要求2所述的服务策略制定方法，其特征在于，所述针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并将所述多种服务策略中对应的收益与成本之差最大的服务策略确定为所述最优服务策略，包括：
利用如下决策公式计算采用每种服务策略后决策优化函数的取值，并将使所述决策优化函数取最大值的服务策略确定为所述多种服务策略中的最优服务策略：
其中，max表示取最大值运算，f表示所述决策优化函数，表示影响用户在时刻达成所述服务目标所有自变量的组合，X表示所述多种服务策略构成的集合，x表示集合X中的任一服务策略，R表示用户达成所述服务目标的收益函数，表示采用服务策略x，表示不采用服务策略x，表示用户在时刻采用服务策略x后达成
所述服务目标的概率，表示用户在时刻不采用服务策略x后达成所述服务目标的概率，表示采用服务策略x对于用户达成所述服务目标带来成本。
10.根据权利要求9所述的服务策略制定方法，其特征在于，所述决策公式的约束条件包括合规性约束和/或资源约束。
11.根据权利要求6所述的服务策略制定方法，其特征在于，在所述输出用于执行所述最优服务策略的控制指令之后，所述方法还包括：
获取所述最优服务策略的执行结果，根据所述执行结果更新所述知识图谱中记录的用户的数据；
根据用户的最新数据更新所述因果贝叶斯网络中的节点的概率分布函数。
12.一种服务策略制定装置，其特征在于，包括：
任务获取模块，用于获取从人机协作的认知服务中拆解得到的决策任务，所述决策任务包括需要进行决策的多种服务策略；
策略选择模块，用于针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并根据计算结果选择所述多种服务策略中的最优服务策略；其中，所述用户是指所述认知服务的服务对象；
指令输出模块，用于输出用于执行所述最优服务策略的控制指令。
13.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质上存储有计算机程序指令，所述计算机程序指令被处理器读取并运行时，执行如权利要求1-11中任一项所述的方法。
14.一种电子设备，其特征在于，包括：存储器以及处理器，所述存储器中存储有计算机程序指令，所述计算机程序指令被所述处理器读取并运行时，执行如权利要求1-11中任一项所述的方法。

说明书全文

一种服务策略制定方法、装置、存储介质及电子设备

技术领域

[0001] 本发明涉及人工智能技术领域，具体而言，涉及一种服务策略制定方法、装置、存储介质及电子设备。

背景技术

[0002] 近年来，随着人工智能技术的不断发展，有越来越多的人工智能产品出现在行业服务当中，人类很多简单重复的工作正在不断被机器人替代。

[0003] 认知服务是一类服务的统称，这类服务实质上是一个认知迭代和认知博弈过程。以电销服务为例，在服务初期，作为服务对象的用户，其画像信息和购买意愿往往是比较少的，需要在服务过程中通过有效的沟通话术和策略逐步形成对用户的认知，引导用户完成销售转化。

[0004] 目前，对于在认知服务的过程中应该如何制定服务策略以便达成服务目标，尚无人提出有价值的解决方案。

发明内容

[0005] 本申请实施例的目的在于提供一种服务策略制定方法、装置、存储介质及电子设备，以改善上述技术问题。

[0006] 为实现上述目的，本申请提供如下技术方案：第一方面，本申请实施例提供一种服务策略制定方法，包括：获取从认知服务中拆解得到的决策任务，所述决策任务包括需要进行决策的多种服务策略；针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并根据计算结果选择所述多种服务策略中的最优服务策略；其中，所述用户是指所述认知服务的服务对象；输出用于执行所述最优服务策略的控制指令。

[0007] 上述方法提供了一种针对认知服务选择最优服务策略的机制，在该方法中通过计算每种服务策略对应的收益和成本来衡量采用每种服务策略后对于用户达成服务目标的影响，从而有利于根据实际需求快速确定服务于用户的最优服务策略，更好地为用户提供服务。并且，以上流程完全自动化执行，无需人工干预，从而可以应用于大规模认知服务场景。

[0008] 在第一方面的一种实现方式中，所述针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并根据计算结果选择所述多种服务策略中的最优服务策略，包括：针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并将所述多种服务策略中对应的收益与成本之差最大的服务策略确定为所述最优服务策略。

[0009] 在上述实现方式中，将最优服务策略定义为对应的收益与成本之差最大的服务策略，因收益减去成本可看作服务质量的提升，因此在该实现方式中通过执行最优服务策略可使用户感知到最大的服务质量提升，保障每个用户的服务质量，有利于促进用户达成认知服务的服务目标。

[0010] 在第一方面的一种实现方式中，所述决策任务为人机分工任务，所述多种服务策略中包括由人为用户提供服务的策略和由机器为用户提供服务的策略。

[0011] 对于重复性强且简单的工作，机器能够高效地提供服务，但毕竟现有的人工智能技术还不完善，在一些复杂问题的处理上，机器提供的服务质量远逊于人类，因此对于一项认知服务，确定由人还是机器来提供服务是一项重要议题。

[0012] 在上述实现方式中，通过将由人提供服务和由机器提供服务作为人机分工任务中的两项策略，并通过计算策略对应的成本和收益选择最优策略，有利于将认知服务交付给更适合提供服务的对象来完成，优化人机间的分工协作。

[0013] 在第一方面的一种实现方式中，计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益，包括：根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述服务目标带来的收益；其中，所述因果贝叶斯网络包括节点以及节点之间的因果关系，所述节点中包括对应于用户达成所述服务目标的概率的服务目标节点，以及，对应于影响用户达成所述服务目标的原因的影响因素节点；所述影响因素节点中包括对应于每种服务策略的采用状况的策略节点。

[0014] 贝叶斯网络是一种描述随机变量之间条件依赖关系的网络，如果这种条件依赖关系是因果关系，则可称该贝叶斯网络为因果贝叶斯网络。在上述实现方式中，策略节点可视为因果贝叶斯网络的输入，其取值为采用服务策略（例如，取1）或不采用服务策略（例如，取0），服务目标节点可视为因果贝叶斯网络的输出，其取值为用户在服务策略的某种采用状况下达成服务目标的概率，该概率值可通过上述输入结合因果贝叶斯网络的具体结构进行推算，并且根据该概率可以进一步计算采用某种服务策略对应的收益。

[0015] 在第一方面的一种实现方式中，所述影响因素节点中还包括对应于影响用户达成所述服务目标的显式原因的显因节点，以及，对应于影响用户达成所述服务目标的隐性原因的隐因节点，所述策略节点以及所述显因节点分别与所述隐因节点之间存在因果关系，所述隐因节点与所述服务目标节点之间存在因果关系；所述根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益，包括：根据知识图谱中记录的用户的近期数据计算所述显因节点的概率；根据所述策略节点的值以及所述显因节点的概率计算所述隐因节点的概率；根据所述隐因节点的概率计算所述服务目标节点的概率；根据所述服务目标节点的概率计算采用所述服务策略对于用户达成所述服务目标带来的收益。

[0016] 在上述实现方式中，将除服务策略之外的影响用户达成服务目标的因素分为两类：显因和隐因。其中，显因是采集到的用户的数据中表现出的原因，不是直接决定用户达成服务目标的因素。隐因是用户的数据之下隐含的、直接导致用户达成服务目标的因素，显因和服务策略只有作用到隐因上（体现为因果关系）才能促成用户达成服务目标。

[0017] 表现到因果贝叶斯网络中，上述显因和隐因分别对应显因节点和隐因节点，获得策略节点的值、显因节点的概率（即显因节点的值）后可推算隐因节点的概率（即隐因节点的值），并进一步推算服务目标节点的概率（即服务目标节点的值）及相应的收益。

[0018] 上述基于策略节点、显因节点、隐因节点、服务目标节点以及它们之间的因果关系的因果贝叶斯网络的网络结构是发明人大量研究实践的结果，该网络结构充分体现了用户在服务目标的过程产生的因果关系。

[0019] 在第一方面的一种实现方式中，在所述根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益之前，所述方法还包括：根据业务专家的专家经验确定所述因果贝叶斯网络的初始结构；利用知识图谱中记录的历史用户的历史数据对所述因果贝叶斯网络中的因果关系进行识别、评估以及反驳，确定所述因果贝叶斯网络的最终结构；利用所述历史数据和/或所述专家经验确定所述因果贝叶斯网络中的节点的概率分布函数，所述概率分布函数用于计算所述节点的概率。

[0020] 上述实现方式是因果贝叶斯网络的一种可能的构建过程，根据该过程不难看出，因果贝叶斯网络的结构中体现了业务专家的专家经验，同时又结合了实际数据，因此能够有效建模用户对于服务目标的认知过程，为计算服务策略对应的收益，最终确定最优服务策略提供充分的、精确的依据。

[0021] 在第一方面的一种实现方式中，所述历史数据包括从所述历史用户的结构化数据以及非结构化数据中抽取的特征。

[0022] 结构化数据和非结构化数据是构建因果贝叶斯网络的两类数据来源，以电销服务为例，结构化数据可以是历史用户的基本信息、历史购买记录、在应用程序中的历史行为记录等，非结构化数据可以是电销录音、未转化原因记录、产品关注问题记录等。从结构化、非结构化数据中抽取特征后，可用于拟合节点的条件概率函数，例如拟合显因节点的条件概率函数。

[0023] 在第一方面的一种实现方式中，计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的成本，包括：根据知识图谱中记录的所述服务策略和所需资源的关系，计算采用所述服务策略对于用户达成所述服务目标带来的成本。

[0024] 服务策略和服务策略所需的资源之间的关系是事先记录在知识图谱中的，根据这种关系便可以确定采用某种服务策略后产生的资源成本。

[0025] 在第一方面的一种实现方式中，所述针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并将所述多种服务策略中对应的收益与成本之差最大的服务策略确定为所述最优服务策略，包括：利用如下决策公式计算采用每种服务策略后决策优化函数的取值，并将使所述决策优化函数取最大值的服务策略确定为所述多种服务策略中的最优服务策略：其中，max表示取最大值运算，f表示所述决策优化函数，表示影响用户在时刻达成所述服务目标所有自变量的组合，X表示所述多种服务策略构成的集合，x表示集合X中的任一服务策略，R表示用户达成所述服务目标的收益函数，表示采用服务策略x，表示不采用服务策略x，表示用户在时刻采用服务策略x
后达成所述服务目标的概率，表示用户在时刻不采用服务策略x后
达成所述服务目标的概率，表示采用服务策略x对于用户达成所述服务目标带来成本。

[0026] 上述公式右侧的第一项表示采用策略x产生的收益，第二项表示采用策略x产生的成本，决策公式优化的目标就是使得这两项的差值最大，找出此时对应的策略x。

[0027] 在第一方面的一种实现方式中，所述决策公式的约束条件包括合规性约束和/或资源约束。

[0028] 约束条件用于决策公式的优化求解。以电销场景为例，合规性约束可以是指道德、法律、规章制度方面的约束，例如不应该过度营销让用户产生反感、投诉倾向等；资源约束可以是指当前可用于提供电销服务的人力资源、设备资源、渠道资源的数量等。

[0029] 在第一方面的一种实现方式中，在所述输出用于执行所述最优服务策略的控制指令之后，所述方法还包括：获取所述最优服务策略的执行结果，根据所述执行结果更新所述知识图谱中记录的用户的数据；根据用户的最新数据更新所述因果贝叶斯网络中的节点的概率分布函数。

[0030] 执行结果包括在本次执行最优服务策略的过程中产生的用户的数据，例如，新的电销录音、新的用户画像信息等，即对用户有了进一步的认知。这些数据可记录到知识图谱中并用于更新因果贝叶斯网络中节点的条件概率函数，使得对认知服务的服务经验沉淀到因果贝叶斯网络中，达到优化网络、进而优化决策过程的效果。

[0031] 第二方面，本申请实施例提供一种服务策略制定装置，包括：任务获取模块，用于获取从认知服务中拆解得到的决策任务，所述决策任务包括需要进行决策的多种服务策略；策略选择模块，用于针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并根据计算结果选择所述多种服务策略中的最优服务策略；其中，所述用户是指所述认知服务的服务对象；指令输出模块，用于输出用于执行所述最优服务策略的控制指令。

[0032] 第三方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质上存储有计算机程序指令，所述计算机程序指令被处理器读取并运行时，执行第一方面或第一方面的任意一种可能的实现方式提供的方法。

[0033] 第四方面，本申请实施例提供一种电子设备，包括：存储器以及处理器，所述存储器中存储有计算机程序指令，所述计算机程序指令被所述处理器读取并运行时，执行第一方面或第一方面的任意一种可能的实现方式提供的方法。附图说明

[0034] 为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

[0035] 图1示出了本申请实施例提供的一种服务策略制定方法的流程图；图2示出了本申请实施例提供的一种电销因果贝叶斯网络的结构图；
图3示出了本申请实施例提供的服务策略制定方法的一种分层实现的示意图；
图4示出了本申请实施例提供的一种服务策略制定装置的功能模块图；
图5示出了本申请实施例提供的一种电子设备的示意图。

具体实施方式

[0036] 下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行描述。应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步定义和解释。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

[0037] 本申请实施例提供一种针对认知服务的服务策略制定方法，图1示出了该服务策略制定方法的一种可能的执行流程，该方法可以由一电子设备执行，图5示出了该电子设备的一种可能的结构，可参考后文描述。参照图1，该方法包括：步骤S100：将认知服务拆解为决策任务。

[0038] 认知服务是一类涉及认知迭代和认知博弈过程的服务的统称，认知服务包括服务提供方和被服务的对象，其中，服务提供方可能是人也可能是机器，而被服务的对象则可以简称用户。此外，认知服务还包括服务目标（或称认知目标），即服务提供方希望通过向用户提供认知服务而使得用户做出某种行为、或者达到的某种效果等。

[0039] 典型的认知服务可以包括电销服务、贷后管理服务等，在后文中主要以电销服务为例进行介绍，电销服务的服务目标主要是销售转化，即购买推销的产品。在电销服务的初期，用户的画像信息和购买意愿往往是比较少的，需要在服务过程中通过有效的沟通话术和策略逐步形成对用户的认知，引导用户完成销售转化。

[0040] 认知服务可以拆解为多个决策任务来完成，每个决策任务包括需要进行决策的多种服务策略，通过执行后续步骤从多种服务策略中选择一种最优服务策略来为用户提供认知服务（即执行该最优服务策略）。由于对每个决策任务的处理方式都是类似的，因此在后文中仅以一个决策任务的处理过程为例进行说明。

[0041] 例如，对于可进行人机协作（即服务提供方既可以是人也可以是机器）的认知服务，可以拆解出的决策任务包括人机分工任务，该决策任务中包括两种服务策略，分别是由人为用户提供服务的策略和由机器为用户提供服务的策略。对于重复性强且简单的工作，机器能够高效地提供服务，且服务成本较低；不过现有的人工智能技术还不完善，在一些复杂问题的处理上，机器提供的服务质量远逊于人类，这些场景可能需要人来提供服务，但人提供服务的效率不及机器并且需要付出较高的服务成本。在后续步骤中会根据一定的规则从这两种策略中选择一种为用户提供服务。比如，在电销服务中，上述人机分工任务就是要决策由坐席给用户打电话还是由机器给用户打电话。

[0042] 又例如，对于电销服务，可以拆解出的决策任务还包括销售策略选择任务，该决策任务中包括多种销售策略，例如发放优惠券、进行场景化营销等。在后续步骤中会根据一定的规则从这些销售策略中选择一种用于和用户的电话沟通。销售策略的选择可以在人机分工选择之后再执行，例如，选择了由机器给用户打电话，机器具体在通话中需要采用哪种销售策略和用户沟通，可以进一步进行选择。

[0043] 需要理解，在服务提供方提供认知服务的过程中，步骤S100可能并非每次提供服务时都要执行，例如，对于电销服务而言，说服用户购买某个产品可能需要多次和用户通话，每次通话视为为用户提供一次服务，每次通话都涉及是由人打电话还是由机器打电话的问题，在一些可能的实现方式中，只有首次和用户通话时才会拆解产生人机分工任务，假设最终选择了由人和用户通话的策略，之后针对同一用户可以沿用这一策略，一直由人去通话，不必再重新拆解产生人机分工任务（进而重新选择人机分工策略），以便简化处理逻辑。当然，电销服务也可能分为不同的阶段，例如信息收集阶段（主要用于收集用户信息）、销售阶段（主要用于向用户推销产品）等，这些阶段实现的功能不同，对应的决策任务也可能不同，因此在不同阶段开始时，可以重新拆解电销服务并重新进行决策。

[0044] 步骤S110：针对每种服务策略，计算采用该服务策略后对于用户达成认知服务的服务目标带来的收益。

[0045] 步骤S120：针对每种服务策略，计算采用该服务策略后对于用户达成认知服务的服务目标带来的成本。

[0046] 以上两个步骤结合在一起进行介绍。在本申请实施例提供的服务策略制定方法中，通过计算每种服务策略对应的收益和成本来衡量采用每种服务策略后对于用户达成服务目标的影响，进而决定应该执行哪种服务策略去为用户提供服务。服务策略带来的收益，可以理解为对用户达成服务目标产生的正向激励，例如，使得用户完成销售转化的概率提高了；而服务策略带来的成本，可以理解为实施这种服务策略所要付出的代价，因为服务策略的执行必然依赖于外部的资源，例如，需要坐席或者机器去执行服务策略。

[0047] 在一种实现方式中，可以根据预先构建的因果贝叶斯网络来计算采用每种服务策略对于用户达成服务目标带来的收益。

[0048] 贝叶斯网络是一种描述随机变量之间条件依赖关系的网络，如果这种条件依赖关系是因果关系，则可称该贝叶斯网络为因果贝叶斯网络。具体而言，因果贝叶斯网络由节点以及节点之间的因果关系构成，每个节点可视为一个随机变量。图2示出了本申请实施例提供的一种电销因果贝叶斯网络的结构图，参照图2，右侧部分的每个小圆圈表示一个节点，节点之间的有向边（箭头表示方向）表示节点之间存在的因果关系，边的方向为从原因指向结果。

[0049] 本申请实施例提供的因果贝叶斯网络的节点可分为两类：服务目标节点以及影响因素节点。服务目标节点对应于用户达成服务目标的概率，例如，对于图2中的电销因果贝叶斯网络而言，就是用户完成销售转化的概率。影响因素节点对应于影响用户达成服务目标的各类原因，影响因素节点至少应包括对应于每种服务策略的采用状况的策略节点，如图2中的电销因果贝叶斯网络的左起第一列的节点。

[0050] 策略节点可视为因果贝叶斯网络的输入，其取值为采用服务策略（例如，取1）或不采用服务策略（例如，取0），服务目标节点则可视为因果贝叶斯网络的输出，其取值为用户在采用某种服务策略或不采用某种服务策略的情况下达成服务目标的概率，服务目标节点的概率可通过上述输入结合因果贝叶斯网络的具体结构进行推算，并且根据该概率值可以进一步计算采用某种服务策略对应的收益。

[0051] 进一步的，发明人经长期研究发现，除服务策略之外还存在其他影响用户达成服务目标的原因，可将这些原因分为两类：显式原因（简称显因）和隐性原因（简称隐因）。

[0052] 其中，显因是采集到的用户数据中表现出的原因，不是直接决定用户达成服务目标的因素：例如，用户在电话沟通中显示出沟通态度良好、或者与销售人员很配合、或者表现出对产品的关注，并不代表用户有强烈的购买意愿，也许只是用户自身素质比较高或者想要了解一下该产品的功能。每种显因对应于一个影响因素节点，称为显因节点，如图2中的电销因果贝叶斯网络的左起第二列的节点。

[0053] 隐因是采集到的用户数据之下隐含的、直接导致用户达成服务目标的因素：例如，用户购买某款产品是因为他确实有这方面的需求，或者他对这款产品高度认可。每种隐因对应于一个影响因素节点，称为隐因节点，如图2中的电销因果贝叶斯网络的左起第三列的节点。

[0054] 显因和服务策略只有作用到隐因上才能促成用户达成服务目标，体现到因果贝叶斯网络中，显因节点和隐因节点之间具有因果关系，策略节点和隐因节点之间具有因果关系，而隐因节点由于直接与用户达成服务目标相关，因此隐因节点与目标节点之间也具有因果关系，如图2所示。

[0055] 在因果贝叶斯网络中包括策略节点、显因节点、隐因节点以及服务目标节点时，可以根据策略节点的值以及显因节点的概率（即显因节点的值）推算隐因节点的概率（即隐因节点的值），并进一步根据隐因节点的概率推算服务目标节点的概率（即用户达成服务目标的概率），得到目标节点的概率后可以根据该概率计算采用某种策略后带来的收益，后文会给出一些可能的计算方法。

[0056] 之前已经提到，因果贝叶斯网络中的每个节点可视为一个随机变量，因此显因节点和隐因节点都对应一个概率分布函数（或者说条件概率函数），该概率分布函数可在构建因果贝叶斯网络中确定下来并可在网络使用的过程中不断调整。在上面推算服务目标节点的概率的过程中，根据预先保存的用户的近期数据结合显因节点的概率分布函数便可以计算显因节点的概率，然后根据策略节点的值、显因节点的概率结合隐因节点的概率分布函数便可以计算隐因节点的概率。

[0057] 其中，用户的近期数据可以是指在近期为用户提供认知服务的过程中采集到的用户的数据，反映用户近期的状态。例如，若将近期限定到最近一次为用户提供认知服务，并且将认知服务限定为电销服务，则用户的近期数据可以是和用户最近一次的通话录音，通话录音中可以反映出用户在最近一次通话时的态度、配合度等显因，因此可以用于计算显因节点的概率。

[0058] 用户的数据（不限于上述近期数据）可以记录在知识图谱中，数据可以分为两类：结构化数据和非结构化数据。以电销服务为例，结构化数据可以是用户的基本信息（如性别、年龄、职业等画像信息）、产品历史购买记录、在和电销产品相关的某个应用程序中的行为记录（如登陆、搜索行为）等，非结构化数据可以是电销录音（在使用时可以先转化为文字）、未转化原因记录、产品关注问题记录等，如图2左侧部分所示。在服务提供方为用户提供服务的过程中，用户的数据会被保存下来并进行特征抽取，然后将抽取出的特征保存到知识图谱中，在计算显因节点的概率时，实际使用的是知识图谱中对应于用户的近期数据的特征。

[0059] 下面再简单介绍一下因果贝叶斯网络的一种可能的构建过程：首先，获取在历史上（如，过去某个时间段内）提供认知服务的过程中收集到的历史用户的历史数据用于网络的训练，其中，历史数据包括历史用户的结构化数据以及非结构化数据，若历史数据保存在知识图谱中，则历史数据对应从结构化数据以及非结构化数据中抽取的特征。

[0060] 然后，根据业务专家的专家经验确定因果贝叶斯网络的初始结构，包括初始的节点以及节点之间的因果关系。例如，要构建电销因果贝叶斯网络，则应采用电销领域专家的专家经验。可以理解的，不同的专家对同一问题的看法未必相同，并且仅凭专家经验确定的网络结构中可能存在因果关系的错误、遗漏等问题，所以还需进一步处理。

[0061] 之后，利用历史用户的历史数据对因果贝叶斯网络（指上面确定的初始网络）中的因果关系进行识别、评估以及反驳，确定因果贝叶斯网络的最终结构。其中，识别是指根据历史数据确定网络中的因果关系的真假；评估是指考量识别出来的因果关系是否正确；反驳是指验证评估后确认的因果关系是否经得起一些假设条件的检验。在经历了识别、评估以及反驳后，因果贝叶斯网络的结构最终固定下来。

[0062] 最后，利用历史用户的历史数据和/或专家经验确定因果贝叶斯网络中的节点的概率分布函数。例如，上文提到的显因节点以及隐因节点对应的概率分布函数。对于显因节点的概率分布函数，可以对从部分历史数据中抽取到的特征进行拟合后获得，然后再利用历史数据进行迭代最终确定。隐因由于并不直接体现在用户的数据中，所以隐因节点的概率分布函数可以先凭借专家经验确定，然后再利用历史数据进行迭代最终确定，当然也不排除直接使用凭借专家经验确定的概率分布函数。

[0063] 根据上述因果贝叶斯网络的构建过程不难看出，因果贝叶斯网络的结构中体现了业务专家的专家经验，同时又结合了实际数据，因此能够有效建模用户对于服务目标的认知过程（或者说用户达成服务目标的因果逻辑），从而可以为计算服务策略对应的收益，最终在后续步骤中确定最优服务策略提供充分的、精确的依据。

[0064] 知识图谱中除了保存用户的数据，还可以记录服务策略和服务策略所需的资源之间的关系，因此在一种实现方式中，可以根据这种关系计算采用服务策略对于用户达成服务目标带来的成本，即资源成本。可以理解的，在具体实现时，记录服务策略和所需资源之间的关系的知识图谱和记录用户数据的知识图谱可以是一个知识图谱，也可以是不同的知识图谱。

[0065] 步骤S130：根据计算出的收益和成本从决策任务中包含的多个服务策略中选择最优服务策略。

[0066] 具体如何根据每个服务策略对应的收益和成本进行决策本申请方案并不限定。例如，在一种实现方式中，可将多种服务策略中对应的收益与成本之差最大的服务策略确定为最优服务策略。由于收益减去成本可看作认知服务质量的提升，因此若执行通过此种规则选出的最优服务策略可使用户感知到最大的服务质量提升，保障每个用户的服务质量，有利于促进用户达成认知服务的服务目标。当然，也不排除其他实现方式，例如，若更看重收益而不计较成本，则在确定最优服务策略时可向收益因素方面倾斜。总之，基于计算得到的收益和成本，可以根据实际需求决定应采用何种规则确定服务于用户的最优服务策略。

[0067] 针对将多种服务策略中对应的收益与成本之差最大的服务策略确定为最优服务策略的实现方式，下面给出一种具体的决策公式，可以理解的，决策公式的形式并未唯一，以下仅为示例。

[0068]其中，max表示取最大值运算，f表示决策优化函数，表示影响用户在时刻达成服务目标所有自变量（例如，可以指隐因对应的随机变量）的组合，X表示决策任务包含的多种服务策略构成的集合，x表示集合X中的任一服务策略，R表示用户达成服务目标的收益函数，表示采用服务策略x，表示不采用服务策略x 表示用户
在时刻采用服务策略x后达成服务目标的概率，表示用户在时刻
不采用服务策略x后达成服务目标的概率，表示采用服务策略x对于用户达成服务目标带来成本。上述公式右侧的第一项表
示采用策略x产生的收益，第二项表示采用策略x产生的成本，第一项减去第二项就是收益与成本之差，关于P和C的计算上文在介绍步骤S110和步骤S120时已经阐述。

[0069] 上述决策公式表达的含义是：计算采用每种服务策略后决策优化函数f的取值，并将使决策优化函数f取最大值的服务策略x确定为多种服务策略构成的集合X中的最优服务策略。

[0070] 为求解决策公式，可以设置相应的约束条件。例如，约束条件可以包括合规性约束和/或资源约束。以电销场景为例，合规性约束可以是指道德、法律、规章制度等方面的约束，例如不应该过度营销让用户产生反感、投诉倾向等；资源约束可以是指当前可用于提供电销服务的人力资源、设备资源、渠道资源的数量等，因为毕竟可用于提供服务的资源数量是存在客观限制的。

[0071] 步骤S140：输出用于执行最优服务策略的控制指令。

[0072] 在步骤S130中确定好最优服务策略后，将用于执行最优服务策略的控制指令输出给提供认知服务的对象（例如人或机器），使之根据控制指令执行最优服务策略（当然由人还是机器提供服务本身也可以是最优策略的一部分）。以电销服务为例，对于人的行为是无法完全控制的，因此输出的控制指令只是作为指示信息，指示坐席按照最优服务策略与用户通话；而机器的行为是可以控制的，机器可以执行控制指令，从而按照最优服务策略与用户通话，并采用预设的话术。

[0073] 参照图1，在执行完最优服务策略以后，还可以获取最优服务策略的执行结果，并根据执行结果更新知识图谱中记录的用户的数据，然后根据知识图谱中用户的最新数据（即更新的数据）更新因果贝叶斯网络中的节点的概率分布函数。

[0074] 其中，执行结果可以包括在本次执行最优服务策略的过程中产生的新的用户数据，例如，新的电销录音、新的用户画像信息等，即对用户新增的认知。从而，这些数据可记录到知识图谱中并用于更新因果贝叶斯网络中节点的条件概率函数，使得对认知服务的服务经验能够逐步沉淀到因果贝叶斯网络中，达到优化网络、进而优化决策过程的效果。

[0075] 此外，在执行完最优服务策略以后，还可以将执行结束的信号反馈给执行认知服务拆解的组件，使之可以继续执行下一决策任务的拆解以及后续的决策过程。

[0076] 综上所述，本申请实施例提供的服务策略制定方法提供了一种针对认知服务选择最优服务策略的机制，该机制通过计算每种服务策略对应的收益和成本来衡量采用每种服务策略后对于用户达成服务目标的影响，从而有利于根据实际需求快速确定服务于用户的最优服务策略，更好地为用户提供服务。

[0077] 在一些实现方式中，可以利用因果贝叶斯网络计算服务策略对应的收益，该因果贝叶斯网络基于领域专家的经验构建，并可在服务用户的过程中不断更新，将服务经验沉淀到网络中。

[0078] 在一些实现方式中，可以将收益与成本之差最大的服务策略确定为最优服务策略，以获得最大的服务质量提升，保障每个用户感知到的认知服务的质量，促进用户达成认知服务的服务目标。

[0079] 在一些实现方式中，决策任务中包括人机分工任务，这类任务将由人提供服务和由机器提供服务作为两项候选的服务策略，并通过计算策略对应的成本和收益选择最优策略，有利于将认知服务交付给更适合提供服务的对象来完成，优化人机间的分工协作。通过不断执行人机分工优化，使得人工仅需要处理少量复杂的问题，其他则交由机器处理，在保障服务质量的情况下极大提高人效。

[0080] 通过上面的总结不难看出，本申请的方案很好地结合了专家经验和机器智能，虽然在因果贝叶斯网络的构建中结合了专家经验，但整个流程由数据驱动，无需人工干预，从而可以应用于大规模的人机协作认知服务场景，避免了单纯依赖专家经验进行决策难以规模化的弊端。另一方面，本申请也并非完全依赖机器进行决策，从而避免了决策出现盲区的问题，比如服务的内容如果完全按当前用户喜好特征来决策，而不分析用户喜好特征潜在的因果因素，很容易使得服务失去创新趋向同质化。

[0081] 在一些实现方式中，本申请实施例提供的服务策略制定方法可以采用多个逻辑层次来实现，例如图3示出的任务层200、决策层210、认知层220以及知识层230。

[0082] 其中，任务层200负责拆解认知服务，并将拆解得到的决策任务下发给决策层210。决策层210用于根据对应于每个服务策略的收益和成本进行决策，选择出最优服务策略并输出用于执行策略的控制指令，而收益和成本则交由认知层220进行计算并在计算完成后返回给决策层210，认知层220的主要载体就是因果贝叶斯网络。在认知层220之下还有一层知识层230，其主要载体是知识图谱，构建因果贝叶斯网络所需的数据以及计算服务策略对应的成本时所需的数据都存储在知识图谱中。

[0083] 图4示出了本申请实施例提供的服务策略制定装置300的功能模块图。参照图4，服务策略制定装置300包括：任务获取模块310，用于获取从认知服务中拆解得到的决策任务，所述决策任务包括需要进行决策的多种服务策略；
策略选择模块320，用于针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并根据计算结果选择所述多种服务策略中的最优服务策略；其中，所述用户是指所述认知服务的服务对象；
指令输出模块330，用于输出用于执行所述最优服务策略的控制指令。

[0084] 在服务策略制定装置300的一种实现方式中，策略选择模块320针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并根据计算结果选择所述多种服务策略中的最优服务策略，包括：针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并将所述多种服务策略中对应的收益与成本之差最大的服务策略确定为所述最优服务策略。

[0085] 在服务策略制定装置300的一种实现方式中，所述决策任务为人机分工任务，所述多种服务策略中包括由人为用户提供服务的策略和由机器为用户提供服务的策略。

[0086] 在服务策略制定装置300的一种实现方式中，策略选择模块320计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益，包括：根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述服务目标带来的收益；其中，所述因果贝叶斯网络包括节点以及节点之间的因果关系，所述节点中包括对应于用户达成所述服务目标的概率的服务目标节点，以及，对应于影响用户达成所述服务目标的原因的影响因素节点；所述影响因素节点中包括对应于每种服务策略的采用状况的策略节点。

[0087] 在服务策略制定装置300的一种实现方式中，所述影响因素节点中还包括对应于影响用户达成所述服务目标的显式原因的显因节点，以及，对应于影响用户达成所述服务目标的隐性原因的隐因节点，所述策略节点以及所述显因节点分别与所述隐因节点之间存在因果关系，所述隐因节点与所述服务目标节点之间存在因果关系；策略选择模块320根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益，包括：根据知识图谱中记录的用户的近期数据计算所述显因节点的概率；根据所述策略节点的值以及所述显因节点的概率计算所述隐因节点的概率；根据所述隐因节点的概率计算所述服务目标节点的概率；根据所述服务目标节点的概率计算采用所述服务策略对于用户达成所述服务目标带来的收益。

[0088] 在服务策略制定装置300的一种实现方式中，所述装置还包括：网络构建模块，用于在策略选择模块320根据预先构建的因果贝叶斯网络计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的收益之前，根据业务专家的专家经验确定所述因果贝叶斯网络的初始结构，以及用于利用知识图谱中记录的历史用户的历史数据对所述因果贝叶斯网络中的因果关系进行识别、评估以及反驳，确定所述因果贝叶斯网络的最终结构，以及用于利用所述历史数据和/或所述专家经验确定所述因果贝叶斯网络中的节点的概率分布函数，所述概率分布函数用于计算所述节点的概率。

[0089] 在服务策略制定装置300的一种实现方式中，所述历史数据包括从所述历史用户的结构化数据以及非结构化数据中抽取的特征。

[0090] 在服务策略制定装置300的一种实现方式中，策略选择模块320计算采用所述服务策略对于用户达成所述认知服务的服务目标带来的成本，包括：根据知识图谱中记录的所述服务策略和所需资源的关系，计算采用所述服务策略对于用户达成所述服务目标带来的成本。

[0091] 在服务策略制定装置300的一种实现方式中，策略选择模块320针对每种服务策略，计算采用所述服务策略后对于用户达成所述认知服务的服务目标带来的收益和成本，并将所述多种服务策略中对应的收益与成本之差最大的服务策略确定为所述最优服务策略，包括：利用如下决策公式计算采用每种服务策略后决策优化函数的取值，并将使所述决策优化函数取最大值的服务策略确定为所述多种服务策略中的最优服务策略：其中，max表示取最大值运算，f表示所述决策优化函数，表示影响用户在时刻达成所述服务目标所有自变量的组合，X表示所述多种服务策略构成的集合，x表示集合X中的任一服务策略，R表示用户达成所述服务目标的收益函数，表示采用服务策略x，表示不采用服务策略x，表示用户在时刻采用服务策略x
后达成所述服务目标的概率，表示用户在时刻不采用服务策略x后
达成所述服务目标的概率，表示采用服务策略x对于用户达成所述服务目标带来成本。

[0092] 在服务策略制定装置300的一种实现方式中，所述决策公式的约束条件包括合规性约束和/或资源约束。

[0093] 在服务策略制定装置300的一种实现方式中，所述装置还包括：结果反馈模块，用于在指令输出模块330输出用于执行所述最优服务策略的控制指令之后，获取所述最优服务策略的执行结果，根据所述执行结果更新所述知识图谱中记录的用户的数据，以及用于根据用户的最新数据更新所述因果贝叶斯网络中的节点的概率分布函数。

[0094] 本申请实施例提供的服务策略制定装置300，其实现原理及产生的技术效果在前述方法实施例中已经介绍，为简要描述，装置实施例部分未提及之处，可参考方法施例中相应内容。

[0095] 图5示出了本申请实施例提供的一种电子设备的示意图。参照图5，电子设备400包括：处理器410、存储器420以及通信接口430，这些组件通过通信总线440和/或其他形式的连接机构（未示出）互连并相互通讯。

[0096] 其中，存储器420包括一个或多个（图中仅示出一个），其可以是，但不限于，随机存取存储器（Random Access Memory，简称RAM），只读存储器（Read Only Memory，简称ROM），可编程只读存储器（Programmable Read-Only Memory，简称PROM），可擦除只读存储器（Erasable Programmable Read-Only Memory，简称EPROM），电可擦除只读存储器（Electric Erasable Programmable Read-Only Memory，简称EEPROM）等。处理器410以及其他可能的组件可对存储器420进行访问，读和/或写其中的数据。

[0097] 处理器410包括一个或多个（图中仅示出一个），其可以是一种集成电路芯片，具有信号的处理能力。上述的处理器410可以是通用处理器，包括中央处理器(Central Processing Unit，简称CPU)、微控制单元（Micro Controller Unit，简称MCU）、网络处理器(Network Processor，简称NP)或者其他常规处理器；还可以是专用处理器，包括数字信号处理器(Digital Signal Processor,简称DSP)、专用集成电路(Application Specific Integrated Circuits，简称ASIC)、现场可编程门阵列(Field Programmable Gate Array，简称FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。

[0098] 通信接口430包括一个或多个（图中仅示出一个），可以用于和其他设备进行直接或间接地通信，以便进行数据的交互。例如，通信接口430可以是以太网接口；可以是高速网络接口（如Infiniband网络）；可以是移动通信网络接口（如3G、4G、5G网络的接口）；可以是各类总线接口，例如USB、CAN、I2C、SPI等总线接口；还是可以是具有数据收发功能的其他类型的接口。

[0099] 在存储器420中可以存储一个或多个计算机程序指令，处理器410可以读取并运行这些计算机程序指令，以实现本申请实施例提供的服务策略制定方法以及其他期望的功能。

[0100] 可以理解，图5所示的结构仅为示意，电子设备400还可以包括比图5中所示更多或者更少的组件，或者具有与图5所示不同的配置。图5中所示的各组件可以采用硬件、软件或其组合实现。例如，在采用硬件方式实现时，电子设备400可以是PC机、服务器等；在采用软件方式实现时，电子设备400可以是虚拟机、容器等。并且，电子设备400不限于单台设备，也可以是多台设备的组合或者大量设备构成的集群、平台等。

[0101] 本申请实施例还提供一种计算机可读存储介质，该计算机可读存储介质上存储有计算机程序指令，所述计算机程序指令被计算机的处理器读取并运行时，执行本申请实施例提供的服务策略制定方法。例如，计算机可读存储介质可以实现为图5中电子设备400中的存储器420。

[0102] 在本申请所提供的实施例中，应该理解到，所揭露装置和方法，可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的，例如，所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，又例如，多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

[0103] 另外，作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

[0104] 再者，在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分，也可以是各个模块单独存在，也可以两个或两个以上模块集成形成一个独立的部分。

[0105] 以上所述仅为本申请的实施例而已，并不用于限制本申请的保护范围，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

标题	发布/更新时间	阅读量
一种用于餐饮后厨的智能巡查方法	2020-05-08	690
基于动态贝叶斯网络的模糊PLS建模方法	2020-05-11	104
自动生成自动警报合并的数据中心网络映射的系统和方法	2020-05-11	761
一种服务策略制定方法、装置、存储介质及电子设备	2020-05-12	216
一种基于BP神经网络的BI配色方法及系统	2020-05-08	525
一种一次回风空调系统中传感器误差的在线识别与修复方法	2020-05-08	485
基于知识图谱的智能扫地机行为决策方法及智能扫地机	2020-05-12	301
音频分类方法、装置及可读存储介质	2020-05-12	828
一种大型桥梁工程施工阶段动态风险评估方法	2020-05-08	108
一种交通工程安全隐患评估装置及方法	2020-05-08	102

一种服务策略制定方法、装置、存储介质及电子设备

一种服务策略制定方法、装置、存储介质及电子设备

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：