一种针对地理网点的智能任务分配和人员调度方法、系统专利检索-价带电气元件和设备专利检索查询-专利查询网

一种针对地理网点的智能任务分配和人员调度方法、系统

阅读：1014发布：2020-11-05

专利汇可以提供一种针对地理网点的智能任务分配和人员调度方法、系统专利检索，专利查询，专利分析的服务。并且本发明公开了一种针对具有一定地理位置特征的网点的智能拜访任务分配和人员调度方法、系统，包括以下步骤：从企业信息系统决策模块的基础数据和实时数据中，对物理商业网点和业务员分别提取特征，对业务员拜访网点的历史数据建模；用二分图表示业务员和网点之间的连接从而形成拜访计划网络图；根据业务员所处环境信息，规划最优拜访路线；使用强化学习方法，根据业务员执行某一动作后产生的预设的奖赏或惩罚，评估分配策略获取的收益，并反馈给深度神经网络模型，反复更新学习参数，确定最优任务匹配策略；实际拜访过程中，采用强化学习方法进行计算，将任务执行策略优化方法以及拜访路线优化方法同时不断迭代，综合得出全局最优的拜访方式。，下面是一种针对地理网点的智能任务分配和人员调度方法、系统专利的具体信息内容。

权利要求

1.一种针对地理网点的智能任务分配和人员调度方法，其特征在于，步骤为：
(1)从企业信息系统决策模块的基础数据和实时数据中提取特征，特征包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征；
(2)对业务员和拜访网点之间的关系，形成拜访计划的二分网络，同时根据地理位置关系对网点集合建立偏序关系，对历史记录和业务员拜访网点的实时数据建模，得到深度神经网络模型；
(3)根据业务员执行某一动作后产生的效果确定预设的奖赏或惩罚，评估分配策略获取的收益，并反馈给深度强化学习模型，更新学习参数，确定最优任务执行策略；
(4)根据业务员所处环境信息，规划最优拜访路线；
(5)实际拜访过程中，将步骤(3)的任务执行策略优化方法以及步骤(4)的拜访路线优化方法同时不断迭代，综合得出全局最优的拜访方式。
2.根据权利要求1所述的任务分配和人员调度方法，其特征在于，步骤(1)中，所述待拜访网点的特征包括：拜访网点类型以及网点基本信息，所述拜访网点类型包括已有网点、潜在待开发网点、疑似假网点，所述网点信息包括经营者基础信息、地理位置、经营品类、供货方式、产品库存；所述业务员的特征包括：基础信息、业务能力、历史拜访记录、熟悉的网点和范围、熟悉的产品类目；所述拜访任务的特征包括：网点和业务员之间的交互情况，即该网点是否被业务员拜访、拜访任务的难度、拜访的预期目标；所述业务员的周边环境包括：
业务员的时间和空间状态，即所处地理位置、交通状况、拜访时间。
3.根据权利要求1所述的任务分配和人员调度方法，其特征在于，步骤(2)中，神经网络模型的输入是状态集S和动作集A，业务员的特征和业务员周边环境表示状态集S，待拜访网点的特征和拜访任务的特征表示动作集A。
4.根据权利要求1所述的任务分配和人员调度方法，其特征在于，步骤(2)中，在建立的深度神经网络模型的过程中，用二分图来表示业务员和拜访网点之间的匹配关系，在该二分图中，将业务员和网点作为节点，业务员与网点的初始是全连接状态，在与环境的交互过程中，随着连接边上的权重不断更迭，同时，根据地理位置关系对网点集合建立偏序关系，获得最优匹配策略。
5.根据权利要求1所述的任务分配和人员调度方法，其特征在于，步骤(3)中，完成该拜访动作a后会带来奖励，奖励r定义为拜访网点的总执行时间和拜访网点的效果，同时完成该拜访动作后会自动使业务员发生状态的转移，即从st转换到st+1；将效果等反馈信息反馈给模型，用于计算在某状态下的预期累积收益的期望的动作价值函数Q(s,a)，该价值函数表示业务员和网点之间连接边的权重，即学习参数，不断更迭价值函数，求解最优匹配，进而确定最优任务执行策略。
6.根据权利要求1所述的任务分配和人员调度方法，其特征在于，步骤(4)中，确定最优任务执行策略后，进行拜访路线规划，即根据周围环境因素规划最优网点拜访顺序和路径，周围环境因素包括实时路况、距离远近。
7.根据权利要求1所述的任务分配和人员调度方法，其特征在于，步骤(5)中，实际拜访过程中，实时评估业务员的位置和拜访计划完成情况，分析是否有无法完成日常规定拜访网点的风险，及时改派；日常已有网点优先拜访，再根据业务员实施拜访情况和业务员的位置，分配待开发的新店。
8.一种针对地理网点的智能任务分配和人员调度系统，其特征在于，
特征提取模块，从企业信息系统决策模块的基础数据和实时数据中提取特征，包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征；
深度强化学习模型构建模块，用于对业务员和拜访网点之间的关系，形成拜访计划的二分网络，同时根据地理位置关系对网点集合建立偏序关系，对历史记录和业务员拜访网点的实时数据建模，得到深度神经网络模型；
任务匹配策略优化模块，用于根据业务员执行某一动作后产生的效果确定预设的奖赏或惩罚，评估分配策略获取的收益，并反馈给深度强化学习模型，更新学习参数，确定最优任务执行策略
拜访路线优化模块，用于根据业务员所处环境信息，规划最优拜访路线；
拜访方式确定模块，用于实际拜访过程中，将任务匹配策略优化模块中的任务执行策略优化方法以及任务匹配策略优化模块中的拜访路线优化方法同时不断迭代，综合得出全局最优的拜访方式。

说明书全文

一种针对地理网点的智能任务分配和人员调度方法、系统

技术领域

[0001] 本发明涉及企业信息系统研究领域，特别涉及一种针对地理网点的智能任务分配和人员调度方法、系统。

背景技术

[0002] 信息系统是企业经营的大脑。伴随着企业规模扩大、企业信息化建设进程的逐渐深入，管理深度、数据和信息量不断增大。因此全凭人工管理系统信息和企业决策，企业生产远远达不到高效率。尤其是企业日常经营中存在很多简单且高频的经验型决策问题，信息系统中也存在大量经验型决策模块，这类问题往往耗费大量人力且不需过多脑力，增加了企业的人力成本。

[0003] 典型如面向线下商业网点的拜访计划，经常存在任务分配和人员调度的决策问题，由于现实情况中存在不确定性和复杂性，初始分配方案缺乏科学依据，同时对环境及交通情况不敏感，可能变得不合理，这时企业一般的解决方案是采取人工重新规划，再传入企业信息系统中，并通知业务员任务发生变动，这一系列操作，不仅影响业务员的工作效率，还给客户留下不好的印象。

[0004] 随着人工智能技术的不断发展，深度学习和强化学习等方法更使人工智能得到新突破，将人工智能技术运用于企业信息系统，代替人进行经验性决策，提高企业的决策柔性化。

[0005] 基于以上背景，研究一种可实现企业信息系统智能化响应，可实时进行任务分配和人员调度的方法具有重要的实用价值。

发明内容

[0006] 本发明的主要目的在于克服现有方法的缺点与不足，提供一种针对地理网点的智能任务分配和人员调度方法、系统，其可利用企业所积累的用户大数据，尤其是在需要人工进行经验型业务决策的模块中，提炼出业务逻辑规则，对这部分模块的输入与输出数据进行建模，训练深度神经网络，从而利用神经网络代替人工决策，克服人工决策的决策成本高、效率低等问题。

[0007] 本发明的目的通过以下的技术方案实现：一种针对地理网点的智能任务分配和人员调度方法，包括步骤：

[0008] (1)从企业信息系统决策模块的基础数据和实时数据中，提取特征，特征包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征等。

[0009] (2)使用二分图将业务员和拜访的具有地理位置特征的商业网点(以下简称网点)之间的关系形成拜访计划网络，对历史记录和业务员拜访网点的实时数据建模，得到深度强化学习模型；

[0010] (3)根据执行某一动作后产生的预设的奖赏或惩罚，评估分配策略获取的收益，并反馈给深度强化学习模型，反复迭代更新学习参数，最终确定最优任务执行策略；

[0011] (4)根据业务员所处环境信息，规划最优拜访路线；

[0012] (5)实际拜访过程中，采用强化学习方法进行计算，将步骤(3)的任务执行策略优化方法以及步骤(4)的拜访路线优化方法同时不断迭代，综合得出全局最优的拜访方式。

[0013] 优选的，获取决策模块的基础数据后，先对其进行数据预处理，预处理包括：检查原始数据中是否存在脏数据，脏数据一般是指不符合要求，以及不能直接进行相应分析的数据；填写缺失的值、光滑噪声数据、识别或删除离群点并解决不一致性来清理数据；通过平滑聚集、规范化等方式将数据转换成适用于神经网络训练的形式。

[0014] 优选的，步骤(1)中，决策模块的基础数据是指业务数据库的历史数据，包括待拜访网点信息、业务员信息等，实时数据是指拜访任务信息、实时交通状况、业务员地理位置等。

[0015] 优选的，步骤(1)中，所述待拜访网点的特征包括：拜访网点类型以及网点基本信息，所述拜访网点类型包括已有网点、潜在网点、疑似假网点等。所述网点基本信息包括地理位置、经营品类、供货方式、产品库存等。

[0016] 所述业务员的特征包括：业务能力、历史拜访记录、熟悉的网点和范围等。

[0017] 所述拜访任务的特征包括：拜访顺序及路线，预期的订单目标，网点和业务员之间的交互情况，即该网点是否被业务员拜访、拜访任务的难度、业务员正在拜访或空闲操作。对网点拜访整个过程而言，业务员拜访一个网点需经历三个流程，即前往待拜访的网点、拜访网点和离开网点。

[0018] 所述业务员周边环境特征包括：业务员的时间和空间状态，即当前所处地理位置、交通状况、拜访时间等。

[0019] 优选的，步骤(1)中，提取待拜访网点的特征时，对各个网点设定先后顺序。

[0020] 优选的，步骤(2)中，深度强化学习模型的输入是状态集S和动作集A，业务员的特征和业务员周边环境特征表示状态集S，待拜访网点的特征和拜访任务的特征表示动作集A。

[0021] 优选的，步骤(2)中，在建立的深度强化学习模型的过程中，用二分图来表示业务员和拜访网点之间的匹配关系，在该二分图中，将业务员和网点作为节点，业务员与网点的初始是全连接状态，在与环境的交互过程中，随着连接边上的权重不断更迭，同时，根据地理位置关系对网点集合建立偏序关系，获得最优匹配策略。

[0022] 更进一步的，步骤(2)中，在进行拜访网点和业务员匹配的过程中，应考虑一些实际情况，例如已有网点拜访优于潜在网点拜访，(Ti,Tj)表示网点i必须在网点j前拜访，一个拜访任务的开启必须在上一个拜访计划完成后，即到达网点j开始拜访的时间fr(j)小于离开网点i的时间fL(i)。

[0023] 优选的，步骤(3)中，假设拜访动作a，在完成该拜访动作后会自动使业务员发生状态的转移，即从st转换到st+1，同时完成该拜访动作后会带来奖励，定义奖励r为拜访网点的总执行时间和拜访网点的预期目标完成情况；将该信息反馈给深度强化学习模型；根据反馈信息计算用于表示在某状态下的预期累积收益的期望的动作价值函数Q(s,a)，该价值函数表示业务员和网点之间连接边的权重，即学习参数，不断更迭价值函数，求解最优匹配，进而确定最优任务执行策略。

[0024] 优选的，步骤(4)中，确定最优任务执行策略后，进行拜访路线规划，即根据实时路况、距离远近等周围环境因素，规划最优网点拜访顺序和路径。

[0025] 优选的，步骤(5)中，实际拜访过程中，实时评估业务员的位置和拜访计划完成情况，分析是否有无法完成日常规定拜访网点的风险，及时改派；日常已有网点优先拜访，再根据业务员实施拜访情况和业务员的位置，分配待开发的新店。

[0026] 针对地理网点的智能任务分配和人员调度系统，包括：

[0027] 特征提取模块，从企业信息系统决策模块的基础数据和实时数据中提取特征，包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征；

[0028] 深度强化学习模型构建模块，用于对业务员和拜访网点之间的关系，形成拜访计划的二分网络，同时根据地理位置关系对网点集合建立偏序关系，对历史记录和业务员拜访网点的实时数据建模，得到深度神经网络模型；

[0029] 任务匹配策略优化模块，用于根据业务员执行某一动作后产生的效果确定预设的奖赏或惩罚，评估分配策略获取的收益，并反馈给深度强化学习模型，更新学习参数，确定最优任务执行策略

[0030] 拜访路线优化模块，用于根据业务员所处环境信息，规划最优拜访路线；

[0031] 拜访方式确定模块，用于实际拜访过程中，将任务匹配策略优化模块中的任务执行策略优化方法以及任务匹配策略优化模块中的的拜访路线优化方法同时不断迭代，综合得出全局最优的拜访方式。

[0032] 本发明与现有技术相比，具有如下优点和有益效果：

[0033] (1)本发明针对原有人工决策业务员任务分配问题，对企业信息系统的原需要人工决策的模块中的输入和输出数据进行分析建模，利用历史数据训练深度强化学习模型，实现企业信息系统智能化响应，从而使神经网络代替人工决策，为企业实时调度业务员及分配任务提供决策方案。

[0034] (2)将人工智能技术运用于企业信息系统，代替人进行经验性决策，降低了企业的人力决策成本，优化了企业的决策柔性化。

[0035] (3)使神经网络代替人工决策实现企业信息系统智能化响应，可实时调度业务员及分配任务，缩短了企业决策任务匹配计划的时间，提升业务员的工作效率。

[0036] (4)采用拜访任务匹配优化和路径优化算法实时相结合，并将周围环境因素考虑在内，提高了拜访任务匹配精度，并提升拜访效率。

[0037] (5)对任务进行优先度排序，为业务员预留拜访空白时间，优先度较低非需紧急拜访的网点，根据业务员拜访的实际情况，实时进行任务分配。附图说明

[0038] 图1是本发明方法的业务员与网点匹配图。

[0039] 图2是本发明进行深度强化学习训练时的过程。

[0040] 图3是本发明方法的流程示意图。

具体实施方式

[0041] 下面结合实施例及附图对本发明作进一步详细的描述，但本发明的实施方式不限于此。

[0042] 实施例1

[0043] 本实施例提供一种快销行业业务员拜访线下网点的任务分配和调度方法，步骤是首先提取信息系统相关数据，提取特征，进而运用二分图表示业务员和拜访网点之间的关系，形成拜访计划网络图。通过企业信息系统中历史业务数据进行日常拜访网点任务匹配，结合网络图中业务员当前状态，利用深度强化学习方法，对历史数据和实时数据，从拜访任务匹配优化和业务员路径优化这两个层次同时不断迭代，综合得出全局最优的拜访方式和拜访路径。下面结合附图对各个步骤进行具体说明。

[0044] 一、从企业信息系统决策模块的数据和实时数据中，提取特征。

[0045] 对企业信息系统的模块进行划分，对经验型人工决策模块的基础数据进行处理，该部分数据包括待拜访网点信息、业务员信息等。实时数据是指拜访任务信息、实时交通状况、业务员地理位置等。

[0046] 对业务数据库的历史数据和实时数据运用深度学习方法进行分析和处理，提取待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征。待拜访网点的特征包括：拜访网点类型以及网点基本信息，所述拜访网点类型包括已有网点、潜在待开发网点、疑似假网点，所述网点信息包括地理位置、经营品类、供货方式、产品库存等。在进行业务员与拜访网点匹配时，优先考虑已有网点的日常拜访任务，潜在网点拜访根据日常拜访任务的完成情况，实时安排给业务员。

[0047] 业务员的特征包括：业务能力、历史拜访记录、熟悉的网点和范围等。拜访任务的特征包括：网点和业务员之间的交互情况，即该网点是否被业务员拜访、拜访任务的难度、预期的拜访效果等。对网点拜访整个过程而言，业务员拜访一个网点需经历三个流程，即前往待拜访的网点、拜访网点和离开网点。业务员的周边环境包括：业务员的时间和空间状态，即当前所处地理位置、交通状况、拜访时间等。

[0048] 二、使用深度强化学习方法对历史记录和业务员拜访网点的实时数据建模，运用二分图表示业务员和拜访网点之间的匹配关系。

[0049] 对深度强化方法学习训练过程中的状态集S和动作集A进行定义，业务员的特征和业务员周边环境表示状态集S，待拜访网点的特征和拜访任务的特征表示动作集A。

[0050] 在建立的模型中，用二分图来抽象业务员和网点之间的匹配关系，将业务员和网点作为节点，业务员与网点的初始联系是全连接状态，通过与环境的交互过程中，随着连接边上的权重不断更迭，获得最优匹配策略，如图1。在进行网点和业务员匹配的过程中，应考虑一些实际情况，例如已有网点拜访优于潜在网点拜访，(Ti,Tj)表示网点i必须在j前拜访。一个拜访任务的开启必须在上一个拜访计划完成后，即到达网点j开始拜访的时间fr(j)小于离开网点i的时间fL(i)。

[0051] 在建立的模型中，对网点间的地理位置关系建立偏序关系。

[0052] 三、根据执行动作a后的产生奖赏或惩罚，评估分配策略获取的收益，并反馈给强化学习模型，更新学习参数，通过不断反馈更新的方式，确定最优任务执行策略。

[0053] 动作a是完成拜访的动作会自动使业务员发生状态的转移，即从st转换到st+1，同时完成动作后会带来奖励，定义奖励r为拜访网点的总执行时间和拜访网点的反馈情况。

[0054] 强化学习中的动作价值函数Q(s,a)表示在某状态下的预期累积收益的期望，对应了在总执行时间和拜访网点的反馈情况，价值函数即表示业务员和网点之间连接边的权重，不断更迭价值函数，求解最优匹配，进入最终分配环节。

[0055] 四、规划最优拜访路线，确定日常拜访匹配策略后，进行拜访路线规划，即根据实时路况、距离远近等周围环境因素，规划最优网点拜访顺利和路径。

[0056] 五、根据拜访实际情况，结合任务分配策略和路径规划方法自动调节拜访任务，并在拜访过程中分配待开发的新店。

[0057] 自动调节拜访任务是实时评估业务员的位置和拜访计划完成情况，分析是否有无法完成日常规定拜访网点的风险，及时改派。待分配的网点是指日常已有网点优先拜访，根据业务员实施拜访情况，和业务员的位置，再分配待开发的新店。

[0058] 实施例2

[0059] 一种针对地理网点的智能任务分配和人员调度系统，包括：

[0060] 特征提取模块，用于从企业信息系统决策模块的基础数据和实时数据中，提取特征，特征包含待拜访网点的特征、业务员的特征、拜访任务的特征、业务员周边环境特征等；

[0061] 深度强化学习模型构建模块，用于使用二分图将业务员和拜访的具有地理位置特征的商业网点之间的关系形成拜访计划网络，对历史记录和业务员拜访网点的实时数据建模，得到深度强化学习模型；

[0062] 任务匹配策略优化模块，用于根据业务员执行效果产生的预设的奖赏或惩罚，评估分配策略获取的收益，并反馈给深度强化学习模型，更新学习参数，确定最优任务执行策略；

[0063] 拜访路线优化模块，用于根据业务员所处环境信息，规划最优拜访路线；

[0064] 拜访方式确定模块，用于在实际拜访过程中，采用强化学习方法进行计算，将任务执行策略优化模块中的任务匹配策略优化方法以及拜访路线优化模块中的拜访路线优化方法同时不断迭代，综合得出全局最优的拜访方式。

[0065] 所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，上述描述的系统、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

[0066] 本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、计算机软件或者二者的结合来实现，为了清楚地说明硬件和软件的可互换性，在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本发明的范围。

[0067] 在本发明所提供的实施例中，应该理解到，所揭露的系统、模块和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，所述模块的划分，仅仅为逻辑功能划分，实际实现时可以有另外的划分方式，也可以将具有相同功能的模块集合成一个模块，例如多个模块或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另外，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口、装置或单元的间接耦合或通信连接，也可以是电的，机械的或其它的形式连接。

[0068] 所述作为分离部件说明的模块可以是或者也可以不是物理上分开的，作为模块显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本发明实施例方案的目的。

[0069] 另外，在本发明各个实施例中的各功能模块可以集成在一个处理单元中，也可以是各个模块单独物理存在，也可以是两个或两个以上模块集成在一个模块中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

[0070] 所述集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分，或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

[0071] 上述实施例为本发明较佳的实施方式，但本发明的实施方式并不受上述实施例的限制，其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化，均应为等效的置换方式，都包含在本发明的保护范围之内。

标题	发布/更新时间	阅读量
一种用于合成新的空调运行模式的方法、系统及智能终端	2021-03-18	3
一种新型桡动脉压迫装置	2021-12-29	2
汽车车内双耳异响时变噪声响度评价方法	2022-12-26	2
一种用于牙医操作姿势评估的方法	2021-07-06	0
一种便于携带的医用骨科绑扎固定结构	2020-09-13	0
抗EGFR抗体药物偶联物	2022-06-05	1
一种摆盘式用于精密模块自动装配带纠正的设备	2023-07-14	0
一种同步带驱动式升降搬运装置	2021-09-28	1
一种具有自动清理功能的蜂蜜杀菌设备	2020-05-21	2
一种眼科硅油抽取装置	2020-09-11	2

一种针对地理网点的智能任务分配和人员调度方法、系统

一种针对地理网点的智能任务分配和人员调度方法、系统

技术领域

背景技术

发明内容

具体实施方式

该功能需要专业版企业版VIP权限，您可以：