首页 / 专利库 / 电脑编程 / 算法 / 邻近用户识别方法、终端及可读存储介质

邻近用户识别方法、终端及可读存储介质

阅读:724发布:2023-12-23

专利汇可以提供邻近用户识别方法、终端及可读存储介质专利检索,专利查询,专利分析的服务。并且本 申请 公开了一种邻近用户识别方法、终端和计算机可读存储介质,通过获取各用户的常驻小区MR特征信息,根据各常驻小区MR特征信息计算获得所述各用户MR特征系数;根据所述MR特征信息和所述MR特征系数,计算MR特征相似度;根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组,实现室内邻近用户的识别,扩大了用户的识别范围,因此可利用邻近用户的群体特征来对室内无线网络 质量 进行监控,即由邻近用户的通信指标变化,对室内网络的通信问题进行判断和告警。,下面是邻近用户识别方法、终端及可读存储介质专利的具体信息内容。

1.一种邻近用户识别方法,其特征在于,所述邻近用户识别方法包括:
获取各用户的常驻小区MR特征信息,根据所述各常驻小区MR特征信息计算获得所述各用户MR特征系数;
根据所述MR特征信息和所述MR特征系数,计算MR特征相似度;
根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组。
2.如权利要求1所述的邻近用户识别方法,其特征在于,所述获取各用户的各常驻小区MR特征信息的步骤包括:
获取所述各用户预设天数的白天工作常驻小区的MR数据,作为第一MR数据;
获取所述各用户预设天数的晚上居住常驻小区的MR数据,作为第二MR数据;
基于各所述第一MR数据和各所述第二MR数据,筛选预设时间段内的各所述用户常驻小区MR数据。
3.如权利要求2所述的邻近用户识别方法,其特征在于,所述筛选预设时间段内的各所述用户常驻小区MR数据的步骤之后,包括:
基于各所述用户常驻小区MR数据,依次将各所述用户常驻小区作为主服小区,将所述常驻小区MR数据中常驻小区之外的各小区作为邻近小区,获取所述主服小区场强和各邻近小区场强的平均场强、各主服小区识别号和各邻近小区识别号;
根据所述各邻近小区通信上报频次预设筛选条件,从所述通信上报频次筛选得到选定邻区频次,其中,所述预设筛选条件包括预设上报频次排名和预设频次阈值
将所述平均场强和所述选定邻区频次作为各所述常驻小区MR特征信息。
4.如权利要求3所述的邻近用户识别方法,其特征在于,所述将所述平均场强和所述选定邻区频次作为各所述常驻小区MR特征信息的步骤之后,包括:
将各所述平均场强进行归一化处理,得到场强系数;
将各所述选定邻区频次进行归一化处理,得到频次系数;
将所述场强系数和所述频次系数作为所述各用户MR特征系数。
5.如权利要求4所述的邻近用户识别方法,其特征在于,所述根据所述MR特征信息和所述MR特征系数,计算MR特征相似度的步骤包括:
获取同一个预设小区内两个常驻用户的所述MR特征信息;
若所述两个常驻用户的所述MR特征信息具有相同的所述邻近小区识别号,则提取所述两个常驻用户的所述MR特征系数,以通过预设第一算法计算获得所述两个常驻用户的MR特征相似度;
若所述两个常驻用户的所述MR特征信息不具有相同的所述邻近小区识别号,则提取所述两个常驻用户的所述MR特征系数,以通过预设第二算法计算获得所述两个常驻用户的MR特征相似度。
6.如权利要求5所述的邻近用户识别方法,其特征在于,所述根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组的步骤包括:
根据预设第一参数,确定有效用户组的用户数;
根据预设第二参数,从所述有效用户组的用户数确定最优用户分组用户人数。
7.如权利要求6所述的邻近用户识别方法,其特征在于,所述从所述有效用户组的用户数确定最优用户分组用户人数的步骤之后,包括:
计算所述最优用户分组范围每两个用户之间的所述MR特征相似度;
遍历各所述MR特征相似度,根据层次聚类获取所述选定范围最小特征相似度和最大特征相似度;
将所述最小特征相似度作为单连接系数的初始值,通过迭代计算,获得满足最优用户分组的单连接系数;
将所述最大特征相似度作为全连接系数的初始值,通过迭代计算,获得满足最优用户分组的全连接系数。
8.如权利要求1所述的邻近用户识别方法,其特征在于,所述根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组的步骤之后,包括:
根据所述最优邻近用户分组识别临近用户群体,并赋予各所述用户识别号;
根据各所述用户真实的位置信息和各所述识别号进行填充,获取各所述用户的真实位置网格分布图;
基于所述真实位置网格分布图,结合所述最优邻近用户分组,根据用户组进行颜色渲染,验证最近用户分组效果。
9.一种终端,其特征在于,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的邻近用户识别程序,所述邻近用户识别程序被所述处理器执行时实现如权利要求1至8中任一项所述的邻近用户识别方法的步骤。
10.一种存储介质,其特征在于,所述存储介质上存储有邻近用户识别程序,所述邻近用户识别程序被处理器执行时实现如权利要求1至8中任一项所述的邻近用户识别方法的步骤。

说明书全文

邻近用户识别方法、终端及可读存储介质

技术领域

[0001] 本申请涉及无线通信技术领域,尤其涉及一种基于常驻用户群体分组的邻近用户识别方法、终端及可读存储介质。

背景技术

[0002] 目前,移动互联网70%以上的业务发生在室内,室内场景已成为网络优化及业务应用的重点区域。现有的室内用户识别针对单个用户特定时刻的室内位置进行定位,即基于用户无线网络连接,或用户WIFI网络以及蓝牙设备连接,通过室内硬件设备的支持,采集现场定位指纹数据后,才能实现室内用户的识别和定位。由此可见,目前室内用户识别方法硬件需求条件高,而且获得的单个用户数据不具备代表性。发明内容
[0003] 本申请的主要目的在于提供一种邻近用户识别方法、终端及计算机存储介质,旨在解决现有技术中室内用户识别方法硬件需求条件高,而且获得的单个用户数据不具备代表性的技术问题。
[0004] 为实现上述目的,本申请实施例提供一种邻近用户识别方法,所述邻近用户识别方法包括以下步骤:
[0005] 获取各用户的常驻小区MR特征信息,根据所述各常驻小区MR特征信息计算获得所述各用户MR特征系数;
[0006] 根据所述MR特征信息和所述MR特征系数,计算MR特征相似度;
[0007] 根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组。
[0008] 可选地,所述获取各用户的各常驻小区MR特征信息的步骤包括:
[0009] 获取所述各用户预设天数的白天工作常驻小区的MR数据,作为第一MR数据;
[0010] 获取所述各用户预设天数的晚上居住常驻小区的MR数据,作为第二MR数据;
[0011] 基于各所述第一MR数据和各所述第二MR数据,筛选预设时间段内的各所述用户常驻小区MR数据。
[0012] 可选地,所述筛选预设时间段内的各所述用户常驻小区MR数据的步骤之后,包括:
[0013] 基于各所述用户常驻小区MR数据,依次将各所述用户常驻小区作为主服小区,将所述常驻小区MR数据中常驻小区之外的各小区作为邻近小区,获取所述主服小区场强和各邻近小区场强的平均场强、各主服小区识别号和各邻近小区识别号;
[0014] 根据所述各邻近小区通信上报频次预设筛选条件,从所述通信上报频次筛选得到选定邻区频次,其中,所述预设筛选条件包括预设上报频次排名和预设频次阈值
[0015] 将所述平均场强和所述选定邻区频次作为各所述常驻小区MR特征信息。
[0016] 可选地,所述将所述平均场强和所述选定邻区频次作为各所述常驻小区MR特征信息的步骤之后,包括:
[0017] 将各所述平均场强进行归一化处理,得到场强系数;
[0018] 将各所述选定邻区频次进行归一化处理,得到频次系数;
[0019] 将所述场强系数和所述频次系数作为所述各用户MR特征系数。
[0020] 可选地,所述根据所述MR特征信息和所述MR特征系数,计算MR特征相似度的步骤包括:
[0021] 获取同一个预设小区内两个常驻用户的所述MR特征信息;
[0022] 若所述两个常驻用户的所述MR特征信息具有相同的所述邻近小区识别号,则提取所述两个常驻用户的所述MR特征系数,以通过预设第一算法计算获得所述两个常驻用户的MR特征相似度;
[0023] 若所述两个常驻用户的所述MR特征信息不具有相同的所述邻近小区识别号,则提取所述两个常驻用户的所述MR特征系数,以通过预设第二算法计算获得所述两个常驻用户的MR特征相似度。
[0024] 可选地,所述根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组的步骤包括:
[0025] 根据预设第一参数,确定有效用户组的用户数;
[0026] 根据预设第二参数,从所述有效用户组的用户数确定最优用户分组用户人数。
[0027] 可选地,所述从所述有效用户组的用户数确定最优用户分组用户人数的步骤之后,包括:
[0028] 计算所述最优用户分组范围每两个用户之间的所述MR特征相似度;
[0029] 遍历各所述MR特征相似度,根据层次聚类获取所述选定范围最小特征相似度和最大特征相似度;
[0030] 将所述最小特征相似度作为单连接系数的初始值,通过迭代计算,获得满足最优用户分组的单连接系数;
[0031] 将所述最大特征相似度作为全连接系数的初始值,通过迭代计算,获得满足最优用户分组的全连接系数。
[0032] 可选地,所述根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组的步骤之后,包括:
[0033] 根据所述最优邻近用户分组识别临近用户群体,并赋予各所述用户识别号;
[0034] 根据各所述用户真实的位置信息和各所述识别号进行填充,获取各所述用户的真实位置网格分布图;
[0035] 基于所述真实位置网格分布图,结合所述最优邻近用户分组,根据用户组进行颜色渲染,验证最近用户分组效果。
[0036] 本申请还提供一种终端,所述终端包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的邻近用户识别程序,所述邻近用户识别程序被所述处理器执行时实现如上所述的邻近用户识别方法的步骤。
[0037] 本申请还提供一种计算机存储介质,所述计算机存储介质上存储有邻近用户识别程序,所述邻近用户识别程序被处理器执行时实现如上所述的邻近用户识别方法的步骤。
[0038] 本申请在最优邻近用户分组的过程中,首先获取各用户的常驻小区MR特征信息,根据所述各常驻小区MR特征信息计算获得所述各用户MR特征系数;然后根据所述MR特征信息和所述MR特征系数,计算MR特征相似度;最后根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组。本申请基于常驻用户群体对临近用户进行识别,从而可以利用邻近用户的群体特征来对室内无线网络质量进行监控,并对室内网络故障进行告警。同时,针对相临近用户群体,也可以应用于关联业务推广,具有极大的应用价值。附图说明
[0039] 此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0040] 为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0041] 图1为本申请实施例一个可选的终端的硬件结构示意图;
[0042] 图2为本申请邻近用户识别方法一实施例的流程示意图;
[0043] 图3为图2中步骤S10的一细化流程示意图;
[0044] 图4为图3中步骤S13之后新增的流程步骤示意图;
[0045] 图5为图4中步骤S16之后新增的流程步骤示意图;
[0046] 图6为图2中步骤S20的一细化流程示意图;
[0047] 图7为图2中步骤S30的一细化流程示意图;
[0048] 图8为图7中步骤S32之后新增的流程步骤示意图;
[0049] 图9为图2中步骤S30之后新增的流程步骤示意图;
[0050] 图10为本申请邻近用户识别方法中用户的真实位置网格分布示意图;
[0051] 图11为本申请邻近用户识别方法中验证最近用户分组渲染效果示意图。
[0052] 本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。

具体实施方式

[0053] 应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
[0054] 在后续的描述中,使用用于表示元件的诸如“模”、“部件”或“单元”的后缀仅为了有利于本申请的说明,其本身没有特定的意义。因此,“模块”、“部件”或“单元”可以混合地使用。
[0055] 如图1所示,图1是本申请实施例方案涉及的硬件运行环境的终端结构示意图。
[0056] 本申请实施例终端可以是固定终端,如物联网智能设备,包括智能空调、智能电灯、智能电源、智能路由器等智能家居;也可以是移动终端,包括智能手机、可穿戴的联网AR/VR装置、智能音箱、自动驾驶汽车等诸多联网设备。
[0057] 如图1所示,该邻近用户识别系统的架构设计包括节点服务器,其设备结构可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
[0058] 可选地,该邻近用户识别系统还可以包括用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路传感器、音频电路、WiFi模块等等。用户接口可以包括显示屏(Display)、触摸屏、摄像头(包括AR/VR设备)等,可选用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口、蓝牙接口、探针接口、3G/4G/5G联网通信接口等)。
[0059] 本领域技术人员可以理解,图1中示出的邻近用户识别系统结构并不构成对邻近用户识别系统的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
[0060] 如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及邻近用户识别程序。操作系统是管理和控制邻近用户识别系统硬件和软件资源的程序,支持邻近用户识别程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与邻近用户识别系统中其它硬件和软件之间通信。
[0061] 在图1所示的邻近用户识别系统中,处理器1001用于执行存储器1005中存储的邻近用户识别程序,实现以下步骤:
[0062] 获取各用户的常驻小区MR特征信息,根据所述各常驻小区MR特征信息计算获得所述各用户MR特征系数;
[0063] 根据所述MR特征信息和所述MR特征系数,计算MR特征相似度;
[0064] 根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组。
[0065] 进一步地,处理器1001可以调用存储器1005中存储的邻近用户识别程序,还执行以下操作:
[0066] 获取所述各用户预设天数的白天工作常驻小区的MR数据,作为第一MR数据;
[0067] 获取所述各用户预设天数的晚上居住常驻小区的MR数据,作为第二MR数据;
[0068] 基于各所述第一MR数据和各所述第二MR数据,筛选预设时间段内的各所述用户常驻小区MR数据。
[0069] 进一步地,处理器1001可以调用存储器1005中存储的邻近用户识别程序,还执行以下操作:
[0070] 基于各所述用户常驻小区MR数据,依次将各所述用户常驻小区作为主服小区,将所述常驻小区MR数据中常驻小区之外的各小区作为邻近小区,获取所述主服小区场强和各邻近小区场强的平均场强、各主服小区识别号和各邻近小区识别号;
[0071] 根据所述各邻近小区通信上报频次预设筛选条件,从所述通信上报频次筛选得到选定邻区频次,其中,所述预设筛选条件包括预设上报频次排名和预设频次阈值;
[0072] 将所述平均场强和所述选定邻区频次作为各所述常驻小区MR特征信息。
[0073] 进一步地,处理器1001可以调用存储器1005中存储的邻近用户识别程序,还执行以下操作:
[0074] 将各所述平均场强进行归一化处理,得到场强系数;
[0075] 将各所述选定邻区频次进行归一化处理,得到频次系数;
[0076] 将所述场强系数和所述频次系数作为所述各用户MR特征系数。
[0077] 进一步地,处理器1001可以调用存储器1005中存储的邻近用户识别程序,还执行以下操作:
[0078] 获取同一个预设小区内两个常驻用户的所述MR特征信息;
[0079] 若所述两个常驻用户的所述MR特征信息具有相同的所述邻近小区识别号,则提取所述两个常驻用户的所述MR特征系数,以通过预设第一算法计算获得所述两个常驻用户的MR特征相似度;
[0080] 若所述两个常驻用户的所述MR特征信息不具有相同的所述邻近小区识别号,则提取所述两个常驻用户的所述MR特征系数,以通过预设第二算法计算获得所述两个常驻用户的MR特征相似度。
[0081] 进一步地,处理器1001可以调用存储器1005中存储的邻近用户识别程序,还执行以下操作:
[0082] 根据预设第一参数,确定有效用户组的用户数;
[0083] 根据预设第二参数,从所述有效用户组的用户数确定最优用户分组用户人数。
[0084] 进一步地,处理器1001可以调用存储器1005中存储的邻近用户识别程序,还执行以下操作:
[0085] 计算所述最优用户分组范围每两个用户之间的所述MR特征相似度;
[0086] 遍历各所述MR特征相似度,根据层次聚类获取所述选定范围最小特征相似度和最大特征相似度;
[0087] 将所述最小特征相似度作为单连接系数的初始值,通过迭代计算,获得满足最优用户分组的单连接系数;
[0088] 将所述最大特征相似度作为全连接系数的初始值,通过迭代计算,获得满足最优用户分组的全连接系数。
[0089] 进一步地,处理器1001可以调用存储器1005中存储的邻近用户识别程序,还执行以下操作:
[0090] 根据所述最优邻近用户分组识别临近用户群体,并赋予各所述用户识别号;
[0091] 根据各所述用户真实的位置信息和各所述识别号进行填充,获取各所述用户的真实位置网格分布图;
[0092] 基于所述真实位置网格分布图,结合所述最优邻近用户分组,根据用户组进行颜色渲染,验证最近用户分组效果。
[0093] 基于上述硬件结构,提出本申请邻近用户识别方法的各个实施例。
[0094] 参照图2,本申请邻近用户识别方法第一实施例提供一种邻近用户识别方法方法,所述方法包括:
[0095] 步骤S10,获取各用户的常驻小区MR特征信息,根据各常驻小区MR特征信息计算获得各用户MR特征系数;
[0096] 常驻小区指的是用户物理位置以及手机通信上报地点长期占用的通信小区,包括了工作地和居住地两种工作类型;如用户A在某个时间段比如5个月中,在B科技园上班,在C公寓居住,那么用户A的手机通信上报地点则为B科技园和C公寓,则将B科技园和C公寓作为用户A的常驻小区。常驻小区MR特征信息指的是包括了用户手机识别号、驻点类型、常驻小区ECI(常驻小区识别号)三部分信息。MR特征系数指的是表征用户MR特征的系数,包括了场强和频次两个系数。
[0097] 步骤S20,根据MR特征信息和MR特征系数,计算MR特征相似度;
[0098] MR特征相似度指的是分别通过对两个用户MR特征系数中的场强和频次进行计算,获得两个用户之间的距离。
[0099] 步骤S30,根据预设分组条件和MR特征相似度,计算获得最优邻近用户分组。
[0100] 预设分组条件指的是邻近用户分组的组内用户数量的限制要求;先通过预设分组条件得到用户数量;再依次计算此围内每两个用户之间的距离,即获得MR特征相似度;最后通过迭代运算,即可得的最优邻近用户分组。
[0101] 在本实施例中,首先获取各用户的常驻小区MR特征信息,根据所述各常驻小区MR特征信息计算获得所述各用户MR特征系数;然后根据所述MR特征信息和所述MR特征系数,计算MR特征相似度;最后根据预设分组条件和所述MR特征相似度,计算获得最优邻近用户分组。本申请基于常驻用户群体对临近用户进行识别,从而可以利用邻近用户的群体特征来对室内无线网络质量进行监控,并对室内网络故障进行告警。同时,针对相临近用户群体,也可以应用于关联业务推广,具有极大的应用价值。
[0102] 进一步地,在本申请邻近用户识别方法另一实施例中,参照图3,在步骤S10包括:
[0103] 步骤S11,获取各用户预设天数的白天工作常驻小区的MR数据,作为第一MR数据;
[0104] 常驻小区包括白天工作常驻小区和晚上居住常驻小区;白天工作常驻小区指的是用户白天在工作地长期占用的小区,晚上居住常驻小区指的是用户晚上在居住地长期占用的小区;预设天数指的是达到一定数量、具有代表性的日期,主要是为了扩大统计的时间范围,减小得到的统计数据的误差,如某用户到外地出差一个月则如果用这一个月的时间来统计,得不到我们需要的用户常驻小区的数据,因此需要拉长时间维度,如使用三个月去统计;MR数据包括了用户手机识别号、主服小区识别号、邻近小区识别号、平均场强和邻区上报频次。
[0105] 步骤S12,获取各用户预设天数的晚上居住常驻小区的MR数据,作为第二MR数据;
[0106] 获取各用户预设天数的白天工作常驻小区的MR数据作为第一MR数据之后,同理,获取各用户预设天数的晚上居住常驻小区的MR数据,作为第二MR数据。根据现代人类的作息习惯,天亮的时间段一般在工作场所上班,天暗的时间段一般回到居住地准备就寝,因此分别统计白天和晚上用户不同常驻小区的数据,提高了所得常驻小区的MR数据的准确率。
[0107] 步骤S13,基于各第一MR数据和各第二MR数据,筛选预设时间段内的各用户常驻小区MR数据。
[0108] 为了进一步提升获取所得MR数据的代表性和提高数据分析的准确率,选用从步骤S11和步骤S12得到的第一MR数据和第二MR数据进行筛选;预设时间段包括白天工作时间段和晚上居住时间段,白天工作时间段为9:00-12:00和14:00-17:00,晚上居住时间段为19:00-24:00和0:00-6:00。即从第一MR数据筛选出时间段为9:00-12:00和14:00-17:00的数据、从第二MR数据筛选出时间段为19:00-24:00和0:00-6:00的数据。
[0109] 在本实施例中,获取各用户预设天数的白天工作常驻小区的MR数据、晚上居住常驻小区的MR数据,然后基于这些数据,筛选预设时间段内的各用户常驻小区MR数据,为后续获取用户常驻小区MR特征信息做好准备。
[0110] 进一步地,在本申请邻近用户识别方法又一实施例中,参照图4,在步骤S13之后,包括:
[0111] 步骤S14,基于各用户常驻小区MR数据,依次将各用户常驻小区作为主服小区,将常驻小区MR数据中常驻小区之外的各小区作为邻近小区,获取主服小区和各邻近小区场强的平均场强、各主服小区识别号和各邻近小区识别号;
[0112] 一个手机可以接受多个网元小区信号,把正在提供服务的小区称为主服小区,把备选提供服务的小区称为邻近小区。平均场强指的是单个用户主服小区的场强和依次该用户每个邻近小区的场强计算所得的平均值,邻近小区的数量与平均场强的数量一一对应。
[0113] 步骤S15,根据各邻近小区通信上报频次预设筛选条件,从通信上报频次筛选得到选定邻区频次,其中,预设筛选条件包括预设上报频次排名和预设频次阈值;
[0114] 上报频次预设筛选条件指的是为了筛除用户在非常驻位置上上报的MR数据(如离开座位等)所设置条件;依据频次计算公式获得用户邻区数据上报频次FREQi,其中计算用户邻区数据上报频次FREQi的公式如下:
[0115]
[0116] 计算每个小区的频次后,提取出现频次FREQi处在前6名的小区且满足FREQi≥FREQm,其中FREQm为频次的限阈值。例如,最终单个用户的MR特征值如下输出如下表:
[0117]
[0118]
[0119] 步骤S16,将平均场强和选定邻区频次作为各常驻小区MR特征信息。
[0120] 例如某用户的邻近小区(简称邻区)有3个,分别为邻区1、邻区2和邻区3,则通过步骤S14和步骤S15,可获得主服场强E和邻区1场强的平均场强E1,邻区1频次;主服场强和邻区2场强的平均场强E2,邻区2频次;主服场强和邻区3场强的平均场强E3,邻区3频次,那么主服场强E、平均场强E1、平均场强E2、平均场强E3、邻区1频次、邻区2频次、邻区3频次为MR特征信息。
[0121] 在本实施例中,通过积累多天并筛选特定时间段的各用户常驻小区MR数据之后,再根据邻区上报频次筛选条件邻区选定频次,最后将获得的平均场强和选定邻区频次作为各常驻小区MR特征信息。
[0122] 进一步地,在本申请邻近用户识别方法又一实施例中,参照图5,在步骤S16之后,包括:
[0123] 步骤S17,将各平均场强进行归一化处理,得到场强系数;
[0124] 步骤S18,将各选定邻区频次进行归一化处理,得到频次系数;
[0125] 步骤S19,将场强系数和频次系数作为各用户MR特征系数。
[0126] 各平均场强和各选定邻区频次指的是步骤S16所得的两个MR特征值;即用户常驻小区MR特征值中包含平均场强和邻区频次,因为特征值列表中,RSRP(场强,参考信号接收功率)和FREQ(出现频次)具有不同的量纲,需要进行数据标准化处理,以解决数据指标之间的可比性问题,即归一化后平均场强和各选定邻区频次均变成(0,1]的值。归一化的方法是将有量纲的数据转化为无量纲的数据表达。依据线性函数归一化(Min-Max scaling)公式,把场强和频次转换到(0,1]的范围,其中,归一化公式如下:
[0127]
[0128] 其中,X为归一化前的数值、Xnorm为归一化后的数值、Xmax为样本数据中的最大值、Xmin为样本数据中的最小值;将平均场强和邻区频次分别归一化,即代入上述归一化公式,就可得即可得到场强系数RSRPnorm和频次系数FREQnorm,场强系数和频次系数即为各用户MR特征系数。
[0129]
[0130]
[0131] 在本实施例中,通过归一化方法将平均场强和邻区频次分别归一化,即可得到各用户MR特征系数:场强系数RSRPnorm和频次系数FREQnorm。
[0132] 进一步地,在本申请邻近用户识别方法又一实施例中,参照图6,步骤S20包括:
[0133] 步骤S21,获取同一个预设小区内两个常驻用户的MR特征信息;
[0134] 步骤S22,若两个常驻用户的MR特征信息具有相同的邻近小区识别号,则提取两个常驻用户的MR特征系数,通过预设第一算法计算获得两个常驻用户的MR特征相似度;
[0135] 步骤S23,若两个常驻用户的MR特征信息不具有相同的邻近小区识别号,则提取两个常驻用户的MR特征系数,通过预设第二算法计算获得两个常驻用户的MR特征相似度。
[0136] 距离度量(Distance)用于衡量个体在空间上存在的距离,距离越远说明个体间的差异越大。欧氏距离是一种常用的距离定义,指在m维空间中两个点之间的真实距离,对多维向量A=(A1,A2,……,An),B=(B1,B2,……,Bn),欧氏距离的计算公式如下:
[0137]
[0138] 其中, 为用户邻区对距离总和,n为用户邻区对的个数。
[0139] 常驻用户的特征值中包含测量到信号的邻区ECI,场强和出现频次,归一化后变成(0,1]的值。提取同一个小区内的两个常驻用户,提取他们的MR特征,针对双方的邻区数据进行距离运算,通过以上方法,可以获取两个用户的邻区对距离;再通过邻区对距离,可以计算用户MR特征距离,分开两种情况,公式如下:
[0140] 情况1:两个用户的邻区列表内都具有该小区的信号,使用上述第一算法计算用户MR特征距离,具体公式如下:
[0141]
[0142] 情况2:其中一方不具备该小区信号,使用上述第二算法计算用户MR特征距离,具体公式如下:
[0143]
[0144] 在本实施例中,基于欧式距离模型,计算用户MR特征相似度,相似度越高,两个用户之间的实际距离越近。
[0145] 进一步地,在本申请邻近用户识别方法又一实施例中,参照图7,步骤S30包括:
[0146] 步骤S31,根据预设第一参数,确定有效用户组的用户数;
[0147] 步骤S32,根据预设第二参数,从有效用户组的用户数确定最优用户分组用户人数。
[0148] 在本实施例中,最优用户分组需要满足预设第一参数α和预设第二参数β:
[0149]
[0150] GroupUsermax≤β
[0151] 其中:GroupUser为归属于有效用户组(组内人数大于等于5人)的用户数,AllUser为全部用户,α为有效用户组人数占比最优值;GroupUsermax为人数最多的用户组的用户个数;β为最多人数的用户组人数最优值。
[0152] 进一步地,在本申请邻近用户识别方法又一实施例中,参照图8,步骤S32之后,包括:
[0153] 步骤S33,计算最优用户分组范围每两个用户之间的MR特征相似度;
[0154] 每两个用户之间的MR特征相似度即为MR特征系数(簇)之间的距离,计算簇间的距离的方法如下:
[0155] 每个簇都是一个集合,因此需要计算集合的某种距离即可。例如,给定簇Ci和Cj,可通过以下3种方式计算距离:
[0156] 最小距离:dmin(Ci,Cj)=minx∈Ci,z∈Cjdist(x,z)
[0157] 最大距离:dmax(Ci,Cj)=maxx∈Ci,z∈Cjdist(x,z)
[0158] 平均距离:
[0159] 最小距离由两个簇的最近样本决定,最大距离由两个簇的最远样本决定。
[0160] 步骤S34,遍历各MR特征相似度,根据层次聚类获取选定范围最小特征相似度和最大特征相似度;
[0161] 遍历是指沿着某条搜索路线,依次对树(或图)中每个节点均做一次访问。访问结点所做的操作依赖于具体的应用问题,具体的访问操作可能是检查节点的值、更新节点的值等。不同的遍历方式,其访问节点的顺序是不一样的。遍历所有用户间的距离,得到距离矩阵中的最小值为Distancemin,距离矩阵中的最大值为Distancemax。
[0162] 层次聚类试图在不同的层次对数据集进行划分,它的思路是先将数据集中的每个样本看作一个初始聚类簇,然后找出两个聚类最近的两个簇进行合并,不断重复该步骤,直到达到预设的聚类个数或某种条件。
[0163] 凝聚层次聚类中,判定簇间距离的两个标准方法就是单连接(single linkage)和全连接(complete linkage)。单连接,是计算每一对簇中最相似两个样本的距离,并合并距离最近的两个样本所属簇。全连接,通过比较找到分布于两个簇中最不相似的样本(距离最远),从而来完成簇的合并。
[0164] 步骤S35,将最小特征相似度作为单连接系数的初始值,通过迭代计算,获得满足最优用户分组的单连接系数;
[0165] 步骤S36,将最大特征相似度作为全连接系数的初始值,通过迭代计算,获得满足最优用户分组的全连接系数。
[0166] 决定用户组聚类的关键因子包括两个:单连接系数(Distancesingle)、全连接系数(Distancecomplete)。设定Distancesingle的初始值为Distancemin,Distancecomplete的初始值为Distancemax,通过迭代运算,计算出满足最优用户分组两个条件的最优系数Distancesingle、Distancecomplete。
[0167] 在本实施例中,首先计算获取选定范围每两个用户之间的MR特征相似度;然后遍历各MR特征相似度,获取选定范围最小特征相似度和最大特征相似度;再将最小特征相似度作为单连接系数的初始值,通过迭代计算,获得满足最优用户分组的单连接系数;最后将最大特征相似度作为全连接系数的初始值,通过迭代计算,获得满足最优用户分组的全连接系数。
[0168] 进一步地,在本申请邻近用户识别方法又一实施例中,参照图9,步骤S30之后,包括:
[0169] 步骤S40,根据最优邻近用户分组识别临近用户群体,并赋予各用户识别号;
[0170] 提取某个楼层下的用户数据进行验证测试。举个例子,通过以上聚类算法,将用户进行聚类识别,识别临近用户群体,并赋予ID标识,结果如下:
[0171] GroupA:AA,AB,AD,AE,AG,BA,BB,BC,BD,BE,BF,BG,CA,CB,CC,CD,CE,CF[0172] GroupB:DC,DD,DF,EC,EE,FC,FD,FE,FG,GC,GD,GE,GF,GG,HG
[0173] GroupC:FF,HC,HD,HE,HF,ID,IE,JA,JB,JD,JF
[0174] GroupD:IC
[0175] 其中,AA、AB…是用户的标识号。
[0176] 步骤S50,根据各用户真实的位置信息和各识别号进行填充,获取各用户的真实位置网格分布图;
[0177] 将平面区域分开为7*10的网格区域,根据用户真实的位置信息和识别号填充,获取用户的真实位置网格分布图,真实位置参照图10。
[0178] 步骤S60,基于真实位置网格分布图,结合最优邻近用户分组,根据用户组进行颜色渲染,验证最近用户分组效果。
[0179] 真实位置网格分布图指的是用户物理位置分布相关示意图。此处用(1)代表第一种颜色,用(2)代表第2种颜色,用(3)代表第三种颜色,用(4)代表第四种颜色,渲染效果参照图11。
[0180] 在本实施例中,首先根据最优邻近用户分组识别临近用户群体,并赋予各用户识别号;然后根据各用户真实的位置信息和各识别号进行填充,获取各用户的真实位置网格分布图;最后基于真实位置网格分布图,结合最优邻近用户分组,根据用户组进行颜色渲染,验证最近用户分组效果,即实现了临近用户群体识别及效果验证。
[0181] 本申请还提供一种终端,所述终端包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的邻近用户识别程序,所述邻近用户识别程序被所述处理器执行时实现上述邻近用户识别方法的步骤。
[0182] 本申请还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有邻近用户识别程序,所述邻近用户识别程序被处理器执行时实现上述的邻近用户识别方法的步骤。
[0183] 在本申请邻近用户识别方法、终端及可读存储介质的实施例中,包含了上述邻近用户识别方法各实施例的全部技术特征,说明书拓展和解释内容与上述邻近用户识别方法各实施例基本相同,在此不做赘述。
[0184] 需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0185] 上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
[0186] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,空调器,或者网络设备等)执行本申请各个实施例所述的方法。
[0187] 以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈