基于运动轨迹的高铁用户识别方法 |
|||||||
申请号 | CN201710084157.0 | 申请日 | 2017-02-16 | 公开(公告)号 | CN106878946A | 公开(公告)日 | 2017-06-20 |
申请人 | 山东浪潮商用系统有限公司; | 发明人 | 苗慧生; | ||||
摘要 | 本 发明 公开了基于运动轨迹的高 铁 用户识别方法,属于移动用户特殊场景识别技术领域,包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长;车站小区:候车大厅/站台/高铁进站前后,出站前后的占用小区;高铁小区:高铁小区+市区内非高铁小区;公网小区:非市区的第一层小区;占用第一个小区时间:取该小区下最后一条XDR的结束时间;占用最后一个小区时间:取该小区下第一条XDR的开始时间。本发明通过结合车站小区、高铁专网小区、高铁附近公网小区、小区占用时长、路段速度筛选,简化识别 算法 ,提高识别 精度 。 | ||||||
权利要求 | 1.基于运动轨迹的高铁用户识别方法,其特征在于包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长; |
||||||
说明书全文 | 基于运动轨迹的高铁用户识别方法技术领域[0001] 本发明涉及移动用户特殊场景识别技术领域,具体地说是基于运动轨迹的高铁用户识别方法。 背景技术[0002] 现有的高铁用户识别算法受限于高铁车速动态性、切换序列不稳定等因素,识别效果较差。现有高铁用户识别算法如下:通过采集S1-MME接口的信令消息,将同一用户占用的小区按照时间顺序先后排序,当该用户占用高铁专网小区个数超过3个,再依据用户在高铁专网小区间移动速率,综合识别为高铁用户。具体步骤如下: 第一步:全量用户筛选法,统计一个时间粒度内(60分钟),同一用户出现了3个以上不同高铁专网小区下的用户,将这批用户定义为高铁基础用户。 [0003] 第二步:序列递增分析法,对高铁沿路的覆盖小区进行依次编号,例如京沪高铁济南地市段有24个高铁小区依据方向性依次编号,建议从省/地市边界为编号起始点,按照序列号递增(减)关系,找出用户所占的专网小区是否与编号匹配,提升识别精度。 [0004] 第三步:移动速率验证法,在序列递增(减)识别的用户基础上,按照用户所占的小区(建议为独立信源小区)距离,和在各小区出现的时间差,能够计算出用户的移动速率,通过判断移动速率是否>150km/小时,提升识别精度。 [0005] 第四步:输出满足以上条件的用户,定义为高铁用户。 [0006] 现有技术存在的问题和缺点:步骤三中的移动速率验证法,“通过判断移动速率是否>150km/小时,提升识别精度”该门限过于严格,例如列车在进站和出站,列车速度一般都低于100km/小时,另外算各小区间的时间差来求速度,实现的算法逻辑过于复杂,实现难度较大。步骤二中序列递增分析法,“按照序列号递增(减)关系,找出用户所占的专网小区是否与编号匹配,提升识别精度”实现难度角度,因为通信系统中的无线环境无法预测,手机在小区间的切换如频繁切换、乒乓切换等带有无序性、随机性,不会按照特定的顺序进行切换,因此序列递增分析法实现难度角度。 发明内容[0007] 本发明的技术任务是针对以上不足之处,提供基于运动轨迹的高铁用户识别方法,通过结合车站小区、高铁专网小区、高铁附近公网小区、小区占用时长、路段速度筛选,简化识别算法,提高识别精度。 [0008] 本发明解决其技术问题所采用的技术方案是:基于运动轨迹的高铁用户识别方法,包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长; 车站小区:候车大厅/站台/高铁进站前后,出站前后的占用小区; 高铁小区:高铁小区+市区内非高铁小区,如太原-晋中等特殊情况; 公网小区:非市区的第一层小区; 占用第一个小区时间:取该小区下最后一条XDR的结束时间(情景:用户上车,在候车大厅,等待时间较长); 占用最后一个小区时间:取该小区下第一条XDR的开始时间(情景:用户下车,出站时间较长); 总时长:占用最后一个小区时间-占用第一个小区时间;境内运行时间 [0009] 优选的,候车大厅/站台/高铁进站前后,出站前后的占用小区,同一个车站可以多个。 [0010] 优选的,结束时间-开始时间,集团规范一个XDR切割时间为5分钟。 [0011] 高铁用户识别步骤包括筛选小区集(高铁小区+公网小区+车站小区),统称小区集;统计一天时间内小区集的所有用户(可包含所有场景:用户在不同车站、不同时间的上下车行为,以及使用手机的不同状态,只要占用即可统计到);统计单用户(每个)占用小区集的情况:车站小区个数、高铁小区个数、总时长、单小区占用时长、移动速度等,将这些用户经过的小区按开始时间进行排序。 [0012] 算法如下:车站小区数>=2 and 高铁小区数>=2 and 总时长 [0013] 本发明的基于运动轨迹的高铁用户识别方法和现有技术相比,具有以下有益效果:利用大数据挖掘技术,对高铁用户快速移动中的关键数据如附着、TAU、PAGING等事件,以及HTTP、即时通信等话单进行分析;通过对车站小区、高铁小区、公网小区等名称的定义,实现快速、高效、准确的高铁用户识别,进而对高铁网络质量、高铁用户行为特征分析提供有效支撑。 [0014] 简化高铁用户识别算法,相对于现有算法“移动速率验证法”更加简单有效,仅对于车站小区数<2的用户,利用最后一个高铁小区和第一个高铁小区的时间差来求速度更加容易实现。忽略了通信系统中的无线环境导致的无序切换,对于不满足现有算法中的“序列递增分析法”的用户,能够更大程度的识别高铁用户,减少遗漏。 具体实施方式[0016] 下面结合具体实施例对本发明作进一步说明。 [0017] 基于运动轨迹的高铁用户识别方法,包括数据获取、名称定义,名称定义包括车站小区、高铁小区、公网小区、占用第一个小区时间、占用最后一个小区时间、总时长、单小区占用时长;车站小区:候车大厅/站台/高铁进站前后,出站前后的占用小区; 高铁小区:高铁小区+市区内非高铁小区,如太原-晋中等特殊情况; 公网小区:非市区的第一层小区; 占用第一个小区时间:取该小区下最后一条XDR的结束时间(情景:用户上车,在候车大厅,等待时间较长); 占用最后一个小区时间:取该小区下第一条XDR的开始时间(情景:用户下车,出站时间较长); 总时长:占用最后一个小区时间-占用第一个小区时间;境内运行时间 [0018] 优选的,候车大厅/站台/高铁进站前后,出站前后的占用小区,同一个车站可以多个。 [0019] 优选的,结束时间-开始时间,集团规范一个XDR切割时间为5分钟。 [0020] 高铁用户识别步骤包括筛选小区集(高铁小区+公网小区+车站小区),统称小区集;统计一天时间内小区集的所有用户(可包含所有场景:用户在不同车站、不同时间的上下车行为,以及使用手机的不同状态,只要占用即可统计到);统计单用户(每个)占用小区集的情况:车站小区个数、高铁小区个数、总时长、单小区占用时长、移动速度等,将这些用户经过的小区按开始时间进行排序。 [0021] 算法如下:车站小区数>=2 and 高铁小区数>=2 and 总时长 [0022] 利用大数据挖掘技术,对高铁用户快速移动中的关键数据如附着、TAU、PAGING等事件,以及HTTP、即时通信等话单进行分析;通过对车站小区、高铁小区、公网小区等名称的定义,实现快速、高效、准确的高铁用户识别,进而对高铁网络质量、高铁用户行为特征分析提供有效支撑。 [0023] 通过上面具体实施方式,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的具体实施方式。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。 |