一种基于大数据的人车关联识别方法

申请号 CN201410744522.2 申请日 2014-12-09 公开(公告)号 CN104468787A 公开(公告)日 2015-03-25
申请人 浪潮电子信息产业股份有限公司; 发明人 赵仁明; 辛国茂; 亓开元; 金洪殿;
摘要 本 发明 提供一种基于 大数据 的人车关联识别方法,属于大数据领域,本发明首先对MSC中手机 位置 信息的处理和准备,从而便于与卡口建立关联。并且通过卡口过车信息,提取目标车的行驶轨迹,并对在各个卡口相应时间的手机信息进行统计分析。通过获取交通卡口的过车数据,无线MSC数据,运营商的手机用户实名登记数据,进行智能分析比对,快速的智能的识别出目标车在一定时间范围内的车内的人员。
权利要求

1.一种基于大数据的人车关联识别方法,其特征在于,该方法由4部分组成:
(1)MSC中位置信息的映射和数据准备;
(2)根据卡口数据,描绘出目标车辆在指定时间范围内的行驶轨迹;
(3)根据目标车的行驶轨迹,对各卡口相应时间的MSC手机信息进行统计分析;得出与目标车辆存在潜在关联的手机号;
(4)通过手机用户实名登记数据,将人与车辆建立关联。
2.根据权利要求1所述的方法,其特征在于,
MSC中位置信息的映射和数据准备:
将卡口的过车信息实时的写入HBase数据库,包含车辆信息,过车时间,卡口编号等,其中rowkey为车牌号码+过车时间;将MSC信息进行映射和预处理,入HBase库;其中包含手机的msisdn,imei,imsi,dest_lac,dest_ci,时间,区域名称,rowkey为卡口ID+时间;
卡口的ID根据dest_lac以及dest_ci进行映射,将卡口附近的基站映射为该卡口ID。
3.根据权利要求1所述的方法,其特征在于,
目标车辆行驶轨迹的获取:
通过用户输入的车牌号和相应的时间段,在HBase中根据rowkey进行scan,可以得出目标车辆在一段时间以内完整的行驶轨迹。
4.根据权利要求1所述的方法,其特征在于,
车辆与手机信息的关联分析:
根据目标车辆曾出现的卡口,以及对应在卡口出现的时间,查找在对应时间前后几分钟之内的该卡口附近的手机信息,获取出现过的手机列表;统计分析这些手机号码在相应的卡口附近基站出现的次数;出现次数越高的手机号的潜在关联性越强。
5.根据权利要求1所述的方法,其特征在于,
人车关联的建立:
根据手机用户的实名登记信息,可以取得手机用户,从而建立了人与车辆对应的关联关系。

说明书全文

一种基于大数据的人车关联识别方法

技术领域

[0001] 本发明涉及大数据技术,尤其涉及一种基于大数据的人车关联识别方法。

背景技术

[0002] 大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和计算联系到一起,因为实时的大型数据集分析需要像MapReduce、HBase一样的框架来向数十、数百或甚至数千的电脑分配工作。大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统。
[0003] 大数据可分成大数据技术、大数据工程、大数据科学和大数据应用等领域。目前人们谈论最多的是大数据技术和大数据应用。工程和科学问题尚未被重视。大数据工程指大数据的规划建设运营管理的系统工程;大数据科学关注大数据网络发展和运营过程中发现和验证大数据的规律及其与自然和社会活动之间的关系。
[0004] 物联网、云计算、移动互联网、车联网、手机、平板电脑、PC以及遍布地球各个落的各种各样的传感器,无一不是数据来源或者承载的方式。
[0005] 大数据最核心的价值就是在于对于海量数据进行存储和分析。相比起现有的其他技术而言,大数据的“廉价、迅速、优化”这三方面的综合成本是最优的。
[0006] 交通事故处理中调查取证不全面甚至错误问题,以及可能由此引发一系列问题,道路交通事故机动车驾驶人识别调查取证较为困难。可否将大数据利用到交通系统中,用以解决现有的调查困难状况成为目前待解决的技术问题。

发明内容

[0007] 本发明采用基于大数据处理的方法,可以对目标车辆相应时间段内的人员进行定位,分析和建立人与车关联。对指定车辆的相应时间范围内相对固定的驾驶人进行识别。
[0008] 通过获取交通卡口的过车数据,无线MSC数据,运营商的手机用户实名登记数据,进行智能分析比对,快速的智能的识别出目标车在一定时间范围内的车内的人员。该方法由4部分组成:(1)MSC中位置信息的映射和数据准备。(2)根据卡口数据,描绘出目标车辆在指定时间范围内的行驶轨迹。(3)根据目标车的行驶轨迹,对各卡口相应时间的MSC手机信息进行统计分析。得出与目标车辆存在潜在关联的手机号。(4)通过手机用户实名登记数据,将人与车辆建立关联。
[0009] 本发明主要包含以下几个过程:(1)数据的准备:
将卡口的过车信息实时的写入HBase数据库,包含车辆信息,过车时间,卡口编号等,其中rowkey为车牌号码+过车时间。将MSC信息进行映射和预处理,入HBase库。其中包含手机的msisdn,imei,imsi,dest_lac,dest_ci,时间,区域名称等,rowkey为卡口ID+时间。卡口的ID根据dest_lac以及dest_ci进行映射,将卡口附近的基站映射为该卡口ID。
[0010] (2)目标车辆行驶轨迹的获取:通过用户输入的车牌号和相应的时间段,在HBase中根据rowkey进行scan,可以得出目标车辆在一段时间以内完整的行驶轨迹。主要包含车辆曾出现的卡口,以及相应的时间。
[0011] (3)车辆与手机信息的关联分析:根据目标车辆曾出现的卡口,以及对应在卡口出现的时间,查找在对应时间前后几分钟之内的该卡口附近的手机信息,获取出现过的手机列表。统计分析这些手机号码在相应的卡口附近基站出现的次数。出现次数越高的手机号的潜在关联性越强。
[0012] (4)人车关联的建立:根据手机用户的实名登记信息,可以取得手机用户,从而建立了人与车辆对应的关联关系。
[0013] 通过获取交通卡口的过车数据,无线MSC数据,运营商的手机用户实名登记数据,进行智能分析比对,快速的智能的识别出目标车在一定时间范围内的车内的人员。附图说明
[0014] 图1是手机信息映射示意图。
[0015] 图2是原始数据图。

具体实施方式

[0016] 首先对MSC中手机位置信息的处理和准备,从而便于与卡口建立关联。并且通过卡口过车信息,提取目标车的行驶轨迹,并对在各个卡口相应时间的手机信息进行统计分析。
[0017] 下面对本发明的内容进行更加详细的阐述:(1)将卡口过车信息写入HBase数据库中。原始数据如附图2;
(2)将手机信息写入HBase数据库中,根据不同的运营商基站的dest_lac和dest_ci与附近的卡口进行映射。将卡口周围的基站关联到这一卡口ID。例如dest_lac:54021 dest_ci:33281基站所对应的卡口ID为3701126116。将映射后的卡口ID一起存入HBase中。如附图1;
(3)查询目标车辆的相应时间段的轨迹信息。例如查找车牌号为鲁A12345在
2013-11-29,8点至10点的行驶轨迹,可以返回4条结果(分别经过ID为3701126151,
3701126190, 3701126235,3701126116的卡口)。对应经过卡口的时间分别是:08:20:00,
08:23:00,08:35:00,09:13:00;
(4)查找经过的每个卡口的时前后的一段时间内的手机信息。例如在卡口ID为
3701126151附近的基站,查找08:20:00前后两分钟之内的手机数据;
(5)统计手机号在车辆轨迹的各个卡口中出现的次数。
QQ群二维码
意见反馈