一种基于路测数据的基站位置定位方法 |
|||||||
申请号 | CN201610757586.5 | 申请日 | 2016-08-29 | 公开(公告)号 | CN106162652A | 公开(公告)日 | 2016-11-23 |
申请人 | 杭州电子科技大学; | 发明人 | 元广杰; 苑鹏; 李小东; 江照意; 郭志潍; | ||||
摘要 | 本 发明 公开了一种基于路测数据的基站 位置 定位 方法。本发明首先采集基站 信号 路测原始数据,对原始数据进行极坐标转换;其次,对转换后的数据进行白化处理;然后,对白化后的数据进行k‑means聚类处理,确定 数据中心 点;最后,对确定的中心点进行极坐标反转,所得坐标信息即为当前基站物理位置。本发明通过对路测 大数据 的研究,充分考虑数据点的离散型和相关性,提出对原始数据进行极坐标转换和白化处理等方法,最终应用k‑means聚类 算法 实现基站的物理位置定位。基站物理位置坐标的获得对于基站信号的强度分布和基站信号 覆盖 范围分布有着重要的参考作用。 | ||||||
权利要求 | 1.一种基于路测数据的基站位置定位方法,其特征在于:首先采集基站信号路测原始数据,对原始数据进行极坐标转换;其次,对转换后的数据进行白化处理;然后,对白化后的数据进行k-means聚类处理,确定数据中心点;最后,对确定的中心点进行极坐标反转,所得坐标信息即为当前基站物理位置。 |
||||||
说明书全文 | 一种基于路测数据的基站位置定位方法技术领域背景技术[0002] 以物联网、大数据和云计算为代表的新一代信息通信技术发展迅猛,物联网技术正在通过与其它新技术的不断融合,加速向各个领域渗透,精确的节点定位是物联网位置服务应用的关键。同时,“大数据”已经成为当今人们生产和生活的热点词汇,无处不在的社会和商业活动源源不断地产生各种数据,例如一些城市特定部门采集的基站信令数据就属其中的一种。对于基于路测大数据定位技术的研究价值是巨大的,尤其是当大数据和当今的物联网相融合时。 [0003] 基于路测数据的基站位置定位方法,以所采集的路测信息数据库作为实验数据,在复杂的实际环境下,实现基站物理位置的主动定位,摆脱对运营商的信息依赖。基站物理位置的获取,一方面可在之后的路测数据采集工程中作为信号强度变化趋势的参考点;另一方面,在之后研究的定位基站信号覆盖范围的算法中,也作为了一个非常重要的参考点。 [0004] 在数据处理过程中,重点应用了k-means聚类算法。在实际的应用中,聚类分块并没有考虑信号的相关性,导致分类精度不够高,从而致使定位精度不够高。本发明提出将RSSI信号白化后在进行k-means聚类,去除数据之间的相关性,提高聚类中心的合理性和可信度,使得基站的定位精度有了一定程度的提高。 发明内容[0005] 本发明基于现有应用和技术背景,针对现有数据处理上的不足,提出一种基于路测数据的基站位置定位方法。 [0006] 本发明首先采集基站信号路测原始数据,对原始数据进行极坐标转换;其次,对转换后的数据进行白化处理;然后,对白化后的数据进行k-means聚类处理,确定数据中心点;最后,对确定的中心点进行极坐标反转,所得坐标信息即为当前基站物理位置。 [0007] 本发明的有益效果是:通过对路测大数据的研究,充分考虑数据点的离散型和相关性,提出对原始数据进行极坐标转换和白化处理等方法,最终应用k-means聚类算法实现基站的物理位置定位。基站物理位置坐标的获得对于基站信号的强度分布和基站信号覆盖范围分布有着重要的参考作用。附图说明 [0008] 图1为城市路测数据采集示意图; [0009] 图2为极坐标转换示意图; [0010] 图3为白化前后聚类精度对比结果图; [0011] 图4为基站物理位置定位结果对比图; [0012] 图5为白化前后基站位置定位精度统计结果。 具体实施方式[0013] 以下结合附图对本发明作进一步说明。 [0014] 如图1所示,对定位目标区域运用专业路测设备进行基站路测数据的采集,其中采集轨迹按照城市道路情况。图中的每一个红色标记代表一个数据采样点,每一个采样点包含移动、联通、电信的各制式数据以及WIFI数据信息。以电信4G为例,所含参数信息如下表所示。 [0015] [0016] 具体步骤如下: [0017] 步骤一:从采集数据中依据(LAC,CI)值筛选出属于某一个(LAC,CI)区域的所有采集点。 [0018] 步骤二:从上述筛选后的点集中找出所有具有相同RSSI值的采集点点对,设第i对采集点的垂直平分线方程为y=aix+bi,为避免ai,bi出现极端情况,采用参数变换方法将垂直平分线转换为一个极坐标(r,θ)。极坐标转换示意图如图3所示,其中,r为原点o到直线y=aix+bi的距离,θ为射线与x轴之间的夹角。空间中的点(r,θ)对应于原坐标系中的一条直线。 [0019] 步骤三:对所有点进行白化处理,白化(Whitening)的目的就是去除数据之间相关带来的冗余,保证数据的性质不变,降低相关性。数据的Whitening必须满足两个条件:一是不同特征间相关性最小,接近0;二是所有特征方差相等。常见的白化操作有PCA Whitening和ZCA Whitening。 [0020] PCA Whitening是保证数据各维度的方差为1,而ZCA Whitening是保证数据的各维度的方差相等即可。并且两种Whitening的用途也不一样,PCA Whitening主要用于降维且去相关性,而ZCA Whitening主要用于去除相关性,且尽量保持原数据。本发明这里只是想去掉数据之间的相关性,因此采用ZCA Whitening。ZCA Whitening公式为公式(1)、(2): [0021] [0022] xZCAwhite=UxPCAwhite (2) [0023] 上式中,xrot,i表示每个特征数据, 为缩放因子,xPCAwhite表示经过PCA白化处理的数据,U表示一个特征向量矩阵。 [0024] 步骤四:基于所有(r,θ)坐标点进行聚类分析,计算基站坐标位置。所用到的K-means聚类算法主要步骤为: [0026] 2)确定任意采集点p的类别 [0027] 3)将属于第i类采集点集合Si的聚类中心更新为 其中pj∈Si,in为集合Si的元素个数。 [0028] 4)如果||ci-c′i||<σ,σ为某一给定的阈值,则程序终止;否则,重复步骤2)、3)和4),直到条件满足。 [0029] 定位结果分析:图3显示了聚类中心数目K从1到8变化时,白化前后的聚类精度。由图3可以看出,白化后的K-means算法在聚类准确度上优于白化之前的效果。而且,随着聚类中心k值的增加,效果更加明显,这是因为,在一定的定位区域内,k值越大,意味着将定位区域划分成了越多的子区域,与此同时相邻的子区域之间数据的相关性就越大,通过白化后去除数据之间的相关性带来的冗余,从而使得白化后的聚类精度有了明显的提升。由图3也可以看出,k值过大或过小都不利于聚类精度的提高,以k等于4为分界点,k值过小,聚类精度没有明显的变化,k值过大,聚类精度下降很快。因此,k值的选取对于实验的结果有着直接的影响,所以为了提高实验的简易性和结果的精确性,本次实验将聚类中心值定位4。图4(a)、4(b)分别为白化前后基站位置定位结果示意图。图中标识文字为“基站物理位置”的塔状标记表示基站的实际物理位置,另一个为算法定位的物理位置。图5为白化前后基站位置定位统计结果图。由图5易知,不同的定位精度下,对信号白化后再进行聚类,可明显提高实验定位精度。白化后的定位精度在2米内的概率为60%,较RSS无白化的定位精度提高了39%左右;在3米内的定位精度概率为77%左右,提高了12%左右;而且,在1米内的定位精度概率也有较为明显的提高。 |