首页 / 专利库 / 人工智能 / 人工智能 / 机器学习 / 半监督学习 / 基于支持向量机的半监督学习室内定位方法

基于支持向量机的半监督学习室内定位方法

阅读:610发布:2020-10-04

专利汇可以提供基于支持向量机的半监督学习室内定位方法专利检索,专利查询,专利分析的服务。并且本 发明 涉及基于 支持向量机 的半 监督学习 室内 定位 方法,该定位方法包括如下步骤:S1.对室内定位环境进行网格划分,并对每个网格采集接收到来自 覆盖 区域内WiFi无线接入点AP的 信号 接收强度RSS数据;S2.对所述采集数据进行处理;S3.对移动终端进行定位。本发明这种支持向量机方法实时定位 精度 高,采集数据利用效率高,适用场景广。,下面是基于支持向量机的半监督学习室内定位方法专利的具体信息内容。

1.基于支持向量机的半监督学习室内定位方法,其特征在于,该定位方法包括如下步骤:
S1.对室内定位环境进行网格划分,并对每个网格采集接收到来自覆盖区域内WiFi无线接入点AP的信号接收强度RSS数据;
S2.对所述采集数据进行处理;
S3.对移动终端进行定位。
2.根据权利要求1所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述S1网格采集包括连续型采集数据和离散型采集数据。
3.根据权利要求2所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述连续型采集数据或离散型采集数据,都对应着一组已知接入点AP编号的RSS数据。
4.根据权利要求1所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述S2对所述采集数据进行处理包括带位置标签的数据处理,不带位置标签的连续型数据处理和不带位置标签的离散型数据的处理。
5.根据权利要求4所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述带位置标签的数据处理包括两类分类问题的C-支持向量机方法和多分类问题的方法;
所述支持向量机方法包括步骤如下:
步骤一:任取带不同位置标签的两类数据,使用高斯核函数映射至数据高维空间;
步骤二:针对不同级别的数据设置松弛变量和惩罚参数,构造二次优化不等式组;
步骤三:求解二次优化不等式组,获得分类超平面,即两类分类器;
所述多分类问题方法包括步骤如下:
步骤一:将所有数据按照位置标签两两组合;
步骤二:将步骤一中的两两组合使用两类分类问题的C-支持向量机方法构造两类分类器,所有两类分类器组合构成多分类分类器;
步骤三:将待定位移动终端获取到的数据输入多分类分类器,使用投票法,获得最终定位结果。
6.根据权利要求4所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述不带位置标签的连续型数据处理包括:
1)对处理数据进行等级划分,带位置标签的数据划分在第一层次;大部分无位置标签连续型数据划分在第二层次,所有离散采集的未带位置标签的数据的定位结果,划分在第三层次;
2)对第一层次的数据的惩罚因子C1设定一个适当的值;
3)将第二层次的数据进行分类,获得的结果再加入至带位置标签的训练数据中,并设置惩罚参数C2,以得到一个新的分类器;
4)使用第三层次的数据重复步骤3)的内容,并设置相应的惩罚参数的C3;
5)利用所有的训练数据,我们获得了最终的数据分类器。
7.根据权利要求1所述的基于支持向量机的半监督学习室内定位方法,其特征在于,所述的定位包括如下步骤:
1)统计每个网格中接收到的AP的RSS值>=-70dBm的数量,并选取数目在前k的网格作为聚类中心。确定好聚类中心后,设中心网格的RSS值向量为μi,待聚类网格的RSS值向量为Rj;
2)根据数据预聚类的方法,确定室内环境中聚类中心的位置,然后每一个AP都储存着一个聚类中心表,按照距离AP所在位置的空间距离由近及远排列,当MS需要定位服务时,会发起服务请求,然后接受服务请求的AP用数据预聚类的方法查找聚类中心表,找到最接近的聚类中心,并把聚类中心位置报告至服务器
3)在云端服务器中,使用数据处理阶段获得的多分类器对MS的RSS数据进行分类,其中使用多分类器所有类别之间“成对比较”的比较的方式替换为以聚类中心聚集的聚类内部类别之间采用“成对比较”的方式,最后获得最终的定位结果。

说明书全文

基于支持向量机的半监督学习室内定位方法

技术领域

[0001] 本发明涉及一种应用于室内环境的无线电定位技术,特别是涉及基于支持向量机的半监督学习室内定位方法。

背景技术

[0002] 在现今室内定位技术中,有两种应用基于WiFi信号强度定位的常用方法:一是利用信号损耗经验模型,通过求解定位圆方程,获得多个定位圆交点或多条定位直线交点作为位置估计值,由于经验公式误差随着场景不同差距较大,因此该方法的定位误差非常大;二是通过前期在室内环境中进行大量的训练数据采样数据处理来建立所需的经验数据库,然后利用机器学习的方法确定位置,此方法定位精度较高,但是前期采样数据过程耗时费,并且采集到的数据样本集不仅数据量大,而且由于无线信道的时变特性,无法实时更新修正数据集的误差,影响定位精度。

发明内容

[0003] 针对以上现有技术的不足,为解决能充分利用所有采集数据并提高性能,本发明基于机器学习中的支持向量机方法,提出一种基于支持向量机的半监督学习室内定位方法。
[0004] 基于支持向量机的半监督学习室内定位方法包括如下步骤:
[0005] S1.对室内定位环境进行网格划分,并对每个网格采集接收到来自覆盖区域内WiFi无线接入点AP的信号接收强度RSS数据;
[0006] S2.对所述采集数据进行处理;
[0007] S3.对移动终端进行定位。
[0008] 所述S1网格采集包括连续型采集数据和离散型采集数据。
[0009] 所述连续型采集数据或离散型采集数据,都对应着一组已知接入点AP编号的RSS数据。
[0010] 所述S2对所述采集数据进行处理包括带位置标签的数据处理,不带位置标签的连续型数据处理和不带位置标签的离散型数据的处理。
[0011] 所述带位置标签的数据处理包括两类分类问题的C-支持向量机方法和多分类问题的方法;
[0012] 所述支持向量机方法包括步骤如下:
[0013] 步骤一:任取带不同位置标签的两类数据,使用高斯核函数映射至数据高维空间;
[0014] 步骤二:针对不同级别的数据设置松弛变量和惩罚参数,构造二次优化不等式组;
[0015] 步骤三:求解二次优化不等式组,获得分类超平面,即两类分类器;
[0016] 所述多分类问题方法包括步骤如下:
[0017] 步骤一:将所有数据按照位置标签两两组合;
[0018] 步骤二:将步骤一中的两两组合使用两类分类问题的C-支持向量机方法构造两类分类器,所有两类分类器组合构成多分类分类器;
[0019] 步骤三:将待定位移动终端获取到的数据输入多分类分类器,使用投票法,获得最终定位结果。
[0020] 所述不带位置标签的连续型数据处理包括:
[0021] 1)对处理数据进行等级划分,带位置标签的数据划分在第一层次;大部分无位置标签连续型数据划分在第二层次,所有离散采集的未带位置标签的数据的定位结果,划分在第三层次;
[0022] 2)对第一层次的数据的惩罚因子C1设定一个适当的值;
[0023] 3)将第二层次的数据进行分类,获得的结果再加入至带位置标签的训练数据中,并设置惩罚参数C2,以得到一个新的分类器;
[0024] 4)使用第三层次的数据重复步骤3)的内容,并设置相应的惩罚参数的C3;
[0025] 5)利用所有的训练数据,我们获得了最终的数据分类器。
[0026] 所述的定位包括如下步骤:
[0027] 1)统计每个网格中接收到的AP的RSS值>=-70dBm的数量,并选取数目在前k的网格作为聚类中心。确定好聚类中心后,设中心网格的RSS值向量为μi,待聚类网格的RSS值向量为Rj;
[0028] 2)根据数据预聚类的方法,确定室内环境中聚类中心的位置,然后每一个AP都储存着一个聚类中心表,按照距离AP所在位置的空间距离由近及远排列,当MS需要定位服务时,会发起服务请求,然后接受服务请求的AP用数据预聚类的方法查找聚类中心表,找到最接近的聚类中心,并把聚类中心位置报告至服务器
[0029] 3)在云端服务器中,使用数据处理阶段获得的多分类器对MS的RSS数据进行分类,其中使用多分类器所有类别之间“成对比较”的比较的方式替换为以聚类中心聚集的聚类内部类别之间采用“成对比较”的方式,最后获得最终的定位结果。
[0030] 本发明的优点在于:
[0031] 本发明这种支持向量机方法实时定位精度高,采集数据利用效率高,适用场景广。附图说明
[0032] 图1:数据处理阶段半监督学习算法的流程框图
[0033] 图2:无位置标签的连续采集数据分级结果;
[0034] 图3:训练数据分级;
[0035] 图4:室内定位的云计算框架

具体实施方式

[0036] 以下结合附图对本发明进行详细说明。本方法基于机器学习中支持向量机的方法进行研究,保证了算法的普遍性。采用了理论分析、可行性论证和计算机仿真结合的方法,从理论和实践方面验证了所提出的方案。包括如下内容。
[0037] 一、无线信号强度分布数据采集阶段:
[0038] 本发明首先需要预先将需要室内定位的环境划分为长宽一定的正方形网格,每个网格对应相应的编号,即为位置标签。在每一个网格中采集接收到来自覆盖区域内WiFi无线接入点(AP,Access Point)的信号接收强度(RSS)数据,采集过程可以包括以下两种方式:
[0039] 1.连续型采集:通过在室内环境中连续采集获得。采集到的数据中,序号相邻的数据所对应的位置标签是同一或相邻网格,不可能出现位置标签跳跃的情形,称这类数据为连续型数据。
[0040] 2.离散型采集:采集的数据是通过在室内环境中分散随意采集获得的,相邻数据之间没有特定的关系,称这类数据为离散型数据。
[0041] 采集阶段获得的数据格式:无论是连续型数据还是离散型数据,都对应着一组已知接入点(AP)编号的RSS数据,但是却不能保证每一项采集的数据都有已知的位置标签。
[0042]
[0043] Must:此选项不能为空,Optional:此选项可以为空。
[0044] 带位置标签的数据集定义为可信训练数据集合,该集合内的数据能够被直接被利用去生成应用于室内定位过程的分类器;不带位置标签的数据集定义为存疑训练数据集合,该集合内的数据需要经过处理才能被利用去生成应用于室内定位过程的分类器。
[0045] 二、采集数据处理阶段:
[0046] 步骤1:带位置标签的数据的处理
[0047] 视每一个位置标签作为一个类别(设总共包含L个类别),利用训练数据进行室内定位就是一个典型的多分类问题,解决多分类问题的方式是将其转换为两类分类问题,两类分类问题的解决方案是多分类问题解决方案的基础,因此在本发明的采集数据处理阶段算法分为两个部分:两类分类问题的算法和多分类问题的算法。
[0048] 1)两类分类问题的C-支持向量机(C-SVM)算法
[0049] 也即首先任取带不同位置标签的两类数据,使用高斯核函数映射至数据高维空间;然后针对不同级别的数据设置松弛变量和惩罚参数,构造二次优化不等式组;再求解二次优化不等式组,获得分类超平面,即两类分类器。具体过程如下。
[0050] 设置训练数据为一个l维向量xi:x∈Rd,它的类别为yi,y∈{-1,+1},在线性SVM分类器的情况下,我们可以用(L-1)维超平面去将这些数据划分为两类。在非线性SVM分类器的情况下,为了使我们可以使用线性SVM分类器模型,将使用核函数κ(·,·)=(Φ(·)·Φ(·))把非线性的原始输入数据空间转换至高维特征空间中。在室内环境中的信号传播是近似呈指数衰减,因此我们可选择高斯函数作为核函数。
[0051] κ(x,x′)=exp(-||x-x′||2/(2σ2)) (1)
[0052] 考虑到带噪声的训练数据可能会降低SVM分类器的性能,通过使用松弛变量ξ,允许一些异常值偏离分类平面的边界。为了限制总偏差,设置惩罚参数C与各个松弛变量ξ相乘累加。因此新的C-SVM的二次优化问题,可如下式所示。
[0053]
[0054] s.t.yi[(ω·xi)+b]≥1-ξi,i=1,...,L (3)
[0055] ξi≥0,i=1,...,L (4)
[0056] 原始的C-SVM分类问题满足Karush–Kuhn-Tucker(KKT)条件,因此可通过求解如下对偶问题解决原问题。
[0057]
[0058]
[0059] 0≤αi≤C,i=1,...,L (7)
[0060] 最后,将上式中向量的内积(xi·x)替换为内核函数κ(xi,x),就可以得到一个分类超平面。
[0061]
[0062] 2)多分类问题的算法
[0063] 首先将所有数据按照位置标签两两组合;然后将步骤一中的两两组合使用两类分类问题的C-支持向量机方法构造两类分类器,所有两类分类器组合构成多分类分类器;再将待定位移动终端获取到的数据输入多分类分类器,使用投票法,获得最终定位结果。具体过程如下。
[0064] 在本发明中,利用“成对分类”比较的方式转换为两类分类问题构造分类器,首先通过C-SVM算法将训练数据中两两类别之间带位置标签的数据训练构造为L(L-1)/2个两类分类器。在使用这种方法时,采用的是投票法,当给定一组测试数据时,使用每个分类器进行类别判定并记录分类结果。如果结果属于第i类,此类别获得一票。分类结束后,记票结果最高的是最终的分类结果。
[0065]
[0066] 步骤2:不带位置标签的连续型数据的处理
[0067] 由于经过步骤一之后,获得了一系列对不带位置标签的连续型训练数据的定位结果,本发明制定一个数据等级划分的规则和基于这个规则改进的C-SVM算法。
[0068] 1)数据等级划分规则
[0069] 为了更好地利用所有采集到的训练数据,采集到的数据可以分为三个层次:带位置标签的数据划分在第一层次;所有离散采集的未带位置标签的数据的定位结果,划分在第三层次;对于无位置标签的连续采集数据的定位结果,需要根据一下步骤进行层次划分。
[0070] 正如图2所示的是无位置标签的连续采集数据的分级结果。大部分这类数据分级为第二层次,除了两种特殊情形。第一种特殊情形可称为“存疑情形”,即得到的位置可能会出现不连续的错位,这种数据是不可靠的,如带下划线的位置“BA”就可以划分为第三层次。另一种是“孤立情形”,如带下划线的位置“C”,“C”位于多个连续的“D”中,可认为“C”是一个错误的分类结果,然后将“C”改为“D”,并将此数据划分为第三层次。最后,我们得到的训练数据分级如图3所示。
[0071] 2)改进的C-SVM算法
[0072] 由于改变了不同类别之间的惩罚参数C,可以使分类性能得到提升,因此我们提出了一种改进的C-SVM算法。
[0073] 设训练数据为S=S1∪S2∪S3,S的下标表示的训练数据的划分等级。
[0074]
[0075]
[0076] 其对偶问题可表示为:
[0077]
[0078]
[0079] 向量C=[C1C2C3](C3≤C2≤C1)可以视为影响分类器的性能的权重因子。
[0080] 改进的C-SVM算法包括如下:
[0081] 流程1:与数据处理阶段步骤一中对两类分类问题的C-SVM解决方案相同,我们给第一层次的数据的惩罚因子C1设定一个适当的值(通常是一个比较大的数值),并通过求解式1-8的问题获得相应的分类器。
[0082] 流程2:将第二层次的数据按照流程1进行分类,获得的结果再加入至带位置标签的训练数据中,并设置惩罚参数C2(通常是一个不大不小的数字),并通过求解式10-13,以得到一个新的分类器。
[0083] 流程3:使用第三层次的数据重复流程2的内容,并设置相应的惩罚参数的C3(通常是一个小数目)。
[0084] 最后,通过利用所有的训练数据,我们获得了最终的数据分类器。矢量C是可以根据实际情况进行调整以获得更好的分类器。
[0085] 步骤3:不带位置标签的离散型数据的处理
[0086] 将步骤二中不带位置标签的连续型数据替换为不带位置标签的离散型数据,并重复步骤二的过程。
[0087] 数据处理阶段的流程框图参照图1所示。
[0088] 三、定位阶段:
[0089] 在室内定位数据收集阶段,是按照划分的网格搜集数据。从训练数据的格式上看,在每个网格只能接收到少数的AP的信号。两个相隔较远的网格之间的采集的RSS数据有很大的不同,但相邻网格之间却有相似的RSS数据形式。根据这种特性,可以提出一种数据预聚类方法,来降低计算复杂度。
[0090] 1)数据预聚类k-means算法
[0091] 在k-means算法中,统计每个网格中接收到的AP的RSS值>=-70dBm的数量,并选取数目在前k的网格作为聚类中心。确定好聚类中心后,设中心网格的RSS值向量为μi,待聚类网格的RSS值向量为Rj。
[0092]
[0093] 在将训练数据进行聚类后,一些孤立网格仍然没有划分至大类,可将这些网格划分至空间上距离最近的聚类中心中,此时所有带标签的训练数据都被大类划分至各自的聚类中心。
[0094] 2)室内定位的云计算框架
[0095] 室内定位的云计算框架主要包含两个步骤,如图4示意图所示:
[0096] 步骤1:
[0097] 根据数据预聚类的方法,确定室内环境中聚类中心的位置,然后每一个AP都储存着一个聚类中心表(结构类似路由表),按照距离AP所在位置的空间距离由近及远排列,当MS需要定位服务时,会发起服务请求,然后接受服务请求的AP用数据预聚类的方法查找聚类中心表,找到最接近的聚类中心,并把聚类中心位置报告至云端服务器。
[0098] 步骤2:
[0099] 在云端服务器中,使用数据处理阶段获得的多分类器对MS的RSS数据进行分类,其中使用多分类器所有类别之间“成对比较”的比较的方式替换为以聚类中心聚集的聚类内部类别之间采用“成对比较”的方式,这样的做法降低了整体的计算复杂度,最后获得最终的定位结果。
[0100] 在室内定位中,我们使用如下式的预测精度来衡量该算法的性能,仿真中可达到的预测精度为87.02%。
[0101]
[0102] 也可以使用平均误差距离来衡量算法的性能,由下面的定义来确定的误差距离ε。在仿真中,平均误差距离是0.2315米。
[0103] 应当理解,以上借助优选实施例对本发明的技术方案进行的详细说明是示意性的而非限制性的。本领域的普通技术人员在阅读本发明说明书的基础上可以对各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
高效检索全球专利

专利汇是专利免费检索,专利查询,专利分析-国家发明专利查询检索分析平台,是提供专利分析,专利查询,专利检索等数据服务功能的知识产权数据服务商。

我们的产品包含105个国家的1.26亿组数据,免费查、免费专利分析。

申请试用

分析报告

专利汇分析报告产品可以对行业情报数据进行梳理分析,涉及维度包括行业专利基本状况分析、地域分析、技术分析、发明人分析、申请人分析、专利权人分析、失效分析、核心专利分析、法律分析、研发重点分析、企业专利处境分析、技术处境分析、专利寿命分析、企业定位分析、引证分析等超过60个分析角度,系统通过AI智能系统对图表进行解读,只需1分钟,一键生成行业专利分析报告。

申请试用

QQ群二维码
意见反馈