论文部分内容阅读
在移动互联网时代,众多商业应用均离不开准确获取人的位置信息。在室外广域空间里,以GPS为代表的全球导航卫星系统(GNSS)是最有效的定位手段,由于卫星信号被遮挡,GNSS在室内作用有限,多种室内定位技术纷纷涌现,但尚无一种公认的标准手段。伴随无线局域网(WLAN)及智能手机的普及,WLAN指纹定位成为应用广泛的室内定位手段。围绕降低指纹定位过程运算消耗及人力成本,提高定位精度和运行效率的目标,本文集中对WLAN指纹定位中改进定位模型及降低指纹采集工作量相关策略开展研究。主要内容包括:LocalReliefF-C AP点选择算法、CSBA参考点聚类算法、隐朴素贝叶斯位置估算算法、基于GPR和CGAN的指纹库自动扩充框架、基于AP点RSS值平面搜索和叠加的定位算法、隐式众包指纹采集及定位系统框架、8)4)9)-8)(6指纹样本预处理方法以及协同随机森林半监督学习定位算法。主要研究成果如下:(1)室内环境中无线网络AP点不断增多,增加了指纹定位系统计算复杂度,其中存在一些冗余AP点和噪声AP点可以删除。为了选取最优位置判别AP点集合,提出一种基于位置判别能力评估和冗余特征检测的AP点选择算法LocalReliefF-C。首先,利用改进特征选择算法ReliefF计算指纹样本集中每个AP点分类能力权值,以此衡量AP点位置判别能力,选取权值最大的若干AP点,再计算每对所选AP点之间的最大信息系数(MIC),以此衡量AP点间的冗余关系,删除部分冗余AP点。实验结果表明,LocalReliefF-C AP点选择算法能够显著降低定位算法的运算消耗,得到的最优判别AP点子集同时保证了良好定位精度。(2)传统定位算法为了搜索目标位置要遍历每一个参考点的指纹样本,随着参考点增多搜索效率大幅下降。为提高位置查找效率,在前文AP点选择基础上,提出一种新的参考点聚类算法CSBA。离线阶段将大量参考点划分成有限数量的簇,实现搜索空间的局部化,在线阶段先确定目标簇,再确定簇内目标位置。聚类的依据是参考点的最优位置判别AP点集合具有一定数量的共同元素。实验结果表明,CSBA算法能够有效降低定位过程比较运算次数,显著提高位置查找效率。(3)在簇内位置估算时,引入一种改进定位模型隐朴素贝叶斯(HNB),它打破了经典朴素贝叶斯(NB)算法关于AP点间彼此条件独立的理想化假设,通过定义隐藏的父节点把AP点之间的相互影响纳入位置估算过程。实验表明,相比经典NB算法,HNB算法的定位精度更佳。(4)在已采样参考点数量有限,指纹样本数量不足条件下,定位性能难以保证。在不增加样本采集工作量前提下,提出一种指纹库自动生成与扩充策略,利用高斯过程回归模型(GPR)对样本RSS值与位置坐标之间关系进行建模,生成未采样参考点上指纹样本,再借助深度学习模型条件生成对抗网络(CGAN)生成大量与已有样本极为相似的指纹样本,实现指纹库扩充。(5)在指纹库自动扩充基础上,位置估算阶段提出一种基于AP点RSS值平面搜索和叠加的定位算法。构造指纹库中每个AP点在定位平面上的RSS值矩阵,针对新的RSS观测向量,依次在每个AP点RSS值平面上寻找目标位置区域,最后将多个目标区域叠加,确定最终定位结果。(6)传统指纹收集过程需要耗费高昂时间和人力成本,成为指纹定位系统推广使用的瓶颈。提出一种隐式众包指纹采集及位置估算系统框架,系统包含样本采集客户端、指纹样本预处理模块、半监督学习位置估算模块等核心组件。众包模式将繁重的样本采集任务分发给众多志愿者,指纹服务器实现上传样本的接收和集成。采集程序在设备后台静默运行无需用户主动干预,进一步提高系统实用性。min-max规范化方法实现众包采集指纹的预处理,统一各样本RSS值取值范围,实现取值离散化,有效解决众包模式下观测设备异构性问题,为后续位置估算过程做好数据准备。(7)隐式众包模式采集了大量无标记样本,为将它们用于定位,引入一种融合协同训练和集成学习思想的半监督学习定位算法Co-RandomForest。算法以协同训练的方式利用无标记样本集反复优化生成的随机森林分类器,发挥集成学习优势简化求解最置信样本过程,提高算法执行效率。实验结果表明,Co-RandomForest在使用少量标记样本条件下,通过挖掘大量易于获得的无标记样本定位价值,能够取得与传统监督学习算法相当的定位性能,从而摆脱对大量标记样本采样过程的依赖。