论文部分内容阅读
无线传感器网络(Wireless Sensor Network,WSN)作为一种全新的信息获取方式和处理技术,已经被广泛应用于诸多领域,而且有着广阔的应用前景。WSN的最大特点是面向应用和以数据为中心,因此其部署目的不仅仅是采集数据并将数据传输给观测者,而且还要完成特定的任务,如跟踪、识别、预警等。在WSN要完成的众多任务中,对监测信息进行分类和回归分析是最基础也是最重要的一类任务。因此,许多用于解决分类和回归问题的机器学习方法在WSN中得到了日益广泛的应用。然而,在WSN中,数据都分散在传感器节点上,单独基于单个节点上的数据学习效果较差;而通过多跳路由将分散在传感器节点上的数据传输到数据中心集中学习分类器或回归机又要消耗大量的能量、占用大量的带宽,这与WSN上能源替换代价非常高甚至不可替换、带宽资源非常有限相冲突,同时也容易使数据中心周围的节点成为整个系统的瓶颈。针对上述问题,本论文面向WSN,结合核学习机的特点,基于分布式优化理论、L1正则化技术和Markov链随机理论,以降低WSN中的数据传输代价和延长网络生存时间为目标,研究了仅依靠相邻节点之间的协作,利用节点的处理能力,在网内分布式协同学习核学习机的方法。具体从核学习机优化问题的分解策略、分布式优化问题的求解、相邻节点间的协作方式、核学习机增量学习优化问题构建、基于Markov链的节点选择策略,以及能量平衡的节点选择策略等方面进行了深入研究。本论文的主要研究内容及研究成果主要包括:(1)针对线性核学习机的模型表示特征,以经典核学习机——支持向量机(Support Vector Machine,SVM)的线性情况为例,研究了SVM优化问题的分解策略、求解方法和相邻节点间的协作机制,提出了一种基于权向量全局平均一致性的线性SVM分布式协同训练方法;为了降低权向量全局平均一致性的通信开销,提出了一种基于一次权向量全局平均一致性的线性SVM分布式协同训练方法。仿真实验验证了基于一次权向量全局平均一致性的线性SVM分布式协同训练方法在模型收敛精度、收敛速度和数据传输量上的显著优势。为WSN应用中使用核学习机解决线性分类和回归问题提供了一种快速的低能耗方法。(2)针对非线性核学习机的模型表示特征,以经典核学习机——核最小均方误差学习机(Kernel Minimum Mean Square Error,KM2SE)的非线性情况为例,研究了L1正则化核最小均方误差学习机,即稀疏核最小均方误差学习机的分解策略、求解方法和相邻节点间的协作机制,提出了一种基于模型平均一致性的稀疏核学习机分布式协同训练方法。为了进一步降低数据传输代价,提出了一种样本筛选机制,进而提出了一种基于样本筛选机制的稀疏核学习机分布式协同训练方法。仿真实验验证了提出的非线性稀疏核学习机分布式协同训练方法能够得到与批处理学习方法基本一致的模型预测正确率,而且在模型稀疏率和数据传输量上具有显著优势。为WSN应用中使用核学习机解决非线性分类和回归问题提供了一种低能耗方法。(3)针对非线性稀疏核学习机计算代价高的问题,研究了非线性稀疏核学习机增量学习优化问题的构建、推导和求解,提出了一种非线性稀疏核学习机增量学习方法。针对WSN链路结构不稳定的特点,研究了基于Markov链的节点协作方式,提出了一种基于改进Markov链协作方式的非线性稀疏核学习机分布式增量学习方法。仿真实验验证了非线性稀疏核学习机增量学习方法能够得到与批处理学习方法基本一致的模型预测精度,而且能够显著降低节点上的计算代价和对内存空间大小的需求;基于改进Markov链协作方式的非线性稀疏核学习机分布式增量学习方法可以显著降低节点上的计算代价和数据传输代价,并能适应链路结构不稳定的WSN。(4)针对非线性稀疏核学习机分布式增量学习过程中引起的节点能量消耗不平衡问题,研究了能动态平衡节点剩余能量的节点选择策略,提出了一种能量平衡的节点选择策略,进而提出了一种能量平衡的非线性稀疏核学习机分布式增量学习方法。仿真实验验证了能量平衡的非线性稀疏核学习机分布式增量学习方法既能明显降低数据传输代价也能显著平衡节点上的能量消耗。WSN平台实验进一步验证了本论文提出的多个核学习机分布式协同训练方法在数据传输能耗上的优势表现。最后,分析总结了WSN平台上发送数据和接收数据的能量消耗特点,为进一步深入研究WSN下核学习机分布式协同训练方法奠定了基础。