基于多标签分类的传感网数据异常检测方法研究

来源 :西北工业大学 | 被引量 : 0次 | 上传用户:asdf1aasdf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
无线传感器网络已经广泛地应用于多个领域,其资源受限特性使得它无法从软件和硬件上保证自身具有较强的抗干扰能力。然而,无线传感网络通常部署在环境比较恶劣的野外环境中,这使得无线传感器网络所采集的数据很容易发生错误,称为数据异常。针对实际无线传感器网络的多项研究表明:传感器数据的不可靠性广泛存在,保证传感器数据质量是一个亟需解决的重要问题。为了得到高质量的数据,研究无线传感器网络中的数据异常检测技术具有重要意义。针对传统的学习框架无法处理多种数据异常同时出现的问题,研究了基于多标签分类的无线传感器网络数据异常检测技术,主要创新点和贡献如下:  (1)提出了一种基于多标签分类的数据异常检测建模方法。针对传统的学习框架在描述无线传感器网络中多种数据异常同时出现时会出现歧义的问题,提出了一种基于多标签分类的数据异常检测建模方法。无线传感器网络所采集的传感器数据是连续的数据流,而多标签分类模型需要使用多个实例来描述传感器的数据信息,为此数据异常检测建模方法给出了建立数据异常检测模型的过程,包括数据流的分割、数据特征生成、数据异常标签的标记和数据异常的检测过程。实验结果表明,基于多标签分类的数据异常检测模型在无线传感器网络数据异常检测中是一种有效方案。  (2)提出了一种基于信息熵和集成方法的特征选择方法EMFSIE。由于无线传感器网络中所采集的数据包含了噪声和多种干扰信息,因此想要获得能够准确地描述不同数据异常类型的数据特征并不是一件容易的事情,通常所生成的特征集合中包含了噪声、冗余和不相关的特征,会严重影响数据异常检测模型的性能,为此提出一种基于信息熵和集成方法的特征选择方法,去除冗余和不相关的特征。该方法采用特征与标签集合之间的信息增益值来度量特征与标签集合之间的相关程度;考虑到多种数据异常同时出现使得不同数据异常类型之间出现语义交叉的问题,引入了集成方法的思想,通过聚类将具有相似语义的实例放在一起对特征进行评估,从而减少语义交叉对特征评估结果所带来的负面影响。实验结果表明,所提出的特征选择方法不仅能够显著提升数据异常检测模型的性能,并且能够显著地缩短数据异常检测模型的训练时间。  (3)提出了一种基于多标签RelefF的特征选择方法MLRFS。EMFSIE方法适用于处理离散型数据,在处理连续型数据前需要对数据进行离散化预处理,并且该算法无法直接给出所要选择的特征子集,为此提出了一种基于多标签ReliefF的特征选择方法。首先对ReliefF在原始特征空间中搜索的最近邻实例无法准确对特征进行评估的原因进行了分析;接着MLRFS方法在降维后的特征子集空间中搜索最近邻实例,并在这些实例上对特征子集进行评估;为了给出一个合理的特征子集,MLRFS采用前向搜索的启发式方法搜索特征子集。  (4)提出了基于相关近似熵的特征生成方法。特征选择是一个NP-hard问题,虽然EMFSIE和MLRFS方法可以显著改善数据异常检测模型的性能,但它们无法找到最优的特征子集。为此,基于相关近似熵的特征生成方法从特征生成的角度研究改善数据异常检测模型的性能,解决模糊近似熵在计算传感器数据特征时计算复杂度较大和依赖的参数过多的问题。相关近似熵方法采用相关信息熵来计算向量空间中多维数据之间的相关度,通过计算向量空间在其维数由M维增加到M+1维时多维数据之间保持相关性的概率来判定一个时间序列的复杂程度。相对于模糊近似熵,相关近似熵方法将依赖参数从4个减少到了2个,并减小了计算复杂度。  (5)提出了一种基于相关信息熵的数据异常检测方法。该方法从多种数据异常标签之间的相关关系角度研究改善数据异常检测模型的性能,采用相关信息熵对不同数据异常标签之间的相关关系进行度量。首先依据数据异常标签之间相关关系的强弱次序找出多个互不相交的数据异常标签组合,然后使用LP分类器对这些数据异常标签组合构成的数据集进行训练和预测,最后对这些预测结果进行融合后得到最终的预测结果。
其他文献
在IC设计领域,计算机微处理器是整个系统的核心,人们对其性能的要求越来越高,这些微处理器强有力的运算能力来源于其内部高性能的运算处理单元。加法在各类处理器中都是使用
在宽带互联网络领域,高速率、高质量信息通道的跨越式发展给多媒体业务的推广与普及带来了前所未有的机遇与挑战。以宽带网络技术为主导的多媒体数据通信在通信业务总量中的
与亲朋好友“闲聊”,可以捕捉到新闻线索;与过路人“闲聊”,同样可以捕捉到新闻线索。与过路的陌生人“闲聊”,首先必须学会与他们交朋友。有一次,我在海门汽车站候车,发现
随着业务增长和信息化发展,敏捷的应用集成已成为企业信息系统集成的关键需求。面向服务架构使业务服务根据用户需求随需组合,解决了应用集成的各种问题,同时,企业服务总线为
无线传感器网络的可靠传输研究一直是研究的热点,现有的可靠传输机制主要有FEC前向纠错码,ARQ自动重传以及多路径传输等,这些机制保证一定的传输可靠性,同时也大量增加冗余数
改革开放以来,福建茶叶发展很快,涌现出许多高产优质高效的茶业明星乡镇(村、场),但还有部分茶区的茶业仍呈低产劣质低效状态。落后茶区的茶业,如何加快步伐向高产优质高效转
非接触式IC卡是IC卡领域的一项新兴技术,它是射频识别技术和IC卡技术相结合的产物。射频识别(Radio Frequency Identification,简称RFID)技术是最近几年发展起来的一门新的自动
在实现中国梦的伟大历程中,神舟九号飞船与天空一号交会对接,“蛟龙”号深海探测下潜超过七千米,“歼15”舰载机在“辽宁号”航母上着舰成功等,无疑是梦想成真,中华民族为之
无线传感器网络通常由大量的无线传感器节点构成,这些节点可以监测并采集周围的环境数据。节点通常部署在如战场、火山、南北极冰川、桥梁等偏远且不宜触及的自然区域中,辅助
体育视频是大众喜爱的视频分类之一,它蕴含着丰富的视频内容分析领域的智能信息处理课题。足球视频作为体育视频的典型内容,对其分析和研究,尤其是提取高级语义信息具有重要