基于机器学习的异常检测研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:yinxuchao1123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着GPS设备、传感网络以及RFID等技术日臻成熟以及定位设备的广泛的使用产生了大量的轨迹数据,轨迹数据表现为定位设备所产生的大规模数据流。有效地对数据流形式出现的轨迹进行分析处理,可以发掘出轨迹数据中潜藏的异常现象,从而服务城市规划、交通管理、气象监测等应用。本文研究的对象是移动对象的轨迹数据,在全面分析了国内外对轨迹数据的相关研究后,针对轨迹数据的聚类分析和轨迹的异常检测进行了研究,在此基础上提出了基于加权多特征轨迹聚类方法和基于轨迹信息熵分布的异常轨迹检测方法,并对其进行了理论和实验两个方面的论证和分析。研究的工作主要包括以下两个方面:  (1)针对轨迹聚类分析过分追求提高效率而忽略了轨迹的运动特征信息的问题。提出了基于加权多特征轨迹聚类方法,该方法提取了轨迹运动特征信息,在传统的轨迹间距离度量方式基础上加以改进,引入加权多特征距离作为轨迹间相似度的度量,能够从更全面的多角度分析轨迹的运动特点,从而得到更好的聚类效果,进而得到更佳的代表性轨迹为异常检测中信息熵计算提供依据。  (2)针对异常轨迹检测多特征检测效率低以及异常阈值参数选择敏感的问题。提出了基于轨迹信息熵分布的异常轨迹检测方法,该方法利用信息熵度量不确定数据方面的特点,在异常检测中引入轨迹信息熵的概念,以基于加权多特征轨迹聚类方法后得到的代表性轨迹计算轨迹信息熵,通过比较轨迹信息大小以及分布特点,并结合异常数据检测的“kσ”准则确定异常轨迹阈值,进而提高了异常轨迹检测的效果。  验证试验表明:通过在大西洋飓风样本数据中验证,本文提出的基于加权多特征聚类算法具有更好的聚类效果,进而得到每个类簇更佳的代表性轨迹。基于轨迹信息熵分布的异常轨迹检测方法不仅仅能检测出除了形状异常的轨迹,还能够发掘出轨迹其他特征存在异常的隐藏的异常轨迹,有效解决了多特征检测效率低的问题,提高了异常检测效果。
其他文献
随着信息技术的发展,现代社会越来越多的行业及领域需要使用计算机处理大规模的各种数据。其中一类数据必须用图数据的方式来表示。对包含亿万个顶点和边的图数据进行高效、紧
随着网络通信、信息技术的发展,信息安全越来越受到人们的关注。数据加密算法DES作为典型的分组加密算法,虽然已被穷举法攻破,但因为此前DES加密应用比较广泛,还是有很好的应用基
感知纹理在计算机视觉,模式识别等领域是重要的研究课题,不论是在互联网传输领域还是人们实际生活中都有着重要的意义。本文通过对感知纹理分类实验结果的分析,探寻纹理中某些看
现代医学、航空航天、自然监控和军事等应用领域迫切需要高效的计算机方法在自然环境中实现目标搜索与跟踪。由于自然场景的复杂性,这些任务通常具有高复杂度并且对响应速度
Z-Wave协议是一种新物联网协议,它虽然简单高效,但是也存在一些问题,例如消息传输效率不高、结点负载能力弱、数据传输率低和安全性能较低等问题。在物联网智能家居领域,迫切需要
针对城市大量供热企业能耗高,缺乏统一有效的节能检测及监控技术的现状,天津市科委开发了智能化节能检测及监控系统,但是对于像天津这样的大型城市,热源厂、热力公司、公、民建筑
图像分类技术是指利用计算机软件等相关技术根据图像自身信息中所反映的不同特征,将特征不同的目标或区域划分开来的图像处理方法。传统的图像分类技术则利用对图像的特征提取
近几年来,随着社交媒体以及手持电子拍照设备的迅速发展,互联网上的图像以惊人的速度增长着,这无疑给图像理解带来了新的挑战。如何高效,准确的理解这些图片成了计算机视觉领域的
直角坐标机器人作为工业机器人重要分支,以其高精度,强负载,寿命长等特点,被广泛用于精密加工、工业自动化以及新兴的3D打印等领域。工业机器人的技术研究主要集中在轨迹规划
云计算提供了安全、快速、便捷的数据存储以及多元化的网络服务,人们可以利用各种数据终端通过网络获得大规模的数据计算以及各种定制服务。云计算技术已经越来越受到人们的