基于RFID数据的离群点检测

来源 :江苏大学 | 被引量 : 0次 | 上传用户:shangdianxitongguanl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
RFID(RadioFrequencyIdentification)技术是基于电磁信号检测的无线电通信技术,利用无线射频方式进行非接触的双向通信,以达到识别移动物体的目的。RFID标签具有体积小、容量大、寿命长、可重复使用等特点,可支持快速读写、非接触识别、多目标识别、定位及长期跟踪管理。RFID技术的广泛使用提高了效率,但也给数据的分析和挖掘工作提供了新的难题。从应用中获取的RFID数据和传统条形码数据有所不同,它不但包含了物品的编号,还包含了获取的时间和位置。如果有效地把时间和位置结合起来,将会使RFID数据分析的深度超越传统意义的数据挖掘。但由于RFID具有特殊的数据结构,传统的数据挖掘工具很难直接对其处理,如何进行有效的分析是当前RFID数据挖掘的难题。   论文主要研究数据挖掘中的离群点检测领域。针对两种不同的RFID应用领域产生的序列数据进行研究。一种为对象行为监控应用中产生的行为序列数据,一种为物品流通过程中产生的路径数据。分析了这两类数据的特点并提出了相应的离群点检测方法。论文的主要研究内容如下:   (1)在一些应用中,用户使用RFID技术对对象的行为进行监控,产生了大量的行为序列数据。行为数据反映了对象行为的特征,可以用来发现具有异常行为的对象。研究从大量行为序列中检测异常行为序列的方法。提出序列数据异常度的概念和两种计算异常度的方法。检测算法采用一种变阶马尔可夫模型-概率后缀树对行为序列进行建模。然后使用该模型计算行为序列的异常度。把异常度超过用户指定阈值的行为序列作为异常行为序列。   (2)RFID路径数据中每个节点同时包含地点和时间信息,使路径数据比一般的序列数据更复杂。针对现有的序列数据异常点检测算法不适合处理路径数据的情况,对路径数据的异常路径检测进行了研究。提出适用于路径数据的扩展概率后缀树(EPST)模型和一种采用该模型检测异常路径的方法。该模型用来计算每个路径和路径数据集的相似度。在计算相似度时主要利用了路径数据的“短期记忆”性质,同时考虑了地点和时间信息对路径数据相似度的不同影响。   (3)采用面向对象的软件设计思想,利用C#语言和C++语言基于MicrosoftVisualStudio2010开发平台设计并开实现了RFID数据离群点检测的原型系统,用于对本文提出的算法的效果和性能进行分析。
其他文献
传统意义的网络安全管控系统主要是基于单一互联网,但是三网融合之后,在传统互联网面临的黑客、病毒等安全问题将会转移到电信网、广电网,产生巨大的危害。在孤立的网络环境中这
随着数据业务和多媒体业务在社会生活中应用的日益频繁,基于位置的服务(Location-Based Services,LBS)在人们的需求中呈现出明显的上升趋势。尤其是在地下停车场、机场大厅、
数据挖掘是对观测数据集的分析,以便找到对应模型并且用新的更容易理解和使用的方式总结数据。以时间顺序抵达的数据,在许多其他的领域都有出现,如物理学,金融学,医学和音乐等。时
近些年,人脸识别技术已成为了模式识别领域中的一个热点,其试图赋予计算机根据人物面孔去辨别其身份的能力,该研究具有重要的理论价值和广阔的应用前景。人脸是人类最重要的生物
DTN网络(Delay/Disruption Tolerant Network)是一种新型网络。相比于传统的基于TCP/IP协议的网络(如Internet), DTN网络中节点移动无规律、节点间连接间断,使得网络的消息传
近年来,为保障国内制造业的可持续发展,进一步优化资源配置,云制造的概念被提出,它将云计算的先进理念同信息技术、物联网和制造业有机结合了起来,为用户提供按需使用的高效、廉价
粗糙集理论作为智能信息处理的一种重要方法,由波兰科学家Pawlak首先提出,引起大量学者关注并对其开展研究。在研究过程中,学者们为了打破粗糙集应用场景的局限性,提出了一系
图像分割是图像处理和计算机视觉研究领域中的一个经典问题,是图像处理过程中一个极为重要的环节。也是实现图像处理到图像分析之间的关键步骤。目前,图像分割技术已被广泛应用
随着中国移动网络规模不断发展,已经形成完备的基础无线城市网络结构,伴随WLAN用户数量不断扩大,智能手机的普及,运营商大数据流量时代已经来临。在此过程中,网络技术也在不断更新
随着道路基础设施建设速度满足不了机动车增长速度的矛盾日益突出,交通信息化建设成为缓解该矛盾的关键。交通流量是实现交通信息化的基础,实时、准确的短时交通流预测信息对实