RFID复杂应用中数据预处理技术的研究

被引量 : 0次 | 上传用户:ankeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一门融信号处理,无线通信,嵌入式计算,数据管理为一体的新兴技术,RFID技术正广泛应用于越来越多的领域,如供应链管理,物体跟踪,快捷支付等等。但由于RFID技术采用无线射频信号进行数据通讯,其极易受环境影响,导致在RFID应用中进行数据采集时漏读和错读现象频频发生,而且会产生大量冗余数据以及数据的时间乱序现象,这严重影响了事件检测中查询结果的准确性,阻碍了RFID技术的更广泛应用。因此,对RFID数据进行预处理是保证高质量查询结果的前提条件。针对上面提出的问题,本文对RFID应用中产生的“脏”数据进行数据预处理策略的研究。首先,在对RFID数据进行三元组模型的基础上,本文提出一个数据抽象算法,将RFID数据从数据层抽象到逻辑区域层。它主要是对数据进行抽象压缩,去除大量冗余数据的同时,对数据漏读问题有一定的容忍度。抽象后,数据可被看成简单事件。实验结果表明,RFID数据经过抽象后,数据量极度减少,大大节省系统开销,为下一步数据清洗提供了条件。其次,本文针对RFID应用中“脏”数据的主要类型——漏读数据,在数据抽象的基础上,提出三种填补算法,即贪婪算法,最小k-相似算法和全相似算法。它们对已经发生的事件进行统计学习,并结合逻辑区域本身的漏读情况建立起动态概率事件模型,在此基础上,根据不同的搜索策略查找可能发生漏读事件的最相似事件,据此对漏读数据进行填补,这三种算法大大提高数据的准确率,消除漏读数据对查询质量的影响。理论分析和大量实验证明该数据填补算法的有效性和高效性。最后,本文增加对时间因素的考虑,对上面提出的填补算法进行改进。它主要对概率事件模型进行扩展,引入时间模型,由此提出两种清洗算法的改进策略,即β*改进算法和β+改进算法。β*改进算法是通过直方图分布对时间进行估计,而β+改进算法是通过欧氏距离对时间进行估计,在不同的条件下,两种算法有各自的优势。实验证明改进策略在填补数据准确率方面有一定的优越性。
其他文献
<正>从4月22日起,自治区水利厅组织开展2019年度地下水保护专项行动。本次专项行动共派出3个工作组,全部由水利厅副厅长或厅级领导干部带队,与各盟市政府就超采区治理、违规
我国旅游资源十分丰富,特别是红色旅游资源更具中国特色。把红色旅游与思想教育政治教育创造性结合起来,拓展了思想政治教育的新途径,为思想政治教育提供了新方式。红色旅游
成本管理是现代企业管理的重要内容之一,是企业管理永恒的主题。有效的成本管理对于维持企业的长远发展以及提高对外竞争力具有重要的意义。现代意义上的成本管理已经不再是
<正> 德国—法国联合研制方案 1986年,德国和法国签署了有关防御研究和技术合作的协议。1988年,德法两国在研究电磁炮领
常规信号处理方法的前提条件相对简单,不能满足水声信号处理中海洋环境非平稳和极低信噪比等实际情况。基于模型的信号处理方法(模基处理技术)能够将物理模型引入到信号处理算
我们对“休克心”发生机理的长期研究中发现,在心肌缺血缺氧早期,微管即发生显著破坏,而微管在缺氧引起的一系列效应中所起的作用及对缺氧所致的心肌细胞的能量代谢障碍的影
研究城市生活污水水质的现状,有利于正确处理生活污水,有利于制定污染控制措施。选择燕山大学小区生活区污水沟,采用定点采样的方法,对水沟内的污水进行水质监测。研究结果表
在中国由计划经济转向市场经济的转型时期,在2003年文化体制改革的背景下,传媒体制进行了改革。本文在对传媒体制改革发展现状进行描述的基础上,分析传媒体制改革中存在的问
对于我国现有国有体制而言,油田企业资产存在一定的特殊性。面对市场的竞争压力和国有企业的特殊使命,国有资产的高效管理越来越受到重视,而我国现阶段油田的资产管理也存在
随着嵌入式系统复杂度的不断提高,以FPGA(Field Programmable Gate Array)为代表的可编程逻辑器件得到了广泛的应用。FPGA为开发者提供了便捷的硬件电路设计方案,通过FPGA辅