【摘 要】
:
由于RFID技术采用的无线射频信号极易受外界条件干扰,导致RFID数据采集过程中漏读现象频频发生,降低了RFID应用中查询结果的准确性。目前解决漏读问题的算法主要是基于数据层的,这种做法会填补许多与查询无关的数据,浪费系统资源。在逻辑区域层的基础上提出了两种基于动态事件概率模型的数据清洗算法,即贪婪算法和相似度算法。它们主要对已知的数据进行学习来预测未知的数据.大量实验证明了该数据清洗算法的有效性
【机 构】
:
东北大学信息科学与工程学院 沈阳 110004 东北大学软件学院 沈阳 110004
【出 处】
:
第二十五届中国数据库学术会议(NDBC2008)
论文部分内容阅读
由于RFID技术采用的无线射频信号极易受外界条件干扰,导致RFID数据采集过程中漏读现象频频发生,降低了RFID应用中查询结果的准确性。目前解决漏读问题的算法主要是基于数据层的,这种做法会填补许多与查询无关的数据,浪费系统资源。在逻辑区域层的基础上提出了两种基于动态事件概率模型的数据清洗算法,即贪婪算法和相似度算法。它们主要对已知的数据进行学习来预测未知的数据.大量实验证明了该数据清洗算法的有效性和高效性。
其他文献
入侵检测领域的相关研究大多忽视了对利用存储过程的SQL注入攻击的检测.提出了基于构造路径的存储过程SQL注入检测方法。通过对执行流程的分析,得到执行参数的构造路径,形成检测规则.检测时替换规则中的输入参数为用户输入值,对所得到的SQL语句进行结构和语义上的检测.在标准测试平台TPCW上的实验结果表明,不仅在检测率还是漏报率上都要优于同类研究工作;在增加了基于该方法构建的检测模块后对系统性能影响不大
数据的概念漂移特性是广泛存在的.提出一种挖掘概念漂移数据的自适应集成学习算法(adaptive multiple classifiers ensemble,AMCE).该算法通过给每个分类器分配独立的权重调整参数,增强自适应能力;并且利用基于KL距离的剪枝策略删除集成中存在的冗余个体分类器.实验结果表明,该算法能够有效地改善发生概念漂移时的分类预测结果,同时减少存储空间的使用,提高算法速度,并且其
随着数据流系统日益广泛的应用,需要针对数据流系统的安全机制以保护其资源。针对目前研究的不足和数据流系统的特点提出了一种基于角色的访问控制策略,给出了实现机制.最后在已有的数据流系统Borealis上进行实验,验证算法可行并分析了对系统性能的影响.
无线传感器网络中感知的数据是连续实时的流式数据.由于传感器节点存储空间和处理能力有限,需要用滑动窗口技术将数据流分割成段进行后续处理.确定窗口长度是使用滑动窗口技术必须要解决的问题,包括如何选择滑动窗口的大小才能充分利用感知数据的周期性和相关性,最大程度地减少传感器网络的数据传输量。提出了一种面向感知数据的滑动窗口动态调整技术,该技术利用网络节点数据的关联性通过计算共享数据段的大小调节各节点的滑动
传感器网络的覆盖问题是无线传感器网络研究和应用的关键性基础问题,直接影响着传感器网络的使用性能.针对移动传感器网络中节点自由分布时网络覆盖率低下的问题,研究了达到对监测区域的完全覆盖时的节点最优分布情况,提出了一种能够利用节点的可移动性,在使用尽可能少的节点和尽量节省能量的前提下,近似实现这种完全覆盖的节点重定位策略.实验结果表明,该策略可以大大提高无线传感器网络的覆盖程度.
Wrapper的生成与维护是Deep Web数据集成中一项非常重要的研究课题。传统的方法通常是通过对网页结构或特征的分析来推导Wrapper,这种方法严重依赖于网站模板,在处理某些网站时可能完全失效.同时,以往研究对于Wrapper的维护问题关注较少.这两个问题导致无法真正实现大规模Deep Web数据集成.提出了一种新颖的数据驱动的Wrapper自动生成与维护方法。这种方法利用同一领域不同网站之
目前基于链接关系的排序算法在互联网搜索引擎中起着至关重要的作用。这类算法的提出是以"链接即投票"的假设为前提的.但是随着互联网商业化发展十几年来,这种假设已经不是万能的了.网页之间不再是"投票"关系,有各种各样其他角色的链接(即噪链)充斥其中,噪链的存在降低了基于链接的排序算法的准确性,如何识别和处理噪链是当今国外研究的热点.根据噪链本身的分布特性,提出了一种只基于链接关系就能自动识别和过滤噪链的
在无线传感器网络中,传感器节点间的通信是电池能量的主要消耗者,如何尽可能降低网络中的通信代价,在网络中有效地利用能源计算出数据轮廓,成为当前的研究热点.现有的能量有效的映射过滤算法(EES)是将滑动窗口内的数据映射为整型,以此来缩短节点间传递数据长度,同时利用映射元组设置过滤器的方式来减少通信代价,由于其映射函数是将等距范围内的数据映射为同一个整数,在过滤对计算数据轮廓意义较小的元组时,其过滤性能
从特定领域的多个Web服务中自动抽取出描述其功能特征的主题信息,利于服务分类管理、高效服务发现及合成.将WSDL文档中的服务、操作、输入和输出参数名作为服务描述的要素(称为项),基于对多个WSDL文档中各项的统计计算,分别提出项权重和项集语义覆盖度的概念,并给出基于这两个语义度量标准的关键项自动抽取算法,进而得到以关键项集描述的Web服务主题。实验结果表明,提出的服务主题自动抽取方法具有较高的效率
为支持越来越多Internet和Web应用的高性能、实时性、高可用性和高可靠性等要求,设计了一种3层结构的实时容错数据库及其全更新同步复制模型,并讨论了一个基于多数的两阶段实时同步复制协议2PRTSR.该协议考虑了事务定时限制,放松了全局决定(提交或夭折)的条件并提供事务"重试"和"丢弃"机制.该协议既能保证数据的一致性,又可节约系统资源和提高系统可用性。性能测试结果表明所给出的方法在满足事务平均