论文部分内容阅读
随着RFID和传感器网络技术的快速发展,针对RFID数据的复合事件探测技术得到了日益广泛的应用,如事件预警与事件监控。已有工作一般都是针对确定性数据流,对大量原子事件进行精确匹配,查找复合事件。而在真实情况中,由于阅读器漏读等原因,会造成事件具有不确定性和关联性,而且往往需要对原子事件进行相似性检测。同时,敏感数据的隐私保护也十分重要。因此,本文主要针对符合Markov相关性的数据,从精确匹配、相似性检测和隐私保护三方面进行复合事件检测技术的相关研究。首先,针对符合Markov特性的不确定事件序列,本文形式化定义了匹配事件集和不确定复合事件查询,并针对不确定复合事件精确查询问题,提出了基于序列优先的查询处理方法(seqF_Q)和基于相关性优先的查询处理方法(corF_Q)。两种算法可在多项式时间内对该问题进行求解。考虑到两种算法的影响因素,本文使用真实数据集和虚拟数据集进行测评分析。实验表明,corF_Q方法的处理效率高于seqF_Q方法。其次,针对Markov不确定事件序列的相似性查询问题,本文对上面提出的问题进行扩展,形式化定义了复合事件相似性距离和不确定性复合事件相似性查询问题。为提高检测效率,本文构建了MCE_Index索引并将其分别与seqF_Q和corF_Q方法结合,提出序列优先的相似性查询处理方法(seqF_SQ)和相关性优先的查询处理方法(corF_SQ)。进一步,本文通过设计缓存机制改进了corF_SQ方法,即corF_ca_SQ方法。在真实数据集和虚拟数据集上的实验验证了三种算法的可行性。其中,corF_ca_SQ处理效率最高。最后,针对Markov事件序列的复合事件隐私保护问题,本文对隐私保护的相关概念进行定义,提出了适用于Markov事件序列的效用增益函数,然后提出了基于事件类型(Type_S)和基于事件实例(Instance_S)的舍弃策略,并基于corF_Q方法实现两种策咯。效用增益和处理时间的实验结果表明,Type_S方法具有较高的处理效率,而Instance_S方法能够获得较高效用增益值。因此可以根据特定应用场景选择合适的方法进行相关处理。总之,本文主要研究了数据的不确定性和相关性,并针对面向Markov事件序列的复合事件技术中的关键问题,即精确性匹配、相似性匹配和隐私保护三个方面,提出了高效的解决方案。大量的实验验证了本文方案的高效性和准确性。