【摘 要】
:
随着数据采集、处理、预测等技术的不断进步,不确定序列数据普遍存在于科学、通信、物流、金融等领域的具体应用中。本文首先关注于一般形式的事务序列数据库中的频繁模式挖
论文部分内容阅读
随着数据采集、处理、预测等技术的不断进步,不确定序列数据普遍存在于科学、通信、物流、金融等领域的具体应用中。本文首先关注于一般形式的事务序列数据库中的频繁模式挖掘问题;其次,针对具体的局部相关性不确定数据库,我们研究了其快照序列上处理最近邻模式查询的算法。一个很重要的方面是在不确定序列数据中挖掘未知的序列模式从而将很多的有价值的信息提供给用户。某些序列模式会很有可能包含先前人们未知的有价值的规则。相比于确定序列数据库,不确定序列数据库中挖掘序列模式更加复杂,其通常有着更大的搜索空间。由于数据的不同,已知的目前被广泛应用的基于模式扩展的挖掘方法也不能够直接用来解决不确定序列模式挖掘问题。本文也提出了一种新颖的定义在不确定数据库的快照序列上的概率频繁近邻查询,目的是在快照序列上找到以一定概率频繁成为查询模式最近邻的那些对象。然而由于在局部相关性不确定数据库快照序列中处理概率频繁最近邻查询时,应用现有的基于传统数据和基于不确定数据上的近邻查询算法直接处理这种查询必须面对巨大的搜索空间和访问条件概率表的大量时间开销。针对第一方面问题,本文提出了多项式时间的快速ETP算法来处理不确定序列挖掘,以及相应的剪枝策略。其次,为了很好的解决第二方面问题,我们提出了针对概率频繁最近邻查询的一般的处理框架,及其相应的过滤方法。我们在人工的和真实的数据上都进行了充分的实验,并验证了给出的算法的有效性。
其他文献
随着计算机技术的飞速发展,图像处理和计算能力得到了极大提高,计算机视觉也取得了较快的发展。视觉目标跟踪技术是计算机视觉领域的重点问题。目前虽然专家学者已经研究了很
近年来,3D人脸识别一直是当下模式识别领域的热点。3D人脸识别相对于指纹识别,虹膜识别等识别系统有着先天的优势,主要体现在操作简单方便,对目标具有相当小的侵犯性,甚至可
随着网络技术的发展及应用的普及,园区网结构和用户行为越来越复杂,管理也变得愈加困难。作为网络行为的主体,主机的使用者是网络行为的责任人,因此对网络用户的网络行为管理
科学技术的突飞猛进、世界范围的互联网络,使得人们获得的数据量急速增长,与人们生活密切相关的电信业也积累了海量的数据。数据挖掘技术的出现使得电信运营商得到启发,他们在行
随着人们生活质量的不断提高和传感器网络技术的进步,具有网络传输功能的智能物件不断融入人们的生活,成为生活必需品。智能物件大多采用无源供电,因此,智能物件数量的增加给
手语是聋哑人群体用来交流、学习的主要手段。许多国家和地区都将手语作为一门语言学来研究,并且取得了一定的成果。在计算机领域,研究者们根据手语语言学者的研究成果,将手
随着网络技术的飞速发展,用XML表示与存储的数据量与日俱增,尤其在网络数据的发布,各组织间的数据交换以及电子商务等应用领域中。XML已经成为数据表示,存储与交换的标准,在X
测控系统要想获得原始数据需要通过传感器,压力传感器由半导体材料的压阻效应做成的传感器,是一种以压力作为被测量转化成电流或电压的器件。由于压力传感器的非线性特性及热
面向领域的数据库问答系统是允许用户用自然语言访问数据库的一种方式,它是多学科交叉的产物,涉及自然语言处理,数据库技术,人工智能,人机界面等多方面研究。四十多年来,面向
论文对国内现有的几种汉语自动分词中的歧义字段切分算法进行讨论,重点分析了BP神经网络的局限,提出了改进,建立了新的BP网络歧义切分模型,使其对于歧义字段的切分精度和效率进一