基于不确定数据的轮廓查询处理技术研究

来源 :东北大学 | 被引量 : 0次 | 上传用户:liuyi8431201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人们对客观世界认识的不断深入,计算机应用中普遍存在的数据不确定性逐渐得到业界的关注。尽管在传统数据库领域中作为多目标决策重要手段的轮廓查询得到了广泛深入的研究,但是由于不确定数据带有概率,传统数据库领域的轮廓查询算法都不能直接应用到不确定数据库中。  由于轮廓查询在多目标决策、无线传感器网络、数据挖掘等方面的重要应用,基于不确定数据的轮廓查询成为近期的研究热点。然而,现存的基于不确定数据的轮廓查询不符合某些用户需求,还需要研究新的轮廓查询及其相关算法。基于以上原因,本文提出两种不同的基于不确定数据的轮廓查询算法。本文的主要工作总结如下:  (1)首先定义了概率阈值轮廓点的概念并提出了一种基本的概率阈值轮廓点查询算法,接着提出一种改进的算法。在改进算法中,将存在概率大于等于0.5的非阈值轮廓点所组成的轮廓和存在概率小于0.5的非阈值轮廓点所组成的轮廓分别作为过滤器。查询过程中,将被查询对象和过滤器进行比较,如果查询对象被过滤掉,则不用进行进一步的计算。  (2)在假设元组不独立的基础之上,提出带规则的概率阈值轮廓点查询算法。本文考虑的规则主要包含两个方面:互斥规则和共存规则。所谓互斥规则是指规则内的元组最多只有一个元组能够出现在一个可能世界中;所谓共存规则是指规则内的元组必须同时出现在一个可能世界中。  (3)定义了不确定轮廓的概念并提出了基于排序的不确定轮廓查询算法和基于R-tree索引的不确定轮廓查询算法。为了提高算法效率,提出剪枝策略,并提出一种改进的算法。剪枝策略的理论依据是如果元组不被当前轮廓支配,且存在概率大于等于0.5,则只发展包含此元组的轮廓即可,不包含此元组的轮廓可以忽略不计。  (4)最后,通过实验证明了本文提出的所有算法的有效性以及改进算法性能的显著提高。
其他文献
软件工程学的奠基人Dijkstra早在1968年就提出:软件工程师不仅要关注系统的功能,还需要理解软件的结构。但随着软件规模的不断扩大,软件系统中大量元素及其之间错综复杂的交互
随着Internet的快速发展,Web数据库得到了广泛的应用,越来越多的普通用户通过查询接口访问Web数据库以获取更多信息。当前,数据库查询处理模式通常假定了用户能够明确其查询
随着第三代移动通信(3G)网络应用的普及和发展,其自身的安全问题也日益受到人们的广泛关注。GTP协议作为3G核心网中最为重要的一种IP承载和隧道封装协议,其自身没有采用任何
随着对软件系统的连续运行性要求的提高,构件的动态演化逐渐成为研究热点,而保证构件系统的行为一致性是构件动态演化的首要问题和根本目标。不受约束的系统行为改变可能导致
随着互联网的迅速发展,各个网络服务提供商都需要为越来越多的用户提供服务,用户对应用服务器也提出了更高的要求:7×24小时全天候服务、响应速度快、I/O吞吐量高、容错性好、
近年来,实时Linux系统已逐渐被人们用作嵌入式应用软件的支撑平台。RTAI作为一种优秀的实时Linux系统,实时性、开源性、多平台支持以及可定制性为其广泛的应用奠定了一个良好的
随着信息时代的到来,计算机的普及和应用给各行各业带来了极其深远的影响。在工业控制领域,现代工业技术的快速发展为工业检测提供了众多的检测技术与手段,比起传统的测量技术具
近年来,我国高等职业教育迎来了蓬勃发展的新局面,各院校招生规模不断扩大,学校的教学管理负担越来越重。采用传统的学生信息管理模式(如直接手工管理或者开放性程度不高的管
无线传感器网络(Wireless Sensor Network,简称WSN)是计算机科学与技术学科一个新的研究领域。它涉及到拓扑控制、路由协议、节点定位、时间同步和数据融合等相关技术,其中以
图计算作为一类重要的大数据计算,应用十分广泛。伴随着图数据规模的迅速增长,人们试图使用二级存储设备对图计算系统进行扩展,以期设计更高性价比的图计算系统。但因为二级存储