【摘 要】
:
正交区域查询一直是应用科学领域中的重要课题,尤其在数据库查询和计算几何中被广泛深入的研究,并已经在数据库查询、地理信息系统、计算机图形学、数据挖掘和多媒体信息检索
论文部分内容阅读
正交区域查询一直是应用科学领域中的重要课题,尤其在数据库查询和计算几何中被广泛深入的研究,并已经在数据库查询、地理信息系统、计算机图形学、数据挖掘和多媒体信息检索等领域中得到广泛的应用。随着计算机技术的不断发展,每天产生的数据量的爆炸性增长导致急需新的方法去检索庞大的数据集,而Top-K查询就是解决信息过载最简单有效的方法之一,如今Top-K问题也已经在众多领域被深入研究,包括信息检索、多媒体相似性检索、推荐系统等。最近几年,数据库的易用性受到越来越多的关注,解释用户期待的记录未出现在查询结果中的现象,即所谓的Why-Not问题已经逐渐成为炙手可热的课题,在SQL查询、Top-K查询、Skyline查询、空间关键字Top-K查询等众多领域中的Why-Not问题已经得到较好的解决,但还没有人解决过正交区域Top-K查询中的Why-Not问题。论文在深入研究正交区域Top-K查询算法的基础上,首次提出解决正交区域Top-K查询中的Why-Not问题,即采用自动更新查询的方式对初始查询进行调整,从而使得新查询的结果集包含Why-Not元素且代价最小,对于查询的调整主要是从不改变区域的前提下提高k值、不改变k值的前提下缩小区域、适当提高k值并缩小区域三种方式中找出满足条件且使得代价最小的查询,并借助区域树对算法执行效率进行优化,另外还结合测试数据对Why-Not算法进行了实验,并对比了包括初始k值、初始排序、数据规模等不同因素对算法执行效率的影响,实验结果显示算法具有非常高的准确性和较好的效率。
其他文献
随着数字信息的爆炸式增长和应用需求的不断提高,企业比以往任何时候都更加依赖于数据。如何对数据进行备份和灾难恢复已成为存储业界研究的热点。传统的数据保护技术已经越来
ERP是整合了企业管理理念、业务流程、基础数据、人力物力、计算机硬件和软件于一体的企业资源管理系统。本文首先阐述了ERP的原理和思想以及发展的历史阶段,论述了中小企业
数据竞争是多线程程序中最复杂的一种并发错误。由于线程调度与多线程程序执行顺序的不确定,导致数据竞争的检测变得异常困难。动态检测数据竞争是指在程序执行过程中实时监
信息技术在当今企业生产活动中的作用越来越重要,实现它的主要方式是企业资源规划(Enterprise Resource Planning)。ERP系统要具有相当的灵活性和扩展性,才能帮助企业在瞬息
出于隔离性和安全性等考虑,虚拟机间的通信过程在通信路径上引入了前后端设备驱动,导致虚拟机间的通信性能与传统的进程间通信相差甚远,而虚拟机间通信的结果仅把数据从内存
飞速发展的网络革命正在改变着人类的生活,高速的通讯系统的研发给IPTV(Internet Protocol Television)的问世和普及带来福音。目前,IPTV正在逐渐成为网络中一项重要的业务走
事件提取是指把非结构化文本中出现的事件的时间,地点,事件主体和事件的具体内容提取出来。随着垂直搜索引擎的出现,事件提取作为信息提取的一个研究方面,近年来成为研究的热点,并
微博作为目前最流行的社交应用之一,成为人们信息获取和传播的主要途径。微博数据实际上是一个高速、海量和动态的信息流,更能表达出每时每刻的社会话题及其变化过程,从中进
随着多核处理器成为主流产品和工业标准,如何在屏蔽处理器底层细节简化编程方式的同时充分利用多核处理器的并行资源,是并行程序设计领域的研究热点和难点。流编程作为一种高
随着移动定位设备和移动互联网技术的飞速发展,越来越多的网络对象被贴上地理位置标签和文本描述信息,这种对象称为空间文本对象。在实际应用中,用户可能在未来一段时间内查