论文部分内容阅读
和传统关系型数据库相比,双时态数据库同时支持有效时间维和事务时间维,使得它能够更加精确地表示现实世界中的数据和信息。许多应用程序的数据库(如数据挖掘技术中的数据仓库)存储了数据随时间的变迁历史,这些数据从过去的某个时间开始有效,并一直保持到当前时间。具体来说,人们通常对两种时态因素最感兴趣:有效时间(Valid Time)和事务时间(TransactionTime),分别表示数据在现实世界中为真的时间和数据在数据库中被更新和操作的时间。对于那些需要对数据操作变化跟踪的应用程序,事务时间就显得非常重要。同时支持有效时间和事务时间的数据库就称为双时态数据库。
索引在整个数据库系统中占据着重要的地位,是整个数据库系统效率高低的决定因素,时态数据库也不例外。传统关系数据库的索引使用B+树技术,取得了很好的索引效果。对于多维的双时态数据,一维索引结构B+树难以满足要求,需要使用新的基于R树的空间多维索引结构来进行索引。近年来基于R树的空间多维数据索引技术研究已经取得了丰富的成果,然而真正用于双时态数据库的索引技术的研究却相对较少,对双时态数据库索引的实际应用比较不利。本文基于现有的空间索引结构——4R树和QR树技术,利用中间件的软件技术,提出并改进了一种可以应用于现有时态数据库中间件TimeDB的双时态索引模型和技术。
本论文中,首先讨论了时态数据库的基本概念及双时态索引的理论和技术;接着通过分析和比较现有的各种多维空间索引技术,设计了一种改进的基于4R树和QR树的双时态数据库中间件索引方法,根据时态数据对象的有效时间和事务时间区间终止值是否已知把它们分为两类:不含时间变元的时态数据可以直接进行固定区域索引,包含时间变元“Now”和“UC”的时态数据,先通过数据变换消除其中的时态变元,归结为固定区域的索引;然后对QR树索引的节点插入算法和4R树中两棵子树的索引结构做了改进,有效地提高了索引的更新和查询性能;最后,通过仿真实验和数据评估,检验了本文提出的支持双时态数据库中间件索引的模型和技术的合理性和有效性,证明了文章提出和改进后的QR树索引方法的优越性:虽然在索引存储空间占用上略大于4R树索引方法,但是在查询和更新性能上都有了较大的提高。