论文部分内容阅读
随着物联网的兴起与普及,未来世界上绝大多数的事物都将通过网络相互联结,这些数量庞大而且种类繁多的事物必将产生海量的实时数据,采用一个高效的数据库系统来存储与管理这些的数据显得非常有意义。实时数据库是在数据库的基础上加入实时性技术而发展出来的产物,是通用数据库的补充,特别适合存储与处理快速变化的数据,因此被广泛地应用到工业生产中。随着工业化与智能化的程度不断提高,传感器产生的数据规模以及用户的任务规模也不断扩大,传统的单一节点实时数据库系统渐渐无法满足日益增长的新需求。为了提高系统的数据存储能力,保证系统的实时性、可靠性、可用性,分布式实时数据库应运而生。 分布式实时数据库是在实时数据库的基础上引入了分布式技术,其中的资源调度模块的设计直接影响到整个系统的可伸缩性、高可用性与高效性。好的资源调度模块在保证整个分布式系统的负载均衡与数据存取的高效性的同时,也能提供更优秀的系统伸缩能力与更好的可用性。本文结合分布式实时数据库中数据和任务的特征,对分布式实时数据库资源调度技术进行研究,尽可能地提高系统的效率,并且保证系统的正确性、可用性与可伸缩性。 论文的主要工作有以下四个方面: (1)介绍了当前分布式实时数据库资源调度技术的研究进展,并根据分布式时数据库的数据特征与任务特征,提出对应的负载指标,并针对实时数据存储、实时数据订阅以及历史数据查询这三种主要的任务设计不同的调度策略来保证系统的负载均衡。 (2)针对分布式实时数据库中数据的海量性、实时性、时空相关性、连续性、存取失衡性,提出了局部开放式的一致性哈希数据分布策略。 (3)针对分布式实时数据库中订阅与查询等任务的特点,根据数据节点的实时负载情况,提出一种自适应节点选择策略。 (4)在现有安捷(Agilor)实时数据库系统的基础之上,设计并实现了分布式实时数据库原型系统。