基于Pick-kX算法的分布式存储系统设计与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:csrsyz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络技术的发展和普及,出现了越来越多的像”新浪”,“淘宝”等众多的大型门户网站和电子商务网站,这类网站都保存了大量的数据资源。由于受客户端浏览器的限制,无法从一台服务器上面下载所有的数据资源,因此即使服务器有很高的带宽,用户的访问速度还是会受到很大的影响,另外,由于数据保存在物理硬盘上面,访问数据会进行频繁的I/O操作,因此当并发用户数越来越多时,I/O操作就会成为整个系统的性能瓶颈。  针对以上的问题,本文提出了一种基于Pick-KX算法的分布式存储解决方案,构建一个易于扩展,具有良好的性价比和容错能力的分布式存储系统,并且允许大量的客户端并发访问,而不会出现客户端的请求得不到响应的问题。本文的主要工作和贡献可以归纳为以下几点:  1.研究了HBase数据库的工作原理、读写流程和容错机制,通过对HBase数据库的整体架构和工作机制进行分析,系统利用 HBase数据库对文件进行分布式存储和数据备份。  2.研究了 Redis内存数据库的工作机制、存储数据结构、持久化机制和读写分离机制,通过对Redis源码的阅读和分析,系统采用Redis对数据读取进行优化,将用户频繁访问的数据存入Redis中,同时利用Redis的过期机制将长期未被访问的数据从Redis中移除,提高内存使用效率。  3.研究了ZooKeeper的工作原理,在系统中利用ZooKeeper实现自动化配置管理和集群管理,减少开发和维护人员的工作量,同时让系统主节点实时得知工作节点上线和下线状态,调整任务分配策略,提高系统的可靠性。  4.通过对Pick-KX算法的研究,系统利用Pick-KX算法实现各处理节点的负载均衡,避免某些处理节点长期空闲和忙死的情况,实验表明该算法能够有效地实现系统负载均衡。  5.研究了文本差异检测算法,当用户对当前文件进行修改时,利用该算法将差异同步到服务器上面,避免用户的修改数据丢失,保证系统的完整性,另外,系统利用布隆过滤器避免相同的文件重复上传。
其他文献
在现代存储系统中,为了提高数据访问效率,大多采用将文件数据与其元数据分开存储的组织方式进行管理。然而设计一个高性能、高可靠性的分布式文件系统元数据集群,需要解决的一个
随着煤炭、石油、天然气等可用资源逐渐减少,而资源的利用率依然很低,如何提高现有资源的利用率是我们面临的首要问题。本文主要通过图像处理技术对锅炉底渣含碳量进行研究。文
计算机硬件水平和技术的进步,使得人们对于场景仿真和数据精度提出了更高的要求,更多地需要一种数据整合和全方位立体真实展示的仿真形式。在军用和民用领域,传统的平面二维
随着制造业发展,作业车间调度问题的实现过程也变得越来越复杂化。车间调度问题是一类集各约束条件的组合优化问题,对于该问题具有很实际的一个应用背景,因此该领域也一直是研究的热点,自上世纪80年以来,随着各学科领域之间的相互渗透,也出现了许多研究方法,并涌现了大量有价值的文献。可是该问题被证明是一个NP难问题,所以至今没有一个确定可行的解决方案,这也吸引了越来越多的学者对此进行研究,近几年也提出了很多具
随着移动设备功能的越来越强大,它们所提供的服务变得越来越专业且单一。将这些设备所提供的服务有机的结合起来,可以实现更加复杂的功能,这一过程我们称之为组合服务。这种面向
随着计算机技术、传感技术和机械制造等技术的发展,机器人技术及其应用都获得了空前的发展。教育娱乐型机器人作为近几年应用前景最被看好的服务型机器人之一得到了快速的发
维基百科是一项人类集体智慧工程的结晶,是一个全世界使用最为广泛的百科全书,它既可以作为一个高质量的语料库,也可以作为词库和知识本体进行应用。对维基百科的分类结构进行研
数字化荧光成像技术和分子级生物着色技术的不断发展,极大地推动了研究者对亚细胞结构的直接观察和相关研究。研究人员通过绿色荧光蛋白质来标记亚细胞分子结构,实现了活细胞
随着计算机科学和网络技术的不断发展,近年来出现了以云计算为代表的新兴技术,云计算技术在提供大量高性能服务的同时,也对承载着这些服务的传输网络提出了新的要求。对高性
在云计算快速发展的年代,将计算资源和存储资源存放云端已成为时代发展的必然趋势。当前,云服务的种类快速增加,云服务的质量快速提高,服务供应商们在云服务的相关技术上投入