基于P2P的分布式存储系统的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:likeu111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网服务爆发式增长,用户对海量数据的需求加大,如何在动态网络环境中设计具有高可用性和高可靠性的分布式存储系统,已经成为热点问题。P2P技术的成熟推动了网络存储技术的发展。如今,国际互联网公司又提出“云存储”的概念,整合系统资源,用户付出较少费用,就可以得到稳定可靠的存储服务。现有的分布式系统,没有充分考虑利用服务器和端系统相结合的机制,提供高效的存储服务。本文首先对分布式存储和P2P技术进行分析,结合当前国内外研究现状和发展态势,再根据项目的实际需求,设计出高效的分布式海量存储系统PPDSS(P2P Distributed Storage System),即基于P2P的分布式存储系统,由端系统以及服务器系统构成覆盖网络,并且向终端存储演进。本文的主要工作有以下几点:第一,PPDSS系统设计,引入了分布式架构,去掉中心节点,将元数据索引和数据存储的负载分发到每一台服务器上。实现存储系统的基本功能,包括发布、下载、更新和删除文件。设计多种定时器,处理系统各种超时事件。第二,负载均衡模块的设计与实现,在副本变化的过程中,充分利用服务器的空闲资源,使得系统的服务性能得到最大的发挥,避免系统瓶颈和抖动的出现。第三,实现高效的P2P内容分发策略,在单线程模型下进行高效的网络交互和磁盘访问。针对P2P网络的特性,提出超级节点选择算法,定期选择上传速率高的节点作为邻居节点,优先向其分发数据,同时淘汰放大能力低的节点,有效利用服务器网络带宽,提高内容分发效率。第四,设计并实现Lazy机制,保证PPDSS的数据一致性。利用客户端对PPDSS进行测试,结果表明文件基本操作能够正常进行,客户随时都能下载到正确的数据。选择低负载服务器进行副本扩散能够达到负载均衡,并且降低了对客户下载速率的影响。与多进程服务器的性能对比,基于非阻塞网络读写和磁盘异步I/O的单线程服务器CPU使用率降低了60%。通过将超级节点选择策略和普通选择策略的内容分发效率进行对比,证明引入超级节点以后,客户平均下载完成时间缩短,性能提升17%以上。
其他文献
近年来,随着web信息资源的快速增长,通用搜索引擎存在无法检索所有页面的问题,也不能满足人们日益增长的个性化服务需要,因此各类适应特定人群需要的主题搜索引擎应运而生。
随着计算机及网络技术的发展,网络环境下的案例教学是目前国内外研究的热点。在网络环境下,案例作为案例教学系统中的关键资源,它是前人对特定领域知识经验的总结。不同学科
三维表面重构是计算机视觉领域中一个至关重要的经典问题,是进行图像理解和三维目标识别的关键技术之一,它架起了机器自动完成从客观实体到抽象感知的桥梁,使得利用其来自动
视频车牌检测技术是智能交通领域中研究的热点问题,它作为机器视觉及模式识别研究领域里长期关注的一个重要课题,具有极高的学术研究价值和重要的实际应用价值。同时,Adaboost算
在通信技术和网络技术飞速发展的今天,企业收集、传递、整理信息的途径越来越多,效率要求越来越高,传统传真的机械传真机收发方式已经无法满足企业信息化的要求。本文结合某
随着视频与图像处理技术的发展,基于摄像头的视线估计技术作为人机交互领域的一个重要分支受到了广泛关注。传统的视线估计技术大多采用瞳孔角膜反射向量法,因为它具有良好的
自动化文本分类是数据管理的重要组成部分,目标是自动地将文本划分到已知的类别中去。基于关联规则的文本分类方法相对于其他的文本分类方法,不仅可以产生易于理解的分类规则
遗传算法是模仿自然选择和生物遗传学机理,通过人工方式构造的一种随机搜索算法,具有搜索的隐并行性、进化的自适应性和不依赖于问题特性的鲁棒性等特点。作为一种启发式随机搜
护士排班问题是一个具有挑战性的题目,由于医疗机构和护理工作的特殊性,护士排班问题通常具有各种各样的约束条件。良好的排班方案有助于鼓舞团队的士气,营造良好的工作氛围,从而
为了解决现有Internet面临的高速交换、服务质量(Quality of Service, QoS)保障、网络安全和移动性方面的问题,四川省网络通信技术重点实验室提出了“单物理层用户数据交换平