论文部分内容阅读
随着互联网的发展,传统关系型数据库(RDBMS)已不能满足大数据时代所要求的系统水平扩展的需要。NoSQL存储提供了一个具有巨大的可扩展性、容错性、可用性、可靠性的下一代数据库方案,同时避免了传统的关系数据库的复杂的连结操作造成的效率低下和难于扩展。 图数据关系在描述和表达互联网时代大数据如社交网络、推荐系统等大规模图关系数据上,有着天然的优势。所以,我们可以把具有高水平扩展性的NoSQL存储和图数据库分析结合起来,构建分布式云处理的在线事物处理系统(OLTP)。本文主要研究非关系型数据库(NoSQL)作为图数据库存储后端的解决方案,主要贡献有: 梳理了以CAP定理为代表的分布式系统的基本理论,为实践中对可用性、一致性、分区容忍性的权衡以选取合适的分布式系统奠定理论基础。 介绍了以Dynamo,Cassandra和Riak为代表的对等结构的NoSQL大规模数据存储系统的系统方案,为适应互联网时代大数据的挑战和系统水平扩展的需要提供实际的技术方案。 讨论了对以TinkerPop图数据库技术栈为基础的分布式图数据库Titan进行存储后端扩展的技术路线,使其扩展各种非关系型数据库(NoSQL)作为存储后端。同时,通过在扩展Riak作为分布式图数据库的存储后端的实践以及遇到的挑战,总结了部分NoSQL牺牲RDBMS特性所带来的新的局限性。