论文部分内容阅读
随着互联网的高速发展,数据存储呈现海量增长的趋势,超大规模和高并发的访问请求对传统的关系数据库提出了巨大挑战。独立的Web缓存技术得到了广泛的重视与发展,将数据以键值对的形式进行缓存,使得频繁访问的数据内容可以直接从内存中读取,从而显著提高系统的服务能力。当前互联网应用中的缓存管理系统面临着因数据访问多样性造成的缓存污染问题,针对论文分享系统的具体问题,提出了一种基于内容分类的数据缓存技术,将不同类型的数据内容缓存到不同的内存数据结构中,而非单一的哈希表结构,从而解决缓存中多种类型数据在查找时的互相影响问题,进而提高论文分享系统的性能;采用一种缓存分布式算法,并进行分布平衡性改进,实现论文分享系统缓存的可扩展性,解决了单一服务器内存容量不足问题。测试结果表明,基于内容的分类缓存使得论文分享系统的平均响应时间缩短了60%,显著提高了系统的服务能力。分布式扩展将论文分享系统的缓存读写性能提高了近两倍,使得数据散列均匀,具有良好的分布平衡性。