论文部分内容阅读
溯源感知存储系统是可以自动收集并管理对象溯源的存储系统,是存储系统的一种变革。它不仅存储对象(文件、进程、管道)本身,也可以维护对象的溯源。溯源是描述对象详细历史信息的一种元数据,它提升了数字信息的价值。然而,随着数字信息的爆炸式增长,存储系统对数字信息的管理面临着巨大的挑战。经统计,溯源是数字信息数据量的十倍以上,如何高效的存储并检索溯源是一个亟待解决的难题。为了实现高效的存储并检索溯源,分析了溯源感知存储系统的工作原理并研究了溯源的类型及收集方法。研究发现溯源感知存储系统收集的是整个系统中所有文件、进程和管道的溯源。其中,没有对溯源感知存储系统卷上的文件产生影响的对象的溯源是没有利用价值的,并且没有利用价值的溯源是有利用价值的溯源的数倍。因此,对系统收集到的溯源进行了提取,消除没有利用价值的溯源,大大减少了溯源占用的存储空间。溯源是半结构化数据,研究了半结构化数据存储与检索技术,提出了用有向无环图表示溯源,分析了环检测和消除算法以及环避免算法在消除溯源图中的环性能上的差异。研究了溯源的存储格式,提出将与对象相关的溯源集中存储到一起的存储方式。提出了用图形数据库、伯克利数据库、文本文件存储和检索溯源的方法并从理论上分析了这三个解决方案性能上的差异,设计与实现了用伯克利数据库和文本文件存储和检索溯源。最后,在本地存储系统环境下测试了系统收集溯源的功能,分析了对溯源进行提取之后收集到的溯源的正确性,保证了有价值的溯源信息的完整性。测试了经提取之后的溯源占用的存储空间。然后分析了数据库和文本文件在存储、检索和更新溯源方面的性能。