论文部分内容阅读
随着互联网的快速发展,各种信息不断涌现且形式各异。面对海量信息,用户难以区分数据的结构与层次,对信息资源的高效组织成为一个亟待解决的问题。目前主流的文件系统关心的是数据访问性能及可靠性,而数据特征与数据之间关联并没有受到足够的关注。为了充分利用关联信息进行文件访问,学术界引入了语义文件系统,通过引入新的接口模型来扩展文件的语义关系,但是由于本身局限性关联关系不能持久保存,而且不能移植。因此,为提升文件系统管理效率,研究并实现有效的文件组织机制是非常有意义的。通过对文件的三种组织方式和文件的检索机制的分析与讨论,总结出现有文件系的特点以及不足之处,并在此基础上实现原型系统Xattr-FS,文件内部通过建立扩展属性区域来存放文件说明信息,实现文件的自描述性,提供接口存储语义信息并对扩展属性以及文件内容本身进行读写;文件外部在逻辑上将文件集组织为扁平结构,采用了虚拟路径机制来兼容POSIX规范。文件自身对属性信息和内容进行管理,避免传统系统中关联失效的情况。在以上基础上,采用合并索引算法收集文件中属性信息,对每个子目录下建立索引表与属性表来存储相应的元数据信息,从而实现快速索引以及归档分类。在访问方式上为用户提供了亲和的逻辑视图的接口。实现并验证了原型系统在元数据扩展,文件读写,检索方面的功能。在实现上考虑到简洁性,采用用户空间文件系统框架,相较于原生文件系统降低约为20%的读写性能,测试结果表明,通过扩展属性建立索引后,检索速度有了很大提升,对于扩展属性增加、删除等元数据操作,原型系统的响应时间一般在20微秒左右。达到了预期的水平。