论文部分内容阅读
针对OAI-PMH框架中存在的元数据重复问题,根据重复元数据出现的两种情况给出了相应的解决方法。对于SP中来自同一个数据提供方中的元数据,根据元数据记录的标识符和时间戳去重;对于SP中来自不同数据提供方中的元数据,采用向量空间模型计算元数据间的相似度,进而达到去重目的。通过对OAI-PMH框架中元数据的去重,不仅减少了数据冗余、节约了存储空间,而且也大大提高了用户查询数据的效率。