论文部分内容阅读
云计算快速发展环境下,图书馆馆藏结构由印刷型为主转变为数字资源为主;加工深度由目录精细转变为图表章节,颗粒度越来越细;资源揭示功能由OPAC转变为发现系统,揭示层级越来越丰富;系统功能由单一目录检索转变为丰富发现获取,发现服务应运而生。发现服务是一种大数据规模的元数据搜索服务,通过对多来源异构文献元数据清洗、转化、合并归一形成统一元数据预索引库,以“一站式”检索方式为用户提供快速、简单、内容丰富的多来源文献指引。 宏观上,本文按照绪论、正文和结论的总体布局分为6章内容,通过论述发现服务的定义及其对元数据的要求来理清发现服务与元数据集成整合之间的关系,文章将元数据集成整合作为基础内容并以其为中心展开研究。首先对国内外资源发现系统的元数据集成整合实践进行分类总结,对发现系统的原理、构建方式、必备要素进行了全面的梳理,结合书刊文献资源的特殊性和文献发现需求确定一种分层级、按照文献描述颗粒度依次细化顺序自动挂接的元数据集成整合方案流程、元数据集成整合体系结构,实现文献的层级揭示。 微观上,研究面向发现服务文献元数据集成整合方法和具体步骤,主要包含构建书刊文献元数据框架、制定面向发现服务的书刊文献元数据方案,定义元数据映射机制,阐述元数据集成中的查重规则、数据冲突(母体、卷期、来源渠道冲突等)实现冲突数据合并归一以及从母体和文摘两个层级进行元数据规范辅助相关规则库和规范库建设。集成整合过程中贯穿元数据质量控制,主要从如何评价单条元数据记录的质量和如何评估某一来源维度的元数据质量两方面展开,并提出相应的数据质量改善策略。最后对本研究的主要工作及不足进行了总结。