论文部分内容阅读
互联网的发展为现代人的生活带来了便捷,正一步步取代着传统产业链的各项功能,使传统的社会布局发生着天翻地覆的变化。在WEB2.0时代人人都是信息资源的发布者与接收者,人们想要通过网络来消除信息的不对称。然而互联网的信息资源更像是“洪水猛兽”,若没有完善的信息查询与管理机制人们只能被信息所淹没,而不能有效利用信息创造价值。对海量信息进行有效的组织、管理和利用已经迫在眉睫。网络搜索引擎在此时提供了信息搜集与检索的功能,它一般是通过一定的策略、运用计算机程序或网络机器人从互联网上收集信息,对其进行清洗与处理后提供给用户使用。但随着大数据时代的来临,该类网络搜索引擎的检索结果越来越难满足用户的需求。人们从传统的纸本检索体系吸取经验,想把传统的书目检索应用到互联网中来。但纸本目录发展而来的机读目录著录规则繁琐且需要专业人员进行操作,对大量的信息很难应用。由此,人们专门针对网络信息资源开发了元数据进行信息的组织与检索。随着人们对元数据的研究发展,各平台的网络资源应用着各自的元数据标准,这为将来的资源整合造成了不小的困难。本文综述了元数据的发展过程,对国内外各大资源提供商的元数据设置情况进行研究,通过对比分析、实例研究等方法找出各资源提供商的元数据差异,为元数据标准的构建提供有力的支撑,并草拟数字资源元数据标准框架,以期望为我国的数字资源元数据统一化、标准化提供参考建议。本论文共分为5章,各章内容如下:第一章,引言。本章阐述了文章的研究背景、研究意义、研究内容与目的、研究方法以及本文的创新点。第二章,综述国内外元数据的发展概况。在国外方面本章首先运用实证方法利用web of knowledge数据库分析国外关于元数据的文献研究情况。其次,通过综述文献分析国外元数据的发展脉络。在国内方面也是相同的步骤:首先通过CNKI数据库分析国内关于元数据的文献研究情况,再通过国内的研究项目分析元数据的发展进度。第三章,各资源提供商的描述性元数据差异化分析。通过对选取的11个资源提供商的资源类型进行分析比较,发现国内与国外资源提供商的资源分类差异以及国内资源提供商的资源特色化分类等问题,找出国内外资源的发展方向。本章分为三大部分,其中第一部分是万方数据元数据的案例分析。在这个部分首先是对万方数据的元数据的原则设计进行研究;其次对万方数据传统数字资源与国外DC元数据进行差异化分析;最后总结万方与其他国内外资源提供商的元数据差异,以期望对各资源提供商元数据的修改提供相关数据。第二部分是传统数字资源的元数据差异化分析。在此部分对期刊论文、学位论文以及会议论文的元数据设置情况进行了充分分析,为元数据标准的统一提出建议与意见。第三部分是国内外资源提供商的特色资源元数据对比分析。随着数字化进程的发展,资源提供商的数字资源也越来越丰富,本部分选取了外文文献、专利文献、标准文献、法律文献、图书、以及引文文献对各自元数据进行对比分析,为特色资源元数据的设置提供参考。第四章,国内资源提供商的新兴数据库元数据分析。对这些国内新兴数字化资源的元数据进行分析,一方面给资源的发展提供多元的方向,另一方面也期望对特色数据库的元数据统一构建提供参考资料。第五章,通过对全文的总结与梳理,草拟国内数字资源元数据标准体系框架。在大数据时代,数字资源的统一整合已经是大势所趋,我国急需出台元数据的统一标准以规范各资源的元数据设置情况。本文最后构建元数据标准体系框架,以期望为行业标准的出台提供思路。