资源发现系统国内外应用情况研究

来源 :东方教育 | 被引量 : 0次 | 上传用户:jeff0482003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【摘要】介绍了资源发现系统的产生背景,概述了资源发现系统的定义。对比研究了国内外资源发现系统的内容与资源。最后对资源发现系统的未来发展趋势进行阐述。
  【关键词】资源发现系统;国内外研究;发展趋势
  在信息技术飞速发展的今天,图书馆的资源建设重心逐渐由传统印刷型资源转向数字信息资源,图书馆如何提高数字信息资源服务的问题变得越发要。在此背景下,出现了由数据库提供商和检索系统服务商提供的发现系统。发现系统通过对各种不同数据库和检索系统的信息资源进行预索引,建立元数据的集中索引仓储,提供“一站式”的检索服务和更高级的发现服务。目前国外在资源发现系统研发和图书馆应用方面一直走在前列。国内只有少数几个研究型高校应用了国外的发现系统。本文对国内外图书馆发现系统应用情况进行研究评述,为国内引进或者研发资源发现系统及相关研究提供参考。
  1资源发现系统产生背景
  (1)目前图书馆资源检索存在的问题
  网络技术的发展使得图书馆的数字资源建设得到长足发展,各类购买和自建数据库成为馆藏资源的重要组成部分,但随着用户规模与使用范围的扩大,图书馆的发展也面临着诸多问题。主要表现在以下方面:
  1)资源虽多但缺少关联。高校图书馆每年都会购买了大量数据库使用权限,但是却不能准确地掌握这些数据库的文献覆盖范围和详细数量及种类等状况;各个数据库的收藏资源文献之间的关系也未摸清,已购买的各类数据库之间,资源的分布和交叉情况未分清楚;同时所购买或租用的数字资源与馆藏资源之间的相互关系不清[1]。
  2)资源无法充分利用。由于各个数据库或检索系统的使用界面、和检索方法和步骤各异,使用方法用户难以完全掌握;并且读者对各数据库适用范围、覆盖范围难以把握;同时,可能需要对同一主题要分散到各个数据库中分别进行检索,检索结果是否完整、重复或者检索结果项的相关性等难以把握。
  3)服务能力不足。高校和机构都包含多种不同类型的用户,不同类型的用户需求是广泛而且分散的,除了需要大量的专业科研的相关文献外,还需要较广的学科领域覆盖范围,图书馆提供的保障有限而用户的需求无限的矛盾越来越突出,无法为不同类型读者提供具有不同的学科偏好、不同检索习惯的定制资源发现服务。
  因此,应用现代信息技术、网络技术等先进的手段和方法,建立网络环境下集传统馆藏资源与各种数据库资源于一体的检索平台,为提高资源利用率,使得图书馆提供的更加科学化、人性化、高效的服务具有十分重要的意义[2]。
  越来越多的数据库厂商开始开发发现系统,不同厂商的发现系统包含不同的数据库,提供不同的服务,但是发现系统的主要是目标是相同的。从现今已经应用的发现系统来看,发现系统主要从以下几个方面来解决在数字资源整合利用过程中遇到的问题:
  (2)资源发现系统可以解决的问题[2]
  1)对大量资源数据的分析处理问题。信息资源数据库、电子出版物库、索引数据库等通常都具有非常大的数据规模,这给文献资源的检索和发现带来许多的问题。发现系统可以将大量的数据进行提取、过滤、转换、集成,以便从中发现用户所需要的各种信息资源,实现原始数据向有价值资源转化。
  2)对多种类型的资源数据进行分析处理。数字文献数据的特点包括:数据结构无固定结构、数据格式的多言,包括如文本、音频、视频、图像、HTML页面等。发现系统需要对所有收录的不同类型不同格式的资源进行处理。
  3)能有效地组织和管理检索数据。目前发现系统包含的资源数量非常大,需要对系统中进行的检索和检索得到的资源元数据结果进行组织和管理,同时能将检索历史和检索结果集保存在云端,实现检索服务的云服务模式。
  4)对所发现的资源进行全面分析。根据用户选择的检索条件和策略,所获得资源结果数据必须是可以进行进一步分析和利用的。获得的检索结果可能需要精炼或各方面的分析才能体现其价值。
  发现系统的产生的目的就是为了满足高校的学术和科研的信息资源需求,所以对发现系统在学术研究中的应用研究具有及其重要的现实意义。
  2发现系统概述及定义
  新技术的涌现,在一定程度上正在颠覆传统的图书馆业务模式,用户信息需求的膨胀也对图书馆所提供的信息服务提出了新的要求和挑战:检索功能的强大性、应用体验的流畅和易用性、信息的交互与共享的便捷性等。技术环境的变化,催生了图书馆在所提供的传统服务的基础上进行革新。出现了以服务为导向的SOA(Service Oriented Architecture,面向服务的架构)顶层设计思想和云服务的SaaS(Software as a Service,软件即服务)应用的发展,以此来为实现搜集分布式网络信息资源、采集异构数据库元数据资料,以及开放资源高效获取提供了技术支撑[3]。
  最初资源发现系统原型的搜索是基于馆藏检索系统和馆藏数字资源的本地索引,以及基于实时跨库检索的元搜索引擎,这种系统架构存在一次检索资源有限、检索速度受诸多因素制约限制以及相关性排序和去重效果不佳等问题;此后出现了网络级的发现系统(Web-scale discovery system),并取得了快速的发展。发现系统通过一键式的检索方式,检索由各种数据库数字资源、馆藏和网络书目信息、互联网网站内容、机构数据库、网络聚合内容、期刊文献、报纸、专利标准等预先收割和索引内容构成的索引元数据库,进行统一资源检索。其中,基于分布式、异构的元数据进行集合预索引,从预索引元数据仓库中进行检索的过程被认为是发现系统的核心思想[4]。
  在此基础上,许多图书馆尝试建立一个整合的统一检索平台,一些数据库商和图书馆服务提供商也看到了这一需求的普遍性,建立了商业化的服务平台,发现系统应运而生[5][6][7]。
  所谓发现系统,我们认为:通过一个简单的检索接口,对预先索引好的元数据仓库中进行检索,并返回统一检索结果的一类检索服务系统。发现系统能够帮助用户获取数量越来越多、类型越来越复杂的各类资源,并一定程度上提高图书馆所购买或租用的数据库或检索系统的利用率[8][9][10]。   3国内外相关研究现状
  3.1国外发现系统应用进展
  目前国际市场上主要的发现系统有4种。Proquest旗下Serials Solution公司在2009年7月推出了第一款网络级发现系统Summon。同月,Ex Libris公司公开了Primo Central元数据仓储的建设进展情况,其统一资源发现系统Primo测试版也于2010年1月发布,同时将原有的Primo架构集成到Primo Central和馆藏目录系统之上。OCLC于2007年11月推出全球第一款Worldcat Local系统,提供馆藏资源和电子资源的一站式检索,随着OCLC与数据库商的不断合作,Worldcat Local集成了元搜索功能,并于2010年开始提供网络级发现服务[11]。此后,EBSCO公司也发布了发现系统,名称为EBSCO Discovery Service(简称EDS)。
  1)内容与资源范围比较
  发现系统的核心是搜集海量元数据形成预索引的元数据仓储和基于标准化的预索引库的快速检索,因此元数据的覆盖深度和广度是用户选择发现系统的基础。从发现系统推出以来,发现系统服务商一直在致力与数据库提供商、出版社等达成协议,努力扩大自身发现系统的资源覆盖范围和资源的质量,国外4大发现系统的资源覆盖及元数据范围比较内容,如下页表1。
  表1 国外4大发现系统资源比较[1]
  内容
  系统 元数据总量及资源范围 中文资源覆盖
  Summon Summon涵盖了7,000多个出版商,80多种资源类型,包含了大约7.5亿条数据记录,其中39个开放获取档案和257个机构资源库中的4000万条记录多半都是全文索引。 与Calis达成协议,允许其利用其学术论文的元数据;与Apabi达成相关数据使用协议
  Primo Central Primo Central已经收录超过5亿条索引记录,整合了世界上大部分的外文电子期刊文章、电子书元数据、部分报纸。 已与重庆维普公司达成相关数据使用协议
  EDS 截至2012年6月,EDS涵盖了大约2万个期刊出版社和大约7万个图书出版社,包括大约64000种期刊,82.5万CD & DVD,600万种图书,3.2亿报纸文章,40万会议记录,还有几十万种其它类型的信息资源。 与Apabi达成协议,Apabi大量的电子书元数据可以被EDS利用
  WCL 截至2012年9月1日,WCL.可一站式搜索超过9.69亿数据记录,其中期刊91495篇,文章7.31亿篇,数字内容资料3200万部,电子图书1390万册,机构资料库记录2200万册,硕博士论文1800万册,录音记录1200万条,可视资料1000万部,档案资料2400万本,连续出版物1100万册,会议记录1300万篇,乐谱600万张,地图390万张,图书2.28亿册,评价内容4600万条。 --
  对比这四大发现系统的资源覆盖情况,发现其元数据覆盖率都较高,基本涵盖了所有国外数据库的资源。但对中文元数据的覆盖率太低,其中的原因可能是因为中文数据库提供商对其元数据一直采取封闭的态度。值得高兴的是当前国内的一些数据库提供商转变态度,积极与国外的发现系统服务商和数据库提供商进行合作。
  3.2国内研究进展
  (1)国内引进国外系统的概况
  我国发现系统研究和应用虽然起步较晚,但是国内的很多高校图书馆已经陆续开展针对自身实际的资源探索发现系统建设和应用实践。也有部分知名高校部分采用直接引进国外成熟的发现系统的方式来进行建设。比较典型的代表有上海交通大学图书馆的“思源探索”,其资源探索发现系统采用的均是以色列Ex Libris公司的Primo系列产品[12]。清华大学图书馆集成了Ex Libris公司的资源探索发现系统Primo和集成检索系统MetaLib/SFX,北京大学图书馆是在SirsiDynix公司的Symphony自动化管理系统和 Summon探索发现系统的基础上建立的“未名搜索”发现系统。华东师范大学图书馆的ONE-search发现系统则是采用的EBSCO公司的发现检索工具EBSCO Discovery Service[13]。
  (2)国内系统的概况
  国内相关的检索系统提供商中,主要的服务商也开始提供发现系统或发现平台的服务。
  超星发现系统以数十亿海量元数据记录为基础,对复杂的异构数据库群进行集成整合,可以完成高效、精准的学术资源检索,在此基础上通过引文分析、知识关联分析、分面聚类等功能为读者提供具备完善的知识挖掘与分析功能的发现系统[14]。
  CNKI学术资源发现平台是一个跨语种、跨文献类型、权威的学术资源发现平台,包括各类学术文献,如期刊、专著、学位论文、会议论文、图书、专利、标准等。利用先进的智能标引和深度知识挖掘技术,实现文献和知识链接,建设全球范围的知识网络,打造一个基于知识发现的统一学术资源发现平台[15]。
  维普智立方知识发现系统是重庆维普资讯有限公司推出的知识资源服务平台,力图满足资源发现、情报服务、知识管理的多层次需求,为图书馆、科研机构或个人用户提供全方位、基于云平台架构的一体解决方案[16]。
  4 结语
  目前,国内外的发现系统都获得了较快的发展,国外服务商为了进入国内市场,采取和高校合作的方式,推行定制化的发现系统。我们不难预测,在未来发现系统将有更好更大的发展,主要可能在以下几个方面:1)发现系统会有更广的资源覆盖范围。发现系统的宗旨是为了给用户提供完备的资源,预先索引各种数据的资源,为了达到这个目的,发现系统自身的发展就是最有限发展的方面,其必然会进一步扩大其资源的覆盖率,达到更完备的资源覆盖。2)发现系统的功能会日益发展。发现系统是在传统的OPAC检索系统和跨库检索系统的基础上发展而来,发现系统以用户为中心,更注重用户的检索体验。为提供更好的服务和体验,我们不难预测,发现系统不仅已有的功能会继续进化,而且在新的移动互联网迅猛发展的背景下,发现系统会可能会有移动化的趋势,更便捷的服务。
  3)更高的应用程度,更高的占有率。我们通过发现系统的发展历史可以知道,国外的发现系统是由数据库提供商和检索系统建设厂家发展而来,发现系统的出现就是为了取代传统的跨库检索系统,所以提供商会进一步推动发现系统的应用,这样发现系统的应用程度会持续的提高。
  参考资料:
  [1]巩林立.高校图书馆资源发现服务系统体系构建[J].图书馆学研究,2013,(9).
  [2]崔瑞琴,孟连生.数字信息资源整合问题研究[J].图书情报工作,2007,(7).
  [3]孙宇,张磊,刘炜.图书馆资源发现系统选型研究[J].图书馆杂志,2013,(12).
  [4]包凌,蒋颖.图书馆统一资源发现系统的比较研究[J].情报资料工作,2012,(5):67-72.
  [5]梁劳慧.资源发现系统在高校图书馆中的应用研究[J].图书馆学研究,2013,(18).
  [6]窦天芳,姜爱蓉.资源发现系统功能分析及应用前景[J].图书情报工作,2012,(7).
  [7]胡玮.“985工程”高校图书馆资源发现系统现状分析和思考[J].图书馆学研究,2013,(16).
  [8]常唯.综合性学术搜索引擎研究[J].大学图书馆学报,2007(2):73-77.
其他文献
【摘要】求真务实是坚持党的思想路线的重要保证。解放思想,实事求是是我党的思想路线,也是邓小平理论的精髓。我们在任何时候任何情况下都要坚定不移地坚持这条思想路线。求真务实的本质涵义正充分体现了实事求是的精神,可以说,没有求真务实的精神和作风,就谈不上实事求是和解放思想,坚持党的思想路线也就成为一句空话。所以,求真务实是坚持党的思想路线的重要保证。  【关键词】求真务实;自身修养;怎样提高  一、如何
期刊
【摘要】实体经济是人类社会赖以生存和发展的基础。它直接与民生疾苦和企业生存联系在一起。越是在经济结构经历深刻变革的时期,“实体经济”的稳定运行对于维护社会经济秩序往往越重要。本文剖析其发展中存在的瓶颈,探索破解措施,以期为促进实体经济发展提供一些借鉴和参考。  【关键词】实体经济;瓶颈;破解措施。  实体经济是人类社会赖以生存和发展的基础,是一国社会稳定运行的最广泛基础。它直接与民生疾苦和企业生存
期刊
词汇是语言的基石,在语言教学中有着十分重要的地位,正如英国语言学家D.Wilkins(1972:22)所说:“没有语法,人们可以表达的事物寥寥无几;而没有词汇,人们则无法表达任何事物”(Without grammar very little can be conveyed without vocabulary nothing can be conveyed)。据估计,我国有两三亿在校学生,无论是大
期刊
【摘要】在新的形势下,随着企业经营、改革、发展的不断深入,各种利益关系的重新调整,思想政治工作面临着许多新情况、新特点、新问题和新矛盾。如何继续发挥思想工作的优势,成为每名思想政治工作者考虑的问题。  【关键词】新的形势下;思想政治工作;探讨  一、市场经济新形势下,企业思想政治工作的新特点  (一)思想政治工作的复杂性。首先,在对政治的态度上发生了变化。一部分职工特别是青年职工对政治冷淡,缺乏正
期刊
【摘要】大学英语是高职非英语专业的一门专业必修课程,是培养学生运用英语进行有关涉外业务工作能力的重要课程。为提升大学英语课程的教学效果,更好地培养学生的实践能力,并实现为专业课服务的目标,本文对公共英语如何运用“教学做一体化”的教学模式为专业课服务进行探讨。  【关键词】公共英语;“教学做一体化”教学模式;专业课;服务       高职高专教育英语课程教学基本要求明确提出“以应用为目的、实用为主、
期刊
【摘要】思维、语言、文化、观念以及意识形态自古以来都是哲学界和语言学界热点关注的话题。撒丕尔—沃尔夫的强势学说认为语言形式决定思维、信念以及人们对待事物的态度等等;人们如何去看待观察世界大多取决于语言是如何描写世界的。但笔者从中英语言形合与意合、句法结构、段落组织等个方面的对比来验证思维模式对语言在某些方面却也起着决定性的作用,从而得出强势说的不足之处。  【关键词】撒丕尔—沃尔夫假说;思维;语言
期刊
【摘要】本文介绍了超高强度钢的性能,并采用铣削实验对高速铣削加工32Cr3NiMoVA的铣削力进行了研究,为生产实践提供理论依据。  【关键词】超高强度钢 高速铣削 铣削力  前言  超高强度钢因其具有良好的机械性能,广泛应用于航空航天、汽车和模具等领域。但其高的强度,良好的塑韧性、优异的疲劳性能和断裂韧性使得超高强度钢成为一种难加工材料。切削加工时,切削力大、切削温度高、刀具磨损大[1]。本文采
期刊
在信息爆炸的当下,“即刻售罄”“竞相传阅”等词汇已经过时,“疯狂转发”“点击过万”成为当下的关键词。  与纸质媒体的衰败形成鲜明对比的是,数字化媒体正以惊人的发展速度,颠覆着人们的阅读习惯、生活方式,甚至影响一个时代!  纸质媒体是以报纸、杂志等传统媒体为代表的传统媒体。而数字化媒体是以互联网为代表的“第四媒体”和以手机移动网络为代表的“第五媒体”的新媒体。2008年11月19日,著名的电脑杂志P
期刊
【摘要】当前,免疫抑制性疾病已经对我国的养鸡业带来很大危害。本文主要阐述了鸡群免疫抑制病的感染现状,分析了造成鸡免疫抑制的原因,概述了免疫抑制病发生的危害及其流行,并提出了防控措施。  【关键词】鸡免疫抑制病;原因;危害;防控措施  免疫抑制是近十年来已成为养鸡生产中的重要问题。在生产实践中时常发生鸡的生长受阻、疫苗免疫失败、多种疾病并发或继发感染的现象,导致大批鸡只死亡或淘汰,造成巨大的经济损失
期刊
【摘要】人力资源开发与管理必须适合企业所在行业特点,电力企业有着区别其他行业的一些独有特点,这些特点对电力企业的人力资源管理产生了特殊的要求,本文主要分析电力企业的人力资源现状,并较为全面地展示了我国电力企业人才资源开发面临的困境与解决思路,以期为进行更好的人力资源风险管理提供依据。  【关键词】电力企业;人力资源;开发;管理  人力资源的数量、质量以及配置机制是企业稳定、增长和可持续发展能否顺利
期刊