论文部分内容阅读
摘 要:数字图书馆的建立使服务模式从“馆藏为中心”转向“以讀者需求为中心”,其衡量标准不再是馆藏是多少、馆舍的大小等,而是以服务技术、服务方式等方面。检索系统的便捷程度将影响到用户对数字图书馆的使用。国家图书馆“文津”搜索系统整合数字资源,更好地展示数字资源的管理和如何利用,充分满足用户需求,提升用户体验感。
关键词:国家图书馆;“文津”搜索系统
随着信息技术的发展进步,国家图书馆的数字资源建设从20世纪90年代开始,其馆藏资源规模持续扩大,文献类型丰富,扩大数据库网络访问权限,丰富在线阅读资源,不仅拥有传统的纸质文献,而且还拥有多样化的数字资源,共同构成了庞大的资源库,成为宝贵而丰富的知识资产。2017年底数字资源总量为1603.87TB,包括馆藏特色资源数字化量1102.24TB,外购数据库157TB,网络导航和网络采集量175.95TB,数字资源征集162.44TB,电子报纸呈缴6.24TB。通过对2014年至2017年的数据对比可知,资源量是逐年递增的(见表一)。国家图书馆数字资源内容单元主要包括电子图书、电子期刊、电子报纸、学术论文、会议论文、音频资料、视频资料等。图书馆朝着大规模数字化方向发展,但也面对着诸多挑战,国家图书馆不断优化资源检索系统,使其页面友好,方便读者可以快捷地使用国家图书馆检索服务。并且,国家图书馆非常重视资源的组织加工。
一、“文津”搜索系统概况
1.“文津”搜索建设背景和总体设计
国家图书馆不断推进文献信息资源整合,建设“文津”搜索系统,提升资源发现能力,满足读者对各类资源的“一站式”检索需求,快速获取所需内容,享受便捷服务。“文津”搜索系统提供国家图书馆自建和外购资源统一的元数据搜索服务,是国家数字图书馆工程重要的项目之一,“文津”搜索系统建设目标是结合基于互联网的信息收集和数据分析挖掘技术,向用户提供的一个统一、实时高效、精准、权威的数字图书馆数字资源元数据搜索服务平台。并且整合国家数字图书馆自建或其他方式获取的数字资源,建立和维护高性能分布式索引。数字资源的生命周期包括数字资源采集、数字资源加工处理、数字资源保存和数字资源服务利用。而数字资源服务利用正是体现国家数字图书馆工程建设价值的关键环节。“文津”搜索系统是数字资源服务利用的集中体现,面向图书馆读者用户,提供基于图书馆元数据的权威搜索服务。
“文津”搜索系统将结合数字图书馆推广工程,建立一个覆盖全国数字图书馆的搜索服务平台,满足读者对数字图书馆各类资源“一站式”检索、获取的需求,涵盖了国家图书馆各类中外文自建和外购数据库资源。方便读者直接获取数字资源的目标对象文件和各种应用服务,提高全国图书馆数字资源利用率,实行“海量资源,一搜既得”。“文津”搜索系统检索结果多维聚类和导航,实现在不同需求的检索结果基础上聚类显示,以及检索服务的个性化定制与推送。“文津”搜索系统是一个集软件、硬件于一体的集成系统。致力于提供一站式发现和获取服务。基于“文津”系统在服务内容和服务对象的定位,要求系统能够承载巨大的访问请求,同时提供快速检索。要求性能满足平均每分钟10万次检索请求,峰值每秒一万次检索请求的处理能力,系统架构具有扩展能力。
截至2015年年底,“文津”搜索系统已整合百余个数据库,其中已上线数据库58个(含中文外购数据库17个,外文外购库15个,自建资源库23个,联合编目2个库,Aleph 1个库),所有上线数据库全部面向读者提供服务。国家图书馆外购数据库相关数据见表2。2017年,国家图书馆在文献资源整合工作中对“文津”搜索系统进行系统优化升级和内存扩容升级。基于先进的技术方案,扩充高性能、大内存服务器,实现对异构服务器集群的管理,以解决制约“文津”搜索系统数据更新和应用拓展的关键问题,并对多年积累的新数据进行整合、测试及整改,对资源访问接口进行调试,以实现对大量新资源的揭示,从而使“文津”搜索系统揭示的资源库数量成倍增长。
2.“文津”搜索系统首界面
读者可通过域名http://find.nlc.cn直接访问“文津”搜索系统,或登录国家图书馆主页(www.nlc.cn),在“文津”搜索系统的检索入口处一键式检索。在“文津”搜索系统首界面(如图1所示)内容包括搜索类型(全部、图书、古文献、论文、期刊报纸、多媒体、缩微文献、文档、词条等)、高级检索、联邦检索、搜索热词榜、国图首页、登录、注册、帮助,界面一目了然。“文津”搜索的热词榜(如图2)内容非常丰富多彩,热词排行榜分为日、周、总统计的,有不同的10大热门关键词排行,热点阅读、人气资源库和“文津”云图,供读者查看检索,使读者了解阅读热点,帮助读者查找有关资料。点击榜单和标签云中的任意检索词,可直接进行检索,出现该词汇的搜索结果。如图3所示,点击“浙江日报”,出现其检索词的全部检索结果。
3.“文津”搜索检索功能
“文津”搜索系统主界面采用的是单框检索入口,界面简洁,读者输入检索词后,从而对系统内所有资源进行一站式检索,并具有搜索建议功能,可以为读者提示热门搜索词(如图4所示),其可检测内容除了国家图书馆OPAC系统内各类型书刊文献资源、省市公共图书馆文献资源,也包括国家图书馆各类中外文自建资源和部分外购资源库。其包括单条件检索、二次检索、高级检索、联邦检索、相关检索、聚合检索等。联邦检索又包括整合检索、数据库查找、期刊查找、原文查找、个人空间。整合检索是对所有馆藏目录,包括电子数据库进行的梳理、揭示和整合。
(1)“文津”搜索系统检索项
第一,初级检索。检索项的数量同文献信息的揭示程度有关,也影响到读者检索结果。“文津”搜索首页,可进行初次检索,在搜索栏内输入查询词进行搜索,即可出现与查询词相关的检索结果。初级检索能让不具有检索知识、检索技能,检索目的不明确的读者满足其检索需求。 在“文津”搜索首页,也可进行专业检索,点击选取导航栏资源和检索字段进行专业检索,表3所示资源名称对应的检索字段,根据不同类别专业检索字段快速查找资源。例如,用户点击“论文”时,统一检索栏的前端会出现“全部字段”“题名”“责任者”“关键词”和“刊名”选项。为了支持专业检索,把数字资源进行了分类,“文津”搜索系统分为一级分类、二级分类,其中一级分类主要是根据文献类型,划分为图书、古文献、论文、期刊报纸、多媒体、缩微文献、文档和词条;二级分类根据一级类目的文献内容和文献类型,即数字资源的实际情况而形成的。这对用户能快速准确的查找资源提供便利。
第二,高级检索。高级检索能提高检索效率、检索速度,即提高齐全率和准确率。图书、古文献、论文、期刊报纸、多媒体、缩微文献、文档、词条等这些一级分类均有高级检索。高级检索中逻辑检索方式的流程为选择文献类型、选择高级检索条件、选择出版年份、可勾选“来源库”(包括馆藏中文资源、民国资源、博士论文、数字方志、碑帖菁华、古代典籍以及国家图书馆自建数据和部分外购数字资源库)(如图5所示),可选择是否提供全文、点击检索。在选择高级检索方式时,需选择是逻辑检索还是全文检索这两种检索类型,选择逻辑检索的检索项同初级检索的检索项,可以最多添加三个检索条件项目,并且还可以翻译成中文或英文。
图5 高级检索界面
第三,联邦检索。国内或称为“跨库检索”或“整合检索”等,维基百科对其定义为,将一个检索请求以合适的语法进行转换后发送到一组独立的数据库中,合并检索到的检索结果,以简洁统一的格式和最小的重复显示结果,提供一个自动或者用户选择的排序方式对结果进行排序。联邦检索提供分类浏览,提高了检索效率和速度,“文津”搜索系的联邦检索是整合了国家图书馆数字资源门户系统中的各个资源,在同一界面即可发现所有内容信息,根据所需文献类型准确定位。在联邦检索中包括整合检索、数据库查找、期刊查找、原文查找、个人空间等项目。内容丰富强大,为用户提供更全面、更细化以及不同类型文献的检索需求。
4.“文津”搜索系统检索结果页面
“文津”搜索系统的检索结果与国家图书馆的部分资源系统实现了无缝整合链接,在系统的检索结果页面支持查看到文献的封面、题名、文献类型、著者、出版年、出版社、来源数据库。部分文献资源还提供了摘要、目次、馆藏信息以及在线阅读等栏目,在检索结果的详细界面,除上述项目外,还会出现该文献资源的详细信息、摘要、目次、馆藏信息、在线阅读、分享到新浪微博、文献传递延伸检索、更多相似资源、更多相关资源等栏目,可帮助读者进一步确认是否是所需文献,直观初步了解资源信息,提高检索效率及准确率。延伸检索是为了更好地满足读者同步获取相关网络资源的需求,面向谷歌、百度等外部搜索引擎的延伸检索链接。根据文献类型不同,具体信息包括所有责任者、标识号(ISBN、ISSN)、出版发行地、关键词、语种、分类(中图分类)、丛编题名、载体形态、版本说明。与此同时,系统提供了收藏该书的全国省市图书馆的馆藏位置信息的导航功能,以列表形式说明资源所在位置和提供的服务,如点击“国家图书馆”即可看到单册状态、馆藏子库的架位导航信息,从而可预约此本单册。点击其他省市公共图书馆,也可看到该单册的馆藏信息以及文献信息,界面还展示了联合编目成员馆馆藏信息的可视化地图,查看到所在的具體城市和图书馆。搜索到所需文献后,可直接获取各类自建或部分外购数据库系统的全文信息,或直接向文献提供中心发送馆际互借与文献传递申请。结果界面还包括全部检索字段、排序、相关结果数量、页数、相关搜索、二次检索等。
在检索结果界面中,展示出含有检索词的文献资料,在页面左侧显示了多维度的导航选项,包括文献类型、著者、年份(可对年份进行筛选)、是否可提供全文、语种(汉语、英语、日语、其他)以及来源数据库等,用户可以通过这几项导航选项进一步缩小检索范围,实现基于不同需求的检索结果聚类显示。比如,年份导航,读者选择年份后或者对年份进行筛选,右侧搜索结果列表只显示在此期间的检索结果。在检索页面最下端的“相关搜索”选项是系统通过对用户历史检索词及系统规范词库的分析得出的,用以帮助读者更加明确自己的检索词。
5.“文津”搜索系统检索服务的个性化服务
在“文津”搜索系统中登录后,在界面中会出现个人中心选项,为读者提供了个性化搜索服务,包括我的检索历史,可以查看到自己历次检索词、检索文献类型、检索字段和执行时间等,并且可以清空检索历史。在我的搜索设定中,可选择网页显示语言(中文、英文)、检索历史是否保存、检索结果是否展现封面信息、选择自己的职业类目、兴趣等选项进行设定,设定搜索习惯等。
参考文献:
[1]蔡忠兵.传统图书馆与数字图书馆的距离[J].图书馆建设,2001
[2]杨东坡,邢 军.论国家图书馆“文津”搜索的涉及与实现[J].国家图书馆学刊,2014
[3]马 骅.国外主要联邦检索系统的兴起、现状及发展趋势[J].图书馆建设 2009
(作者单位:国家图书馆)
关键词:国家图书馆;“文津”搜索系统
随着信息技术的发展进步,国家图书馆的数字资源建设从20世纪90年代开始,其馆藏资源规模持续扩大,文献类型丰富,扩大数据库网络访问权限,丰富在线阅读资源,不仅拥有传统的纸质文献,而且还拥有多样化的数字资源,共同构成了庞大的资源库,成为宝贵而丰富的知识资产。2017年底数字资源总量为1603.87TB,包括馆藏特色资源数字化量1102.24TB,外购数据库157TB,网络导航和网络采集量175.95TB,数字资源征集162.44TB,电子报纸呈缴6.24TB。通过对2014年至2017年的数据对比可知,资源量是逐年递增的(见表一)。国家图书馆数字资源内容单元主要包括电子图书、电子期刊、电子报纸、学术论文、会议论文、音频资料、视频资料等。图书馆朝着大规模数字化方向发展,但也面对着诸多挑战,国家图书馆不断优化资源检索系统,使其页面友好,方便读者可以快捷地使用国家图书馆检索服务。并且,国家图书馆非常重视资源的组织加工。
一、“文津”搜索系统概况
1.“文津”搜索建设背景和总体设计
国家图书馆不断推进文献信息资源整合,建设“文津”搜索系统,提升资源发现能力,满足读者对各类资源的“一站式”检索需求,快速获取所需内容,享受便捷服务。“文津”搜索系统提供国家图书馆自建和外购资源统一的元数据搜索服务,是国家数字图书馆工程重要的项目之一,“文津”搜索系统建设目标是结合基于互联网的信息收集和数据分析挖掘技术,向用户提供的一个统一、实时高效、精准、权威的数字图书馆数字资源元数据搜索服务平台。并且整合国家数字图书馆自建或其他方式获取的数字资源,建立和维护高性能分布式索引。数字资源的生命周期包括数字资源采集、数字资源加工处理、数字资源保存和数字资源服务利用。而数字资源服务利用正是体现国家数字图书馆工程建设价值的关键环节。“文津”搜索系统是数字资源服务利用的集中体现,面向图书馆读者用户,提供基于图书馆元数据的权威搜索服务。
“文津”搜索系统将结合数字图书馆推广工程,建立一个覆盖全国数字图书馆的搜索服务平台,满足读者对数字图书馆各类资源“一站式”检索、获取的需求,涵盖了国家图书馆各类中外文自建和外购数据库资源。方便读者直接获取数字资源的目标对象文件和各种应用服务,提高全国图书馆数字资源利用率,实行“海量资源,一搜既得”。“文津”搜索系统检索结果多维聚类和导航,实现在不同需求的检索结果基础上聚类显示,以及检索服务的个性化定制与推送。“文津”搜索系统是一个集软件、硬件于一体的集成系统。致力于提供一站式发现和获取服务。基于“文津”系统在服务内容和服务对象的定位,要求系统能够承载巨大的访问请求,同时提供快速检索。要求性能满足平均每分钟10万次检索请求,峰值每秒一万次检索请求的处理能力,系统架构具有扩展能力。
截至2015年年底,“文津”搜索系统已整合百余个数据库,其中已上线数据库58个(含中文外购数据库17个,外文外购库15个,自建资源库23个,联合编目2个库,Aleph 1个库),所有上线数据库全部面向读者提供服务。国家图书馆外购数据库相关数据见表2。2017年,国家图书馆在文献资源整合工作中对“文津”搜索系统进行系统优化升级和内存扩容升级。基于先进的技术方案,扩充高性能、大内存服务器,实现对异构服务器集群的管理,以解决制约“文津”搜索系统数据更新和应用拓展的关键问题,并对多年积累的新数据进行整合、测试及整改,对资源访问接口进行调试,以实现对大量新资源的揭示,从而使“文津”搜索系统揭示的资源库数量成倍增长。
2.“文津”搜索系统首界面
读者可通过域名http://find.nlc.cn直接访问“文津”搜索系统,或登录国家图书馆主页(www.nlc.cn),在“文津”搜索系统的检索入口处一键式检索。在“文津”搜索系统首界面(如图1所示)内容包括搜索类型(全部、图书、古文献、论文、期刊报纸、多媒体、缩微文献、文档、词条等)、高级检索、联邦检索、搜索热词榜、国图首页、登录、注册、帮助,界面一目了然。“文津”搜索的热词榜(如图2)内容非常丰富多彩,热词排行榜分为日、周、总统计的,有不同的10大热门关键词排行,热点阅读、人气资源库和“文津”云图,供读者查看检索,使读者了解阅读热点,帮助读者查找有关资料。点击榜单和标签云中的任意检索词,可直接进行检索,出现该词汇的搜索结果。如图3所示,点击“浙江日报”,出现其检索词的全部检索结果。
3.“文津”搜索检索功能
“文津”搜索系统主界面采用的是单框检索入口,界面简洁,读者输入检索词后,从而对系统内所有资源进行一站式检索,并具有搜索建议功能,可以为读者提示热门搜索词(如图4所示),其可检测内容除了国家图书馆OPAC系统内各类型书刊文献资源、省市公共图书馆文献资源,也包括国家图书馆各类中外文自建资源和部分外购资源库。其包括单条件检索、二次检索、高级检索、联邦检索、相关检索、聚合检索等。联邦检索又包括整合检索、数据库查找、期刊查找、原文查找、个人空间。整合检索是对所有馆藏目录,包括电子数据库进行的梳理、揭示和整合。
(1)“文津”搜索系统检索项
第一,初级检索。检索项的数量同文献信息的揭示程度有关,也影响到读者检索结果。“文津”搜索首页,可进行初次检索,在搜索栏内输入查询词进行搜索,即可出现与查询词相关的检索结果。初级检索能让不具有检索知识、检索技能,检索目的不明确的读者满足其检索需求。 在“文津”搜索首页,也可进行专业检索,点击选取导航栏资源和检索字段进行专业检索,表3所示资源名称对应的检索字段,根据不同类别专业检索字段快速查找资源。例如,用户点击“论文”时,统一检索栏的前端会出现“全部字段”“题名”“责任者”“关键词”和“刊名”选项。为了支持专业检索,把数字资源进行了分类,“文津”搜索系统分为一级分类、二级分类,其中一级分类主要是根据文献类型,划分为图书、古文献、论文、期刊报纸、多媒体、缩微文献、文档和词条;二级分类根据一级类目的文献内容和文献类型,即数字资源的实际情况而形成的。这对用户能快速准确的查找资源提供便利。
第二,高级检索。高级检索能提高检索效率、检索速度,即提高齐全率和准确率。图书、古文献、论文、期刊报纸、多媒体、缩微文献、文档、词条等这些一级分类均有高级检索。高级检索中逻辑检索方式的流程为选择文献类型、选择高级检索条件、选择出版年份、可勾选“来源库”(包括馆藏中文资源、民国资源、博士论文、数字方志、碑帖菁华、古代典籍以及国家图书馆自建数据和部分外购数字资源库)(如图5所示),可选择是否提供全文、点击检索。在选择高级检索方式时,需选择是逻辑检索还是全文检索这两种检索类型,选择逻辑检索的检索项同初级检索的检索项,可以最多添加三个检索条件项目,并且还可以翻译成中文或英文。
图5 高级检索界面
第三,联邦检索。国内或称为“跨库检索”或“整合检索”等,维基百科对其定义为,将一个检索请求以合适的语法进行转换后发送到一组独立的数据库中,合并检索到的检索结果,以简洁统一的格式和最小的重复显示结果,提供一个自动或者用户选择的排序方式对结果进行排序。联邦检索提供分类浏览,提高了检索效率和速度,“文津”搜索系的联邦检索是整合了国家图书馆数字资源门户系统中的各个资源,在同一界面即可发现所有内容信息,根据所需文献类型准确定位。在联邦检索中包括整合检索、数据库查找、期刊查找、原文查找、个人空间等项目。内容丰富强大,为用户提供更全面、更细化以及不同类型文献的检索需求。
4.“文津”搜索系统检索结果页面
“文津”搜索系统的检索结果与国家图书馆的部分资源系统实现了无缝整合链接,在系统的检索结果页面支持查看到文献的封面、题名、文献类型、著者、出版年、出版社、来源数据库。部分文献资源还提供了摘要、目次、馆藏信息以及在线阅读等栏目,在检索结果的详细界面,除上述项目外,还会出现该文献资源的详细信息、摘要、目次、馆藏信息、在线阅读、分享到新浪微博、文献传递延伸检索、更多相似资源、更多相关资源等栏目,可帮助读者进一步确认是否是所需文献,直观初步了解资源信息,提高检索效率及准确率。延伸检索是为了更好地满足读者同步获取相关网络资源的需求,面向谷歌、百度等外部搜索引擎的延伸检索链接。根据文献类型不同,具体信息包括所有责任者、标识号(ISBN、ISSN)、出版发行地、关键词、语种、分类(中图分类)、丛编题名、载体形态、版本说明。与此同时,系统提供了收藏该书的全国省市图书馆的馆藏位置信息的导航功能,以列表形式说明资源所在位置和提供的服务,如点击“国家图书馆”即可看到单册状态、馆藏子库的架位导航信息,从而可预约此本单册。点击其他省市公共图书馆,也可看到该单册的馆藏信息以及文献信息,界面还展示了联合编目成员馆馆藏信息的可视化地图,查看到所在的具體城市和图书馆。搜索到所需文献后,可直接获取各类自建或部分外购数据库系统的全文信息,或直接向文献提供中心发送馆际互借与文献传递申请。结果界面还包括全部检索字段、排序、相关结果数量、页数、相关搜索、二次检索等。
在检索结果界面中,展示出含有检索词的文献资料,在页面左侧显示了多维度的导航选项,包括文献类型、著者、年份(可对年份进行筛选)、是否可提供全文、语种(汉语、英语、日语、其他)以及来源数据库等,用户可以通过这几项导航选项进一步缩小检索范围,实现基于不同需求的检索结果聚类显示。比如,年份导航,读者选择年份后或者对年份进行筛选,右侧搜索结果列表只显示在此期间的检索结果。在检索页面最下端的“相关搜索”选项是系统通过对用户历史检索词及系统规范词库的分析得出的,用以帮助读者更加明确自己的检索词。
5.“文津”搜索系统检索服务的个性化服务
在“文津”搜索系统中登录后,在界面中会出现个人中心选项,为读者提供了个性化搜索服务,包括我的检索历史,可以查看到自己历次检索词、检索文献类型、检索字段和执行时间等,并且可以清空检索历史。在我的搜索设定中,可选择网页显示语言(中文、英文)、检索历史是否保存、检索结果是否展现封面信息、选择自己的职业类目、兴趣等选项进行设定,设定搜索习惯等。
参考文献:
[1]蔡忠兵.传统图书馆与数字图书馆的距离[J].图书馆建设,2001
[2]杨东坡,邢 军.论国家图书馆“文津”搜索的涉及与实现[J].国家图书馆学刊,2014
[3]马 骅.国外主要联邦检索系统的兴起、现状及发展趋势[J].图书馆建设 2009
(作者单位:国家图书馆)