图书馆文献信息智能化服务平台构建探究

来源 :企业科技与发展 | 被引量 : 0次 | 上传用户:ff303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  【关键词】图书馆;信息资源整合;服务平台;智能化
  【中图分类号】G252 【文献标识码】A 【文章编号】1674-0688(2021)09-0056-03
  0 前言
   当今社会,各种信息化技术高速发展,人们的信息获取途径发生了很大的变化,越来越多的人通过电脑、手机等科技产品获取信息,传统的图书馆服务已很难满足当前形势下的社会发展需求。图书馆作为文献信息资源的“桥头堡”[1],却很难发挥出自身的优势,我们急需通过信息资源的整合和信息化服务平台的构建等方法,提升图书馆的服务质量,满足社会不同人群的信息需求,服务于社会的高速发展。5G时代的到来,物联网、云计算、大数据等技术快速发展,使空间信息的实时智能服务实现成为可能[2]。图书馆作为公益性的基础设施,在信息化时代下,管理和服务实现网络化、自动化模式成为当务之急[3]。
  1 图书馆文献信息智能化服务平台的构建
   图书馆文献信息智能化服务平台的构建必须基于用户的知识服务诉求[4],力求在开放自由的环境下实现文献信息智能化服务模型设计,并把结构层次简单化,整合各行各业的知识资源,带动知识资源的存储、共享和传播,实现知识资源的集成服务。图书馆是信息资源的主阵地,也是科技创新工作者获取知识的重要场所,构建图书馆智能化服务平台的目的是为信息传播服务,实现信息资源的高效利用,满足不同用户的多元化、个性化的信息需求。
  1.1 图书馆文献信息智能化服务平台的资源整合架构
   各大图书馆具有大量的文献资源,然而大部分图书馆的文献资源是“信息孤岛”,难以实现资源共享,大量资源利用率低,导致很多优质的文献资源被闲置。图书馆一定要高度重视文献信息资源的整合利用。进入21世纪的今天,信息资源已成为整个社会继资金、技术、人才之后的第四大资源要素[5]。加强现代化信息资源整合利用正是全面提升图书馆服务质量,提高文献保障的一个重要前提。只有加强网络资源的协调管理及与其他图书资源的共建共享建设,加深不同地区图书馆的广泛交流与合作,才能实现信息资源的合理布局和协调规划。信息资源不局限于传统的书籍、文本,还应包含图像、符号、声频、视频等数据信息,确保各图书馆信息资源的充足与完善。进一步疏通信息资源的利用渠道,以共建共享方式为图书馆服务提供完备的信息资源,提高信息保障。
   通过海量数据信息资源的整合实现各图书馆之间的信息共享,主要包括文本、图像、符号、声频及视频等多媒体数据进行信息提取、加工、分类等操作,并通过统一数据格式实现标准化信息存储,进而实现不同图书馆电子文献资源的交叉共享利用。值得注意的是,在进行数据标注化的过程中,要严格按照标准规范体系进行整理,使数据资源格式规范化并具互通性。图书馆信息资源数据标准化的实现是一个大工程,依赖于一系列标准的制定和采用,这需要图书馆、数据库产业界及数据资源服务商等各部门的合作,共同推进信息资源数据标准化。同时,由于很多图书馆的文献资源具有重复性,因此信息提取过程中的删选合并也必须考虑,从而避免数据的重复而降低服务质量,文献信息资源整合平台的方案架构如图1所示。
  1.2 图书馆文献信息智能化服务平台物理层
   图书馆文献信息智能化服务平台的物理层即其基础设施,主要是通过硬件支持图书馆文献信息智能化服务平台的正常运行,其主要包括储存集群、服务器集群及网络设施集群,并通过虚拟化软件实现文献信息资源的统一管理,屏蔽数据差异,从而实现数据的合并与分发,从而提供动态可伸缩的数据资源。目前,较成熟的虚拟化软件包括微软公司的Hyper-V系列,VMware公司的vSphere系列和思科公司的XenServer平台。这些软件为物理设备提供了虚拟化管理系统,可以实现文献资源的統一调度配置,同时实现不同进程之间的负载均衡。服务器在进行虚拟化过程中,可借助主流虚拟化软件直接把虚拟化平台应用于物理层之上,例如市面上应用较多的VMware ESX虚拟化平台,可以不做其他修改的情况下在用户机基础上划分为几个独立的、相互隔离的虚拟化平台。以VMware ESX虚拟化平台为例,虚拟机架构包括两大功能:一是虚拟机管理器对硬件进行虚拟化,包括内存及CPU等的虚拟化;二是对物理资源的调度及管理。虚拟化平台的应用如图2所示。
  1.3 图书馆文献信息智能化服务平台的处理层
   图书馆文献信息智能化服务平台的处理层是解决服务器集群间的协同工作的关键,为大规模信息处理和海量信息存储提供保障。为此,需要利用大数据预处理技术,开发数据预处理程序,建立数据预处理模型,对图书馆文献信息智能化服务平台采集到的文献信息资源数据进行融合、语意识别、数据转义、残缺数据处理、错误数据矫正、关联性验证、一致性校验等数据清洗处理,从而形成统一文献信息资源数据格式和语义的数据集。图书馆文献信息智能化服务平台处理层需预处理的数据量较大,数据预处理模型复杂,程序可采用开源Hadoop技术和Mapreduce并行运算模型,以提高图书馆文献信息智能化服务平台的数据处理效率。以Hadoop为例,Hadoop分布式文件系统HDFS用于实现大规模数据可靠的分布式读写,是一个结构化、可扩展、具体日志功能,适用于大数据集应用程序的分布式文件架构。HDFS具有较高的数据读写和容错能力,其吞吐量极高且可部署在低廉的硬件上[6],可作为图书馆文献信息资源超大数据集的应用程序。Hadoop架构在图书馆文献信息智能化服务平台中的应用实例如图3所示。分布式数据库HBase具有良好的伸缩性和高可用性,可作为存放容器运行在分布式文件系统HDFS之上。计算模型Map Reduce是一个编程模型,可进行大规模数据分析,因此可用于实现图书馆文献信息资源超大规模数据计算。
  1.4 图书馆文献信息智能化服务平台的应用层
   图书馆文献信息智能化服务平台的应用层应包含图书馆文献信息资源超大规模数据的应用服务和管理中间件两个部分,实现文献资源在中间件的统一调控下,按照用户的需求进行高效、安全的统一分发配置,用户只需要通过一次登录,便可实现对各大图书馆文献资源的搜索和访问,从而保障文献信息智能化服务平台发挥最佳功效。以Force.com实现数据共享为例(如图4所示),Force.com为多租户架构,通过组成共享数据库的方式实现图书馆文献信息资源数据共享,同时能够实现应用程序的个性化定制。   1.5 图书馆文献信息智能化服务平台的人机界面
   用户的知识结构、兴趣爱好及职业等不同,对文献信息的需求也不同,简单检索输出功能已很难满足用户个性化要求。同时,根据其目的不同,文献信息的需求也会有深化和细化程度的不同。图书馆文献信息的检索结果是否可以趋向个性化显得越来越重要。因此,图书馆文献信息智能化服务人机交互功能应包含智能输入、智能处理及智能展示功能,其技术体系如图5所示。例如,有的用户因工作需求迫切希望得到经过优化加工的个性化文献信息,如根据关键字输入即可生成包括政策、法规、产业、市场、技术、投资等综合个性化信息知识报告。数字图书馆提供个性化服务,不仅能够使读者更好地利用图书馆,还能够使读者的多样化信息需求得到满足[7]。因此,图书馆文献信息智能化服务平台的人机界面应充分考虑用户的个性化需求,设置不同应用需求让用户选择,通过智能分析或手动设定的方式了解用户的目的和需求,从而满足用户的个性化需求,为用户提供高质量的信息服务。用户界面在输出信息时,应该考虑关联度,给出适当数量的检索结果,当给出的关联数量过多时,会让用户感到压抑,特别是某些不太相关的内容输出时,会令用户产生疲劳感,降低用户的使用体验。当输出的结果较少时,如用户的输入条件较少时,可能会导致用户想要的信息没有输出,给用户带来使用不便。因此,输出的量、输出的关联度应作为智能处理的要点之一。同时,根据类型的不同给文献进行排序,同时对搜索的关键字或近义词进行高亮提示,也可以提高用户体验。
   图书馆文献信息智能化服务平台人机界面虽然只是面向用户的终端一环,但其页面布局及智能交互性能直接影响用户的使用体验,对整个平台的推广与应用起着关键的作用。优秀的人机界面需要强大的智能交互性能作为基础。例如,智能问答系统作为人机界面的智能化服务的重要组成部分,可将平台获取的无序语料信息进行科学且有序的整理,从而提高信息处理的智能性,节约人力资源。智能问答系统可实现一问一答,精确地定位图书馆用户所需要的文献信息,通过与用户进行智能交互,为用户提供个性化的文献信息服务。为此,需面向图书馆用户服务领域开发语音识别系统的数据标准化、训练、建模等关键技术。首先,建设多于800 h的语音识别系统基础训练数据集和面向用户服务应用领域的专业训练数据集,建立统一的语音数据标注规范,不断积累高质量数据。其次,构建可并行训练的、可视化的语音识别训练环境,实现对用户意图的准确研判。最后,建立面向户服务领域的专用语音识别模型并对外提供接口服务,语音模型应包括普通话和地方特色方言,同时在智能知识库构架下建立自助语音服务知识体系,实现与用户意图相匹配的图书馆文献信息智能搜索,以最优路径解决用户问题。与此同时,图书馆信息服务平台的人机界面要简洁友好,层次分明,通过设置简单检索、高级检索、专业检索、分类检索等不同的检索功能满足不同群体的检索需求。服务平台通过统计不同用户的检索习惯、历史记录等信息,通过人脸识别、账号信息识别等功能为用户提供个性化服务界面及历史记录,实现界面友好的同时提供高质高效服务。例如,图书馆文献信息智能化服务平臺通过人脸识别、条形码、二维码或账号密码等作为平台会员登录方式,平台在用户登录时智能识别用户身份信息,并采集用户的阅读内容、阅读频次等信息,便于进行会员分类管理及优化服务,从而提升图书馆文献信息智能化服务平台的服务质量。
  2 结语
   图书馆文献信息智能化服务可提高信息传播、科技创新的效率。新时代,图书馆作为文献信息资源的“桥头堡”,对图书馆进行信息化改革势在必行。图书馆可通过信息资源的整合构建智能信息化服务平台,提升图书馆的服务质量,满足社会不同人群的信息需求。实现图书馆信息资源的集成与共享,将为我国的文化传播、科技的高速发展提供源源不断的动力,为我国早日实现中华民族伟大复兴贡献图书馆更强大的力量。
  参 考 文 献
  [1]梁晨.河南省县级图书馆信息资源建设评估研究[D].郑州:郑州大学,2012.
  [2]吴博.5G时代下高校图书馆信息服务模式研究[J].软件,2020,41(1):70-73.
  [3]钟鑫.建设网络化自动化图书馆信息服务系统的现状与研究[J].科学咨询,2020(19):90.
  [4]沈东婧,江晓波,王斌.基于用户需求的图书馆个性化知识服务系统构建[J].情报探索,2010(1):14-16.
  [5]霍艳蓉.网络环境下企业竞争情报系统的建设[D].北京:中国科学院大学,2003.
  [6]王翔,潘郁.基于云计算的协同技术创新平台[J].计算机工程与应用,2011,47(15):57-60,82.
  [7]林丽辉.探究数字图书馆的个性化信息服务[J].百科论坛电子杂志,2020(7):293-294.
其他文献
旅游产业具有关联度高、带动效应明显的特性,对促进地区经济发展有明显的作用。文章以广东省梅州市为例,通过旅游业依存度、旅游业贡献率和旅游业拉动率综合分析旅游产业对地区经济增长的拉动效应。同时,利用2010年至2019年梅州市各县区的面板数据对旅游产业的拉动效应进行实证分析。结果表明,梅州市旅游产业对地区经济增长具有正向的促进作用。
【关键词】沼气;集中供气沼气工程;转变;可持续发展  【中图分类号】S216.4 【文献标识码】A 【文章编号】1674-0688(2021)09-0031-03   沼气是有机物质,如碳水化合物、蛋白质及其代谢物等在厌氧条件下,经过微生物的发酵作用而生成的一种混合气体,主要成分包括甲烷、二氧化碳、硫化氢等,其成分与天然气类似。沼气经脱硫,可直接燃烧用于炊事、供暖及照明等,也可用于发电[1]。由
【关键词】双向注意力;问答情感分析;深度学习  【中图分类号】TP391.1 【文献标识码】A 【文章编号】1674-0688(2021)09-0095-03  0 引言   随着时代发展进程的不断加快,处于Web2.0时代背景下,各大电商平台获得了迅猛发展,大量卖家选择刷单作为提升自家店铺销量和信誉度的方法,这种不正当行为给用户购物带来了负面影响。所以,如何准确地挖掘产品评论舆情,对虚假的网络
文章的主要目的是对影响大学生网络信贷的行为进行系统的研究。文章先从相关理论入手,结合国内研究现状,通过调查问卷的方式收集大学生网络信贷消费行为的数据,从大体上了解大学生网络信贷的认知以及消费行为的情况,分析得出影响大学生网络信贷消费的因素。通过研究发现,许多大学生对于网络信贷消费缺乏必要的了解和认知,对于潜在的风险不能合理规避,这无疑会影响互联网金融的良性发展以及网络消费的安全性。文章以大学生网络消费的态度以及使用情况为研究依据,从网络信贷、政府以及学生三个角度提出相关建议。
【关键词】危险化学品;液氨;风险;防范  【中图分类号】TQ113.5 【文献标识码】A 【文章编号】1674-0688(2021)09-0092-03  0 引言   危险化学品属于国家重点监管的化学品,其在生产、储存、运输等各个环节极易发生事故,威胁人民生命安全。近年来发生的“2015年8月12日天津滨海新区爆炸事故”和“2020年8月4日黎巴嫩首都贝鲁特港口区爆炸事故”等危险化学品事故造成
随着市场经济的快速发展,带来了能源消耗量的进一步增加,温室气体的排放量更是以前所未有的速度在增长,为解决空气污染带来的资源稀缺性问题,碳排放权交易作为控制温室气体排放的市场手段应运而生。碳排放权作为新兴的资产,评估协会还未对其评估方法制定统一标准,其价格制定机制与传统的资产相比存在一定的差异,选取一种更为合理的方式对碳排放权价值进行评估具有重要意义。虽然广西区内目前尚无碳交易试点城市,但2021年起我国将从国家层面对接控排企业,完善全国统一的碳交易市场,文章将对碳排放权影子价格进行预测,可以为广西自治区政
【关键词】钢筋混凝土梁;锚粘钢板加固技术;施工工艺  【中图分类号】TU375.1;U445.72【文献标识码】A【文章编号】1674-0688(2021)09-0080-03  0 前言   随着我国改革开放事业的不断推进,城市化发展脚步逐步加快,在这个过程中,建筑业得到了长足发展,如今建筑的改造与维修加固俨然成为建筑领域的一大热点。钢筋混凝土结构作为现阶段得到广泛推广的一种结构形式,其发展与
【关键词】大数据时代;信息技术;计算机网络;信息安全  【中图分类号】TP393.08;TP311.13【文献标识码】A【文章编号】1674-0688(2021)09-0089-03  0 引言   在社会整体进入大数据时代之后,就要着重开展计算机网络安全维护与防范工作。考虑到原有的网络技术已无法紧跟社会发展趋势,也无法满足计算机网络安全需求,所以极易产生网络被攻击的现象。为了能够有效解决网络安
【关键词】板底脱空;破碎板;直接换板;先灌浆后换板  【中图分类号】U418.6 【文献标识码】A 【文章编号】1674-0688(2021)09-0071-03  0 引言   随着沥青混凝土技术的日益成熟和沥青路面的大量普及,水泥混凝土路面逐渐减少,目前存在的水泥混凝土路面基本是开通运营了10年以上的老路,路面病害较严重,具体表现为单块板多条横向裂缝、板角断裂、局部沉降明显,或多快板出现了连
【关键词】高速公路;路堤地基;设计方法  【中图分类号】U416.1 【文献标识码】A 【文章编号】1674-0688(2021)09-0074-03  0 引言   目前,高速公路地基设计采用建筑行业的设计方法,缺乏针对柔性基础的设计依据[1]。随着我国交通建设的快速发展,中国高速公路里程已经突破16万km,地基对高速公路的寿命影响极大,由于地势地貌的不同,高速公路地基设计差异大。我国高速公路