图书馆借阅管理中的数据挖掘分析

来源 :城市建设理论研究 | 被引量 : 0次 | 上传用户:muscleprince
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:随着图书馆数字化和信息化的发展,图书管理员也被要求能够为读者提供导航员的服务。这种角色要求图书管理员对图书馆的图书情况以及读者的阅读需求有着深刻的了解,达到不仅能够主动为读者提供服务,还能主动引导读者阅读需求的程度。
  关键词:数据挖掘;借阅管理;图书管理员
   近年来我国公共图书馆加快了数字化建设的历程,使得图书馆中储存的数据和信息量疯狂增长。读者面对信息量庞大的数字图书馆,如何从中获得自己所需要的信息和数据,如何应用日新月异的数据库技术,是一个亟待解决的问题。为了使读者从这种“数字坟墓”中解脱出来,数据挖掘技术应运而生。数字挖掘技术指的是将数据仓库技术和神经网络等技术相结合并加以贯通运用,最终将数据库中纷繁负责的信息和数据变为读者能够轻易掌握的信息宝库。
   一、数据挖掘形式
   数据挖掘又被称为“数据库中的知识发现”,是目前信息化研究过程中的热点问题。实际上,数据挖掘就是从数量庞大的、不清晰的、随机的数据和信息中提取出所需的、特定的、对读者有用的知识的发现过程。
   在这一过程中我们需要对“知识”进行定义。从狭义的角度理解,信息和数据是知识的一种形式,但是从广义的角度来理解的话,概念、规则或者规律等也被人们看作是知识的表现形式之一。无论知识的表现形式有多少,数据始终被认为是知识的源泉。知识的发现方法可以采用数学方式,也可以采用非数学方式;可以采用演绎的方法,也可以采用归纳的方法。知识可以被应用于信息的管理、数据的查询以及管理的控制等各个方面,甚至还可以被应用于数据自身的维护。从这一角度来说,数据挖掘是一个多学科交叉的技术,人们通过对数据的挖掘,可以实现对数据的应用从低层次的查询跃升为高层次的从数据中提取知识的过程。为了达到这种高层次的知识应用的目的,就需要将多学科的技术进行汇集,特别是数据库技术、人工智能技术、数理统计、可视化技术等新兴的领域。一般来说,我们根据数据 不同的表现形式将数据挖掘分为数据挖掘、Web数据挖掘和文本数据挖掘三种形式。
   (一)数据挖掘形式
   这种形式的对象是那些结构化的数据,如常见的SQL、Server、Qracle、Informix等数据库或数据仓库。目前这方面可以使用下列软件: IBM的DB2 Intelligent Miner for Data SAS Enterprise Miner等。
   (二)Web挖掘形式
   这种形式的对象是Web页面内容、页面之间的结构、用户访问信息、商务交易信息等在内的各种Web数据。通过数据挖掘的方式为人们提供更为便捷的方法从网页中提取所需要的信息和数据,对网站的设计进行改进,更好地实现电子商务等服务。Web数据挖掘分为Web内容挖掘、Web访问信息挖掘、Web结构挖掘。
   (三)文本数据挖掘形式
   文本数据挖掘又称为文本信息的数据挖掘,指的是数据挖掘的对象全部是文本信息。再结合数据挖掘算法与信息检索算法对文本信息进行信息化的处理,这就实现了文本信息中数据的挖掘。文本数据挖掘最主要包括特征提取、文本摘要、文本分类与聚类、概念操作以及探索性数据分析等几个方面的工作。文本数据挖掘主要应用词频反文献频率向量表示法、词串表示法,贝叶斯分类算法、词集合算法,文本聚类算法以及最近邻参照分类算法等。
   数据挖掘技术是目前是信息化领域研究的一个热点,并且其研究成果在很多领域都得到了广泛的应用,体现出很好的应用效果和开发的潜力。在图书馆公共管理领域运用数据挖掘技术,再结合人工智能技术等,帮助读者更快更好地获取所需要的信息,是公共图书馆实现数字化和信息化管理的必经之路。
   二、数据挖掘在数字图书馆信息服务中的作用
   (一)提高读者获取信息的效率
   为了使读者在最短的时间内获取所需要的信息和数据,可以采取以下方法:首先,对读者每次进行搜索和查询的信息进行统计,做成一个专题或者形成一种模式,将读者每一次浏览的内容形成一个数据库;再次,利用关联规则采掘算法计算出产讯频率超过特定值的专题,再运用分类算法将访客户的浏览模式与频繁项目集进行相似匹配,将进行相似或者相同内容的浏览读者信息集中到同一个服务器上,达到减少服务器中缓存的数量以及需要转换的页面的数量的目的;再次,将数据库中读者访问相对频繁的专题或者模式利用关联规则存入到同一服务器 的知识库中,这样读者再次查询该网页或者专题、模式的时候,网络代理就能够根据关联规则找到相关的网页,读者查询的速度就能够得以提高。另外,还可以应用Web挖掘技术获取读者访问的序列模式,可以预先获取读者可能访问的网页。
   (二)提高图书馆服务的质量
   随着网路信息化的发展,图书馆的服务方式也应当由被动服务转为向读者提供主动服务的方式,由向读者提供信息转为主动引导读者查询信息。最主要的是两个方面:一是信息的检索。公共图书馆中传统的信息检索方式为读者提供的是无序的巨量的信息和数据,读者不能在第一时间找到有用的信息,而智能化的检索方式不仅能够为读者提供模糊查询、联想查询等多种检索方式,还能够利用聚类算法在最短的时间内经查询结果有序排列,以供读者使用。二是更新服务。在信息化的时代,数据和信息的变更是非常迅速的,而图书馆的更新服务只要针对的是光盘检索和文件检索两种。公共图书馆可以利用可视化技术等实现信息的及时更新。三是信息分析服务。我们认为,只有对检索出的文本信息进行深入的探索性的分析才能做到真正意义上的数据挖掘。而文本信息的分析指的是,对文本数据进行深入研究并对其相互之间的关系进行分析,最后找出以前未发现的有用的知识的过程,例如利用文本EDA形成一些科学假设等。公共图书馆提供的信息分析服务可以帮助商业读者确定其发展战略等,是一项实用性非常强的功能。
   (三)提高公共图书馆的管理水平
   我国图书馆的发展一直受到管理方式落后、管理水平较低等因素的影响,而图书馆管理水平的高低在很大程度上受到决策水平的影响。公共图书馆的传统决策模式大都依靠领导层的经验,但这种主观经验存在很多的片面性和盲目性,越来越难以使用社会的发展需要,无法为图书馆科学决策提供保障。但是,实现数据挖掘技术能够有效避免图书馆决策非科学性这一弊端:首先,数据挖掘能够将图书馆数据库中的各种信息都汇总起来,经过一定的处理和转换程信息,这样能够避免决策者因为信息量的不足造成决策失误的情况;其次,数据仓库系统中的OLAP工具可以实现数据的多维分析和比较,对假设性的决策结果进行验证,为决策者提供决策结果优劣的分析,达到有效利用图书馆资金的目的;最后,数据挖掘能够从以前的数据中找到潜在的专题和固定的模式,并能够以此为依据做出一定的预测,这对决策者的思维有着创造性的启发作用,对信息化社会的建设有着重大的意义。
   三、结论
   公共图书馆实现数据挖掘技术主要是为了能够实现信息的现代化和智能化。随着图书馆的决策需求变化,可以预先选择所需要挖掘的数据类别,建立一个合乎需求的数据仓库,然后将这个数据仓库的数据输出成应用软件所需要的格式文件,就可以直接放到数据挖掘应用软件进行相关数据挖掘,以改进工具使用的简易性,让图书馆管理者更能够专著于管理决策需求,提升图书馆经营与服务的品质与效益。面向数字图书馆的数据挖掘是一个新生的研究领域,随着信息技术和数字图书馆事业的发展,这方面研究成果的应用必将推动数字图书馆个性化服务系统的完善,并创造出良好的社会效益。
   参考文献:
  [1]石冰、郑燕峰.信息检索中的数据挖掘技术[J].情报学报,2009(3): 25-27.
  [2]王继成等.Web文本挖掘技术研究[J].计算机研究与发展,2008(5): 13-14.
  [3]孙卫祥.基于数据挖掘与信息融合的故障诊断方法研究[D].上海交通大学工学博士学位论文,2006.
  [4] [美]Pang-Ning Tan等著.數据挖掘导论[M].北京:人民邮电出版社,2008.
  [5]张力.数据挖掘在图文信息系统中的应用[D].华东师范大学硕士学位论文,2006.
其他文献
施工成本控制室施工方项目管理的重要任务之一。施工方的利润主要来自于施工承包收入与施工成本的差额。因此,施工方若要增加利润,一方面应增加收入,包括即时结算工程进度款、加强索赔管理等;另一方面必须根据确定的成本目标控制实际成本的支出,并采取措施降低成本。   1、施工项目成本控制的原则  众所周知,施工项目作为一种特殊产品,具有生产的一次性、关键环节多、原材料种类繁多、技术性强、制造周期长、外界干扰因
期刊
摘要:随着我国城镇化进程的加快,污水的排放量也逐年增加。因此在污水处理方面存在着不少问题。本文主要通过对我国城镇污水处理存在的问题进行论述,提出了处理污水的方法。  关键词:污水处理 问题 对策    引言  城镇排放的污水一般由居民日常生活、小型餐饮服务、小型輕工业以及手工业生产、公共卫生服务设施排放的污水组成,其中以生活污水、工业废水等为主。因此,污水中不含重金属和其他的一些有毒有害物质,但污
期刊
【摘要】:本文着重介绍既有隧道扩挖改造过程中遇见的不同类型坍方,有针对性的提出了相应的施工方案和方法,可为类似工程坍方处治提供借鉴。  【关键词】:隧道 扩挖 坍方 处理  1.工程基本情况  既有钟鼓山隧道位于厦门市思明区万石植物园附近,下穿钟山和鼓山。为分离式双车道隧道,分为钟鼓山隧道A洞和B洞,A、B洞为既有隧道改造,既有钟鼓山A洞为石拱结构,于1984年经由50年代人防洞室改造而成,B洞为
期刊
摘要:2009年以来,地方政府融资平台在全国快速发展。通过这一平台。一方面,地方政府拓宽了中央政府投资项目配套资金的融资渠道,加快了城市化建设步伐;另一方面,商业银行扩大了贷款投放,进一步优化7贷款结构,为中国应对危机和扩大内需发挥了重要作用。地方政府融资平台贷款规模的迅速扩张。对许多地区的地方财政偿付能力构成了威慑。也对商业银行信贷资金安全带来一定隐患。最终很可能会造成财政问题和金融问题。其隐性
期刊
摘要 本文主要是通过作者的多年的施工经验,详细地介绍了悬浇连续梁合拢段施工的具体情况。  关键词 悬浇连续梁 合龙段 施工 方法 顺序  合拢是连续梁施工和体系转换的重要环节,合拢施工段必须满足受力状态的设计要求和保  持梁体线形,控制合拢段的施工误差。  1、 合拢段施工顺序  边跨现浇段及中间节施工完成后, 安装边跨合拢段吊架, 进行边跨合拢段锁定, 浇筑边跨合拢段混凝土, 张拉边跨第一批预应
期刊
[摘要]:陈设品在现代空间中巨大的表现力和无穷的魅力,尤对酒吧空间氛围的营造起着至关重要的作用。在一个造型较为简洁,风格尚不明显的酒吧中,如果能恰如其分的设置不同的陈设品即可产生不同风格氛围的形态空间效果。但是从20世纪80年代开始我国的装饰行业得到迅速发展的同时也进入了发展的误区。大多数室内设计都是依附装饰施工的,不少的装饰公司为了寻求利润的最大化,加上认知的局限,他们都要求设计者运用高档的材料
期刊
摘要:施工技术无论是在设计阶段还是在施工阶段都具有非常重要的作用,设计者意图的实现往往取决于施工技术;因此,在一定条件下,施工技术的先进与否直接影响到设计者的意图能否实现。  关键词:土木工程;基础理论;钻孔;管理体制;内力和位移  1.引言  国外土木工程施工控制技术的研究和应用较早,其施工控制已纳入常规施工管理工作之中,形成监控、预报、反馈、分析、调整的施工控制系统。国内的施工控制在部分领域已
期刊
摘 要:文中介绍了对建筑物的节能和太阳能建筑技术的推广应用进行分析,太阳能采暖系统的构成和设计方法,对太阳能采暖系统的成本和经济性进行了分析。  关键词:太阳能 采暖 建筑 节能    建筑节能是反映一个国家先进技术的重要标志,新能源利用是实现建筑可持续发展的重要环节。利用太阳能进行采暖是太阳能热利用的一个重要方面,也是促进资源节约型社会有效的技术手段,当今社会十分关注建筑工程的能源消耗及建筑物使
期刊
1工程概况  某二级公路工程,全长81.5215km,该段路地形相对开阔平缓,总体上填挖不太大,深挖高填不大。本段查明软弱土7段,但规模不大,软弱土厚度一般0.5~1.4m不等。本段软基是主要的工程地质问题,本段工程地质条件基本良好。  2 路基设计原则、路基断面布置  本项目的路基设计按照《公路路基设计规范》(JTGD30-2004)及其他相关技术规范、规程等,对公路沿线地质、水文、地形、地貌、
期刊
摘 要:设备维修是确保设备正常运行的主要手段,是煤炭企业的一项重要管理工作,是生产费用支出的主要部分。作者阐述了机电设备维修体制的发展过程和机电设备维修方式,并对机电设备维修管理方面提出对策。   关键词:煤矿机电;维修体制;管理 ;对策  1、机电设备维修体制的发展过程   设备维修体制是以生产为中心,为生产服务的一种维修体制,根据有关资料统计,它由五种具体的维修方式构成。   (1)维修预防。
期刊