论文部分内容阅读
摘要:数据挖掘技术是近期情报学专业研究的热点,本人围绕数据挖掘技术展开,进而对数据挖掘技术在图书馆信息服务中的应用进行探讨。
关键词:数据挖掘技术;图书馆;信息服务;应用
网络社会,传统意义上的图书馆已经不能满足信息需求者的需求,改变传统的服务观念,深化信息服务是图书馆获得可持续发展的重要途径。在这样的大背景下,数字图书馆的概念应运而生!数字图书馆(Digital Library)是用数字技术处理和存储各种图文并茂文献的图书馆,实质上是一种多媒体制作的分布式信息系统。它把各种不同载体、不同地理位置的信息资源用数字技术存贮,以便于跨越区域、面向对象的网络查询和传播。它涉及信息资源加工、存储、检索、传输和利用的全过程。通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。以下将结合数据挖掘技术探讨数据挖掘技术在数字图书馆信息服务中的应用。
1.数据挖掘技术的内涵
随着信息技术的高速发展,人们积累的数据量急剧增长,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。其主要任务是关联分析、分类、预测时序模式和偏差分析等。是知识发现(knowledge discovery in database)的关键步骤。数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘的技术模式有很多种,按照用途可以分为:预测型模式和描述型模式。
2.数据挖掘技术在数字图书馆信息服务中的应用
2.1数据的搜集和整理
数字图书馆系统面对的不仅仅是单独一个图书馆的馆藏资源,还包括各个兄弟单位的馆藏信息及线上信息,这些数据的分布较广,再加上数据内容和数据特点的复杂性都给图书馆进行信息存储和情报分析带来了很大的困难。面对这些问题,数字图书馆系统就必须采用新的信息存储方法,利用新的强大的解决方案,将数据分类、系统地进行存储,在更高的层次上对分析对象进行完整、统一的描述,保障信息的完整性和一致性。
2.2 数据分析和知识挖掘
馆藏数据中隐含着很多重要的信息,有必要对其采取更高层次的梳理,以便更好地利用这些信息。由于传统的数据库系统缺乏数据分析和数据挖掘中隐藏的信息的手段,业务类型数据形式的复杂性以及数据规模的庞大更使传统的决策支持系统难以使用。为了更好的利用数据,急需一种技术能够从复杂多样的数据中,迅速地挖掘出有意义、有价值的知识,以支持信息咨询服务。数据挖掘技术的思路就是从冗杂的数据中抽取有用的信息,它可以帮助我们从数据集中识别出有效的、潜在有用的以及最终可被理解的知识。阻碍我国图书馆事业发展的重要原因之一是管理水平低。管理水平不高在很大程度上是因为决策方式不科学。传统的图书馆决策方式没有与时俱进地改进以适应时代的变化,大多属于经验主义,往往存在片面、不客观、盲目等问题。数据仓库技术使领导层决策的科学性更有保证。一方面,数据仓库技术使决策所依据的信息更加充足。数据仓库将各种内部数据和外部信息汇集起来并进行处理和转换,形成随时可用、集中统一的决策信息,从而有效解决了决策所依据的信息不足的问题。另一方面,数据仓库技术使决策可信度和可行性更高。数据仓库技术可以从多角度对集成数据进行分析和比较,审查和验证决策假设,提高决策的可靠度和可行性。最后,数据挖掘工具可以从海量的历史数据中找出潜在的模式,并较为准确地做出预测和判断。这样,图书馆决策者的创新思维能够得到充分激发,从而有效应对信息化给图书馆事业发展带来的挑战。
2.3 决策支持
数据仓库和数据挖掘技术是科学决策的有效工具,通过下面案例可以了解它们在图书馆服务中的作用。案例:基于数字图书馆的领导决策信息咨询服务系统图书情报机构拥有强大的信息资源优势,有全面、准确提供信息服务的手段,有对信息进行分析、综合、浓缩、转换与创新的条件和实力,已经具备为领导决策提供信息咨询服务的能力和优势。但是,图书情报机构并没有成为领导决策信息咨询服务的重要组成部分。究其原因,一是信息咨询服务形式乱而无序,缺少有针对性的某一领域和某一专业的信息咨询服务,没有形成统一管理、统筹安排、有侧重点地提供服务的格局;二是缺乏对信息的进一步加工,不能为决策者提供更为直接、有效的知识。因此,在今后的信息咨询中,图书情报机构需要做好以下两点:一是信息资源建设的针对性。图书情报机构应分析自己的馆藏信息,确定信息咨询方向,有针对性地全面采集某一领域或某一专业的信息,形成信息优势。二是采用先进的信息技术(如数据挖掘技术)和数据仓库技术)对馆藏数据库进行深加工。馆藏数据中隐藏着许多重要信息,蕴涵着丰富的知识,如果能把这些信息和知识从数据库中抽取出来,进一步加工,将为决策创造很多直接的、潜在的支持。数字图书馆是图书馆信息服务朝网络化和数字化方向发展的产物,它是一个将计算机网络环境下信息资源收藏、服务和使用者集成在一起的环境,以支持数字化数据、信息和知识的生成、发布、传输、利用和保存。在数字图书馆系统中,增加数据挖掘、数据仓库系统,就能对馆藏信息资源进行深加工,更好地进行决策咨询服务。(1)特色源数据库是指某一特定咨询领域的信息集合。(2)数据挖掘、数据仓库是决策信息咨询的技术基础,数据仓库为有效支持决策分析提供了全局一致的数据环境,数据挖掘从数据库中搜索出有价值的决策信息。(3)信息采集是手工采集和网络机器人采集的整合。(4)信息检索服务覆盖图书馆业务中的内容檢索、元信息检索和决策信息检索。(作者单位:西南科技大学经济管理学院)
参考文献
[1]蒙小朋.局域网安全探讨[J].陕西水利,2002,(3):3 一31.
[2]卢昱,林琪.网络安全技术[M].北京:中国物资出版社.
[3]戴泳.知识发现与知识挖掘技术及其应用[J].科技情报开发与经济,2007,(26).
[4]贾宏.基于Web 使用挖掘的数字图书馆个性化服务[J].河南图书馆学刊,2006,(4).
[5]张芳.网络信息挖掘技术在数字图书馆中的应用[J].科技情报开发与经济,2007,(30).
[6]谢含.数据挖掘—未来图书馆参考咨询工作的新方法[J].高校图书馆工作,2006,(1).
[7]罗琳,陈远.知识挖掘与数字图书馆个性化服务[J].中国图书馆学报,2004,(3).
[8]夏南强,张红梅.基于数据挖掘的数字图书馆个性化服务[J].科技情报开发与经济,2006,(6).
关键词:数据挖掘技术;图书馆;信息服务;应用
网络社会,传统意义上的图书馆已经不能满足信息需求者的需求,改变传统的服务观念,深化信息服务是图书馆获得可持续发展的重要途径。在这样的大背景下,数字图书馆的概念应运而生!数字图书馆(Digital Library)是用数字技术处理和存储各种图文并茂文献的图书馆,实质上是一种多媒体制作的分布式信息系统。它把各种不同载体、不同地理位置的信息资源用数字技术存贮,以便于跨越区域、面向对象的网络查询和传播。它涉及信息资源加工、存储、检索、传输和利用的全过程。通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。以下将结合数据挖掘技术探讨数据挖掘技术在数字图书馆信息服务中的应用。
1.数据挖掘技术的内涵
随着信息技术的高速发展,人们积累的数据量急剧增长,如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需要应运而生发展起来的数据处理技术。其主要任务是关联分析、分类、预测时序模式和偏差分析等。是知识发现(knowledge discovery in database)的关键步骤。数据挖掘(data mining)是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘的技术模式有很多种,按照用途可以分为:预测型模式和描述型模式。
2.数据挖掘技术在数字图书馆信息服务中的应用
2.1数据的搜集和整理
数字图书馆系统面对的不仅仅是单独一个图书馆的馆藏资源,还包括各个兄弟单位的馆藏信息及线上信息,这些数据的分布较广,再加上数据内容和数据特点的复杂性都给图书馆进行信息存储和情报分析带来了很大的困难。面对这些问题,数字图书馆系统就必须采用新的信息存储方法,利用新的强大的解决方案,将数据分类、系统地进行存储,在更高的层次上对分析对象进行完整、统一的描述,保障信息的完整性和一致性。
2.2 数据分析和知识挖掘
馆藏数据中隐含着很多重要的信息,有必要对其采取更高层次的梳理,以便更好地利用这些信息。由于传统的数据库系统缺乏数据分析和数据挖掘中隐藏的信息的手段,业务类型数据形式的复杂性以及数据规模的庞大更使传统的决策支持系统难以使用。为了更好的利用数据,急需一种技术能够从复杂多样的数据中,迅速地挖掘出有意义、有价值的知识,以支持信息咨询服务。数据挖掘技术的思路就是从冗杂的数据中抽取有用的信息,它可以帮助我们从数据集中识别出有效的、潜在有用的以及最终可被理解的知识。阻碍我国图书馆事业发展的重要原因之一是管理水平低。管理水平不高在很大程度上是因为决策方式不科学。传统的图书馆决策方式没有与时俱进地改进以适应时代的变化,大多属于经验主义,往往存在片面、不客观、盲目等问题。数据仓库技术使领导层决策的科学性更有保证。一方面,数据仓库技术使决策所依据的信息更加充足。数据仓库将各种内部数据和外部信息汇集起来并进行处理和转换,形成随时可用、集中统一的决策信息,从而有效解决了决策所依据的信息不足的问题。另一方面,数据仓库技术使决策可信度和可行性更高。数据仓库技术可以从多角度对集成数据进行分析和比较,审查和验证决策假设,提高决策的可靠度和可行性。最后,数据挖掘工具可以从海量的历史数据中找出潜在的模式,并较为准确地做出预测和判断。这样,图书馆决策者的创新思维能够得到充分激发,从而有效应对信息化给图书馆事业发展带来的挑战。
2.3 决策支持
数据仓库和数据挖掘技术是科学决策的有效工具,通过下面案例可以了解它们在图书馆服务中的作用。案例:基于数字图书馆的领导决策信息咨询服务系统图书情报机构拥有强大的信息资源优势,有全面、准确提供信息服务的手段,有对信息进行分析、综合、浓缩、转换与创新的条件和实力,已经具备为领导决策提供信息咨询服务的能力和优势。但是,图书情报机构并没有成为领导决策信息咨询服务的重要组成部分。究其原因,一是信息咨询服务形式乱而无序,缺少有针对性的某一领域和某一专业的信息咨询服务,没有形成统一管理、统筹安排、有侧重点地提供服务的格局;二是缺乏对信息的进一步加工,不能为决策者提供更为直接、有效的知识。因此,在今后的信息咨询中,图书情报机构需要做好以下两点:一是信息资源建设的针对性。图书情报机构应分析自己的馆藏信息,确定信息咨询方向,有针对性地全面采集某一领域或某一专业的信息,形成信息优势。二是采用先进的信息技术(如数据挖掘技术)和数据仓库技术)对馆藏数据库进行深加工。馆藏数据中隐藏着许多重要信息,蕴涵着丰富的知识,如果能把这些信息和知识从数据库中抽取出来,进一步加工,将为决策创造很多直接的、潜在的支持。数字图书馆是图书馆信息服务朝网络化和数字化方向发展的产物,它是一个将计算机网络环境下信息资源收藏、服务和使用者集成在一起的环境,以支持数字化数据、信息和知识的生成、发布、传输、利用和保存。在数字图书馆系统中,增加数据挖掘、数据仓库系统,就能对馆藏信息资源进行深加工,更好地进行决策咨询服务。(1)特色源数据库是指某一特定咨询领域的信息集合。(2)数据挖掘、数据仓库是决策信息咨询的技术基础,数据仓库为有效支持决策分析提供了全局一致的数据环境,数据挖掘从数据库中搜索出有价值的决策信息。(3)信息采集是手工采集和网络机器人采集的整合。(4)信息检索服务覆盖图书馆业务中的内容檢索、元信息检索和决策信息检索。(作者单位:西南科技大学经济管理学院)
参考文献
[1]蒙小朋.局域网安全探讨[J].陕西水利,2002,(3):3 一31.
[2]卢昱,林琪.网络安全技术[M].北京:中国物资出版社.
[3]戴泳.知识发现与知识挖掘技术及其应用[J].科技情报开发与经济,2007,(26).
[4]贾宏.基于Web 使用挖掘的数字图书馆个性化服务[J].河南图书馆学刊,2006,(4).
[5]张芳.网络信息挖掘技术在数字图书馆中的应用[J].科技情报开发与经济,2007,(30).
[6]谢含.数据挖掘—未来图书馆参考咨询工作的新方法[J].高校图书馆工作,2006,(1).
[7]罗琳,陈远.知识挖掘与数字图书馆个性化服务[J].中国图书馆学报,2004,(3).
[8]夏南强,张红梅.基于数据挖掘的数字图书馆个性化服务[J].科技情报开发与经济,2006,(6).