论文部分内容阅读
摘要:本文分析了数学方法与情报学的关系,对情报学中用到的几种重要的数学方法进行了详细的介绍,预测了今后数学方法与情报学结合的几种新的趋势。
关键词:数学方法;情报学;数学思想;数学模型
1、 引言
数学方法的运用是现代科学研究的主要特征之一,学术界甚至出现了这样一种倾向:以数学方法的运用程度作为科学研究研究水平的评判标准。情报学由定性研究走向定量研究,数学方法越来越多地被引入情报学研究。[1]
由国防科工委情报所八室编科技文献出版社1988年12月出版的《情报数学》是中国最早论述情报科学技术和数学之间的结合部的一本专著。[2]
数学这是所有学科中的基础的学科,如果哪门学科没有加入数学很难说其已经建成了真正的科学。因此,数学方法对于图书馆学情报学理论、方法、实践领域以及所拓展的研究方向,都发挥着不可替代的作用。[3]
2、 数学方法在情报学中的应用
2.1计量学
计量学是情报学领域最为常用的数学方法之一。1934- 1960年是文献计量学的奠定时期。这一时期的研究比较注重理论研究与规律的发现。献计量学中大量的规律和定律都是在这段时间内提出的, 其中包括文献计量学中著名的三大定律中的布拉德福定律和齐普夫定律。在此阶段, 除了对文献计量学的基本规律进行了研究以外,还对其他规律进行研究。例如文献的引用规律、文献的增长规律及文献的老化规律。之后,又有许多文献计量学的概念、规律和方法被提出。从科学引文索引的发行以来, 从实际应用的角度计量学分成两种类型类型: 评价类和关联类。
计量学很好地利用了数学的思维方式,即运用数和量来发现事物的规律和联系。
2.2集合理论
假如一个系统可以划分成N种类别,并且各个类别之间的关系可以被清楚地表达出来,那么这个系统就能很方便地建立起一个集合模型,例如集合论在的主题词系统中的应用。
情报集合是一个集合,由许多条情报组成。也就是说一条条情报便是集合中的元素。实际上每条情报也是一个集合,它是由一个个概念词组合而成。为著录和查询情报而编制的主题词索引也组成一个主题词集合。主题词集合与对应的情报集合存在着一定的对应关系,即存在一个映射F,能够完成主题词集合到情报集合的映射。
2.3模糊数学
模糊数学又被叫作Fuzzy 数学,是用于研究和处理模糊性现象的一套数学理论和方法。它是模糊拓扑、模糊测度论等数学领域的统称,是在模糊集合、模糊逻辑基础之上发展起来的一种数学工具,用来研究现实世界中许多界限不明确以及存在模糊性 的问题的。
情报学领域存在大量模糊现象,仅靠随机数学和明确数学方法很难解决所有问题。模糊数学的引入提供了很好的视角。情报学领域经常采用的模糊数学的方法包括模糊算法,模糊匹配,模糊评价法,模糊聚类,模糊推理,模糊加权等。模糊数学在情报学中的应用,如信息检索的动态模糊聚类现象,可以使用模糊数学理论和方法描述作出模糊判断。模糊数学在该领域迅速地应用,显示出独特功能。如建立网络信息聚类的模糊模型。
2.4概率论与统计学
统计学是一门相对综合的科学,主要是通过搜集、整理、分析等技术手段达到推断所测对象的本质,甚至能预测对象未来的科学,在此过程中运用大量的数学及其它学科的专业知识,它的使用范围极广泛,几乎覆盖了社会科学和自然科学的各个领域。统计学在情报学领域的应用跟计量学有时候不太好区分,但是两者的应用领域还是比较明显的。统计学在医学情报学这个大的情报学分支上应用相对较多,而且也已经相当成熟。在处理情报的过程中的遇到的事件大多为随机事件,比如情报用户需求,情报的分布情况等。对于研究这种类型的问题,常采用数理统计方法。情报数理统计分析包括多种分析方法,例如情报分布统计分析,情报用户需求的统计分析,情报统计分析与预测,建立情报检索概率模型等。一般可将概率论和数理统计方法结合来进行处理,目的是可以看出变动的趋势,并且可以计算出各种可能出现的结果的比例和分布。例如情报分布情况的概率统计模型,情报检索系统的概率统计模型等。[4]
2.5线性代数
向量常常用来描绘与多个因素有关的一个问题,而矩阵描述的是与多个因素有关的一组问题, 其中最特殊的问题是线性代数中的线性方程组问题。
情报学中对于类概念词(包括主题词、关键词、标引词、类名等)的组配规则, 它们之间存在的多维性及它们因整体所显示的某种线性空间的性质的重视, 是矩阵理论与向量理论运用到情报工作中的前提条件。因为情报工作中亦存在着多维概念空间, 或者说存在着需要通过多个因素的量进行描述的问题, 这为线性代数应用于情报工作创造了最为坚实的基础。矩阵和向量在情报学中的应用主要是在计算机检索, 线性代数方法既是计算机检索系统模拟方法之一, 也是计算机扩检和缩检的手段之一。 情报检索系统采用的矩阵向量模型改进了传统检索的思路, 检索速度更快, 检索效率更高。线性代数方法还用于解释和预见情报活动中的实际具体问题,如著名的普莱斯指数增长模型,引文检索系统中的矩阵向量。[5]
3、 数学方法在情报学应用的发展趋势
首先,新的理论成果与新的方法渗透到情报学的研究工作中。数学方法作为一种研究方法适应各种科学研究的特点,最重要的是数学中的各种理论方法不断吸收自然科学研究中的新成果来完善自身。[6]
其次,定性和定量方法相结合。定性方法和定量方法相结合的研究方法日益成为情报学研究方法的主流,数学方法能够有效地把两种方法有机地结合起来。由定量分析上升至有相对数量依据的定性判断,最终形成具有足够根据的科学结论。
第三,利用计算机辅助建模及模型求解是发展的新趋势。情报系统涉及的因素、变量经常是众多的,有时计算量之大超出人的能力。计算机计算速度快、信息储存量大、计算结果准确的特点,特别是专业性软件的开发与应用可帮助研究者处理复杂问题。(作者单位:吉林大学管理学院)
参考文献:
[1]刘达. 情报学的新领域——情报计量学[J]. 情报学刊,1981,04:48-51.
[2]张芝兰. 《情报数学》[J]. 图书情报工作,1989,05:30.
[3]赖茂生. 数字化时代的情报学[J]. 图书情报工作,2007,04:25-29.
[4]马喜武. 数学方法在图书情报学中的应用[J]. 吉林农业科技学院学报,2007,04:63-64.
[5]邱均平,杨瑞仙,陶雯,李雪璐. 从文献计量学到网络计量学[J]. 评价与管理,2008,04:1-9.
[6]华薇娜. 中美两国图书馆学、情报学研究方法、主题、对象、分析技术的比较研究[J]. 情报学报,1997,01:12-19.
关键词:数学方法;情报学;数学思想;数学模型
1、 引言
数学方法的运用是现代科学研究的主要特征之一,学术界甚至出现了这样一种倾向:以数学方法的运用程度作为科学研究研究水平的评判标准。情报学由定性研究走向定量研究,数学方法越来越多地被引入情报学研究。[1]
由国防科工委情报所八室编科技文献出版社1988年12月出版的《情报数学》是中国最早论述情报科学技术和数学之间的结合部的一本专著。[2]
数学这是所有学科中的基础的学科,如果哪门学科没有加入数学很难说其已经建成了真正的科学。因此,数学方法对于图书馆学情报学理论、方法、实践领域以及所拓展的研究方向,都发挥着不可替代的作用。[3]
2、 数学方法在情报学中的应用
2.1计量学
计量学是情报学领域最为常用的数学方法之一。1934- 1960年是文献计量学的奠定时期。这一时期的研究比较注重理论研究与规律的发现。献计量学中大量的规律和定律都是在这段时间内提出的, 其中包括文献计量学中著名的三大定律中的布拉德福定律和齐普夫定律。在此阶段, 除了对文献计量学的基本规律进行了研究以外,还对其他规律进行研究。例如文献的引用规律、文献的增长规律及文献的老化规律。之后,又有许多文献计量学的概念、规律和方法被提出。从科学引文索引的发行以来, 从实际应用的角度计量学分成两种类型类型: 评价类和关联类。
计量学很好地利用了数学的思维方式,即运用数和量来发现事物的规律和联系。
2.2集合理论
假如一个系统可以划分成N种类别,并且各个类别之间的关系可以被清楚地表达出来,那么这个系统就能很方便地建立起一个集合模型,例如集合论在的主题词系统中的应用。
情报集合是一个集合,由许多条情报组成。也就是说一条条情报便是集合中的元素。实际上每条情报也是一个集合,它是由一个个概念词组合而成。为著录和查询情报而编制的主题词索引也组成一个主题词集合。主题词集合与对应的情报集合存在着一定的对应关系,即存在一个映射F,能够完成主题词集合到情报集合的映射。
2.3模糊数学
模糊数学又被叫作Fuzzy 数学,是用于研究和处理模糊性现象的一套数学理论和方法。它是模糊拓扑、模糊测度论等数学领域的统称,是在模糊集合、模糊逻辑基础之上发展起来的一种数学工具,用来研究现实世界中许多界限不明确以及存在模糊性 的问题的。
情报学领域存在大量模糊现象,仅靠随机数学和明确数学方法很难解决所有问题。模糊数学的引入提供了很好的视角。情报学领域经常采用的模糊数学的方法包括模糊算法,模糊匹配,模糊评价法,模糊聚类,模糊推理,模糊加权等。模糊数学在情报学中的应用,如信息检索的动态模糊聚类现象,可以使用模糊数学理论和方法描述作出模糊判断。模糊数学在该领域迅速地应用,显示出独特功能。如建立网络信息聚类的模糊模型。
2.4概率论与统计学
统计学是一门相对综合的科学,主要是通过搜集、整理、分析等技术手段达到推断所测对象的本质,甚至能预测对象未来的科学,在此过程中运用大量的数学及其它学科的专业知识,它的使用范围极广泛,几乎覆盖了社会科学和自然科学的各个领域。统计学在情报学领域的应用跟计量学有时候不太好区分,但是两者的应用领域还是比较明显的。统计学在医学情报学这个大的情报学分支上应用相对较多,而且也已经相当成熟。在处理情报的过程中的遇到的事件大多为随机事件,比如情报用户需求,情报的分布情况等。对于研究这种类型的问题,常采用数理统计方法。情报数理统计分析包括多种分析方法,例如情报分布统计分析,情报用户需求的统计分析,情报统计分析与预测,建立情报检索概率模型等。一般可将概率论和数理统计方法结合来进行处理,目的是可以看出变动的趋势,并且可以计算出各种可能出现的结果的比例和分布。例如情报分布情况的概率统计模型,情报检索系统的概率统计模型等。[4]
2.5线性代数
向量常常用来描绘与多个因素有关的一个问题,而矩阵描述的是与多个因素有关的一组问题, 其中最特殊的问题是线性代数中的线性方程组问题。
情报学中对于类概念词(包括主题词、关键词、标引词、类名等)的组配规则, 它们之间存在的多维性及它们因整体所显示的某种线性空间的性质的重视, 是矩阵理论与向量理论运用到情报工作中的前提条件。因为情报工作中亦存在着多维概念空间, 或者说存在着需要通过多个因素的量进行描述的问题, 这为线性代数应用于情报工作创造了最为坚实的基础。矩阵和向量在情报学中的应用主要是在计算机检索, 线性代数方法既是计算机检索系统模拟方法之一, 也是计算机扩检和缩检的手段之一。 情报检索系统采用的矩阵向量模型改进了传统检索的思路, 检索速度更快, 检索效率更高。线性代数方法还用于解释和预见情报活动中的实际具体问题,如著名的普莱斯指数增长模型,引文检索系统中的矩阵向量。[5]
3、 数学方法在情报学应用的发展趋势
首先,新的理论成果与新的方法渗透到情报学的研究工作中。数学方法作为一种研究方法适应各种科学研究的特点,最重要的是数学中的各种理论方法不断吸收自然科学研究中的新成果来完善自身。[6]
其次,定性和定量方法相结合。定性方法和定量方法相结合的研究方法日益成为情报学研究方法的主流,数学方法能够有效地把两种方法有机地结合起来。由定量分析上升至有相对数量依据的定性判断,最终形成具有足够根据的科学结论。
第三,利用计算机辅助建模及模型求解是发展的新趋势。情报系统涉及的因素、变量经常是众多的,有时计算量之大超出人的能力。计算机计算速度快、信息储存量大、计算结果准确的特点,特别是专业性软件的开发与应用可帮助研究者处理复杂问题。(作者单位:吉林大学管理学院)
参考文献:
[1]刘达. 情报学的新领域——情报计量学[J]. 情报学刊,1981,04:48-51.
[2]张芝兰. 《情报数学》[J]. 图书情报工作,1989,05:30.
[3]赖茂生. 数字化时代的情报学[J]. 图书情报工作,2007,04:25-29.
[4]马喜武. 数学方法在图书情报学中的应用[J]. 吉林农业科技学院学报,2007,04:63-64.
[5]邱均平,杨瑞仙,陶雯,李雪璐. 从文献计量学到网络计量学[J]. 评价与管理,2008,04:1-9.
[6]华薇娜. 中美两国图书馆学、情报学研究方法、主题、对象、分析技术的比较研究[J]. 情报学报,1997,01:12-19.