论文部分内容阅读
随着计算机技术,特别是数据库技术的发展,高校的信息化发展有了很大的进步,校园网内各类管理信息系统以及因特网上权威检索数据库中存储的数据已初具规模。如何发现隐含在这些数据中的规则和知识,并辅助教育决策,成为亟待解决的问题。数据挖掘技术的出现和发展为此提供了有力的支持。
本文从信息计量学的角度,对构建科研评价体系中的问题需求进行分析,进而寻找该体系中具有强支持度的属性和规则。当前科研管理信息系统中的数据主要以关系型数据库存储,因此本文采用关联规则挖掘算法对科研数据进行挖掘研究,旨在为构建科学的科研评价体系提供数据支持,从而更好地完善科研评价,科学地实施教育决策。文中首先介绍高校科研评价的研究现状,发现现行体系中的不足,并阐述数据挖掘技术在高校科研管理中应用研究的内容和意义。其次,介绍分析数据挖掘及其主要技术。数据挖掘是集成多项技术(如统计学、人工智能、数据库等)于一体的交叉性学科,是从大量不完备的、模糊随机的数据中,提取出事先未知的、但具有价值的信息和知识的过程。数据挖掘的主要技术之一是关联规则,后者从多种信息存储库(如事务数据库、关系数据库等)中的大量数据的项集之间发现有趣的、频繁出现的模式、关联和相关性。关联规则中的经典算法主要有Apriori算法及其改进算法。再次,高校科研数据的关联挖掘系统的设计。坚持科学性、前瞻性、导向性、可行性、平衡性等的原则构建高校科研评价体系,其目标可以实现科学预测、项目评估、专家遴选以及人才与科研机构评价等,进而指导教育决策。高校科研管理系统中包含科研人员库、专家库、项目库、论文库、著作库等大量数据,文中仅以成果库中项目、著作、论文数据为对象进行挖掘研究。同时由于各类数据表都具有多个属性,因此文中着重针对关联挖掘多维Apriori算法进行设计和研究。有了核心算法,就可从科研数据挖掘系统的设计需求、执行流程以及系统结构方面对该系统作设计。最后,高校科研数据的关联挖掘系统的实现。选择部分科研项目、学术论文、学术著作等数据进行清理、集成,通过去除冗余、模糊信息确认、事务信息定义等步骤,实施由一个关系数据表变成事务表,进而生成事务集的数据变换过程。经过上述数据准备,就可以进入关联挖掘过程的具体实施。对挖掘结果进行分析,发现一些潜在的、能有助实施评价的关联规则;发掘影响科研成果的关键要素,以及各科研条件间和科研成果间的关联规则。从而为组织、协调及评价教师科研工作,并作出科研决策提供科学依据,为科研管理提供一种新的思路和研究方法。
本文使用关联规则挖掘技术对高校管理信息系统中的数据进行发掘,这是数据挖掘在科研管理信息系统中的一次应用研究。本次应用也仅是对大量数据中的抽样数据进行实验性发掘。因各高校现行科研体制各具特色,所以今后还需加大总结各高校的特点,进行具有针对性实例性研究。发掘科研管理系统中对科研评价有强支持度的数据、条件及事务,从而为构建科研评价体系和实现评价系统,为教育决策提供有力支持,为提高高校科研管理信息系统的实时性和智能性提供了有效可行的技术途径。