论文部分内容阅读
随着人们认识和管理水平的提高,对客观世界的描述越来越全面,存储的数据量也越来越大,然而,对数据库中数据的开发应用主要是检索查询,效率很低,简单的数据查询或统计虽然可以满足某些低层次的需要,但人们更为需要的是从大量数据资源中挖掘出对各类决策有指导意义的一般知识.大量的数据未能充分利用这一现象常常被描述为"数据丰富,但信息贫乏".快速增长的数据如果没有强有力的工具来助,其得出的决策结果只能是基于决策者的直觉而不是数据库中丰富的信息.为此,决策者迫切需要从海量数据中提取有价值知识的工具,OLAP和数据挖掘技术基于此而产生.本文介绍了北京化工大学科技信息管理平台的设计与实现,着重阐述了它的网络结构和安全体系,在 OLTP 的基础上对 OLAP 和数据挖掘方面做了进一步研究探索。首先在历年科技数据基础上构建科技数据仓库,该数据仓库综合了ROLAP 组织数据以及 MOLAP 多维形式存储的优点,利用关系数据库存储细节数据,将基本事实数据和汇总数据以多维形式存储.其次利用 OLAP 引擎建立起关于教师的 OLAP 分析主题,包括:教师基本情况、项目、论文与教学任务等。系统提供了多种表格、图形分析 ii<WP=5>北 京 化 工 大 学 学 位 论 文 用 纸方法,使用户能够以直观的形式进行分析,同时分析主题可以通过开发工具和第三方软件(如 EXCELL)访问,具有较高的灵活性。最后,对数据挖掘技术中较为重要的关联规则采掘问题进行了研究。分析了典型的关联规则挖掘算法 Apriori 和改进算法 FP-tree 算法,结合作者开发的北京化工大学科技信息管理平台,设计了旨在协助决策者找到影响学科发展因素的基于 FP-tree 算法的挖掘系统原型。将数据挖掘技术运用到高校的发展战略决策中,给高校科技管理探索了一种新的思路。