论文部分内容阅读
随着科研信息管理系统在高校的普遍应用,产生了大量的科研数据,如何发现隐含在这些数据中的规则和知识,并辅助教育决策,已成为亟待解决的问题。
学校的科研水平通常通过纵向科研项目立项的级别、数量和资助金额,横向科研项目的到款金额、发表的论文期刊级别、收录检索情况、发表的著作数量、类型等数据来衡量,纵向科研项目申报成功与否和项目组成员的团队结构、研究基础、申报的项目级别、是否有学科交叉等信息密切相关,这些客观条件与申报结果之间是否存在着某些有趣的关系,是我们科研管理部门和教师所关心的问题,如能从教师的项目申报数据中挖掘出这些规则,将对项目申报工作起到莫大的促进作用。
本文对学校教师一年内所提交的项目申报书的信息进行数据挖掘,分析项目负责人和成员的职称、学历、申报项目的级别、研究基础与项目立项与否之间的关系,为教师个人在项目申报和学校在申报组织管理时提供参考依据,以提高项目申报成功率,从而提高整个学校的科研水平。
文中采用SQL查询语言从学校的人事管理系统、科研管理系统中提取教师人事信息和科研项目信息,并整理了学校2011年度的所有项目申报表,从中提取项目组成员的团队组成结构、研究基础等相关数据,针对这些数据的不完整性、有噪声、不一致问题,经过数据清理、数据集成,选用动态聚类技术对部分指标进行数据归约等预处理工作,然后使用Apriori算法经过多次迭代,挖掘事务数据库中的频繁项集,从中发现有效的强关联规则。