论文部分内容阅读
关联规则是数据挖掘中一个重要的研究方向,其主要研究目的是从大型数据集中发现隐藏的、有趣的、属性间存在的规律。人们可以利用这些规律来预测事物发展趋势,提高决策支持的能力。关联规则可以分为布尔型关联规则和多值属性关联规则,前者可以看作是后者的基础和特例。由于实际应用中多值属性的数据居多,因此多值属性关联规则逐渐成为关联规则研究的热点。频繁项集挖掘是关联规则挖掘中的关键技术和步骤,借助于矩阵可以使这一步骤的执行效率明显提升。人力资源是指在一定范围内能够推动整个社会和经济发展的具有智力与体力劳动能力的人的总和,是在劳动力资源的基础上,能够发挥创造性劳动的群体。高校人力资源主要包括教学科研人员、党政管理人员、后勤服务人员以及校办产业人员。他们具有人力资源的基本特征,即主动性、时效性、可再生性,同时,高校担负着培养高层次创新人才的重任,这就要求高校的人力资源在政治道德、职业道德、科学文化素质等方面要远远高于社会平均水平。人力资源是高校发展中最有活力、效益最显著的资源,它的开发是实现高校可持续发展的关键,无论是学科建设的发展、人才的培养,还是高校资源的合理利用,都离不开对人力资源的有效开发和利用。通过数据挖掘技术对高校人力资源数据源中的数据进行分析,寻找其中有价值的关系和规律,对教师聘用、培养、选拔等实际工作能够在一定程度上起到辅助作用,从而为制定人才需求规划、人才招聘和培养提供比较客观的决策支持。本文的主要贡献包括:(1)提出有效的数据预处理方法将原始事务数据库转化为多值型挖掘数据库,摈弃原始数据中一些与挖掘目标不相关的属性,为算法提供干净、准确、更有针对性的数据,从而减少了数据处理量,提高了算法挖掘效率和知识发现的起点。(2)设计出基于矩阵的多值属性关联规则挖掘算法,其中利用FAFS算法在多值型数据库中挖掘频繁项集,利用GAR算法在频繁项集中提取关联规则。并通过实验证明了算法的高效性和正确性。(3)将基于矩阵的多值属性关联规则的挖掘算法应用于高校干部人事电子档案管理信息系统中进行人力资源的开发,为高校各级人事部门提供决策支持。该系统的成功运行验证了算法的实用性。