论文部分内容阅读
信息是事务特征的整体描述,它既可用于解释事务当前行为,也可用于预测事务发展趋势。在信息社会,信息已经成为人们制定决策的重要参考因素。计算机的出现使得大容量的数据存储和快速处理成为可能,它的广泛使用使得各种数据急剧增加以至超过人们掌握和消化的能力,而且由于数据组织结构不统一、数据冗余和数据的不一致性,更是增加了数据处理的难度。人们已经意识到数据是一笔宝贵的财富,如何有效利用数据、发现数据中隐藏的有用信息是目前人们迫切需要解决的问题,由此产生了数据挖掘技术。简单的说,数据挖掘技术就是以发现数据中隐藏的有用信息为目的的一门信息技术。关联规则挖掘是数据挖掘技术研究中的重要内容之一,它的目的是发现事务内部隐藏的关联关系,为人们改进工作、制定决策提供依据。Apriori算法是关联规则挖掘中的经典算法,它采用多次迭代的方法来生成频繁项集,每次生成频繁项集都需要经过数据库扫描、连接操作和剪枝操作等步骤,以便从候选项集中发现所有的频繁项集。该算法在项数量少的数据库中具有较好的性能,但在项较多且事务量大的数据库中进行关联规则挖掘时,由于Apriori算法需要多次扫描事务数据库并且产生庞大候选项集这两个固有缺陷影响了关联规则的挖掘效率。为了提高Apriori算法的挖掘效率,本文从下列三个方面对Apriori算法进行改进:采用数据库事务压缩的方法来减少算法的IO负载、采用连接操作前频繁项集优化的方法来减少连接操作次数和候选项集个数、采用连接操作优化的方法来减少连接操作中项的比较次数。实验表明,改进后的Apriori算法比传统的Apriori算法在运行效率上有了较大提高。计算机等级考试是目前高校中重要的计算机能力水平考试,考试内容一般包括理论知识和操作技能两部分,计算机理论知识的考试技术已经相当完善,而计算机操作技能考试由于自身的复杂性导致该考试技术仍然不够完善,因此,计算机技能考试成为最近几年来的研究热点。在传统计算机技能考试中,首先是教师在计算机上提供试题要求和素材文件,然后由学生上机操作答题,最后再由教师一一阅卷评分,这种考试方式由于考试组织时间长、耗费人力物力多、阅卷不客观等缺点已逐渐被淘汰,很多高校为了提高工作效率,开发或购买了相应的计算机考试系统,这些系统利用计算机的高性能来辅助完成考试组织过程中的出题、阅卷、成绩分析等方面的工作,减少了考试组织过程中的人力、物力耗费,但也存在操作过于复杂、步骤之间关系不明确、试题题意模糊、获取信息少等不足,并且由于考生众多,成绩数据量大,教师通过传统的数据库管理系统难以获取成绩数据中隐藏的反映学生学习规律的重要信息。针对计算机操作技能考试的特点及市场上已有计算机考试系统中的不足,本文设计并实现了一个新的Excel智能考试系统,该系统简化了计算机考试组织的操作步骤、明确了步骤之间的关系、减少了教师和学生的工作量、节省了考试组织的时间、人力和物力,并应用改进后的Apriori算法对系统中得分知识点进行关联规则挖掘,提高了系统的智能性,发现Excel中的关键知识点对教师改进教学具有重要意义。因此,该智能考试系统具有一定的推广性和应用价值。