论文部分内容阅读
在信息爆炸的今天,无论是商业企业、科研机构或者政府部门,都积累了海量的、以不同形式存储的数据资料。由于这些资料十分繁杂,要从中发现有价值的信息或知识,达到为决策服务的目的,成为非常艰巨的任务。此外,互联网的迅猛发展,己经将我们淹没在数据和信息的汪洋大海中。存储数据的爆炸性增长己激起对新技术和自动工具的需求,以便帮助我们将海量数据转换成信息和知识。
数据挖掘(Data Ming),通常又称数据库中的知识发现(Knowledge Discovery inDatabases),它的目标是从数据库中发现隐含的、有意义的知识,以便通过预测未来趋势及行为,做出可靠的,基于知识的决策。
关联规则挖掘是发现大量数据中项集之间有趣的关联或相关联系。随着大量数据不停地收集和存储,许多业界人士对于从他们的数据库中挖掘关联规则越来越感兴趣。从大量商务事物记录中发现有趣的关联关系,可以帮助许多商务决策的制定,如分类设计、货架摆放、市场决策等。
本文重点研究了关联规则的挖掘算法,并进行了以下几方面的工作:
1.对数据挖掘现状进行了分析研究。
2.对关联规则算法(特别是Apriori算法,AprioriTid算法)进行深入研究,实现了AprioriTid算法。在数据挖掘的研究领域,Apriori算法和AprioriTid算法是其中比较有代表性的一个算法。关联规则的数据挖掘主要挑战性在于数据量巨大,因此算法的效率是关键。
3.完成AprioriTid算法在中职教学管理系统中的应用。一是将数据挖掘中的关联规则算法运用于教学评价,通过发现和运用关联规则来提高教学评价数据的客观性和可靠性,提高教学评价技术水平,使之更好地为教学服务。二是,使用AprioriTid算法来分析试卷各项定量评价指标与总体定性评价之间的关系,对试卷质量作出科学分析。