论文部分内容阅读
近年来,数据挖掘技术已经引起了信息产业界的广泛关注,这是快速增长的数据量和日益贫乏的信息量之间矛盾运动的必然结果。对数据挖掘技术进行系统和深入细致的研究是全球信息化发展的客观要求。数据挖掘技术有很多研究领域,其中关联规则就是一个重要的研究方向,有着极其重要的应用价值。本文主要从事的是与关联规则数据挖掘算法相关的研究。 在现有的关联规则挖掘算法中,广泛采用了“支持度—置信度”的评价标准。然而,在很多时候,挖掘出来的关联规则其支持度和置信度都很高,却没有实际的意义。该标准也没有考虑在支持度和置信度都较高的正项规则无趣时,其负项规则的有趣性问题。因此,文中引入了关联规则的兴趣度标准,基于前人对关联规则的定义的改进和相关性兴趣度的定义,本文作者改进了基于支持度、置信度和兴趣度的关联规则挖掘算法。 随着数据库管理系统的不断完善与发展,在其功能扩展的同时,越来越多的非精确的数据存储到数据库中,这给数据挖掘技术的应用带来了极大的挑战。传统的数据挖掘算法,如Apriori算法及其改进算法都是集中在确定的、精确的概念上完成数据的挖掘,难以对非精确的或者说模糊的概念进行挖掘。因此,文中结合模糊集理论的知识,对关联规则挖掘算法做了进一步的研究,引入了模糊关联规则的概念,用模糊概念表示数据之间的关联关系,拓宽了关联规则的表示和应用范围。基于多层关联规则的挖掘方法,本文作者提出了一种基于模糊集的多层关联规则挖掘算法,并用其解决模糊概念的关联规则挖掘的问题。