论文部分内容阅读
形式概念分析是德国数学家Wille教授于1982年提出的。经过三十年的发展,已经应用于多个领域,如知识发现、机器学习等。形式概念分析的核心数据结构是概念格,因此其应用的核心就是构建概念格。论文在前人的成果的基础上,对一种渐进式概念格生成算法进行了改进,理论和实验都证明改进措施提高了算法的速度。论文还改进了概念格上关联规则挖掘算法,并将此算法应用到个性化推荐系统中。论文的主要内容归纳如下:(1)简要介绍了文中用的一些基本知识,包括数据挖掘、个性化推荐、模糊概念格以及关联规则的基本概念,关联规则的主要算法——Apriori算法和FP-Growth算法——的基本思想等。(2)改进了一种渐进式概念格生成算法,并将其推广到模糊概念格的构建上。原来的概念格生成算法通过遍历索引树来遍历概念格,在遍历概念格过程中渐进式生成新概念格。论文对遍历索引树的过程进行了优化改进。通过仔细观察,我们发现索引树的遍历隐含着一种有序性,这种有序性就是词典序。论文将这种有序性进一步发挥,让新增对象的属性集(字母集合)升序排列,而且给索引树的每一个树节点设置一个unik属性,unik属性是用来表示当前树节点与其父节点之间的边特征的。这样就可以将一部分概念格节点的类型的判断转换为字母的大小比较,从而降低了算法的复杂度,缩小了索引树遍历的范围,减少了冗余的集合操作,优化了原来的算法。(3)在渐进式概念格生成算法的基础上,改进了概念格关联规则挖掘算法。概念格上的关联规则挖掘是通过概念格的内涵缩减实现的。论文着重介绍了一种概念格的渐进式内涵缩减算法,并将这种算法融合到前面优化改进了的渐进式概念格生成算法上。优化改进措施使渐进式概念格生成算法变快了,所以融合后的内涵缩减算法一定优于原来的内涵缩减算法。我们的理论分析和实验都验证了这种算法的优越性。与前面的渐进式概念格生成算法相比,融合后的内涵缩减算法生成的是量化概念格。这种带有内涵缩减集的量化概念格非常适于关联规则的挖掘。(4)设计实现了视频网站上的基于概念格的个性化推荐系统。