论文部分内容阅读
关联挖掘的目的是从大量数据中发现对用户有用、新颖、重要的关联规则。传统的关联挖掘算法会产生大量对用户而言显而易见的平凡规则,使那些真正对用户有用的新颖规则被淹没,而一些针对新颖性的改进算法往往又存在先验知识表达复杂且工作量极大的问题。在本文中,我们运用简单的分类树,引入“新颖度”的概念,对Apriori算法进行改进,得到了基于“新颖度”的关联挖掘算法,此算法既充分考虑了挖掘过程中得新颖性问题,又克服了先验知识表达过于复杂的困难。