论文部分内容阅读
随着互联网技术的快速发展,“数据爆炸”问题越来越显著,在商业领域消费者从海量的产品中搜索出自己满意的商品越来越困难。关联规则作为个性化推荐中的重要一员,在缓解“数据爆炸”问题上具有很好的效果。目前,关于关联规则算法的研究内容很丰富,但是大部分的研究都集中于提高算法的挖掘效率中。近来年来,也有不少学者发现了关联规则算法会产生大量的规则结果,因此部分学者开始研究如何简化规则结果,但是这些研究工作绝大多数都忽略了领域知识对于规则结果的筛选作用,基于这一点本文对规则结果的选择进行了以下几点研究:首先,论文回顾了个性化推荐的研究现状,并指出了相应的研究难点与研究方向。同时,简要的介绍了基于内容的推荐、基于协同过滤的推荐、基于知识的推荐以及基于内容的推荐,并分析了这几种算法的工作原理以及相应的方法的优劣势,通过对比分析得出这几种算法的优劣势有明显的互补倾向,从而论文得出将多种算法混合求解最优的推荐结果的启发。其次,论文对当前研究工作的总结后,分析了关联规则算法研究的热点以及难点,提出了规则算法效率低的问题是无法避免的,只有根据实际情况尽量的降低这一缺陷,同时还分析了规则结果数量大、价值低、存储杂乱的问题。当前的研究工作都是从算法内部做改进,提高规则结果的利用效率,而实际上领域知识对于规则的使用具有重要的作用,但是这些知识常常被忽略了,鉴于此引出了本文对规则结果处理的新方法。本文提出了规则结果处理的新方法,即一种基于聚类的规则结果筛选方法,文中以一种改进的距离度量方法对规则结果进行聚类,并以基于领域知识的时效度和新颖度指标对聚类后的规则进行筛选,保留其中价值高的规则。同时还提出了一种基于协同过滤思维的规则结果选取问题的解决方案ARCUR,该算法通过用户评分这一领域知识对规则结果进行二次挖掘,并以实验证明了算法的有效性,成功解决了多种规则支持度——置信度指标无法解决的规则选取问题。最后,对论文的总结中可以发现文中的算法有很多都涉及到了多种参数,这些参数值的设定很大程度上是需要结合实践经验才能使得推荐结果具有良好的效果。同时,本论文结合聚类分析和协同过滤的方法提升关联规则算法的做法也证实了混合多种算法提升算法效果的启发。关联规则在现实世界中有很多重要的应用,本文结合领域知识对规则结果的深入挖掘研究工作证明了这种思路很好的提升算法的推荐效果。