论文部分内容阅读
在日常生活中,用户偏好决定着选择,用户偏好的不同导致了用户选择结果的不同,所以,在关系型数据库中对偏好查询问题的研究成为研究热点。在具体应用中,偏好可分为定量偏好和定性偏好。定量偏好是用具体数字的形式表达用户偏好,也就是把用户的特定选择转化成一个量值,这种方法虽然简单、直观,但不是所有问题都可以用这种量值形式来表达。定性偏好通过事物属性间的联系表达用户偏好。在面对自动化决策问题时,定性偏好相对于定量偏好来说应用的范围更广。CP-net是一种简单而又直观的图形化的偏好表示工具,尤其适合信息不完整情况下的属性间具有依赖关系的多属性定性偏好决策。本文的工作是对偏好查询的处理,主要是将帕累托复合机制扩展到CP-net中,基于“格”框架(Lattice)理论,实现了基于PCA降维技术的条件偏好的关系数据库的Top-k查询,完成满足用户偏好的查询。本文主要进行了如下研究:(1)帕累托偏好复合:对于人们的多属性偏好,偏好复合是满足用户个性化需求的关键.而传统的帕累托复合只考虑优先的偏好关系,而CP-net可以表示属性间的依赖关系,所以必须拓展帕累托复合。(2)Top-k查询技术:Top-k查询的目的就是检索用户给定的相关关键字,并且将在指定区域分布的最佳k个对象提取出来。在数据库领域中,将偏好集成应用于数据库是一个重要的研究方向。其中,Top-k查询表示将最可能满足用户偏好的k个对象提取出来,因此也被称为序敏感查询。Top-k查询技术帮助用户从大量数据中得到自己最关心的配置,有效的减少数据库的搜索空间,提高检索效率,提高查询效率。(3)基于PCA降维技术的Top-k查询:现实生活中人们经常需要使用多属性描述大量的复杂事物和现象,高维数据就是这些属性抽象而成。高维数据提供了有关属性详细、丰富的信息,但另一方面,数据维数的大幅度提高往往给随后的数据处理工作带来了巨大的困难。本文将PCA降维技术与Top-k查询技术相结合,在进行Top-k查询前,对高维数据进行降维处理,从而减少数据维度,达到提高查询速率的目的。