论文部分内容阅读
互联网技术的快速发展使得信息爆炸成为当今社会的一大特点,越来越多的用户依赖于使用搜索引擎在互联网上获取知识。查询推荐技术成为帮助用户使用搜索引擎获取知识的重要辅助工具,其可弥补当前搜索引擎的查询词在表达能力上的局限性,辅助用户更好地表达查询意图。当查询推荐系统面临一词多义问题时,传统的基于流行性的查询推荐方法往往关注于查询词的热度而忽视弱势群体的搜索需求,导致推荐落空的风险提高,多样化查询推荐方法能够较好的解决这个问题。众所周知,多样化推荐方法的前提是被推荐对象集合中存在分类体系,目前大多数对多样化查询推荐的研究采用的是已有的分类体系,如维基百科、wordnet等本体库。由于这些多样化推荐方法采用了第三方提供的已有分类体系,导致其在推荐过程中存在一系列问题。首先,使用已有分类体系使多样化推荐方法很难有效解决数据稀疏性问题。其次,已有分类系统对于查询推荐中查询词的覆盖度不足,而且很多分类系统覆盖不到的查询词属于一段时间内查询热度相当高的词汇,这会导致最终推荐集合不完整。第三,采用已有分类系统使通过多样化查询推荐方法得到的推荐集合不具有针对性。不同背景的用户对于同一个查询词会有不同含义的理解,多样化推荐方法的研究目标和推荐策略决定了其对所有的用户都只能提供相同的推荐集合。为了解决上述问题,本文提出基于用户查询行为构建查询词动态分类体系的做法,给出了基于用户行为的查询词动态分类体系的定义以及构建方法,进一步提出了基于典型用户行为模型的多样化查询推荐框架。在此基础上,本文设计了三种基于该动态分类体系的多样化查询推荐,针对不同情况下的特定用户提供更高质量的查询推荐服务。本文在以下方面展开了深入的研究。(1)基于用户行为构建查询词的动态分类体系。多样化查询推荐方法中查询词的分类体系大多使用已有分类体系。采用已有分类体系会导致出现数据稀疏性问题、已有分类体系覆盖度不足、推荐结果针对性不强的问题。为了解决以上问题,本文提出基于用户查询行为构建查询词动态分类体系的做法,给出了以典型用户行为作为查询词分类体系的思路,并给出典型用户行为模型的定义以及构建方法,最后还提出了基于典型用户行为的多样化查询推荐思路。(2)针对多样化推荐方法存在的数据稀疏性问题、已有分类体系覆盖度不足问题,本文提出了面向流行性行为的多样化查询推荐方法,此方法采用查询词动态分类体系,面向的是在搜索引擎日志中查询记录极少或者是没有查询记录的用户,该方法能够基于全体用户的流行性行为向用户提供多样化的推荐服务。(3)针对传统多样化推荐方法存在的推荐结果针对性不强问题,本文提出了面向差异化搜索背景的多样化查询推荐方法。此方法采用查询词动态分类体系,面向的是在搜索引擎日志中存在一定量的查询记录,能够判断该用户属于哪个用户群体的用户。该方法能够基于用户群体自身的查询行为向用户提供针对用户群体的推荐服务。(4)针对传统多样化推荐方法存在的推荐结果针对性不强问题,对于在搜索引擎查询日志中记录很多的用户,本文进一步提出了流行性与相似性结合的多样化查询推荐方法。此方法采用查询词动态分类体系,面向的是在搜索引擎日志中存在大量的查询记录,能够判断该用户属于哪个用户群体的用户,并且能够体现一定的操作规律。该方法能够基于用户自身的查询行为和其所在用户群体的查询行为向用户提供针对其个人的推荐服务。