论文部分内容阅读
随着网络上信息量的飞速增加,怎样从巨大的信息宝库中有效地查找到符合用户需求的信息逐渐成为人们关注的焦点。在信息检索领域中,查询扩展是解决词语不匹配问题并提高检索效率的重要方法之一,它将与当前查询相关度较高的词项加入到初始查询中,以弥补因用户查询过于简短和词语歧义性对查询效果产生的影响。目前多数的查询扩展方法没有对不同用户进行区分,个性化程度较差,无法满足不同用户的查询需求,影响用户满意度。传统的基于用户日志的方法根据对大量用户的历史查询词进行统计,计算出与查询相关度较高的词语加入原始查询完成查询扩展。该方法针对大量用户进行统计性计算,无法对不同用户给出有针对性的查询结果,缺乏个性化处理,而且该方法对日志信息的挖掘不够充分,对查询效果的改善不十分明显。针对以上问题,本文提出一种基于信任网络的查询扩展模型,旨在通过建立用户信任网络找出本次查询的可信任用户作为扩展词来源用户,同时通过深入挖掘用户查询日志信息,有效地提取扩展词,从而改善查询效果,提高用户对查询结果的认可度。首先,本文提出一种基于信任网络的查询扩展模型,充分利用用户社会关系,丰富扩展词来源,以有效的提高查询扩展的准确度从而改善查询结果,提高用户满意度;其次,提出一种结合社会性和相似性信任度的混合用户信任度计算方法,使个体间的信任关系以主题相关性为基础,准确的选择偏好与当前查询相符的可信用户作为扩展词项的来源用户;然后,通过深入挖掘日志中的初始排名和点击情况并结合用户信任度,给出一种基于用户日志和信任度的查询扩展方法;最后,设计多组实验验证作者提出的算法及模型整体的有效性。实验证明,本文提出的查询扩展模型可以有效的提高查询准确度,并提高用户对查询结果的满意程度。