论文部分内容阅读
随着信息技术的迅速发展,互联网上的信息每天都在爆炸式地增长,人们在海量的信息面前显得无所适从,如何准确快速地获取需要的信息变成了困扰人们的难题。大量的研究表明,推荐系统可以有效地帮助解决信息过载的问题。 作为推荐领域主要的方法之一,基于内容的过滤被广泛地应用到各种推荐系统中,方便人们进行有效信息过滤。基于内容的推荐根据用户的历史行为,如阅读偏好、购买记录等,为用户建立兴趣模型,挖掘物品和用户兴趣的相关性,预测用户对物品的喜好,并根据预测结果为用户推荐其可能感兴趣的物品。 在基于内容的推荐系统中,关键技术是如何进行用户和物品建模,并计算两者的相关性。现有的很多研究使用词袋模型(Bag-of-Words,BOW)进行建模,并使用夹角余弦或者Jaccard衡量相似度,而忽略了用户和物品之间的语义联系。为了更好地对用户和物品进行建模,挖掘两者之间的语义关联,如何将语义相似性模型引入到基于内容的推荐系统中受到了越来越多的关注。 另一方面,很多推荐系统过于追求推荐的准确性,而忽略了推荐系统其他方面的表现,反倒降低了用户的使用体验。作为推荐系统的重要评测指标,新颖性和多样性对用户体验具有重要影响。与用户兴趣匹配度高,且具有较高新颖性和多样性的推荐结果对用户更具吸引力,更能增加用户粘性。如何在兼顾推荐结果语义相关的同时,增加其新颖性和多样性,在提高推荐系统的用户体验方面具有重要的意义。 本文致力于利用本体结构,将语义相关性模型引入基于内容的推荐,在保证推荐结果语义相关的同时提高新颖性和多样性。文章的主要工作和创新点如下: 利用开放的在线百科知识库构建大型的本体结构,并应用于基于内容的推荐系统,提高推荐结果的语义相关性。该本体通过爬虫技术和信息抽取技术自动构建,尽管包含有一定的噪音,但仍能有效地提高推荐结果的语义相关性; 提出基于本体的相关性模型(Ontology Based Similarity Model, OBSM),在本体上度量用户和物品的语义相关性; 为了减少本体噪音对推荐算法带来的影响,提出基于本体的聚类算法X-Ontology对本体进行清理,并基于此提出基于X-Ontology的相关性模型(X-Ontology Based Similarity,X-OBSM),有效地提高OBSM的推荐效果; 提出基于本体的新颖性和多样性模型,并使用新颖性/多样性调整算法增加推荐结果的新颖性和多样性,在保证推荐结果语义相关的同时,提升用户的使用体验。 设计并实现了一个多元化内容推荐系统,为用户提供个性化推荐服务的同时,作为实验平台完成本文研究内容的实验工作。实验结果表明,使用开放的在线百科知识库构建的本体结构,进行相关性、新颖性、多样性建模,能够有效的提高基于内容的推荐系统的准确度和用户的使用体验。