基于本体的多元化内容推荐

来源 :北京大学 | 被引量 : 0次 | 上传用户:choasy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的迅速发展,互联网上的信息每天都在爆炸式地增长,人们在海量的信息面前显得无所适从,如何准确快速地获取需要的信息变成了困扰人们的难题。大量的研究表明,推荐系统可以有效地帮助解决信息过载的问题。  作为推荐领域主要的方法之一,基于内容的过滤被广泛地应用到各种推荐系统中,方便人们进行有效信息过滤。基于内容的推荐根据用户的历史行为,如阅读偏好、购买记录等,为用户建立兴趣模型,挖掘物品和用户兴趣的相关性,预测用户对物品的喜好,并根据预测结果为用户推荐其可能感兴趣的物品。  在基于内容的推荐系统中,关键技术是如何进行用户和物品建模,并计算两者的相关性。现有的很多研究使用词袋模型(Bag-of-Words,BOW)进行建模,并使用夹角余弦或者Jaccard衡量相似度,而忽略了用户和物品之间的语义联系。为了更好地对用户和物品进行建模,挖掘两者之间的语义关联,如何将语义相似性模型引入到基于内容的推荐系统中受到了越来越多的关注。  另一方面,很多推荐系统过于追求推荐的准确性,而忽略了推荐系统其他方面的表现,反倒降低了用户的使用体验。作为推荐系统的重要评测指标,新颖性和多样性对用户体验具有重要影响。与用户兴趣匹配度高,且具有较高新颖性和多样性的推荐结果对用户更具吸引力,更能增加用户粘性。如何在兼顾推荐结果语义相关的同时,增加其新颖性和多样性,在提高推荐系统的用户体验方面具有重要的意义。  本文致力于利用本体结构,将语义相关性模型引入基于内容的推荐,在保证推荐结果语义相关的同时提高新颖性和多样性。文章的主要工作和创新点如下:  利用开放的在线百科知识库构建大型的本体结构,并应用于基于内容的推荐系统,提高推荐结果的语义相关性。该本体通过爬虫技术和信息抽取技术自动构建,尽管包含有一定的噪音,但仍能有效地提高推荐结果的语义相关性;  提出基于本体的相关性模型(Ontology Based Similarity Model, OBSM),在本体上度量用户和物品的语义相关性;  为了减少本体噪音对推荐算法带来的影响,提出基于本体的聚类算法X-Ontology对本体进行清理,并基于此提出基于X-Ontology的相关性模型(X-Ontology Based Similarity,X-OBSM),有效地提高OBSM的推荐效果;  提出基于本体的新颖性和多样性模型,并使用新颖性/多样性调整算法增加推荐结果的新颖性和多样性,在保证推荐结果语义相关的同时,提升用户的使用体验。  设计并实现了一个多元化内容推荐系统,为用户提供个性化推荐服务的同时,作为实验平台完成本文研究内容的实验工作。实验结果表明,使用开放的在线百科知识库构建的本体结构,进行相关性、新颖性、多样性建模,能够有效的提高基于内容的推荐系统的准确度和用户的使用体验。
其他文献
该文首先介绍了并行程序监测的发展现状,并行程序在实际应用中的重要性;分析了目前进行并行程序调试过程中所存在问题和困难,以及解决这些困难对并行程序开发具有的重要意义.
该文主要利用知网知识库中丰富的语义信息,并将其转换成易于使用的语义关系网络形式,然后利用概念距离和统计信息的方法对汉语词的语义相似度进行计算.具体来说,该文主要对下
本文介绍了基于Web的企业计算模式的发展过程,分析了常用的动态Web技术的特性和各自的优缺点,针对Java语言的特点,指出它在动态Web应用开发中的强大优势;在深入剖析软件组件理论
文章在分析Web服务相关技术及现有的密码、认证技术的基础上,确定了该单点登录系统所面对的基本需求,通过引入身份担保机制和身份映射机制解决了安全域间用户身份的传递问题
某武器装备是中国目前重要的大型战略武器,其技术复杂,对其进行维修维护的测试装置复杂度高、操作难度大,需要采用实装对维修维护人员进行测试操作训练.这种训练方式存在诸多
随着物联网的兴起,可以感知周围环境,为将来决策提供数据支持的无线传感器网络再一次成为了研究的焦点。现有的智能传感器(mote)可以进行简单的本地计算和近距离通信,增强了整个
随着各种网络应用的增强,层出不穷的网络安全问题越来越受到人们的重视。安全操作系统在防止安全威胁,提供安全服务中的作用已经不容忽视。本文以结构化保护级安全操作系统——
该文提出了一种多分辨率下的彩色图像分割算法.算法首先通过K均值量化降低颜色索引数目.为了克服直接量化时间开销大,以及颜色类接近的问题,采用了降采样后量化,合并相近类的
该文主要讨论了改造Linux系统,使其适用于嵌入式实时环境所要解决的最关键的问题——Linux内核的实时性,并给出了增强Linux内核实时性能的具体方案.首先,对数控系统和嵌入式
该文主要内容包括:第一章绪论.综述了二十世纪八十年代以来,有关谈判理论模型研究、谈判问题的研究方法、谈判支持系统研究现状,指出了目前NSS系统中存在的问题,并对今后这方