异质网络中基于语义元路径的推荐系统研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:chris_1988
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机科学与互联网的飞速发展,社会网络分析成为了数据挖掘领域的一个重要研究课题。大量社会网络分析的相关研究都集中在同质信息网络上,但随着互联网上的数据信息逐渐多样化,社会网络分析的研究重点逐渐转向异质信息网络,很多数据挖掘任务(如分类、聚类、排序和相似性度量等)都利用了异质信息网络来整合多种异质信息。另外一方面,随着互联网上用户行为数据的大量积累,推荐也成为了一个非常重要的数据挖掘任务。推荐系统可以帮助用户找到自己感兴趣的物品,有效地缓解了互联网上信息过载问题。现实的推荐系统包含了多种类型的对象(如电影推荐系统中的用户、电影、演员和兴趣小组等)以及对象间丰富的关系连接,这些不同的对象和关系构成了一个异质信息网络。然而,常规的异质信息网络并没有考虑到连接上的属性值。在推荐系统中,用户对物品的评分(通常取值为1-5)正是用户与物品关系上的属性值,这导致了被广泛应用的元路径也无法准确地捕获对象间的语义关系。此外,如何利用异质信息网络对多种信息进行整合,并为用户学习到个性化且有区分度的信息偏好,也是本文需要解决的一个关键问题。针对上述问题,本文的贡献主要分为三个部分。第一,本文提出了带权值的异质信息网络和带权元路径等概念,通过引入具有区分度的连接属性值,更精细地描述了路径的语义。此外,本文提出了带权元路径下的相似性计算策略,使得原有的相似性度量方法经过修改后可以应用到带权元路径上来。第二,本文提出了一个基于语义路径的个性化推荐算法SemRec,更准确地预测用户对物品的评分。通过设置不同的元路径,SemRec不仅可以灵活地整合异质信息,还可以学到有区分度的、个性化的权重来表达用户对不同语义路径的偏好。通过在三个现实的数据集上进行对比实验,可以看到SemRec利用带权元路径整合信息,从而获得更好的推荐效果。此外,大量的实验证实了了带权元路径的优势。最后,作者根据SemRec推荐方法设计了一个电影推荐原型系统,该系统利用SemRec学到的个性化路径偏好权重对推荐结果给出合理的推荐解释。
其他文献
复数在几何证题中的应用张玉兰复数有代数、几何、向量、三角、指数等表示形式,复数的几何意义把数与形结合在一起。复数的这些特点给复数的应用提供了广阔的天地。下面介绍复
本文总结了我国分权改革的特征,分析了渐进式梯度分权的方式、财政体制以及地方政府间竞争所产生了一系列问题,并针对以上问题,以区域协调发展为导向,提出基于分权改革的政策
中学教材中有不少以对话为主要内容的小说文本。我们可以把品读人物的话语作为这类小说的教学支点:通过人物话语还原特定情境下的社会生态,揣摩具体语境中的人物心理,探究小
众所周知,阅读在英语学习或者教学中已经占据了重要地位,而且英语之写、听与阅读有着千丝万缕的关系,且影响较大。高中面临着高考英语的"灵活多变",但是只要练好基本功,英语
在民事诉讼司法实践中,送达已经成为困扰法院的一个老大难问题,对于基层法院尤其如此。文章共分四个部分,首先对送达的概念、分类、历史发展及比较法分析作了介绍。本文运用
去甲基斑蝥素是斑蝥素的衍生物,其不仅具有较强的体外抗增殖活性及较显著的蛋白磷酸酯酶(PP1和PP2A)抑制活性,而且大大降低了斑螯素对泌尿系统刺激性等毒性。因此,本论文设计
近几年来,国产电影全面开花,各种题材的电影在市场均占有一席之地。其中,喜剧电影的发展态势最为可观,曾屡次刷新国产电影票房的纪录。2015年,《港囧》和《夏洛特烦恼》在国