结构相似度及其在推荐系统中的应用研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:linjavac
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术和电子商务的迅猛发展已经将我们带入信息爆炸时代,用户可获取的信息量的急增使得人们生活和选择日益多元化,但是与此同时,也带来了信息过载的问题。海量数据的同时呈现,一方面造成用户很难获取到自己感兴趣的信息,另一方面也使得大量少人问津的信息被淹没。在这种情况下,个性化推荐系统应运而生。个性化推荐系统的宗旨是在海量数据中直接为用户提供符合其兴趣爱好的内容与信息,其本质即是信息过滤。尤其是在电子商务领域,个性化推荐服务占据着极其重要的地位。而协同过滤系统是目前应用最为广泛的个性化推荐系统,它可以根据用户的历史信息对其未来的兴趣和爱好进行有效的预测和推荐。其中,协同过滤系统的核心问题是如何度量用户与用户之间的相似度。本文的主要任务即是对推荐系统中各种用户间相似度计算算法进行研究和分析,以达到最大限度的提高推荐效果的目的。论文的主要工作如下:第一,对个性化推荐系统进行了较深入的研究,详细分析了各种个性化推荐技术的内容、应用范围及现状,并重点研究了协同过滤推荐这一应用最为广泛的推荐系统。并对数据挖掘、复杂网络以及链路预测等相关技术基础进行了介绍。第二,文章在将传统的基于打分信息的余弦相似度和Pearson相关系数应用于推荐系统的基础上,将六种基于结构的相似度算法引入到推荐系统中。基于结构的相似度算法是利用网络结构中节点个体以及节点与节点之间的链接来分析计算用户与用户之间或项目与项目之间的相似性关系。同时针对这两种类型的相似度算法,文章从不同的角度进行了多组推荐实验,分析比较二者的推荐效果。第三,在基于打分信息以及网络结构这两种类型的相似度算法的基础上,论文提出一种新的基于结构的相似度计算方法,其同时融合了网络结构分析与用户对项目打分信息这两个因素,从而有效的避免了这两类相似度算法各自的局限性。最后,文章通过大量的实验数据结果验证了这种新的基于结构的相似度算法能够比较有效的提高个性化推荐系统的质量和效果。
其他文献
该系统主要由压缩编码模块、纠错编码模块和舆流分析校验模块组成.论文主要研究内容包括MPEG-2视频压缩编码的设计,舆流在信道传输时的纠错编码方案—RS(204,188)编码器和卷
该文的主要想法是想将形式化语义方法引入工业界应用极为广泛的VerilogHDL中,为Verilog的形式化验证以及自动求精提供严格的语义基础,其主要内容包括三方面:1.该文首次给出了
随着Internet的发展,计算机软件系统的信息处理规模也呈持续增长的趋势。然而,由于传统分布计算技术的固有缺陷,软件系统却变得更庞大、缓慢和脆弱。在这种情况下,分布对象计算应
微阵列技术是实验分子生物学最新的重大突破之一,作为一个强有力的工具,它可以同时得到上千个基因的表达水平,产生大规模基因表达数据。由于在基因表达分析中有巨大的潜力,有
该文介绍了HMM的基本原理和基于HMM的语音识别方法,描述了汉语的语音学基础和识别框架,并从搜索算法的角度对连续语音识别方法进行了讨论.Viterbi搜索算法是目前比较常用的一
该文对WEB数据管理以及查询相关的技术作了较为全面的研究.主要包括WEB数据模型,XML技术,WEB数据的存储,WEB查询和WEB数据结构信息抽取,其中重点研究了WEB数据结构信息的抽取
该文从系统工程的角度阐述了CMM的理论基础、模型结构、组成内容以及应用方法.指出CMM源于有六十多年历史的产品质量原理及统计质量控制原理.详细介绍了成熟度体系成成熟度模
遗传算法是用计算机模拟生物进化思想的优化算法,首先由美国Michigan大学的John Holland教授于1975年提出。它在固定的种群规模下,仅利用个体适应度来引导搜索,通过按照一定概率
组件技术是近几年来蓬勃发展的技术,同样,随着Internet网络技术的不断发展、网络连接的迅速普及与网络速度的不断提升,基于Internet网的Web数据库技术成为当前数据库研究的热点
该文的工作就是研究如何采用系统级故障诊断的方法解决网络的故障诊断问题,主要围绕基于三值模型的诊断、概率诊断、分布式诊断等三个方面进行,对它们的单个或组合故障诊断问